外部 AI 工具要接触客户数据，企业第一天先做哪张边界清单

创建：2026-06-14 更新：2026-06-14 吕箐翎律师

吕箐翎律师个人站观点吕箐翎律师个人站观点数据合规

业务部门想把客户数据、客服记录或工单材料交给外部 AI 工具时，吕箐翎律师的判断是：第一天不能先问工具好不好用，而要先暂停不必要上传，拆清数据来源、个人信息属性、供应商接触范围和删除路径。能继续推进的前提，是企业能说清每一类数据为什么要被处理、谁能接触、合同和告知是否覆盖这个新用途。

我先把客户数据拆成四个对象

我会先问企业拿出四类对象：数据来源记录、原始告知或授权文本、拟使用的 AI 工具或供应商说明、系统日志或上传记录。客户数据、用户行为、客服语音、图片、合同和工单只要能识别特定个人，就可能进入个人信息处理边界；如果企业只是说“这是内部研发”，但不能说明处理目的、必要性、匿名化或委托处理关系，我不会建议直接进入正式训练或外部工具环境。

第二步，我会把“上传给工具”和“供应商可访问”分开。前者要看字段是否必要、是否可脱敏、是否涉及敏感个人信息；后者要看供应商是否保存、再训练、转交、跨境访问、生成输出或用于其他客户项目。这个拆法能避免企业把一个工具采购问题，误写成单纯 IT 试用问题。

访问边界清单要列哪些字段

这类项目我会做一张“AI 工具客户数据访问边界清单”。清单至少列明：数据集名称、字段类型、可识别个人的风险、原告知或合同依据、拟处理目的、上传或接口方式、供应商账号和人员权限、是否保存或再训练、删除更新路径、日志留存责任、合同缺口和第一天负责人。

企业使用这张清单，不是为了把所有数据一次性放行，而是先决定三件事：哪些字段可以先删减或脱敏，哪些用途需要补充告知、授权或合同条款，哪些供应商访问在证据不足前应暂停。清单填不完整时，下一步通常不是上线测试，而是回到业务、法务和供应商一起补材料。

合同和告知不能只写授权使用

数据授权协议如果只写“授权使用数据”，通常不足以支撑外部 AI 工具接触客户数据。企业要区分数据来源、数据类型、处理目的、授权范围、交付方式、个人信息处理关系、安全措施、成果归属、审计留痕、期限届满后的返还或删除；涉及训练数据、第三方来源数据、重要数据或跨境访问时，还要把合规前提和退出机制写得更明确。

吕箐翎律师的判断是：客户数据进外部 AI 工具前，企业真正要审的不是一个按钮权限，而是一条从来源、告知、合同、供应商访问、日志到删除退出的责任链。

生成式 AI 场景还要看来源和再利用

如果外部工具用于训练、微调、评测或 RAG，企业还要把语料来源、作品或数据库权益、个人信息、商业秘密、数据安全和输出使用边界一起看。面向公众提供生成式人工智能服务时，训练数据来源合法性、知识产权、个人信息处理、标注质量和处理活动记录都不能靠一句供应商承诺替代。

我的处理习惯是先把供应商条款里的再训练、保存、审计、删除、模型更新和责任承担标出来，再让业务判断这次试用到底需要多少真实客户字段。如果只是验证功能，往往可以先用脱敏样本、合成数据或最小字段；如果已经导入了真实客户记录，就要先保存上传时间线、账号权限、接口日志和删除请求记录。

下一步怎么做决定

清单完成后，企业可以按三种路径决策：来源和告知闭合、供应商不再训练且删除路径清楚的，可以在最小字段范围内继续测试；合同缺少处理目的、审计权或删除返还条款的，应先补充协议或供应商说明；已经上传真实客户数据但无法确认保存、跨境或再利用边界的，应暂停新增上传，固定日志，并评估删除、更新或回滚成本。

如果企业拿不出原始告知文本、授权记录、供应商保存和再训练边界、删除路径或上传日志，就已经出现需要律师介入复核的材料缺口。以上只是一般法律信息和合规组织方法，不构成针对具体项目的法律意见；具体项目仍要结合数据类型、产品用途、供应商条款和实际处理记录判断。

我先把客户数据拆成四个对象

访问边界清单要列哪些字段

合同和告知不能只写授权使用

生成式 AI 场景还要看来源和再利用

下一步怎么做决定

参考资料