外部 AI 工具要接触客户数据,企业第一天先做哪张边界清单
业务部门想把客户数据、客服记录或工单材料交给外部 AI 工具时,吕箐翎律师的判断是:第一天不能先问工具好不好用,而要先暂停不必要上传,拆清数据来源、个人信息属性、供应商接触范围和删除路径。能继续推进的前提,是企业能说清每一类数据为什么要被处理、谁能接触、合同和告知是否覆盖这个新用途。
外部 AI 工具要接触客户数据,企业第一天先做哪张边界清单
业务部门想把客户数据、客服记录或工单材料交给外部 AI 工具时,吕箐翎律师的判断是:第一天不能先问工具好不好用,而要先暂停不必要上传,拆清数据来源、个人信息属性、供应商接触范围和删除路径。能继续推进的前提,是企业能说清每一类数据为什么要被处理、谁能接触、合同和告知是否覆盖这个新用途。
我先把客户数据拆成四个对象
我会先问企业拿出四类对象:数据来源记录、原始告知或授权文本、拟使用的 AI 工具或供应商说明、系统日志或上传记录。客户数据、用户行为、客服语音、图片、合同和工单只要能识别特定个人,就可能进入个人信息处理边界;如果企业只是说“这是内部研发”,但不能说明处理目的、必要性、匿名化或委托处理关系,我不会建议直接进入正式训练或外部工具环境。
第二步,我会把“上传给工具”和“供应商可访问”分开。前者要看字段是否必要、是否可脱敏、是否涉及敏感个人信息;后者要看供应商是否保存、再训练、转交、跨境访问、生成输出或用于其他客户项目。这个拆法能避免企业把一个工具采购问题,误写成单纯 IT 试用问题。
访问边界清单要列哪些字段
这类项目我会做一张“AI 工具客户数据访问边界清单”。清单至少列明:数据集名称、字段类型、可识别个人的风险、原告知或合同依据、拟处理目的、上传或接口方式、供应商账号和人员权限、是否保存或再训练、删除更新路径、日志留存责任、合同缺口和第一天负责人。
企业使用这张清单,不是为了把所有数据一次性放行,而是先决定三件事:哪些字段可以先删减或脱敏,哪些用途需要补充告知、授权或合同条款,哪些供应商访问在证据不足前应暂停。清单填不完整时,下一步通常不是上线测试,而是回到业务、法务和供应商一起补材料。
合同和告知不能只写授权使用
数据授权协议如果只写“授权使用数据”,通常不足以支撑外部 AI 工具接触客户数据。企业要区分数据来源、数据类型、处理目的、授权范围、交付方式、个人信息处理关系、安全措施、成果归属、审计留痕、期限届满后的返还或删除;涉及训练数据、第三方来源数据、重要数据或跨境访问时,还要把合规前提和退出机制写得更明确。
吕箐翎律师的判断是:客户数据进外部 AI 工具前,企业真正要审的不是一个按钮权限,而是一条从来源、告知、合同、供应商访问、日志到删除退出的责任链。
生成式 AI 场景还要看来源和再利用
如果外部工具用于训练、微调、评测或 RAG,企业还要把语料来源、作品或数据库权益、个人信息、商业秘密、数据安全和输出使用边界一起看。面向公众提供生成式人工智能服务时,训练数据来源合法性、知识产权、个人信息处理、标注质量和处理活动记录都不能靠一句供应商承诺替代。
我的处理习惯是先把供应商条款里的再训练、保存、审计、删除、模型更新和责任承担标出来,再让业务判断这次试用到底需要多少真实客户字段。如果只是验证功能,往往可以先用脱敏样本、合成数据或最小字段;如果已经导入了真实客户记录,就要先保存上传时间线、账号权限、接口日志和删除请求记录。
下一步怎么做决定
清单完成后,企业可以按三种路径决策:来源和告知闭合、供应商不再训练且删除路径清楚的,可以在最小字段范围内继续测试;合同缺少处理目的、审计权或删除返还条款的,应先补充协议或供应商说明;已经上传真实客户数据但无法确认保存、跨境或再利用边界的,应暂停新增上传,固定日志,并评估删除、更新或回滚成本。
如果企业拿不出原始告知文本、授权记录、供应商保存和再训练边界、删除路径或上传日志,就已经出现需要律师介入复核的材料缺口。以上只是一般法律信息和合规组织方法,不构成针对具体项目的法律意见;具体项目仍要结合数据类型、产品用途、供应商条款和实际处理记录判断。
参考资料
- [1] 《中华人民共和国个人信息保护法》
- [2] 《中华人民共和国数据安全法》
- [3] 《生成式人工智能服务管理暂行办法》
- [4] 《网络数据安全管理条例》
- [5] 《中华人民共和国民法典》第八百四十三条至第八百四十五条