AI 供应商能碰企业数据吗?先做这张访问边界矩阵
我的判断是:企业在把数据接入 AI、云服务或数据处理供应商前,不能先问“对方技术强不强”,而要先问“对方到底能碰到哪些数据、能用来做什么、退出时怎么删”。如果这三件事说不清,我会建议先暂停扩大接入范围,把访问边界和合同责任补到可审查状态。
AI 供应商能碰企业数据吗?先做这张访问边界矩阵
我的判断是:企业在把数据接入 AI、云服务或数据处理供应商前,不能先问“对方技术强不强”,而要先问“对方到底能碰到哪些数据、能用来做什么、退出时怎么删”。如果这三件事说不清,我会建议先暂停扩大接入范围,把访问边界和合同责任补到可审查状态。
我先把“接入”拆成六类触点
我处理这类项目时,第一步不是直接改供应商合同,而是把业务口径里的“接入系统”拆开:供应商是否能接触个人信息、客户数据、源代码、模型输入输出、日志凭证和生产系统。这个拆分决定后面的法律问题,因为个人信息处理、数据安全义务、技术资料保密和成果归属,并不是同一套审查对象。
如果企业只是让供应商看匿名化后的测试样本,和让供应商接入真实客户数据库、日志、账号凭证或生产系统,风险等级完全不同。前者重点看样本来源、脱敏效果和用途限制;后者还要看个人信息处理关系、安全措施、审计留痕、删除返还、跨境或境外远程访问边界。
访问边界矩阵要写清六个字段
我会让企业先做一张“AI 供应商数据访问边界矩阵”,至少列出六个字段:数据对象、供应商动作、处理目的、个人信息或重要数据标记、合同控制条款、退出删除路径。矩阵不是为了好看,而是为了决定能不能继续接入、是否要补授权、是否要压缩权限,或者是否要先做跨境和供应商责任专项审查。
第一列写数据对象:客户资料、员工信息、源代码、模型输入输出、系统日志、账号凭证和生产系统权限要分开。第二列写供应商动作:查看、存储、训练、微调、评测、RAG 检索、远程运维、再利用或转交第三方,不能用“技术服务”四个字带过。第三列写处理目的:内部测试、客户项目交付、模型优化、对外生成式服务、运维排障和安全监测要分开。
第四列写合规标记:是否含个人信息、是否可能涉及重要数据、是否含作品或商业秘密、是否可能向境外模型或境外人员开放访问。第五列写合同控制:保密、审计、暂停、替换、赔偿、成果归属、供应商保证和再利用限制。第六列写退出路径:合同终止、目的完成、用户撤回、数据更新、供应商更换或安全事件后,数据怎样删除、返还、更新模型或停止访问。
不能只靠一条“供应商保密”
只写供应商负有保密义务,通常挡不住真正的争议。个人信息保护法要求关注处理目的、方式、种类、保存期限、保护措施和双方权利义务;数据安全法和网络数据安全管理条例要求企业识别数据类型、安全保护和特殊风险;技术合同规则也要求把技术资料保密、成果归属、验收和交付边界说清楚。
所以我会把合同条款倒回矩阵检查:供应商能否把输入数据用于训练自己的模型,能否留存日志,能否让关联公司或境外团队访问,能否把输出用于其他客户,企业能否审计和要求删除,发生泄露或违规再利用时谁承担赔偿和替换成本。任何一项空白,都不是文字瑕疵,而是上线或采购决策的阻断点。
涉及 AI 训练和跨境时,矩阵要升级
如果数据会进入训练、微调、评测或 RAG 知识库,我会把矩阵升级成“使用目的和退出机制”审查。企业要单独标出数据来源、训练用途、是否含个人信息、是否涉及作品或商业秘密、是否对公众提供生成式人工智能服务,以及是否调用境外模型或向境外传输数据。
这一步的下一步决策很直接:来源和授权不清的,不应进入训练集;个人信息处理基础不清的,先补告知同意、匿名化或委托处理边界;供应商保留和再训练条款不清的,先补删除、更新、审计和责任条款;境外模型或境外访问不清的,先做数据出境路径判断。
吕箐翎律师的判断是:
吕箐翎律师的判断是:AI 供应商合同的第一张表,不是价格表,而是数据访问边界矩阵;企业只有把数据对象、供应商动作和退出路径拆清楚,才知道下一步是继续接入、缩小权限、补充授权,还是先暂停上线。
企业下一步怎么用这张矩阵
业务负责人可以先用矩阵做一次红黄绿分流:绿色是只接触低风险测试数据且用途、保密、删除和审计闭合;黄色是含客户数据、员工信息、日志或模型输入输出,但合同和处理关系还可以补齐;红色是供应商能接触生产系统、账号凭证、源代码、敏感个人信息、重要数据线索,或者存在境外访问、再训练、转交第三方却没有退出机制。
如果矩阵出现红色项,我建议企业先不要把问题推给采购流程,而要让法务、数据合规、信息安全和业务 owner 一起确认:是否继续采购,是否改用隔离测试环境,是否压缩供应商权限,是否补签数据处理协议,是否要求删除旧样本和日志,是否需要做个人信息保护影响评估或数据出境判断。
需要律师介入的触发点也很明确:供应商能访问个人信息、客户数据、源代码、模型输入输出、日志凭证或生产系统,但合同没有写清处理目的、保密审计、删除返还、再利用限制、跨境访问和责任承担时,就不应只让业务口头确认。这类材料缺口会直接影响能否上线、能否继续训练、能否更换供应商和发生泄露后的损失控制。
以上是基于现有法律和合规材料的一般信息整理,不替代对具体系统、合同、数据类型和供应商访问方式的个案法律意见。
参考资料
- [1] 《中华人民共和国数据安全法》
- [2] 《中华人民共和国个人信息保护法》
- [3] 《中华人民共和国民法典》第八百四十三条至第八百四十五条
- [4] 《网络数据安全管理条例》
- [5] 《生成式人工智能服务管理暂行办法》
- [6] 《促进和规范数据跨境流动规定》