AI 供应商接入生产数据前,企业不应该先问“能不能接”,而要先问“它到底能看见什么、为了什么处理、处理后谁负责”。我的处理顺序会先把数据对象、系统权限和合同责任拆开;只要三项里有一项说不清,就不适合直接开放生产环境。
先把“接入”拆成可审查的事实
很多企业说的 AI 供应商接入,其实混在一起的是三类事实:一是供应商能否接触客户数据、用户行为、工单、日志、模型输入输出或账号凭证;二是供应商是否进入生产系统、测试环境、RAG 知识库、客服后台或运维接口;三是这些数据会不会被用于训练、微调、评测、算法优化、远程支持或跨境处理。
我会先让企业把这三类事实拆出来,因为数据安全、个人信息保护、技术合同和数据出境判断分别卡在不同位置。只写“供应商仅用于技术服务”太粗,不能覆盖新的训练目的、第三方提供关系、委托处理关系或远程访问安排。
用一张接入前授权边界清单做第一道门
这篇文章里可复用的动作工具,是“AI 供应商生产数据接入前授权边界清单”。它至少要写清六个字段:数据对象,列明客户数据、个人信息、源代码、日志、凭证、模型输入输出分别是否开放;访问路径,区分生产系统、测试库、接口、远程运维和批量导出;处理目的,写明训练、微调、评测、RAG、排障或算法优化是否被允许。
清单还要继续往下追三项动作:合同关系,确认是委托处理、共同处理、向第三方提供还是普通技术服务;跨境路径,确认境外模型 API、境外供应商远程访问、再转移或境外存储是否存在;退出责任,写明审计、保密、删除、更新、替换、赔偿和证据留存由谁承担。
企业使用这张清单的下一步不是把表填满就上线,而是把每个“允许”转换成合同条款和系统权限。清单里任何一栏只能写“待确认”时,对应的数据访问就应该先暂停或缩小到脱敏测试数据,等授权、告知同意、合同责任和日志留痕补齐后再放开。
吕箐翎律师会优先看哪三个风险点
我会先看个人信息边界。客户数据、客服记录、用户行为、语音图片、合同和工单只要能识别特定个人,就不能用“内部研发”当然覆盖 AI 训练或算法优化;如果还涉及敏感个人信息、第三方提供或委托处理,原告知同意、处理目的、保存期限和保护措施都要重新对齐。
第二个风险点是供应商责任。AI、云、数据处理或平台运营合作里,供应商可能接触的不只是数据本身,还包括源代码、日志、凭证、模型输入输出和生产系统。合同里如果没有暂停、审计、保密、删除、替换和赔偿机制,企业出事后很难把责任链条拉回到供应商。
第三个风险点是跨境或远程访问。境外模型 API、境外供应商远程看境内数据、向境外提供个人信息或重要数据,都要先识别数据类型、个人信息规模、重要数据、出境方式、境外接收方和处理目的,再判断是否要走安全评估、标准合同、个人信息保护认证或便利化路径。
吕箐翎律师的判断是:AI 供应商能不能接入生产数据,不取决于供应商说自己“只做技术支持”,而取决于企业能否把数据对象、访问路径、处理目的、合同责任和退出机制逐项落到书面证据。
什么时候可以继续,什么时候要先停
如果清单显示供应商只接触脱敏测试数据,不能导出,不能用于训练或再利用,访问日志可回放,删除和保密责任写进合同,企业可以把下一步放在权限最小化和上线前复核。这个“可以继续”也只是一般合规判断,不等于具体项目已经完成法律审查。
如果供应商会接触可识别个人的信息、真实客户数据、生产系统凭证、模型输入输出或跨境远程访问,而合同里没有训练目的限制、审计权、删除更新机制、供应商赔偿和退出替换安排,就不适合先上线再补材料。企业应先缩小访问范围,补充合同条款,完成个人信息和数据出境路径检查,再决定是否开放生产环境。
需要律师介入的触发点很具体:清单无法说明数据来源和个人信息边界,供应商要求保留或复用输入输出,合同没有删除和审计条款,境外模型或远程访问路径说不清,或者业务部门已经准备把真实客户数据接入生产系统。这些都是材料缺口和上线风险,不适合只靠供应商模板合同处理。
以上是面向企业数据合规和知识产权数据治理的一般法律信息,不构成针对个案的法律意见。具体项目仍要结合数据类型、系统架构、供应商合同、用户告知同意、跨境路径和行业监管要求另行审查。
参考资料
- [1] 《中华人民共和国数据安全法》
- [2] 《中华人民共和国个人信息保护法》
- [3] 《中华人民共和国民法典》第八百四十三条至第八百四十五条
- [4] 《促进和规范数据跨境流动规定》
- [5] 《生成式人工智能服务管理暂行办法》