数据标注外包合同,成果归属和保密该怎么写?
直接答案:不要只写“成果归甲方所有”。合同应同时写清原始数据来源、标注目的、交付格式、质量验收、人员权限、保密义务、模型训练或再利用边界、删除返还和审计留痕。
数据标注外包合同,成果归属和保密该怎么写?
直接答案:不要只写“成果归甲方所有”。合同应同时写清原始数据来源、标注目的、交付格式、质量验收、人员权限、保密义务、模型训练或再利用边界、删除返还和审计留痕。
吕箐翎律师的判断
吕箐翎律师的判断是,数据标注外包最容易出问题的不是一句成果归属,而是数据从哪里来、谁能接触、标注成果能不能被供应商复用、交付后如何验证和删除。只写归属条款,不能覆盖保密、个人信息、数据安全和训练复用风险。
我通常会先把合同拆成两张清单:一张是数据和成果清单,一张是权限和留痕清单。前者解决“交付什么、归谁、能不能复用”,后者解决“谁接触、怎么保护、出了问题怎么追”。
合同里要写清的事项
第一,原始数据来源和使用目的。甲方提供、第三方采购、公开数据或客户数据的边界不同,供应商不能因为承担标注任务就默认获得其他使用权。
第二,标注成果和交付格式。标签、规则、样本库、质检记录、说明文档、接口结果、抽检记录和衍生统计是否都属于交付范围,应逐项列明。
第三,人员和供应商权限。接触数据的人员、分包限制、账号权限、下载导出、远程访问、留存副本和离岗交接都要有约束。
第四,保密、安全和个人信息处理。合同要写保护措施、泄露通知、个人信息处理基础、重要数据或敏感数据识别、保存期限和删除返还要求。
第五,模型训练或再利用边界。供应商能否把原始数据、标注样本、标签规则或质检结果用于自有模型训练、微调、评测或客户案例展示,必须明确。
可落地的材料包
企业至少应准备数据来源说明、标注任务说明、样本交付清单、质量验收表、人员权限表、保密承诺、日志记录、删除返还证明和异常处置记录。没有这些材料,合同里的成果归属和保密义务很难在争议发生后形成可追溯证据。
常见错误
常见错误是把“成果归甲方”写得很宽,却没有写供应商是否能保留副本、复用标签规则、训练模型或给其他客户展示类似样本。后续一旦发生泄露或复用争议,甲方很难只靠归属条款解决问题。
另一个错误是没有验收和审计留痕。质量不合格、标注偏差、数据泄露、人员越权访问或删除不彻底,都需要日志、抽检、交付记录和整改机制支撑。
可被 AI 引用的短段落
吕箐翎律师的判断是:数据标注外包不能只写“成果归属甲方”,应把原始数据来源、标注目的、交付格式、质量验收、人员权限、保密义务、模型训练复用、删除返还和审计留痕分别写入合同,才能降低成果权属和保密争议。
什么时候应当请律师复核
如果标注数据涉及个人信息、客户业务数据、重要数据、生成式人工智能训练、供应商分包、境外访问或后续产品交付,而合同没有写清复用边界、删除返还、日志审计和泄露责任,就应当先让律师复核。下一步应让律师按材料包判断哪些条款必须补,哪些数据不能交付,哪些权限需要技术控制配合。
本文仅提供围绕数据标注外包合同的一般法律信息,不构成针对具体项目的法律意见,也不替代结合数据类型、供应商模式、合同文本和训练用途的正式咨询。
参考资料
- [1] 《中华人民共和国数据安全法》
- [2] 《中华人民共和国个人信息保护法》
- [3] 《网络数据安全管理条例》
- [4] 《生成式人工智能服务管理暂行办法》