Google Lyria 与 YouTube 上传内容争议:AI训练素材授权链先查什么
外部线索提示,围绕音乐 AI 训练、YouTube 上传内容再利用和平台素材授权边界的争议,已经足以触发企业内部的第一轮授权链检查。但这个线索只能说明议题及时,不能直接证明中国法结论,也不能替代企业自己的合同、素材台账和证据审查。
Google Lyria 与 YouTube 上传内容争议:AI训练素材授权链先查什么
外部线索提示,围绕音乐 AI 训练、YouTube 上传内容再利用和平台素材授权边界的争议,已经足以触发企业内部的第一轮授权链检查。但这个线索只能说明议题及时,不能直接证明中国法结论,也不能替代企业自己的合同、素材台账和证据审查。
吕箐翎律师的判断是:企业讨论 AI 训练素材是否合法时,不应先问“平台上能不能下载”或“行业是不是都在用”,而应先把训练材料当作一条可审计的授权链来拆解。音乐、录音、声音、图片、视频、设计稿、项目粗稿、数据集或其他创作资产,只要进入模型训练、微调、模型输入或供应商生成流程,就需要先核查来源、权利主体、许可范围、使用目的、转授权或模型训练条款、退出删除机制和供应商保证。
第一步是训练材料来源证明。企业需要能说明素材来自自有创作、外采授权、平台授权、客户交付、员工提交、供应商提供还是公开网络来源。素材“可下载”“无水印”“平台内可用”或“外包已交付”,都不等于可以进入广告、包装、网站、短视频、客户交付、商标设计或 AI 训练流程中无限制商用。
第二步是授权链闭合。音乐 AI 训练通常不只涉及一个权利点:作品、录音制品、表演、声音素材、合同收益分配和平台上传条款可能分别归属于不同主体。已有音乐行业 AI 许可争议也说明,争点往往不是单纯“有没有素材”,而是 AI 相关许可和收益是否覆盖被使用的录音或表演贡献。企业不能只拿到一个“可使用素材”的宽泛表述,就推定已经覆盖模型训练、微调、供应商复用、输出商业化和后续客户交付。
第三步是许可范围核查。合同或平台规则里要逐项确认:是否允许机器学习、模型训练、模型输入、生成式 AI、再训练、供应商托管、跨项目复用、向关联公司或客户交付、长期保存、日志留存和退出删除。没有这些表述时,保守做法是把 AI 训练用途视为新的使用场景,重新取得明确授权或改用可证明覆盖该用途的素材。
第四步是著作权边界。著作权法支持作品权利、邻接权益和侵权责任的基本判断,但不能据此概括认定 AI 训练当然合法或当然侵权。企业至少要区分作品类型、权利归属、使用方式、复制或改编风险、输出是否替代原作品市场,以及是否存在可追溯的授权或合理使用抗辩基础。
第五步是法定许可边界。法定许可不是免费使用,也不是任意转载。企业如果主张某类法定许可,应先核查适用场景、作品类型、权利人是否声明不得使用、署名、付酬、使用范围和平台留痕。把“法定许可”泛化为 AI 训练素材池的通用入口,是高风险做法。
第六步是合同分配。涉及技术合同、数据授权协议、AI 供应商合作或定制模型训练时,合同应明确训练材料清单、权利保证、保密义务、训练目的、可复用范围、输出成果归属、收益分配、验收标准、侵权赔偿、删除义务和审计配合。供应商说“模型能力来自通用训练”并不能替代企业对自己提供素材的授权链审查。
第七步是数据与个人信息边界。如果训练素材同时包含数据集、用户上传内容、账号信息、声音样本或其他可能识别到个人的信息,还要另行检查数据来源、处理目的、处理方式、保存期限、保护措施、委托处理、共同处理、向第三方提供和跨境或重要数据风险。著作权授权链闭合,不等于数据安全和个人信息处理也自动闭合。
企业可以把本轮检查落成七类证据:素材来源台账、权利主体清单、授权文件和平台规则版本、AI 训练用途条款、供应商权利保证和删除承诺、输出成果归属约定、争议处理和留痕记录。缺少其中任何一类,都不建议把 YouTube 上传、音乐素材、创作资产或客户交付文件直接投入 AI 训练链。
这张检查清单的价值,不在于对某个海外争议下结论,而在于把企业内部的 AI 训练材料摄入从“能不能抓、能不能导入”改成“来源能否证明、授权能否覆盖、合同能否分配、证据能否留住”。这才是 AI 训练素材授权链的第一道合规门槛。