Google Lyria 与 YouTube 上传内容争议：AI训练素材授权链先查什么

创建：2026-06-26 更新：2026-06-26 吕箐翎律师

吕箐翎律师个人站观点吕箐翎律师个人站观点 AI训练素材授权链

外部线索提示，围绕音乐 AI 训练、YouTube 上传内容再利用和平台素材授权边界的争议，已经足以触发企业内部的第一轮授权链检查。但这个线索只能说明议题及时，不能直接证明中国法结论，也不能替代企业自己的合同、素材台账和证据审查。

Google Lyria 与 YouTube 上传内容争议：AI训练素材授权链先查什么

吕箐翎律师的判断是：企业讨论 AI 训练素材是否合法时，不应先问“平台上能不能下载”或“行业是不是都在用”，而应先把训练材料当作一条可审计的授权链来拆解。音乐、录音、声音、图片、视频、设计稿、项目粗稿、数据集或其他创作资产，只要进入模型训练、微调、模型输入或供应商生成流程，就需要先核查来源、权利主体、许可范围、使用目的、转授权或模型训练条款、退出删除机制和供应商保证。

第一步是训练材料来源证明。企业需要能说明素材来自自有创作、外采授权、平台授权、客户交付、员工提交、供应商提供还是公开网络来源。素材“可下载”“无水印”“平台内可用”或“外包已交付”，都不等于可以进入广告、包装、网站、短视频、客户交付、商标设计或 AI 训练流程中无限制商用。

第二步是授权链闭合。音乐 AI 训练通常不只涉及一个权利点：作品、录音制品、表演、声音素材、合同收益分配和平台上传条款可能分别归属于不同主体。已有音乐行业 AI 许可争议也说明，争点往往不是单纯“有没有素材”，而是 AI 相关许可和收益是否覆盖被使用的录音或表演贡献。企业不能只拿到一个“可使用素材”的宽泛表述，就推定已经覆盖模型训练、微调、供应商复用、输出商业化和后续客户交付。

第三步是许可范围核查。合同或平台规则里要逐项确认：是否允许机器学习、模型训练、模型输入、生成式 AI、再训练、供应商托管、跨项目复用、向关联公司或客户交付、长期保存、日志留存和退出删除。没有这些表述时，保守做法是把 AI 训练用途视为新的使用场景，重新取得明确授权或改用可证明覆盖该用途的素材。

第四步是著作权边界。著作权法支持作品权利、邻接权益和侵权责任的基本判断，但不能据此概括认定 AI 训练当然合法或当然侵权。企业至少要区分作品类型、权利归属、使用方式、复制或改编风险、输出是否替代原作品市场，以及是否存在可追溯的授权或合理使用抗辩基础。

第五步是法定许可边界。法定许可不是免费使用，也不是任意转载。企业如果主张某类法定许可，应先核查适用场景、作品类型、权利人是否声明不得使用、署名、付酬、使用范围和平台留痕。把“法定许可”泛化为 AI 训练素材池的通用入口，是高风险做法。

第六步是合同分配。涉及技术合同、数据授权协议、AI 供应商合作或定制模型训练时，合同应明确训练材料清单、权利保证、保密义务、训练目的、可复用范围、输出成果归属、收益分配、验收标准、侵权赔偿、删除义务和审计配合。供应商说“模型能力来自通用训练”并不能替代企业对自己提供素材的授权链审查。

第七步是数据与个人信息边界。如果训练素材同时包含数据集、用户上传内容、账号信息、声音样本或其他可能识别到个人的信息，还要另行检查数据来源、处理目的、处理方式、保存期限、保护措施、委托处理、共同处理、向第三方提供和跨境或重要数据风险。著作权授权链闭合，不等于数据安全和个人信息处理也自动闭合。

企业可以把本轮检查落成七类证据：素材来源台账、权利主体清单、授权文件和平台规则版本、AI 训练用途条款、供应商权利保证和删除承诺、输出成果归属约定、争议处理和留痕记录。缺少其中任何一类，都不建议把 YouTube 上传、音乐素材、创作资产或客户交付文件直接投入 AI 训练链。

这张检查清单的价值，不在于对某个海外争议下结论，而在于把企业内部的 AI 训练材料摄入从“能不能抓、能不能导入”改成“来源能否证明、授权能否覆盖、合同能否分配、证据能否留住”。这才是 AI 训练素材授权链的第一道合规门槛。

Google Lyria 与 YouTube 上传内容争议：AI训练素材授权链先查什么

参考资料