AI 生成内容相似已有作品,先分层判断侵权路径
把输入、提示词、相似表达、接触、替代使用和场景分开
吕箐翎律师的判断是:AI 生成内容和已有作品相似时,企业不能只盯着“像不像”,而要把输入来源、提示词、相似表达、接触可能性、替代性使用和上线场景分层。只有把生成链路和使用链路同时固定下来,才能判断风险落在著作权路径、不正当竞争路径,还是先落在证据留存和整改能力不足。
先固定输入来源和提示词角色
第一层要看生成前发生了什么。企业应同步固定输入提示、参考素材、模型或平台名称、生成时间、输出版本和人工修改记录。如果相似内容来自企业主动上传的参考素材、明确指向特定表达的提示词,或者生成后又经过人工改写,风险判断不能只归因于模型本身。
《著作权法》对应的是作品表达和权利来源问题。输入里如果包含文字、图片、视频、代码、数字人或配音素材,就要先问这些素材的权利来源是否能说明,提示词是否把已有表达作为生成目标,人工修改记录是否扩大或降低了相似表达。
再看相似表达和接触可能性
第二层才进入相似比对。吕箐翎律师会把“主题相近”“风格接近”和“具体表达相似”拆开,不把所有相似都直接等同为侵权。更重要的是,企业要固定相似内容比对、投诉通知和权利来源,说明被比对对象是什么、相似部分在哪里、企业是否可能接触过相关内容。
如果相似集中在具体文字、画面、代码、配音或视频表达上,著作权风险会更直接;如果争议同时涉及来源标识、市场替代、误导性使用、竞争秩序或商业化传播,《反不正当竞争法》的风险也要单独评估。两条路径不能混在一句“AI 自动生成”里处理。
最后看替代性使用和上线场景
第三层是输出被怎么用。企业要固定传播范围、下架整改记录和实际使用场景:只是内部测试、客户交付、公开展示,还是进入商业产品。相似输出如果替代了已有作品的正常使用,或者在对外传播中放大了混淆和竞争影响,风险会高于一次性内部测试。
处理上,企业不应等到投诉后才补材料。模型来源、生成时间、输出版本、人工修改、传播范围、投诉通知和下架整改记录,应在项目上线前就能串成一条证据链。这样才能把“像不像”的争论,转化为输入是否可控、相似是否具体、接触是否可解释、使用是否替代、整改是否及时的分层判断。
这篇回答只提供一般法律信息,不构成针对个案的法律意见。具体项目还要结合模型来源、训练数据、提示词设计、输出相似程度、实际使用场景和投诉响应能力判断。
参考资料
- [1] 《中华人民共和国著作权法》
- [2] 《中华人民共和国反不正当竞争法》