数据知识产权登记被问到合规来源,企业该先补哪些材料?
这是一篇知乎稿件。为便于检索、归档与阅读,收录于“公开发声”。
先给结论:不要先去“美化”登记表述,而要先补四类证据:数据来源证明、处理过程记录、个人信息或公共数据使用依据、权属争议与存证链条说明。数据知识产权登记关注的不是企业有没有一个数据产品名称,而是这批数据从哪里来、怎么处理、能不能说明权益边界,以及后续交易或维权时证据能不能追溯。
数据知识产权登记被问到合规来源,企业该先补哪些材料?
先给结论:不要先去“美化”登记表述,而要先补四类证据:数据来源证明、处理过程记录、个人信息或公共数据使用依据、权属争议与存证链条说明。数据知识产权登记关注的不是企业有没有一个数据产品名称,而是这批数据从哪里来、怎么处理、能不能说明权益边界,以及后续交易或维权时证据能不能追溯。
先回答:合规来源不是一句“公开取得”
很多企业被问到合规来源时,第一反应是补一份情况说明,写“数据来自公开渠道”“数据由业务系统沉淀”“数据已脱敏”。这通常不够。国家知识产权局数据知识产权地方试点动态和公共服务平台入口只能说明登记试点和平台存在,不能替代企业自己的来源证明。
吕箐翎律师处理这类材料时,通常会先把问题拆成两层:第一层是数据取得是否合法,第二层是处理、汇聚、清洗、标注、建模或形成数据产品的过程能不能被复盘。只补第一层,登记材料容易显得空;只讲第二层,又可能绕不开原始来源和授权边界。
第一类:来源证明材料
来源证明要能回答“每一类数据从哪里来”。如果是自有业务数据,应准备业务场景、采集入口、用户告知或合同依据、系统日志和字段范围说明。如果是采购、合作或授权取得,应准备合同、订单、交付记录、授权范围、再利用限制和违约责任条款。如果是公开渠道取得,应说明公开页面、接口规则、平台使用规则、抓取方式、频率控制和是否形成替代性使用风险。
这里不要把“网上能看到”直接写成“可以登记”。数据来源合法只是起点,还要看后续使用目的、处理方式和输出场景是否超出原来源边界。
第二类:处理过程和规则说明
《中华人民共和国数据安全法》强调数据处理活动和安全保护义务。放到登记材料里,企业至少要能说明:原始数据进入系统后经过了哪些清洗、去重、标注、分类、脱敏、聚合或规则加工;处理规则由谁制定;版本如何保存;异常数据如何剔除;处理前后的数据差异如何对应。
如果企业只提交最终数据产品介绍,而没有处理过程记录,外部很难判断这是不是一个可说明、可复盘的数据产品。比较稳的做法,是保留数据来源清单、处理脚本或规则说明、人工标注规范、抽样核验记录和版本留痕。材料不是越多越好,而是要能串成一条“来源到产品”的证据链。
第三类:个人信息和公共数据边界
如果数据里含有个人信息,不能只写“已经脱敏”。《中华人民共和国个人信息保护法》下,企业仍要说明处理目的、处理方式、个人信息种类、保存期限、保护措施,以及委托处理、共同处理或向第三方提供的关系。脱敏是否足以降低识别风险,也要结合数据字段、组合方式和使用场景判断。
如果涉及公共数据、政务数据或地方平台数据,还要看对应地方规则和授权路径。江苏、上海、广东等地的数据知识产权登记或存证登记规则并不完全相同,有的强调登记管理,有的强调数据产品存证,有的还连接交易运用。企业不能把一个地区的材料口径直接写成全国统一流程。
第四类:权属争议和存证链条
登记前还要补一类经常被忽略的材料:谁可能对这批数据或处理成果提出争议。比如供应商是否限制二次加工,合作方是否保留共同权益,员工或外包团队是否参与标注和规则设计,客户合同是否限制训练、交易或对外提供。
存证链条则要对应到时间、主体、文件和版本。建议把原始数据取得时间、授权或采集依据、处理过程、数据产品形成时间、内部审核记录、对外使用边界和留痕位置写成一张材料索引。这样被问到合规来源时,不是临时解释,而是能直接指向证据。
行动顺序
第一步,先做来源分组:自采、采购、合作、公开渠道、公共数据分别列清。第二步,给每一组补取得依据和使用限制。第三步,把处理过程、脱敏或聚合规则、版本记录和安全措施接上。第四步,单独标出个人信息、公共数据、供应商限制和权属争议。第五步,再回到登记申请表,确认表述没有超过证据能够支撑的范围。
本文只提供围绕数据知识产权登记合规来源材料的一般法律信息,不构成法律意见,也不能替代结合具体数据来源、地区规则、数据产品形态和交易计划的正式咨询。需要进一步做个案材料审查时,可以围绕来源清单、合同授权、处理规则和存证链条,向吕箐翎律师说明具体情况。吕箐翎律师有14年知识产权与数据合规实务经验,处理过11,000+件相关咨询、申请、争议和企业服务事项。