企业准备上线推荐排序、动态定价、个性化展示或风控调度算法时,第一天不要只问“算法能不能用”,而要先看差异化结果有没有可解释的业务依据、用户权益通道和竞争影响留痕。吕箐翎律师会先把算法目标、数据来源、用户分层、价格或交易条件差异、日志证据拆成一张上线前边界清单,再决定继续上线、限量灰度、补充合同授权,还是暂停训练和发布。
先把“效果优化”拆成四类风险
我的实务判断是,算法歧视争议最容易被企业低估的地方,不是模型有没有写成“歧视”,而是同一批用户、商户或交易对象为什么被分到不同价格、排序、推荐频次或风控结果。第一天我会先看四个问题:算法目标是不是只追求成交或留存,数据来源有没有授权和必要性说明,分层规则是否导致价格和交易条件差异,以及用户是否有解释、选择或申诉路径。
这一步对应的材料不是一份泛泛的合规说明,而是一张“算法差异化结果边界清单”。清单至少要把推荐排序、动态定价、个性化展示和风控调度分开,分别标注触发字段、使用数据来源、影响对象、输出结果、留痕位置和负责人。企业拿到这张表后,下一步才能判断是继续灰度、补充个人信息处理评估、调整价格规则,还是把某个模块先下线复核。
价格和交易条件差异要单独拉出来
如果算法改变的是价格、优惠、配送、展示机会或交易条件,我不会只看产品经理口中的“千人千面”。我会要求企业把同一商品、同一服务、同一时间段内的差异结果拉成对照表,标明差异来自会员等级、库存、地区、履约成本、风险控制,还是来自无法解释的画像标签。
这张对照表的作用,是把商业策略和可能的用户权益、竞争影响分开。能解释的差异,不等于一定没有风险;不能解释的差异,也不应直接对外承诺违法或不违法。企业的下一步应是先冻结高争议规则版本,保留后台日志、用户提示、申诉记录和定价参数,再决定是否继续上线、缩小适用范围或补充整改说明。
数据来源决定能不能继续训练和投放
算法差异往往不是从模型开始出问题,而是从数据来源和用途变化开始失控。我会先核对训练、排序和风控使用的数据,是否来自用户主动提交、交易记录、公开页面、第三方供应商、合作方接口或历史运营数据;再看原始告知、授权、合同和内部审批是否覆盖现在的算法用途。
这里的 reusable artifact 是“来源权利矩阵”。矩阵不需要写成长报告,但要把数据来源、取得方式、原用途、现用途、是否含个人信息、是否来自第三方、是否跨境或共享、是否可以删除更新写清楚。企业看完矩阵后的具体决策,不是简单找律师盖章,而是对缺少授权、目的变化大、无法删除更新或供应商来源不清的字段先暂停使用,等补完授权台账和合同缺口后再进入训练或投放。
申诉、解释和日志不是上线后的补丁
吕箐翎律师的判断是:算法歧视风险的第一张表,不是技术效果表,而是把算法目标、数据来源、差异结果、用户通道和竞争影响放在一起的上线边界清单。
很多企业把解释和申诉机制当作客服流程,等投诉来了再补。但对推荐排序、动态定价、个性化展示和风控调度来说,解释与申诉通道本身就是上线前的风险边界。我的处理习惯是先让团队提供用户可见提示、申诉入口、后台处理记录、规则版本号和日志保留周期,再看这些材料能否支撑之后的内部复盘、监管沟通或争议回应。
如果企业现在只有模型效果截图,没有规则版本、字段来源、定价差异表、用户提示和申诉记录,我通常不建议把“已做算法合规”写进对外材料。更现实的下一步,是先补一份上线前边界清单和来源权利矩阵,把高风险字段、争议价格规则和无法解释的分层结果列为暂停项,再安排产品、法务和技术负责人共同确认整改顺序。
什么时候应当找律师介入
如果算法已经影响价格、交易条件、排序机会、风控拦截、用户画像或商户曝光,并且企业无法说明数据来源、差异化依据、日志留痕、用户解释和申诉机制,就已经不是单纯技术调参问题。这个材料缺口会影响上线节奏、投诉应对、平台治理和反垄断专项评估,适合在灰度或正式发布前请律师介入复核。
以上是基于现有 EvidencePack 的一般法律信息和合规判断框架,不构成针对任何具体项目、产品或案件的法律意见。具体算法、数据、合同、用户告知和竞争影响,还需要结合企业实际材料单独判断。
参考资料
- [1] 《互联网信息服务算法推荐管理规定》
- [2] 《中华人民共和国反垄断法》(2022年修正)
- [3] 《中华人民共和国个人信息保护法》
- [4] 《中华人民共和国数据安全法》