党的十八大以来,习近平总书记多次就数字中国建设作出重要论述,党的二十大报告亦指出要加快建设数字中国,2024年国务院政府工作报告中也提出要深入推进数字经济创新发展。人工智能作为数字中国建设、数字经济发展的重要组成部分,已经成为新一代产业变革的重要力量。算法、数据和算力是人工智能的三大要素,凡有人工智能应用的地方就有算法,智能手机、网络搜索、个人征信评估、人脸识别,甚至我们利用计算机编辑文字等等,都离不开算法。随着算法应用领域的不断拓展,基于算法应用的新模式、新业态不断涌现,算法在给我们生活带来巨大便利的同时,也带来了众多社会治理的新问题,如侵犯隐私权、大数据杀熟、算法歧视、信息茧房等。在著作权法领域,因算法推荐技术的使用而引发的著作权侵权问题成为了近年来的热点问题。“全国首例算法推荐案”也即北京爱奇艺科技有限公司诉北京字节跳动科技有限公司侵害作品信息网络传播权纠纷案,引发了学界关于算法推荐与网络服务提供者侵权认定规则的争鸣。此后,各地法院陆续审理了多起涉及算法推荐服务提供者侵权认定的案件,各个案件涉及的算法应用场景不尽相同,如何准确构建算法推荐服务提供者的注意义务成为该类案件的争议焦点和审理难点。上海知识产权法院于2023年审理了优酷信息技术(北京)有限公司诉上海喜马拉雅科技有限公司、喜大(上海)网络科技有限公司侵害作品信息网络传播权纠纷案,其中涉及算法推荐能否适用人工推荐规则、能否因算法推荐内容涉及侵权而推定网络服务提供者存在主观过错、举证责任分担等前沿热点问题。本文旨在前述案件审理的基础上,拟从算法推荐技术出发,对算法推荐服务提供者注意义务的系统构建作一些初步探讨,希望能为相关争议提供有益的解决进路。
(一)算法推荐服务的法律定性
首先,算法推荐服务属于网络服务提供行为。目前各平台企业提供的网络服务往往融合了内容服务和多样化技术服务,对于服务类型日趋高度集成的网络平台,难以从整体上界定其属于哪一类网络服务提供者。然从我国立法沿革来看,《信息网络传播权民事纠纷规定》已不再区分具体网络服务类型,而统称为网络服务提供者。在该规定中,对于网络服务提供者的区分仅在于是否实施了作品提供行为,并明确作品提供行为认定采用服务器标准,针对的是作品在网络中的初始传播行为,实施作品提供行为的属于提供内容服务,其他则属于提供网络服务。算法推荐服务提供者通过算法推荐技术向用户提供信息,一定程度上的确改变了内容分发的方式,然该信息仍然来源于其网络用户上传的内容,算法推荐服务提供者并未实施作品提供行为,未导致作品在网络中的初始传播,在现有法律框架下仍然属于网络服务提供者范畴。如认定算法推荐服务属于作品提供行为,算法推荐服务提供者属于内容服务提供者,将导致算法推荐服务提供者对所有推荐内容承担主动审核义务,如推荐内容涉嫌侵权,算法推荐服务提供者构成对信息网络传播权的直接侵权,将极大增加网络服务提供者的的侵权风险,可能直接影响算法技术的发展甚至互联网产业的发展。从比较法角度来看,亦应认定算法推荐服务属于网络服务提供行为。美国版权局展开为时5年的全盘调研后认为,对于“通知—删除”规则与“避风港”规则施行至今产生的失衡状态不需大幅修改法律,这套机制的基本概念、根基与主轴并没有什么真正的大问题。欧盟2019年的《数字单一市场著作权指令》对线上内容分享服务提供者规定了较高的义务,纵使线上内容分享服务提供者本身并未直接参与对特定作品的上传或转发,仍视为从事了信息网络传播行为。对此,有观点认为,只有如欧盟一般缺乏全球顶级互联网企业的地域,才会出现《数字单一市场著作权指令》那样对网络服务提供者“极不友好”的立法选择。相比之下,互联网产业和传统版权产业同样发达的美国,增加和提高互联网产业相关义务的法律,则纷纷“夭折”。可见,对于网络服务提供者的规制路径选择应当基于本国产业发展现状、符合本国产业发展需求。如前所述,在我国大力推进平台经济发展且已经形成一定数量国际领先平台企业的情况下,对于网络服务提供者的角色定位不宜简单借鉴欧盟《数字单一市场著作权指令》,而应坚持网络服务提供者的定位,为创新发展留足空间。
其次,算法推荐区别于人工推荐。以今日头条所公开的算法推荐原理为基础,算法推荐涉及的环节包括内容搜集、内容分析(内容分类和标签提取)、内容审核、用户标签提取(身份特征、行为特征和兴趣特征)、内容推荐、内容复审。可见,算法推荐的本质是特征标签匹配,并不涉及内容的具体识别和判断。《信息网络传播权民事纠纷规定》中明确,网络服务提供者是否构成应知的考虑因素中包含网络服务提供者是否主动对作品、表演、录音录像制品进行了选择、编辑、修改、推荐等。从条文内容来看,该推荐并未区分人工推荐和算法推荐。然从立法背景来看,当时算法推荐并未产生和应用,条文系基于司法实践中的常见问题进行归纳总结,很难认为其包含了算法推荐。从条文体系解释以及原理解释来看,此系根据网络用户侵害信息网络传播权的具体事实是否明显认定网络服务提供者是否构成应知,该条款的推荐行为作为应知的考量因素应落脚于网络服务提供者对于网络用户具体侵权内容的认知可能,基于对特定内容的主动选择和推荐可以推定对该特定内容存在认知可能。算法推荐适用于网络平台中的所有内容,推荐内容受用户历史选择信息的变化而变化,也受平台其他用户上传内容的变化而变化,虽然网络服务提供者对于算法的选择具有主动性,但推荐过程并不涉及内容识别,该种对于内容分发的概括干预与具体侵权内容的认知判断并不具有相关性,因此不能认定算法推荐等同于人工推荐,不能因算法推荐内容涉嫌侵权而推定算法推荐服务提供者应当能够注意到该侵权事实的存在,并进而以此作为过错认定的重要考量因素。
(二)算法推荐服务提供者的注意义务内涵
有观点认为,基于平台私权力理论、危险控制力理论和最小防范成本理论,算法推荐服务提供者应承担较高注意义务。的确,网络服务提供者的注意义务应当随着信息管理能力、所属行业技术发展情况的变化而不断调整。算法推荐技术是技术革新的产物,网络服务提供者对于算法推荐技术的采用一定程度上的确反映了网络服务提供者信息管理能力的提升,但该技术对注意义务产生何种影响仍应基于技术本身的特性而定。
1.算法过滤义务
有观点认为,算法推荐平台既可用算法来推荐网络内容,也可以用算法来监测、筛查侵权内容。事实上,基于行政监管要求,网络服务提供者对于平台黄赌毒信息均会采取过滤措施,对于国家版权局发布的重点作品预警名单亦会采取过滤措施,可见在技术上存在算法过滤的可行性。对于受著作权保护作品的过滤机制构建,一方面需要著作权人与网络服务提供者合作建立比对指纹库,另一方面也对算法过滤的准确性提出更高要求。然实践中,目前比对指纹库的建立在我国仍存在较大障碍,算法过滤对于合理使用的判断也还存在较大程度的局限性,故对于用户上传的受著作权保护的作品进行事先过滤在当前并不具有可行性。也有观点认为,对于有一定知名度的作品,算法推荐服务提供者应当进行关键词过滤。然知名度判断本身极具主观性,且当前网络内容创造亦处于爆发期,涉及不同领域不同种类的大量作品,要求网络服务提供者对于所有内容进行排查筛选出具有知名度的作品进行过滤并不具有可行性;相反,著作权人更加了解自身作品,算法技术的推广亦可以作为权利人排查网络侵权的有效手段;在法律已通过“通知—删除”规则合理分配侵权发现成本的基础上,仍要求算法推荐服务提供者对所有知名度作品主动采取过滤措施缺乏依据。但当网络平台收到权利人的侵权通知、侵权预警函或者法院涉诉材料后,对于这些通知、预警函、涉诉材料中所特定化的作品,网络服务提供者不再存在大量的侵权发现成本障碍,从现有技术发展情况来看,网络服务提供者可以也应当采取合理的过滤措施,如设置黑名单词库,在算法推荐过程中增加撞库步骤,避免与黑名单词库相匹配的内容再次进入推荐环节。也即算法技术的普遍采用,反映了网络服务提供者信息管理能力的提升,同时也赋予传统“通知—删除”规则新的内涵。在北京爱奇艺科技有限公司诉北京字节跳动科技有限公司侵害作品信息网络传播权纠纷案中,北京字节跳动科技有限公司收到北京爱奇艺科技有限公司的律师函后开始主动采取版权管理措施,然公证取证的1314条侵权短视频中的大部分都是在版权管理措施采取日期之后新增,单日侵权短视频新增数量的峰值、单条侵权短视频在上传次日获得超百万播放量亦出现在版权管理措施采取日期之后。法院认为,即使通过算法推荐识别短视频具体内容不具有技术可行性,但对于允许哪些短视频进入被算法推荐的范围,如何设置和优化算法推荐的具体应用方式,以及如何将已经进入推荐范围的侵权短视频纳入复审环节以避免其被大范围、长时间地传播等方面,字节公司仍可以通过在其服务和运营的相应环节施以必要的注意、采取必要的措施加以完善,本案中字节公司所采取的措施并未能在实质上取得制止、预防明显侵权的效果。该案判决实质上亦已体现了特定情形下算法过滤义务的要求,对于已经特定化的作品,算法推荐服务提供者应当采取合理必要措施避免再次进入推荐范围。
2.算法修正义务
算法推荐服务提供者应当定期审核是否存在算法风险并针对可能的算法风险予以修正。从拟解决问题的转化、数据的收集到模型的完善与评估,算法设计者的主观评断决定着输入变量、结果变量、数据的收集范围、数据特征的选择,其个人主观色彩随之融入模型;草率选择数据、不完整、不正确、过时的数据、选择偏差等也将造成算法偏见;人工智能技术的目标是实现机器智能化,能从实例中不断汲取有益因素完善模型,在模型应用阶段,模型可能会因新数据所富集的偏见而异化为问题算法。因此,算法技术本身并非无懈可击,算法设计者有意或无意间的主观价值判断可能导致算法模型本身存在风险,后续使用过程中的数据偏差也可能导致算法异化,算法风险具有存在可能。而算法作为技术,本身并非一成不变,具有技术上的修正和完善可行性。算法推荐服务提供者作为算法技术的使用方,虽然并不要求其在技术采用之初即采取相应的侵权预防措施,以避免对新技术发展苛以过高法律义务导致对于技术本身的实质否定评价,但其在算法推荐技术的运行过程中,应当定期审核、评估是否存在算法风险并采取可能的修正措施。《管理规定》第8条和第10条亦指出,算法推荐服务提供者应当定期审核、评估、验证算法机制机理、模型、数据和应用结果等,不得设置诱导用户沉迷、过度消费等违反法律法规或者违背伦理道德的算法模型;应当加强用户模型和用户标签管理,完善记入用户模型的兴趣点规则和用户标签管理规则,不得将违法和不良信息关键词记入用户兴趣点或者作为用户标签并据以推送信息。与网络著作权相关,在算法模型设计过程中是否加入了推荐侵权内容的指令,是否将违法关键词记入用户兴趣点或者作为用户标签并据以推送信息,是否可能被用于存在较高著作权侵权风险内容的推送等,均是算法推荐技术运行过程中算法推荐服务提供者应当予以持续关注的问题,应当结合算法推荐技术的使用效果进行持续评估。尤其在特定算法推荐系统已经引发著作权侵权事实的基础上,算法推荐服务提供者更应当对其所使用的算法推荐技术进行评估,采取技术上可行的模型修正方式,或者采取其他预防侵权的合理措施,否则将可能被认定为未尽到合理注意义务而构成帮助侵权。在深圳市腾讯计算机系统有限公司、杭州腾讯魔乐软件有限公司诉北京微播视界科技有限公司侵害作品信息网络传播权纠纷案中,法院认为,被诉“抖音智能搜索聚合”功能系根据标签、标题相似度、发布者等因素而进行的快速聚合和更智能的搜索,系一种自动聚合排列,区别于其他搜索功能结构化的算法推荐类型;该聚合是抖音平台自动创建的内容合集,体现了其将类似内容整合提供的目的,并非基于用户的行为而发生的。当算法推荐的内容呈现效果反映了平台主动而为、基于平台特定功能而进行的推荐、并不单纯依赖于用户习惯时,应当认定为平台运用的算法推荐对于内容呈现起到了实质作用,反映到侵权结果内容的传播时,实质起到了整理、推荐等帮助性质的作用。该案判决实质上系对特定算法推荐模型的评价,如算法推荐模型旨在实现的效果除一般特征标签匹配外还涉及信息内容的整合、以特定方式对信息内容予以呈现,体现了算法设计者本身对于内容信息传递方式的选择,则对该模型的使用不仅是简单的技术使用行为,应当结合其具体使用目的、使用方式、使用效果进行综合评价,在此情况下,算法推荐服务提供者应当承担更高的注意义务。
3.算法解释义务
算法一直因其黑箱状态为人所诟病,算法解释也被视为打开算法黑箱、提高算法透明的最直接有效方式。《管理规定》第16条即规定了算法披露要求,算法推荐服务提供者应当以显著方式告知用户其提供算法推荐服务的情况,并以适当方式公示算法推荐服务的基本原理、目的意图和主要运行机制等。司法实践中,算法解释主要涉及举证责任分担问题以及解释程度问题。
关于举证责任分担。涉算法推荐网络著作权侵权纠纷中举证责任的争议主要源于算法黑箱的存在及算法技术的专业性,被侵权人无法进行有效举证的探讨。然随着我国互联网产业规模的突飞猛进,新兴互联网产业与传统版权产业不再泾渭分明,一些拥有市场支配地位的互联网产业开始往上游发展,逐步从传播领域延伸到内容生产领域,开始以内容提供者的身份来要求更为严格的网络服务提供者共同侵权认定标准。反映在司法实践中,大量网络著作权侵权纠纷案件的权利人是具有一定影响力的互联网企业,其本身也是算法推荐技术的使用方。在此情况下,被侵权人对于算法推荐技术具有一定程度甚至是相当程度的了解,对于算法推荐技术存在的风险也具有一定的举证能力,并不存在被侵权人普遍举证不能的情况。在法律未就算法推荐案件规定举证责任倒置的情况下,仍应适用民事诉讼谁主张谁举证的基本原则。原告如果认为被告公示或者陈述的算法推荐基本原理、目的意图、主要运行机制与事实不符,或者认为算法推荐系统存在设计上的瑕疵,应当对其主张承担初步举证责任。只有在原告已经尽到初步举证责任的情况下,才涉及法院根据当事人的主张及待证事实、当事人的证据持有情况、举证能力等因素判断是否适用举证责任转移。在复杂案件审理过程中,根据事实查明情况,往往还涉及举证责任在当事人间的多次转移。在优酷信息技术(北京)有限公司诉上海喜马拉雅科技有限公司、喜大(上海)网络科技有限公司侵害作品信息网络传播权纠纷案中,法院认为,上海喜马拉雅科技有限公司主张本案系其平台因大数据算法推荐内容涉嫌侵权被诉至法院的第一起案件,在案证据显示上海喜马拉雅科技有限公司采用算法推荐技术进行个性化推送和通用榜单排序,并无证据显示将该技术使用于存在较高著作权侵权风险内容的推送,尚不足以认定未尽到与其信息管理能力相应的注意义务。该案判决实质认为,在原告未提供初步证据证明涉案算法推荐技术存在设计问题的情况下,被告作为技术的使用方,并不需要承担自证技术不存在问题的举证责任,亦无需自证已经采取了与该技术匹配的侵权预防措施。
关于解释程度问题。算法内部信息包括代码、公式、参数等,代码层面的算法透明最显而易见的阻力来自商业秘密。有观点认为,算法解释并不要求算法使用者将算法的所有技术细节全部告知算法相对人,而是以算法相对人可理解为限。从目前立法来看,算法可以作为商业秘密予以保护,如《最高人民法院关于审理侵犯商业秘密民事案件适用法律若干问题的规定》中明确算法可以认定为商业秘密中的技术信息,然少有在立法中支持商业秘密不能对抗算法披露要求或者司法实践中支持披露深度算法的案例。在Viacom诉YouTube侵犯版权案中,法院驳回了原告要求被告披露源代码的请求,认为被告源代码之上的秘密具有巨大的商业价值,他人获取代码会得到程序的基本设计框架,可以在没有研发投入的情况下编写出相似软件,对谷歌产生竞争损害。在凌某某诉北京微播视界科技有限公司隐私权、个人信息权益网络侵权责任纠纷案中,北京互联网法院认为,算法确实会涉及被告的商业秘密,告知和公开算法不属于对原告的个人信息进行保护的必要措施。网络著作权侵权纠纷中,同样亦涉及算法解释要求与商业秘密保护的平衡。一般而言,算法推荐服务提供者的算法解释应遵循适度原则和比例原则,解释的目的旨在有效回应案件所反映的算法风险及其产生的原因、是否存在避免可能等,而非要求披露算法的全部内容。解释的方式可以是运行原理、参数设置、权重系数等的介绍,也可以包含演算验证,如通过输入变量的选择,对比实际输出结果与理论结果是否一致,以此来验证所披露的运行原理、参数设置、权重系统等是否准确,解释过程中也可以借助专家辅助人的参与论证。
算法推荐技术是数字经济时代不可逆转的发展方向,如何科学合理规制算法推荐技术的应用是当前的重要课题。在促进平台经济规范健康发展的背景下,需要肯定算法推荐技术中立性的价值,也要避免算法推荐技术的不当使用而侵害其他权利类型。对算法推荐服务提供者的责任规制,应当立足算法推荐技术本身,合理设定与算法推荐服务提供者信息管理能力相适应的注意义务,引导算法推荐服务提供者合理设定、修正算法模型,积极采取预防侵权的措施,推动算法向上向善,促进数字经济健康发展。