《政法论坛》网络首发 || 徐俊:互联网平台算法推荐的版权侵权责任研究

学术   社会   2024-11-01 09:02   北京  
点击上方“政法论坛”关注我们
转载时烦请注明“转自政法论坛公众号”字样
《政法论坛》编辑部首发

编者按




为了切实落实中共中央宣传部等部门《关于推动学术期刊繁荣发展的意见》,创新期刊传播形式和方法手段,有效发挥期刊在学术质量等方面的引领作用,加快融合发展、提升国内国际传播能力,推动学术期刊在数字经济时代的转型升级,《政法论坛》秉持创新发展与严格把关并重的原则,探索实施网络首发制度,从2022年第1期于中国知网陆续推出网络首发文章,并于政法论坛微信公众号同步推出,敬请关注!



互联网平台算法推荐的版权侵权责任研究


徐俊  上海市高级人民法院知识产权审判庭副庭长


本文将发表于《政法论坛》2024年第6期


摘要:尽管算法推荐技术在互联网平台得到广泛应用并受到业界普遍认同,但基于该项技术应用的版权侵权责任承担却引发了较大争议。本文提出对上述争议的解决,需要将平台责任的法律逻辑作为大前提,将算法推荐的技术逻辑和商业实践作为小前提,在场景类型化的基础上根据逻辑三段论推导得出平台是否承担版权侵权责任的结论。算法推荐的主流技术标准客观可量化,互联网平台在算法纯粹输出场景下无需承担概括性的注意义务,同时应当在算法流量倾斜场景下承担更高的注意义务。


关键词互联网平台;算法推荐;版权侵权责任;算法治理




目录

一、问题的提出:面向平台治理的算法推荐版权责任制度设计
二、互联网平台版权侵权责任判定的法律逻辑
三、互联网平台算法推荐的技术逻辑
四、互联网平台算法纯粹输出场景的版权侵权责任
五、互联网平台算法流量倾斜场景的版权侵权责任
结语


一、问题的提出:面向平台治理的算法推荐版权责任制度设计

算法推荐是人类进入互联网时代后为解决信息过载问题的重要发明。在信息过载的背景之下,信息生产者希望让自己的产品脱颖而出并受到用户关注,信息消费者希望从海量信息中迅速定位自己感兴趣的内容并作出选择。为了有效回应这对相向而行的市场需求,算法推荐系统应运而生。

在当前算法推荐通过互联网平台大规模介入人类生活决策的背景下,平台经济中的算法推荐无处不在,算法推荐已经成为当前互联网平台最为常见的一种智能产品形式。不论是电商平台、电影、视频网站、音乐网络电台,还是个性化阅读工具都在通过算法推荐向用户提供内容丰富的各类产品。著名的电子商务网站亚马逊(Amazon)30%左右的销售来自于推荐系统,该网站宣称亚马逊相对于其他电子商务网站最大的优势就在于个性化推荐系统。美国最大的视频网站油管(YouTube)曾通过实验表明个性化推荐的点击率甚至是热门视频点击率的两倍。许多网站平台在应用算法推荐系统的同时,往往还通过搜索和分类目录为用户提供信息,算法推荐系统只是作为平台的一项应用存在其中。在有的网站平台如个性化音乐网络电台中,因音乐的独特性,用户对音乐的选择受心情和情境的影响大,音乐分享的社会属性强,算法推荐系统甚至可以独立支持平台向用户提供服务,像潘多拉Pandora、Last.fm以及豆瓣FM都属于此类情形。

尽管算法推荐技术在互联网平台得到广泛应用,受到业界普遍认同,但基于该项技术应用引发的版权侵权责任承担却引发了较大争议。一方面,有观点认为,若网络服务提供者运用算法,主动向用户推送内容链接或发布信息,则其应承担对所推送或发布内容的侵权注意义务。可从积极层面和消极层面分别考察算法推送的运作机制。“在积极层面上,其技术中立之表象难掩主动推荐之实质;在消极层面上,算法推送结果出现侵权内容构成网络平台对较高注意义务的违反。”具体而言,即使是基于算法在人工没有干预的情况下完成的信息推送,也不能以“技术中立”为由豁免其法律后果,更不能仅因是机器而非人工提供信息使平台免责。平台利用算法向用户“主动推荐”个性化、精准匹配的内容,符合《最高人民法院关于审理侵害信息网络传播权民事纠纷案件适用法律若干问题的规定》(以下简称《信息网络传播权司法解释》)第12条中“明知”“应知”的情形。

但与此相反,另一种观点则认为,“算法推荐技术本质上是一种信息推荐技术,具有实质性非侵权用途。短视频平台应用算法推荐技术不以推荐对象版权合法为前提,采用算法推荐技术并不必然导致平台对用户的侵权行为承担法律责任。”没有迹象表明,平台会因采用算法推荐用户内容而更容易识别出侵权行为,从而认定平台存在过错。既然内容筛选和推送由机器完成,那“算法推送”并不能等同于《信息网络传播权司法解释》中规定的“主动进行选择、编辑、推荐”或“设置榜单”等针对所有平台用户的行为。根据技术中立理论,若算法内并未嵌有指令或设定标准以筛选及推送涉嫌侵权的内容,那么网络服务提供商不应被视为应知,从而构成主观过错。义务分配应具合理性,否则那些采用更先进技术的网络服务提供者可能会因此承担更重的注意义务和法律责任。久而久之,平台可能越发排斥采取新兴技术,这更加破坏了相应的商业模式。

司法实务中的裁判观点差异也较大,北京法院和浙江法院观点截然相反。二审法院北京知产法院在审理广州荔支网络技术有限公司与捷成华视网聚(北京)文化传媒有限公司侵害“港囧”作品信息网络传播权纠纷一案时认为,涉案算法推荐行为实际上是向用户提供了信息流推荐服务。该行为一定程度上提高和扩大了侵权传播效率、侵权传播范围的风险,同时也为服务提供商本身带来了流量增长和市场竞争优势等利益。鉴于此,服务提供商理应对用户的涉嫌侵权行为负有更高的注意义务。然而,在深圳市腾讯计算机系统有限公司、杭州腾讯魔乐软件有限公司诉北京微播视界科技有限公司侵害“北上广依然相信爱情”作品信息网络传播权纠纷中,一审法院杭州互联网法院认为,算法推荐不具有实质性侵权用途,也非专门为了实施侵权行为,算法本身并不具有当然的可责性。早在2019年,浙江省高级人民法院民三庭发布的《涉电商平台知识产权案件审理指南》已经提出依据算法的“个性化推送”行为“一般不导致”平台的“注意义务的提高”。

尽管算法治理往往与现有的法律和监管框架相契合,但在某些情况下,算法的应用也可能需要对现行法律的适用性提出新的见解,进而推动监管创新,以实现更广泛的公共利益和监管目标。对于上述争议的解决,需要将平台责任的法律逻辑作为大前提,将算法推荐的技术逻辑和商业实践作为小前提,在场景类型化的基础上根据逻辑三段论推导得出平台是否承担侵权责任的结论。



二、互联网平台版权侵权责任判定的法律逻辑

在互联网平台经济的产业业态下,权利人发现平台存在用户上传侵犯其版权的视听文字内容后,要想追究这些人数众多又缺乏有效赔偿能力的上传者侵权责任,缺乏现实可操作性且不经济,所以往往选择起诉互联网平台方。算法推荐是互联网平台推送上传内容的技术手段,明确算法推荐的法律属性,并对互联网平台的权责义务进行合理分配,有助于维护作品传播与版权保护之间的利益平衡。

(一)互联网平台版权侵权责任判定的过错原则

2021年1月1日起施行的《中华人民共和国民法典》第1197条明确规定了网络服务提供者构成帮助侵权的主观过错要件。研究互联网平台算法推荐的版权侵权责任,应基于平台的算法推荐行为,讨论平台是否对上传者的直接侵权推波助澜,实施了帮助侵权。侵权法上,过错不仅是判定侵权赔偿责任的必要条件,也是构成帮助侵权所需。只有当网络服务提供者在提供网络服务时存在过错,才会被要求承担相应的法律责任。

《信息网络传播权司法解释》第8条第1款明确指出,法院应根据网络服务提供者的过错,确定其是否承担帮助侵权责任。而这种过错包括对网络用户版权直接侵权行为的明知或者应知。该条第2款明确网络服务提供者对用户的版权侵权行为没有主动审查义务,人民法院不能因为网络服务提供者没有履行主动审查义务而认定其具有过错。这将互联网平台从大量的事前审查工作中解放了出来,避免了巨额成本的支出,被认为符合互联网产业的经济规律。该条第3款进一步规定,网络服务提供者能够证明已采取合理、有效的技术措施,仍难以发现网络用户侵害信息网络传播权行为的,人民法院应认定其不具有过错。尽管该款是从免责角度作出的规定,但什么是合理、有效的技术措施值得关注。按照该款的表述,如果被认定为未采取合理、有效的技术措施来发现侵权内容的,则有可能被认定为具有过错。

明知可以通过权利人向网络服务提供者发出的适格通知作出判断。与明知的判断相比,应知相对难以有较客观化的标准。鉴于此,《信息网络传播权司法解释》第9条归纳了应知的考虑因素。这里的考虑因素因源于审判实践的总结与归纳,从而具有较强的指引性。然而,在实际适用中,并非所有的考虑因素都需机械地一一考量,而应根据个案的具体情况进行灵活判断。换言之,在特定情境下,只要满足部分甚至一个考虑因素,便足以认定网络服务提供者“应知”其用户的侵权行为。《信息网络传播权司法解释》第12条就信息存储空间服务的网络服务提供者对用户侵权“应知”列举了三种情形,这些都是注意义务的明文列举,违反这些注意义务就意味着过错的判定可能。司法实务中,注意义务实际发挥了支持过错判定的重要功能。平台是否构成帮助侵权的认定,很大程度上取决于其是否违反注意义务。

(二)互联网平台版权侵权责任判定的“避风港”规则

“避风港”规则源自美国1998年《千禧年数字版权法》(DMCA)。DMCA第512条(c)款第1项针对网络信息存储空间服务规定了避风港规则,以防法院不加区分地在网络版权案件中对提供者适用严格责任。该条阐明,当网络服务提供者因其执行用户指令而在其运营的网络系统中存储了侵权内容时,只有在满足一定条件的情况下,才能免除其赔偿责任。然而,DMCA在列举这些免责条件的同时,并未直接阐明其背后的法律逻辑。对此,美国国会众议院报告指出,“DMCA第512条,其目的并非在于暗示服务提供者在满足或不满足免责条件时,是否要作为侵权者来承担责任。相反地,这一免责条款的适用,是在服务提供者已经被现行法律认定为需要承担责任的情况下,才提供的一种豁免。”在美国版权法下,用户实施侵权行为的,网络服务提供者须承担严格责任。DMCA的立法者回避了网络服务提供者行为定性上的争议,采取了直接规定“免责条件”的实用主义立法进路。

有趣的是,我国2013年国务院颁布的《信息网络传播权保护条例》第22条也规定了5项针对网络存储服务提供者免除赔偿责任的条件。尽管该条规定参考移植了DMCA“避风港”规则,但我国民事立法和判例实践并未出现美国在网络服务提供者行为定性上的争议,与美国在间接侵权立法和司法实践中的传统存在较大差异,对该条的解读仍应基于我国民事侵权责任判定的既有法律逻辑。《信息网络传播权保护条例》第22条第(一)项关于“明确标示”和第(四)项关于“未直接获得经济利益”的规定属于注意义务范畴,与《信息网络传播权司法解释》第9条、第12条规定的其他各项考虑因素共同辅助侵权过错的判定;第(二)项关于“未改变”的规定属于直接侵权行为在责任豁免上的排除;第(三)项关于“知道”和第(五)项关于“通知删除”的规定则属于帮助侵权行为过错的直接判定。基于前述分析,该条五项规定中,第(二)(三)(五)项属于必须同时满足的条件,而第(一)(四)项则属于综合评估过错的因素。

上述法律、行政法规及司法解释的规定,表明我国在互联网平台作为网络服务提供商的版权侵权责任认定上,既没有完全采纳类似1998年DMCA规定的避风港规则,也没有像2019年欧盟《数字化单一市场版权指令》第17条那样,施加数字服务提供商在内容审查上的严格责任,而是坚持了我国民法上传统的过错责任归责原则。这种立法路径相对灵活,在确立总体原则的前提下将关于注意义务的具体处置权力或者说设立具体规则的权力交给了司法。然而,在对互联网平台版权侵权的过错分析和注意义务标准讨论中产生了较大分歧,这也是算法推荐技术应用引发的版权侵权责任承担存在较大争议的主要原因。这其中核心问题就在于互联网平台是否可以主张算法推荐技术应用的中立地位,以其存在实质性非侵权用途为由免除其注意义务。

(三)互联网平台版权侵权责任判定的“技术中立”抗辩

美国最高法院在1984年的索尼案中,首次确立了版权法领域内对产品提供者主观过错判断的“实质性非侵权用途”规则。该规则明确了只要产品具有一种实质性的非侵权用途,那么即便有人使用该产品进行侵权行为,也不能仅因此推定产品提供者有帮助他人侵权的主观过错。这一规则不仅为高科技产品的创新发展提供了法律保障,也有效消除了产品研发者和销售者在面对可能的帮助侵权责任时的顾虑。但问题是,高科技产品研发者和销售者作为被告时,往往会援引索尼案并提出“实质性非侵权用途”抗辩以豁免侵权责任。同时在司法实践中,法院往往适用“实质性非侵权用途”规则,认为如果一个产品具有多种用途,包括合法用途和非法用途,那么产品提供者不能仅因有人使用该产品进行侵权行为就被认定为有帮助他人侵权的意图。

然而,数字化浪潮使得索尼案所确立的“实质性非侵权用途”规则在政策和法律层面引发广泛争议。在2005年,即索尼案判决后的第21年,美国最高法院在Grokster案中对“实质性非侵权用途”规则进行了新的解释。法院认为,虽然索尼案确立了“实质性非侵权用途”规则,但这并不意味着在任何情况下都不能追究提供具有潜在侵权用途产品的责任。特别是证据显示涉嫌侵权的一方不仅明知其产品可能被用于侵权,且还通过言论或行为鼓励或引诱侵权时,就不能仅因为产品具有“实质性非侵权用途”而免除责任。法院的这一解释强调了责任应当基于故意和有过错的行为,这样才既不会损害合法的商业活动,也不会阻碍创新。

产品提供者并不能预料其使用的技术本身在未来是否合法。倘若仅凭产品和技术存在被用于侵权的可能性,便径行将侵权责任归咎于提供者,实属不公。我国司法中,“实质性非侵权用途”规则在协调技术创新与版权保护之间的冲突中发挥着至关重要的作用。该规则体现出的“技术中立”思想强调,法律应对各种技术手段一视同仁,不偏向或歧视任何特定技术。在实践中,技术中立思想的应用价值主要体现在可以帮助解决责任分配。例如,在数字版权立法中,有关责任豁免的避风港规则、对平台事前主动审查义务的免除以及合理有效的技术措施等在过错判定中的考量,都是技术中立思想的具体体现。在认定侵权责任时,须综合考虑侵权行为的构成要件,而非仅依赖“技术中立”作为抗辩事由。同样,单纯因为使用了某种产品或技术,也并不能直接推定提供者承担侵权责任。

技术进步总会打破原有的平衡机制,使利益的天平向使用者倾斜。立法者对传播技术与传播内容抱有高度期待,期望这两者能在公平基础上实现共赢。为此,法律需在其公正的天平上适时地调整砝码,以确保两者和谐发展。技术进步已显著提升平台识别及预防侵权行为的能力,这一事实不容忽视。随时代变迁,技术中立的概念及其适用范围亦应不断扩展与深化。鉴于互联网平台在规模与技术实力上的持续增长,以及信息与经验的日益积累,技术中立原则所倡导的技术与商业模式、设备与服务间的明确界限正逐渐模糊。伴随着技术的不断演进和应用场景的日益丰富,传统“避风港”规则在版权保护领域正面临着前所未有的挑战。这一规则原旨在为网络服务提供者提供一定程度的豁免权,以避免因其平台用户上传的侵权内容而承担法律责任。然而,这一规则的适用性和有效性逐渐受到质疑。若利用算法技术向用户主动推荐内容的互联网平台总是滥用规则规避其应尽的注意义务,那也是不合理的。但问题是,平台究竟应多大程度地发现侵权内容才能避免侵权责任,或应采取多少措施处理侵权内容,归根到底都是网络服务提供者对其用户上传的侵权内容负有何种程度的注意义务。然而,对这些问题的回答并没有简单明了或者整齐划一的答案。互联网平台提供网络服务的经营模式和技术逻辑存在差异,对网络存储服务提供者的过错归责应基于平台服务性质和产业特点慎重划定注意义务。



三、互联网平台算法推荐的技术逻辑

(一)算法推荐的基本原理

如前所述,算法推荐系统是一种高效的信息过滤工具,它能在不需要用户提供明确需求的情况下,主动推荐用户可能感兴趣的信息。该系统通过收集和分析用户的历史行为数据,如浏览记录、收藏点评等,建立用户的兴趣模型,并据此模型向用户推送符合其偏好的信息。从形式化的角度来看,算法推荐实际上是一个建模过程,即拟合一个用户对内容满意度的函数,该函数需要三个维度的变量,即内容、用户特征及环境特征。(1)内容。综合内容平台包含图文、用户生成的小视频等内容,每种内容有很多特征,需考虑怎样提取不同内容的特征进行推荐。这其中很重要的是热度特征,包括全局热度、分类热度、主题热度及关键词热度等,特别是在用户冷启动阶段,即用户没有先前使用历史可供参考时,内容热度信息显得尤为关键。此时,推荐系统可依据全局热度等特征,为用户推荐热门内容,以满足其初始需求。(2)用户特征。包括各种兴趣标签,职业、年龄、性别等,还有很多模型刻画出的隐性用户兴趣等。(3)环境特征。这是移动互联网时代推荐的特点,用户随时随地移动,在工作、通勤、旅游等不同的场景,伴随地理位置和时间变化,推荐信息会有所调整。

算法推荐系统的重要任务就是结合三方面的维度,评估内容属性与用户是否匹配,推测推荐内容在这一场景下对这一用户是否合适。这种匹配评估既包括显性匹配,如关键词匹配、主题匹配、分类匹配和来源匹配等,也包括通过计算用户向量与内容向量的距离从而给出结论的隐性匹配。同时,算法推荐系统也通过分析不同用户间相似性,如用户的点击目标、兴趣分类、主题偏好、兴趣词汇乃至向量相似度等多个层面的相似,在海量用户行为数据的基础上,通过用户或物品的数据协同从而实现精准推送。

当前最为主流的推荐算法大致可以分为两种情形:一是基于内容的推荐算法,二是基于协同的推荐算法。实践中还有许多基于这两种推荐算法的变种。由于各种推荐方法各有优缺点,所以在实际中经常被采用的方式是组合推荐,特别是前述基于内容和协同的推荐组合。

(二)算法推荐的流量倾斜

不论是基于内容的算法,还是基于协同的算法,都会推出排序列表,这是纯粹算法输出,我们称之为初始排序列表,这是纯粹技术决定的输出结果。然而,这个排序列表是可调整的。在网络平台设计推荐算法时,平台往往会基于对自身内容特色与运营方向的深刻理解,在算法中融入自身的价值取向与运营策略,进而构建出符合平台风格的推送模式。这一过程中,平台会明确内容分析与用户推荐所依据的关键指标及其权重。通过对初始排序列表进行再排序实现平台价值和偏好,这就是流量倾斜。

算法正通过个性化定制方式潜移默化地影响用户观念,而利用算法推荐技术的网络服务提供商可能会加剧市场竞争的不平等性,同时也对产品安全、消费者保护等标准提出挑战。纳入法律研究视野的平台算法既不是数据对象的运算和操作,也并非纯粹的人类决策行为。算法的核心特性体现在其与人类交互过程中的决策功能,故算法超越了单纯科学范畴或工具属性,蕴含了法律层面上的可规制性。可以认为,人们基于算法技术通过机器进行自动化决策或者辅助决策,尽管算法的实现过程有赖于机器的技术支撑,但算法的实现结果无疑受到操控者的干预或影响。与分类目录或设立榜单等服务模式不同,算法推荐系统对信息内容的分发推送基于算法技术类型和系统参数的设定,在算法应用平台的注意义务评估和过错判定上存在较大差异。有必要根据平台对算法操控的类型区分其注意义务,并在此基础上合理确定其版权侵权责任。

算法属性往往随应用场景改变而展现出差异性。因此,对算法实施规制时,需遵循场景化的规制策略,依据算法应用主体的多样性、目标对象的特异性以及所涉领域的广泛性,采取差异化的规制措施,以构建既可靠又负责任的算法体系。从互联网平台算法商业实践的情形来看,通过区分算法纯粹输出场景和算法流量倾斜场景等类型,在不同场景下研究侵权判定,可以更为合理地确定版权侵权责任。



四、互联网平台算法纯粹输出场景的版权侵权责任

无论是基于内容还是基于协同的推荐算法技术本身,内容的甄选及推送目标群体,均依据预设程序予以明确,而算法中融入的所有筛选准则,均确保为客观且可量化的标准,作为纯粹算法输出的初始排序列表,属于纯粹技术决定的输出结果。

(一)基于内容的推荐算法

这种推荐的机理在于对物品分类打标签,通过特征向量的内积运算,得出相似性结果,并据此基于用户过往浏览、购买记录或者用户其他特征推荐。基于内容的推荐算法基本思想是给用户推荐其喜欢的相似物品,而物品之间的相似度本质上就是计算特征向量之间的相似度。基于内容的推荐算法严重依赖于多属性分类的数据标注。标签数量越多,相似度计算越准确,内容推荐的结果越符合用户需求。

由此也可看出,推荐不是一成不变的,标签不同,推荐结果会有差异。关于标签标记的主体目前业界通常做法是人工加机器。平台用户量不大时,会用人工进行标记。若一个平台每天新增1万个视频数量,差不多10个人就可完成打标签的工作量。当这个数量呈几何级上升后,人工显然无法完成,这时就需要机器介入。平台会利用先前人工标签积累的核心数据通过机器学习实现推导迁移。

标签标记的方法对最终推荐的结果影响最为关键。一方面,对于物品标签先是利用物品本身随附的自然数据。商品推介、作品发行过程中必然带有文字内容的数据信息,通过计算机识别其中的关键词语。音频则通过语音智能转换技术识别转成文字,再通过文字提取。而视频标签相对较难,成本也更大,往往需要通过人脸识别技术,抠出人脸形成特征向量,通过特征向量表征图像信息。另一方面,对于用户标签,则可利用用户的网页浏览、搜索、购买记录来标注,其中的浏览记录包括收藏、点赞和转发等数据。当物品标签与用户特征相似时,算法推荐系统就会将这些相似的物品推送给用户。

(二)基于协同的推荐算法

基于协同的推荐算法,所有推荐任务都可归结于如何关联用户和物品。这种算法的重点是交互数据。简单来说,举个基于平行用户浏览习惯推荐作品的例子,比如A喜欢1、2、3,B喜欢1、2,基于A和B在1、2上的共性,相信B也会喜欢3,所以向B推荐3这个作品。这种算法的基本步骤是统一推荐场景建模,然后量化偏好并计算相似度。

第一,统一推荐场景建模。主要任务就是建构用户—物品矩阵。假使abcde表示5个用户,123456表示6个物品。+/-表示用户对物品产生的积极或消极评价,例如收藏某首歌曲,购买某件商品,给某部电影差评等。首先,从用户(矩阵的行)角度来推测分析。用户a跟用户c都对物品1表示了正向兴趣,对物品4与物品6产生了负面兴趣,由此合理推断:用户a跟用户c的品味是接近的。既然用户c对物品2有兴趣,对物品5兴趣不大,那么用户a也有可能如此。结果就是根据推断将物品2而不是物品5推荐给用户a。其次,再从物品(矩阵的列)角度来推测分析。我们观察到物品4和物品6同时被用户a和c表示不感兴趣,被用户b表示有兴趣,那么一个合理的推断是,物品4与物品6是相似的物品,喜欢物品4的可能也会喜欢物品6,反之亦然。既然用户d对物品4有兴趣,结果就是向其推送物品6。

第二,量化偏好并计算相似度。相似度计算的本质其实是两个特征向量的内积运算。在实际的推荐系统应用中,会用更加细粒度的“打分”来量化用户-物品矩阵中用户的偏好。例如,单曲循环=5,分享=4,收藏=3,主动播放=2,听完=1,跳过=-2,拉黑=-5。然后在量化的用户—物品矩阵上计算余弦相似度。这种基于协同的推荐算法,物品和用户都是客观的,没有主观余地。当然,这里的量化打分存在主观性。打分的内容多样,但都是基于用户的客观选择行为。用户选择的交互关系将作为相似的判断依据,在发掘相似关系后再向其他用户推荐。

从以上技术分析来看,基于内容的推荐算法的机理在于对物品分类打标签,通过特征向量的内积运算,与用户过往浏览、购买记录或用户其他特征相比较,得出相似性结果并推荐。基于协同的推荐算法的任务可以归结于如何关联用户和物品。通过用户选择的交互关系来判断是否相似,在发掘相似关系后再向其他用户推荐物品。

算法推荐系统的主要目的是满足信息生产者和消费者在信息有效定位上的需求,尽管算法推荐的信息产品确实存在侵犯版权的情形,但不论是基于内容的推荐算法,还是基于协同的推荐算法,都是通过客观可量化的筛选标准,前者在于物品属性的数据标注,后者在于用户选择的交互关系,从而得出纯粹算法输出。在所述情境下,平台无需负概括性注意义务,原因在于,面对纯算法生成的输出结果,平台难以具备普遍性的能力去发现或辨识其中潜在的版权侵犯行为。若强制施加此类义务,反而对平台构成了超越合理限度的要求,极大增加了平台运营成本。更严重的后果是,相当于给算法推荐技术贴上了“原罪”标签,以所谓法律的名义,实则阻碍了算法技术的发展。



五、互联网平台算法流量倾斜场景的版权侵权责任

算法推荐平台不承担概括性注意义务,并不意味着没有注意义务。相反,在算法流量倾斜场景下,平台应承担更高的注意义务。

(一)算法流量倾斜的商业模式及其实现

一般来讲,平台对算法推荐技术的应用是在用户粘性和流量倾斜之间寻求平衡,最终目标还是平台收益的最大化。算法推荐中的商业考虑,主要是两个方面:一方面是用户角度。主要分析用户年龄和性别等特征。算法推荐的作品更符合特定用户的喜好,比如男性推荐历史的内容,小孩推荐动画的内容,以此提高用户满意度。另一方面是商业角度。平台会增加相关作品的曝光度,增大用户看到这些作品的概率,由此就会增加用户购买的概率。平台通过这种方式把与其有合作的作品推荐给用户,这对平台而言就会取得更大收益。还有的上游内容授权方授权目的不是为了金钱,而是为了扩大知名度,所以这些上游授权方在与平台的协议中,更会专门规定流量倾斜的内容。实践中,平台会综合商业和用户这两方面因素,不会只管商业上的流量倾斜,不然,推荐的都是用户不喜欢的,平台最终也会流失用户。同时,鉴于内容生态维护与社会责任承担的双重考虑,诸如对低俗内容的遏制、对标题党及低质量内容的打压、对重要新闻的置顶展示、权重增加及强制插入,以及对低级别账号所发布内容的权限降低等措施,均超出了纯粹算法范畴,这些措施都是需要平台采取更为积极的手段进行深度干预与管理。可以说,算法推荐中的流量倾斜业已成为平台主流业态。

而平台又如何通过算法推荐实现流量倾斜呢?比如算法可以让某一条信息,展示给用户的概率更大。算法确实是会根据用户浏览偏好和既往阅读习惯数据,来匹配N个内容,但是有流量倾斜的匹配概率就会更大。各个数据都是被考虑的因素,用户最后看到的是各项指标权重综合计算得出的。在平台内容提供的商业实践中,用户看到的内容,大都是平台意图想让用户看到的。比如面对专业机构生成内容(PGC)和普通用户生成内容(UGC),如果是UGC的内容,没有流量倾斜,除非用户专门搜索,否则被看到的概率很小。平台一般都会根据用户的行为习惯,去推荐PGC的优质内容。

算法推荐中的流量倾斜存在以下具体形态和实现方式:(1)添加推荐召回。将筛选出需要倾斜的内容,加入推荐候选池。例如:将平台扶持的作者、合作商的内容、运营炒作的话题内容,添加推荐召回算法,从内容池中专门筛选这些内容放到候选集合里。筛选的内容还可以调节倾斜力度,例如对于不同扶持力度或层次的作者,还可分别筛选出1—10个候选内容,其被曝光的概率就会不同。(2)推荐排序加权。推荐排序时,在模型评分之外,为流量倾斜的内容添加人为的加权分数。(3)固定位置曝光。例如在平台上某一个固定位置,只曝光流量倾斜的内容。(4)固定时段曝光。例如用户连续阅读5个普通内容后,会固定曝光一条广告或者其他内容。又例如在用户连续阅读一个小时的普通内容后,穿插出一条流量倾斜内容。(5)目标人群曝光。为流量倾斜内容,提前划定目标用户群,在这些用户打开平台APP后,就给予一次曝光。(6)目标内容置顶。例如发布国家政策相关内容放在顶部位置保持不变。

(二)算法流量倾斜场景的版权注意义务

基于前述介绍,平台在该种场景下不仅不能以算法推荐技术作为当然免责的抗辩事由,还要为其流量倾斜的具体样态承担较高的注意义务。在适用技术中立原则审理涉技术创新的版权侵权案件时,不仅要考虑到推动科技与商业领域的创新发展,也要警惕并防范借技术中立之名,实则进行侵权行为的现象发生。依据2011年12月《最高人民法院关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》,要“妥善处理好技术中立与侵权行为认定的关系”,并提出了要平衡好技术创新和侵权责任的二者关系。

美国最高法院在Grokster案裁判中批评了第九巡回上诉法院的错误观点,认为第九巡回上诉法院对“实质性非侵权用途”原则的阐释——即认为若产品具备实质性的合法用途,则其制造者与销售者便应免于因第三方侵权使用该产品而承担法律责任——是错误的理解。美国最高法院进一步指出,尽管“索尼案”确立了产品若拥有“实质性非侵权用途”,但不能单纯基于产品被用于侵权,就推定销售者有帮助侵权的故意;然而,该判例并未指明,当存在能表明销售者主观故意的其他确凿证据时,法院是否应忽视这些证据。因此,当有证据表明销售者通过言论或行为引诱了他人的侵权行为时,索尼案所确立的原则并不能阻却责任。可见,美国最高法院对“实质性非侵权用途”准则的适用施加了一项严苛的先决条件:除非产品确实被用于侵权活动,且不存在其他任何证据表明销售者有故意教唆或帮助他人侵权的行为,否则该抗辩不予考虑,即一旦证明了销售者帮助侵权的意图,那么“实质性非侵权用途”抗辩便不应适用。

尽管在纯粹算法输出场景下不应概括性地赋予实施算法推荐技术的平台主体以版权注意义务,但由于流量倾斜是互联网平台主动实施的技术操作,在与流量倾斜相关的系列证据足以证明平台主观意图时,平台不能再以所谓“技术中立”为由抗辩其算法推荐行为应当免除赔偿责任,其应当为算法推荐的流量倾斜承担更高的注意义务。我国《互联网信息服务算法推荐管理规定》第11条和第14条的规定正是显示了对该种流量倾斜行为的强监管。

(三)算法流量倾斜场景的事实查明

算法流量倾斜的事实查明以算法透明制度为依托。算法透明制度提升了可问责性,即当算法在精准度与公平性方面出现偏差时,可基于此来查明流量倾斜的事实,以便追究算法控制者的责任。同时,算法透明制度也确保了算法受规制方享有一定的知情权,而这种知情权正是专业人士等第三方实施监督的权利基础。基于该知情权,算法规制对象也可以依据所披露的算法,事后对算法决策提出有关公平性和合理性的质疑。应建立算法决策事前评估机制,促使算法控制者对所有的算法决策及其潜在风险进行评估。评估后,需向数据主体披露算法决策及其内在逻辑,阐释自动化处理的意涵及后果,并为其提供途径以表达对算法决策的异议。此外,应授予监管机构以访问权限,官方监管算法控制者的算法决策系统中可能存在的偏见、任意性及不公,从而确保监督的全面性和客观性。未来的互联网平台算法治理应强调平台的算法透明义务,要求平台以易于理解的方式向用户介绍算法推荐系统的主要参数,在协调维护平台商业秘密保护需求的同时,明确平台在具体场景下实施流量倾斜的说明及举证义务,确保用户了解系统是如何进行信息的优先级排序,确保用户享有主要参数的替代选项,以此保障用户权利,为算法问责的事后规制提供支撑。

在强调互联网平台算法流量倾斜场景下的注意义务的同时,要注意到平台算法推荐系统自身也面临平台商户刷量炒信带来的作弊问题。大部分推荐系统依赖于对用户行为数据的整理和剖析,以此为基础执行算法驱动的推荐过程。前述基于协同的算法推荐系统介绍了这样一种电商类平台广泛应用的推荐,即针对购买了商品A的消费者,常会一并选购的其他商品推荐,其核心算法在于统计并分析那些已购买商品A的用户群体对于其他商品的购买频次。为了提升自身商品在推荐列表中的排名位置,作弊方可能会采取如下策略:注册众多小号,并利用这些小号同时进行商品A及自家商品的购买操作。在内容服务平台中,不论是提供音视频还是网络小说服务的平台都存在以评分作为要素的算法推荐,作弊一方往往会通过网络雇佣甚至是组织刷量平台给自己意图推荐的物品打高分。这些刷量炒信行为不仅严重污染了网络流量的数据价值,而且也破坏了算法推荐技术应用的重要目的。所以在强调平台主动维护自身健康网络秩序治理义务的同时,不能简单地将这种作弊行为带来的版权侵权责任后果转嫁给平台方



结 语

算法推荐技术在互联网平台的广泛应用,引发了人们对平台算法版权侵权在内的侵权风险的普遍担忧。算法推荐的主流技术标准客观可量化,互联网平台在算法纯粹输出场景下无需负概括性的注意义务,同时应在其算法流量倾斜场景下承担更高的注意义务。未来的互联网平台算法治理应强调平台的算法透明义务,为算法问责的法律规制提供制度保障。尽管算法推荐技术的发展日新月异,但不论算法技术如何发展、经营模式或者业态如何变化,我们在平台侵权责任的判定上仍应坚持平台过错责任的大前提,将算法推荐的技术逻辑和商业实践作为小前提,在场景类型化的基础上根据逻辑三段论推导得出结论。


END

推荐阅读

《政法论坛》2024年第6期目录及摘要

《政法论坛》2024年第5期目录及摘要

《政法论坛》2024年第4期目录及摘要

《政法论坛》2024年第3期目录及摘要

《政法论坛》2024年第2期目录及摘要

《政法论坛》2024年第1期目录及摘要



扫码关注政法论坛

政法论坛
《政法论坛》是中国政法大学主办的法学学术期刊。秉持“一切为了政法学术”的办刊使命,打造新时代下“引领学术潮流、促进学术交流、分享学术智识、承载学术思想”的重要政法研究平台,入选教育部社科期刊“名刊工程”,第一批国家社科基金资助期刊等荣誉。
 最新文章