Perplexity AI被起诉:AI搜索与创作者权益的平衡

科技   2024-11-07 14:57   北京  
来源:MIT Technology Review


十月底,News Corp 对一个受欢迎的 AI 搜索引擎 Perplexity AI 提起了诉讼。乍一看,这似乎并不特别,毕竟这是众多要求 AI 开发者在数据使用上提供归属、征得同意或支付补偿的案件之一。然而,这起诉讼却不同,它可能是其中最具影响的一件。


这场争论的核心是 AI 搜索的未来,即能够从全网信息中提取并总结内容的聊天机器人。随着其日渐流行,这些 AI“答案引擎”可能会成为取代传统搜索引擎的互联网入口。与普通 AI 聊天机器人仅通过训练来复现信息(尽管常常不可靠)不同,AI 搜索工具如 Perplexity、Google 的 Gemini 或 OpenAI 的新推出的 SearchGPT,旨在从第三方网站获取并重新打包信息,向用户提供简短的摘要,并附上从研究论文到 Wikipedia 文章、YouTube 文字记录等少量来源的链接。AI 系统负责阅读和撰写,但信息来源于外部。


在最佳情况下,AI 搜索能够更好地推测用户意图、放大优质内容并整合多种来源的信息。但如果 AI 搜索成为我们访问网络的主要门户,将对本已脆弱的数字经济造成冲击。当前,线上内容的生产依赖于与虚拟流量相关的脆弱激励机制:广告、订阅、捐赠、销售或品牌曝光。如果 AI 搜索将网络内容屏蔽在“全知”的聊天机器人背后,那么它可能剥夺创作者赖以生存的访问量和关注度。


如果 AI 搜索破坏了这个生态系统,现有法律可能难以提供帮助。各国政府已经意识到内容在法律体系中正“漏洞百出”,并正着手通过其他方式来调控网络价值的流动。在此窄小的时间窗口中,AI 行业应该主动构建一个更加智能的内容市场,以避免政府推出无效、只利于少数人或限制网络思想自由流动的干预措施。


版权并不能解决 AI 搜索的破坏性影响


News Corp 认为,用其内容提取信息供 AI 搜索使用相当于版权侵权,并声称 Perplexity AI“在竞争读者的同时还在免费搭便车”。这种观点可能也得到了《纽约时报》的认同,该报在 10 月中旬向 Perplexity AI 发出了一封停止侵权的通知函。


在某些方面,对 AI 搜索的指控比其他涉及 AI 训练的案件更为有力。AI 训练通常会从大量重复性内容中学习一般化的行为模式,而单一内容的贡献往往有限。但在搜索中,内容的价值在于其新颖性或独特性,或者创作者拥有独特的权威性。AI 搜索的设计目的是复现基础数据中的特定特征、引用原创作者的权威,并充当原始内容的替代品。


即便如此,News Corp 依然面临艰难挑战,要证明 Perplexity AI 在处理和总结信息时侵犯了版权。版权法并不保护“纯事实”或创造、新闻及学术劳动的成果。美国法院历来支持将内容用于足够变形的用途的技术被告,这一趋势可能会继续。而若 News Corp 成功,这一判例的影响将远超 Perplexity AI。限制信息丰富的内容用于非创意或非表达的目的,可能会限制丰富多样的优质数据的使用,阻碍提高 AI 系统安全性和可靠性的广泛努力。


各国政府正学习如何规范在线价值分配


如果现有法律难以解决这些问题,各国政府可能会寻求新法律。受与传统搜索和社交媒体平台的争议影响,各国政府可能会效仿澳大利亚和加拿大实施的媒体议价法,或美国加州和国会提出的类似方案。这些改革强制特定平台向显示其内容的部分媒体组织支付费用,例如新闻片段或知识面板。欧盟通过版权改革施加了类似的义务,而英国则引入了广泛的竞争权力,以便在必要时强制议价。


然而,强制议价对于这个复杂问题而言是一种粗放的解决方案。这些改革倾向于特定的新闻组织,基于谷歌和 Meta 等平台剥削出版商的假设。在实际中,很难确定平台流量中有多少真正来自新闻,估计值从 2% 到 35% 不等,而社交媒体上的新闻内容仅占 3%。与此同时,平台在放大出版商内容方面带来了显著收益,但对于这种双向价值的合理分配,并没有统一共识。更具争议的是,这些议价规则不仅针对内容重现,还对索引和链接施加了限制,威胁到支撑网络的“自由链接”能力。此外,聚焦传统媒体的议价法仅适用于加拿大的 1400 家出版物、欧盟的 1500 家和澳大利亚的 62 家组织,而忽视了众多每日为平台流量贡献的创作者和用户。


尽管存在各种缺陷,强制议价可能成为应对 AI 搜索的一个有吸引力的选择。相比之下,AI 搜索的案例更为有力。传统搜索索引、链接并显示来源的简短片段,以帮助用户决定是否点击,而 AI 搜索可能会直接用生成的摘要取代原始内容,潜在地削减了下游网站的流量、关注度和曝光。超过三分之一的谷歌会话无点击结束,AI 搜索中的比例可能更高。而 AI 搜索也简化了经济计算:由于每个回应仅依赖少数来源,平台和仲裁者能够更准确地追踪特定创作者的参与度和收入贡献。


行业应抓住有限的机会建立公平的奖励体系


然而,干预的威胁本身可能比实际改革带来更大影响。AI 公司已经认识到诉讼可能升级为监管的风险。例如,Perplexity AI、OpenAI 和谷歌已开始与出版商和内容平台达成协议,有些覆盖了 AI 训练,有些则专注于 AI 搜索。但与早期议价法类似,这些协议仅惠及少数公司,其中一些(如 Reddit)尚未承诺与自己的创作者分享收入。


这种选择性让步的政策难以为继。它忽视了线上绝大多数创作者,他们无法轻易选择退出 AI 搜索,也没有传统出版商的议价能力。这种策略让改革的紧迫性因安抚了最响亮的批评者而减弱。通过复杂的商业协议来合法化少数 AI 公司,使得新进入者难以获得平等待遇或同等豁免权,这可能会进一步巩固新一轮搜索巨头的地位。长期来看,这可能会为 AI 公司创造不良激励,使它们偏爱低成本、低质量的来源,而非成本较高的高质量新闻或内容,导致信息消费的文化日趋不加辨别。


相反,AI 行业应当投资于能让各类创作者因分享优质内容而获益的框架。从 YouTube 到 TikTok 再到 X,科技平台已证明他们可以为复杂的内容市场中的创作者提供创新的奖励机制。实际上,更公平地对日常内容进行变现正是风险投资者推崇的“web3”运动的核心目标。这一逻辑同样适用于 AI 搜索。如果查询带来了丰厚的参与度,而用户并未点击原始来源,商业 AI 搜索平台应该找到方法将这些价值归于创作者,并在更大范围内进行分享。


当然,也可能我们数字经济从一开始就是不完善的。依靠零星广告收入维持生计或许难以为继,注意力经济对隐私、信息完整性和网络民主已造成实质性损害。支持高质量新闻和新鲜内容可能需要其他形式的投资或激励。


但我们不应放弃对更公平数字经济的追求。AI 搜索使内容议价更加紧迫,同时也比以往更可行。AI 行业的先驱们应抓住这个机会,为构建智能、公平、可扩展的奖励系统奠定基础。如果他们不行动,政府已有能力和信心施加他们所设想的共享价值体系。


Benjamin Brooks 是哈佛 Berkman Klein 中心的研究员,专注于 AI 的监管和立法响应。他曾负责 Stability AI 的公共政策工作,该公司开发了用于图像、语言、音频和视频生成的开放模型。他的观点不代表任何关联组织的立场。


原文链接:

https://www.technologyreview.com/2024/10/31/1106504/ai-search-could-break-the-web/








DeepTech深科技
DeepTech 是一家专注新兴科技的资源赋能与服务机构,以科学、技术、人才为核心,通过科技数据与咨询、出版与影响力、科创资本实验室三大业务板块,推动科学与技术的创新进程。DeepTech 同时是《麻省理工科技评论》中国区独家运营方。
 最新文章