Perplexity AI被起诉：AI搜索与创作者权益的平衡

科技 2024-11-07 14:57 北京

来源：MIT Technology Review

十月底，News Corp 对一个受欢迎的 AI 搜索引擎 Perplexity AI 提起了诉讼。乍一看，这似乎并不特别，毕竟这是众多要求 AI 开发者在数据使用上提供归属、征得同意或支付补偿的案件之一。然而，这起诉讼却不同，它可能是其中最具影响的一件。

这场争论的核心是 AI 搜索的未来，即能够从全网信息中提取并总结内容的聊天机器人。随着其日渐流行，这些 AI“答案引擎”可能会成为取代传统搜索引擎的互联网入口。与普通 AI 聊天机器人仅通过训练来复现信息（尽管常常不可靠）不同，AI 搜索工具如 Perplexity、Google 的 Gemini 或 OpenAI 的新推出的 SearchGPT，旨在从第三方网站获取并重新打包信息，向用户提供简短的摘要，并附上从研究论文到 Wikipedia 文章、YouTube 文字记录等少量来源的链接。AI 系统负责阅读和撰写，但信息来源于外部。

在最佳情况下，AI 搜索能够更好地推测用户意图、放大优质内容并整合多种来源的信息。但如果 AI 搜索成为我们访问网络的主要门户，将对本已脆弱的数字经济造成冲击。当前，线上内容的生产依赖于与虚拟流量相关的脆弱激励机制：广告、订阅、捐赠、销售或品牌曝光。如果 AI 搜索将网络内容屏蔽在“全知”的聊天机器人背后，那么它可能剥夺创作者赖以生存的访问量和关注度。

如果 AI 搜索破坏了这个生态系统，现有法律可能难以提供帮助。各国政府已经意识到内容在法律体系中正“漏洞百出”，并正着手通过其他方式来调控网络价值的流动。在此窄小的时间窗口中，AI 行业应该主动构建一个更加智能的内容市场，以避免政府推出无效、只利于少数人或限制网络思想自由流动的干预措施。

版权并不能解决 AI 搜索的破坏性影响

News Corp 认为，用其内容提取信息供 AI 搜索使用相当于版权侵权，并声称 Perplexity AI“在竞争读者的同时还在免费搭便车”。这种观点可能也得到了《纽约时报》的认同，该报在 10 月中旬向 Perplexity AI 发出了一封停止侵权的通知函。

在某些方面，对 AI 搜索的指控比其他涉及 AI 训练的案件更为有力。AI 训练通常会从大量重复性内容中学习一般化的行为模式，而单一内容的贡献往往有限。但在搜索中，内容的价值在于其新颖性或独特性，或者创作者拥有独特的权威性。AI 搜索的设计目的是复现基础数据中的特定特征、引用原创作者的权威，并充当原始内容的替代品。

即便如此，News Corp 依然面临艰难挑战，要证明 Perplexity AI 在处理和总结信息时侵犯了版权。版权法并不保护“纯事实”或创造、新闻及学术劳动的成果。美国法院历来支持将内容用于足够变形的用途的技术被告，这一趋势可能会继续。而若 News Corp 成功，这一判例的影响将远超 Perplexity AI。限制信息丰富的内容用于非创意或非表达的目的，可能会限制丰富多样的优质数据的使用，阻碍提高 AI 系统安全性和可靠性的广泛努力。

各国政府正学习如何规范在线价值分配

如果现有法律难以解决这些问题，各国政府可能会寻求新法律。受与传统搜索和社交媒体平台的争议影响，各国政府可能会效仿澳大利亚和加拿大实施的媒体议价法，或美国加州和国会提出的类似方案。这些改革强制特定平台向显示其内容的部分媒体组织支付费用，例如新闻片段或知识面板。欧盟通过版权改革施加了类似的义务，而英国则引入了广泛的竞争权力，以便在必要时强制议价。

然而，强制议价对于这个复杂问题而言是一种粗放的解决方案。这些改革倾向于特定的新闻组织，基于谷歌和 Meta 等平台剥削出版商的假设。在实际中，很难确定平台流量中有多少真正来自新闻，估计值从 2% 到 35% 不等，而社交媒体上的新闻内容仅占 3%。与此同时，平台在放大出版商内容方面带来了显著收益，但对于这种双向价值的合理分配，并没有统一共识。更具争议的是，这些议价规则不仅针对内容重现，还对索引和链接施加了限制，威胁到支撑网络的“自由链接”能力。此外，聚焦传统媒体的议价法仅适用于加拿大的 1400 家出版物、欧盟的 1500 家和澳大利亚的 62 家组织，而忽视了众多每日为平台流量贡献的创作者和用户。

尽管存在各种缺陷，强制议价可能成为应对 AI 搜索的一个有吸引力的选择。相比之下，AI 搜索的案例更为有力。传统搜索索引、链接并显示来源的简短片段，以帮助用户决定是否点击，而 AI 搜索可能会直接用生成的摘要取代原始内容，潜在地削减了下游网站的流量、关注度和曝光。超过三分之一的谷歌会话无点击结束，AI 搜索中的比例可能更高。而 AI 搜索也简化了经济计算：由于每个回应仅依赖少数来源，平台和仲裁者能够更准确地追踪特定创作者的参与度和收入贡献。

行业应抓住有限的机会建立公平的奖励体系

然而，干预的威胁本身可能比实际改革带来更大影响。AI 公司已经认识到诉讼可能升级为监管的风险。例如，Perplexity AI、OpenAI 和谷歌已开始与出版商和内容平台达成协议，有些覆盖了 AI 训练，有些则专注于 AI 搜索。但与早期议价法类似，这些协议仅惠及少数公司，其中一些（如 Reddit）尚未承诺与自己的创作者分享收入。

这种选择性让步的政策难以为继。它忽视了线上绝大多数创作者，他们无法轻易选择退出 AI 搜索，也没有传统出版商的议价能力。这种策略让改革的紧迫性因安抚了最响亮的批评者而减弱。通过复杂的商业协议来合法化少数 AI 公司，使得新进入者难以获得平等待遇或同等豁免权，这可能会进一步巩固新一轮搜索巨头的地位。长期来看，这可能会为 AI 公司创造不良激励，使它们偏爱低成本、低质量的来源，而非成本较高的高质量新闻或内容，导致信息消费的文化日趋不加辨别。

相反，AI 行业应当投资于能让各类创作者因分享优质内容而获益的框架。从 YouTube 到 TikTok 再到 X，科技平台已证明他们可以为复杂的内容市场中的创作者提供创新的奖励机制。实际上，更公平地对日常内容进行变现正是风险投资者推崇的“web3”运动的核心目标。这一逻辑同样适用于 AI 搜索。如果查询带来了丰厚的参与度，而用户并未点击原始来源，商业 AI 搜索平台应该找到方法将这些价值归于创作者，并在更大范围内进行分享。

当然，也可能我们数字经济从一开始就是不完善的。依靠零星广告收入维持生计或许难以为继，注意力经济对隐私、信息完整性和网络民主已造成实质性损害。支持高质量新闻和新鲜内容可能需要其他形式的投资或激励。

但我们不应放弃对更公平数字经济的追求。AI 搜索使内容议价更加紧迫，同时也比以往更可行。AI 行业的先驱们应抓住这个机会，为构建智能、公平、可扩展的奖励系统奠定基础。如果他们不行动，政府已有能力和信心施加他们所设想的共享价值体系。

Benjamin Brooks 是哈佛 Berkman Klein 中心的研究员，专注于 AI 的监管和立法响应。他曾负责 Stability AI 的公共政策工作，该公司开发了用于图像、语言、音频和视频生成的开放模型。他的观点不代表任何关联组织的立场。

原文链接：

https://www.technologyreview.com/2024/10/31/1106504/ai-search-could-break-the-web/

http://mp.weixin.qq.com/s?__biz=MzA3NTIyODUzNA==&mid=2649759499&idx=4&sn=864fc9cf34a11860f9212618bb38dcfc

DeepTech深科技

DeepTech 是一家专注新兴科技的资源赋能与服务机构，以科学、技术、人才为核心，通过科技数据与咨询、出版与影响力、科创资本实验室三大业务板块，推动科学与技术的创新进程。DeepTech 同时是《麻省理工科技评论》中国区独家运营方。

澳洲昆大团队研发新型聚合物吸附剂，短时间内实现超99%氟化污染物去除

蛋白质设计再突破！麻省理工团队利用人工智能与梯度优化开发新策略

在家就能查血：MIT开发微型硅光芯片血液检测系统

科学家研发“仿心脏”电极材料，促进离子流传输，解决钠离子电池离子传输动力学缓慢问题

亚马逊向Anthropic追投40亿美元，Anthropic将使用前者芯片训练AI模型

还原真实世界：MIT用“AI+物理模拟”为机器人打造虚拟训练场

诺奖得主联合创办，初创融资3000万美元，开发新型糖免疫疗法

打破传统蛋白质进化方法局限性：MIT团队设计新型蛋白质大模型，发现比自然界高效百倍的突变体

寻找定义未来的科技先锋丨2024年度“35岁以下科技创新35人”中国报名中

被迫剥离Chrome和安卓？谷歌或将迎来“至暗时刻”

初创公司Teleo完成千万美元融资，欲打造机器人行业“ChatGPT时刻”

艾伦研究所与华盛顿大学团队推出开源科研大模型OpenScholar，用小参数超越GPT-4o

北大校友发现新型神经元，能通过靶向激活快速抑制食欲，或促进司美格鲁肽类药物新发展

背靠英伟达的初创公司Enfabrica推出全球最快GPU网络接口控制器芯片，再获1.15亿美元融资

英国核聚变初创公司完成1.25亿美元融资，致力于开发新型反应堆

运动即药物：MIT揭示神经修复新机制

科学家提出“一锅法微流体制造”系统，制备多种复杂陶瓷微粒，能作为微机电系统的精密零件

成立仅半年，印度首家核聚变公司获种子前投资

北航团队提出全新偏好数据构建框架，助力大模型实现更全面的对齐效果

药物研发新突破！中国科大、哈佛等联合开发PocketGen模型，可高效生成蛋白质口袋

AI和量子：谁将主宰未来计算？

内部短路起火时间不到3秒，王朝阳院士团队揭示全固态金属锂电池安全隐患

斯坦福团队发现新型代谢化合物，可抑制食欲、减轻体重

科学家以树蛙皮肤为灵感研制大气水收集装置，每平方米产能超过60升/天，有望满足工业级用水需求

研究人员打造即插即用型框架，将多智能体强化学习引入大语言模型

哈工大团队开发高灵敏度检测设备，可同时实现多种疾病诊断

科学家从小行星挖掘出外太阳系的起源密码

人类首次月球原位资源利用测试项目定档，美国企业计划明年执行首次任务

孙学良院士团队开发双阴离子基钠超离子导体，打破传统固态电解质局限，为开发高性能全固态钠离子电池开辟新途径

这家公司打造1.25万电池充电站，可在地震或台风时提供备用发电

MIT绘制迄今为止最全面大脑皮层功能图

1人完全缓解，斯坦福团队利用CAR-T治疗胶质瘤，突破实体肿瘤限制

结合有机半导体薄膜与细菌人工光合作用，科学家制备人工生物叶片，具备自支撑与能量自给特性

清华校友研发分子编辑工具，为药物分子和材料分子的合成提供新策略

微软联手NASA开发“地球Copilot”，让浩瀚太空数据触手可及

AI导航测试：纽约街道闭路实验揭示生成式模型的薄弱点

生成式AI或在5年内产生数百万吨电子垃圾？科学家提出算力物质流方法，为AI可持续发展提供新视角

四成AI数据中心或陷入“用电荒”，全球能源格局面临重大挑战

首个机械量子比特问世，量子计算迎来“蒸汽朋克”时代

MIT科学家开发新模型能让疫苗更有效

科学家用AI打造离子电路，将成为电子电路的有力补充，可被用于人机交互领域

专访澳大姜颖：开发“BIND通用接口”技术，让柔性生物电子器件实现模块化组合，正联合企业落地转化

超越硅极限：纳米3D晶体管或成AI低功耗未来之钥

科学家提出基于大语言模型的智能体系统框架，促进对不同框架的统一理解

Cursor母公司Anysphere收购Supermaven，计划打造完全整合的AI开发平台

科学家开发新型点击化学反应，突破二硫键高效合成技术瓶颈，正探索将其用于骨修复和脊髓修复

用“飞轮效应”开启智能科学时代新篇章，火山引擎AI for Science研讨会与Bio-OS大赛圆满收官

CFS公司获美国能源部250万美元资助，即将公布首座核聚变发电站选址

天津大学开发类器官-脑机接口技术，为脑损伤修复带来新希望

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉