AI搜索第一案!美新闻集团起诉Perplexity(附应诉檄文:“请不要自取灭亡!”)

学术   2024-11-04 22:44   英国  

来源 |  互联网法律匠


2024年10月21日,AI搜索第一案在美国正式打响,美国新闻集团旗下的道琼斯公司(《华尔街日报》的出版商)和《纽约邮报》正式向在美国联邦纽约南区地区法院起诉Perplexity——一家人工智能搜索科技公司,指控其侵犯版权。

在长达48页的民事起诉状中,原告认为,Perplexity 是一家生成式人工智能公司,声称能为用户提供准确、最新新闻和信息的平台, 用户可以 "跳过链接 "进入各类新闻出版商的网站。为了达到这一目的,Perplexity大量非法复制出版商受版权保护的作品。

原告道琼斯公司、纽约邮政控股公司及其母公司新闻集团("新闻集团 Corp")是世界上最著名的新闻出版商之一。原告的出版物包括华尔街日报》和《纽约邮报》这两份发行量最大的报纸。

原告认为,新闻出版商依靠的是新闻记者的努力、才华、技能和经验,通过一丝不苟地调查和巧妙地撰写新闻报道而实现业务。而记者往往是在紧迫的时间内和不可预知的情况下,冒着生命和自由去调查、撰写和报道他们认为会改变世界的新闻。这些记者、编辑和工作人员在极其艰苦的工作环境中努力谋生。 

在当前的数字时代,原告的收入其原创内容的收入主要来自销售其数字出版物以及消费者访问新闻网站时显示的在线广告。用户可以直接访问出版商的网站,或点击搜索引擎或其他链接,从而访问新闻网站。原告和其他出版商也从其网站的许可中获得了可观的收入。 

但是,为了利用这一巨大的内容市场,被告 Perplexity 筹集了大量资金,用于建立所谓的 "答题引擎",用于大规模地复制受版权保护的新闻内容、分析和观点,并保存在其内部数据库。

然后,被告 Perplexity使用这些受版权保护的内容生成对用户查询的回复,这些网站旨在并确实起到了新闻和其他信息网站的替代作用,因为用户可以 "跳过链接 "直接访问他们的新闻,用户可以完全依赖于 Perplexity而获得所有新闻,进而剥夺了原告的重要收入来源。 

Perplexity从网络获取内容原始来源后复制这些内容,并将其纳入一个庞大的 "检索增强型 RAG"数据库,而后通过大型语言模型("LLM"或 "模型")进行重新包装,最终将索引内容以书面形式回复("输出")给用户。这些输出(或者用 Perplexity 的行话来说:"答案")是机器生成的人工创建内容的复制品,由 LLMs 和 其他概述和转述原始、人工生成内容的工具,有时甚至是逐字逐句地复制原告的原始新闻内容。

原告认为,Perplexity 的行为侵犯了原告根据美国《版权法》在以下方面享有的专有权有多种方式。首先,Perplexity 在输入阶段的行为--未经授权的大规模复制将原告版权作品的数量纳入Perplexity的RAG索引("输入")-- 构成完全和大规模的侵犯版权行为,替代原告作品的复制品和/或衍生内容。同时,Perplexity 的输出内容也非法侵犯原告权利,Perplexity 对用户询问的 "回答 "通常包括完整的或 部分逐字转载原告的新闻、分析和观点文章。更糟糕的是,通过购买订阅 Perplexity 的高级服务 "Perplexity Pro",用户可以更频繁地访问内容并逐字复制。

Perplexity 的业务与传统搜索业务有本质区别是,传统引擎也将大量内容复制到其索引中,但这样做只是为了提供链接到原始网站。在传统形式下,搜索引擎是一种发现、指向和检索信息的工具,只促进版权内容的发现,而不促进版权内容的替代。但是,Perplexity 的商业模式并没有将业务推向内容创作者,相反,它将内容创作者的盈利机会篡为己有。

几个月前,即 2024 年 7 月,原告致函 Perplexity,通知它 对 Perplexity 在未经授权的情况下使用原告版权作品所引发的法律问题以及提出讨论潜在的许可交易,但Perplexity 没有理会。

总结来看,原告提出以下三个诉讼理由:

一是被告行为构成版权侵权(《美国法典》第 17 编第 106 条)--Perplexity 复制了原告的版权作品。 Perplexity 公司未经原告授权,直接或通过第三方间接地故意复制了尽可能多的这些文章,并保存至其RAG数据库。

第二项理由还是版权侵权(《美国法典》第 17 编第 106 条)--Perplexity 复制原告受保护的作品,并为用户查询生成 "输出 "的内容。Perplexity 利用原告的版权内容,通过其 RAG 流程,为用户的查询提供输出或 "答案",但这些答案包括原告受版权保护的内容。

第三项是“商标及不正当竞争竞争”(原文为“虚假原产地名称和淡化原告商标”)。《华尔街日报》和《纽约邮报》的商标均为原告注册和持续使用,这些商标已无可争议。但是,当 Perplexity 的 AI 应用程序被问及与原告有关的问题时,原告的回答是:"我不知道......。”这种用于模糊新闻来源的方式,造成了一种 "不公平 "的行为。

因此,原告要求被告停止侵权,甚至包括下令销毁由 Perplexity 创建的包括原告新闻内容的任何索引或数据库,并主张每项15万美元共计45万美元的赔偿要求。

AI搜索,该是时候想想怎么付费了!


2024 年 10 月 24 日,在被《华尔街日报》和《纽约邮报》起诉后,AI搜索公司Perplexity在官网发布了正式发布了“答辩”声明,前后读来,语气有檄文感受。

以下为全文内容。

关于道琼斯诉讼

周一,我们被《华尔街日报》和《纽约邮报》起诉了。我们对此感到失望和惊讶。

媒体公司针对人工智能生成工具的诉讼大约有三十多起。这些投诉共同的主题是,他们希望这种技术不存在。他们更希望生活在这样一个世界里:公开报道的事实归公司所有,没有人可以在不付费的情况下利用这些公开报道的事实做任何事情。

这不是我们的世界观。

我们相信,像Perplexity这样的工具能够从根本上改变人们了解世界的方式。Perplexity不仅以法律一贯认可的方式实现了这一目标,而且对于一个文化生态系统的良好运作也至关重要,在这个生态系统中,人们可以高效率、高效益地获取和利用他人创造的知识。

Perplexity 从创立之初就一直在生成的答案上方列出资料来源,并为答案的每一部分提供在线引用。我们很高兴其他人工智能聊天机器人也开始效仿 Perplexity 的透明度,并在其产品中强调资料来源。事实上,《华尔街日报》在今年早些时候的"Great AI Challenge"中将 Perplexity 评为综合排名第一的聊天机器人。

这起诉讼反映了媒体与科技之间的对抗态势,这种态势虽然令人沮丧,但从根本上说是短视、不必要和自取灭亡的。我们应该携手合作,为人们提供令人惊叹的新工具,建立真正能扩大蛋糕的业务。

在默认适用法律所允许的范围之外,我们还有无数事情想做,这就需要与像这里选择起诉而非合作的公司这样的对手建立互利的商业关系。Perplexity 很荣幸能够与《时代》周刊、《财富》杂志和《明镜周刊》等领先出版商共同推出一项首创的 收入共享计划[1],这些出版商已经签署了该计划。

如果《邮报》和《日报》决定真诚地与我们合作,我们的大门永远是敞开的,就像其他众多出版商一样。

不过,除非发生这种情况,否则我们将在这场诉讼中为自己辩护。这里不是讨论这些问题的地方,但我们想在一开始就简要地说明两点:

首先,申诉中指控的事实充其量只是误导。所引用的 "重复 "产出的例子明显错误地描述了材料的来源。即使是在所引用的具体事例中,他们对所发生的事情的描述也是虚伪的,他们对Perplexity的用途的描述也是宽泛的(剧透:Perplexity并不是为了转播可以在其他地方更直接、更有效地获取的文章全文)。关于我们从未回应过新闻集团外联活动的说法纯属子虚乌有:他们伸出了援手,我们当天就做出了回应,但他们非但没有继续对话,反而提起了诉讼。

其次,我们在提起诉讼后的短时间内了解到,这类案件有一个令人不安的趋势:被起诉的公司在诉状中对人工智能工具所做的各种看似糟糕的事情提出各种诽谤性的指控--然后,在诉讼过程中,当被追问他们是如何取得如此明显不具代表性的结果等细节时,他们会立即否认他们在公开记录中提到的例子,并发誓他们不会在案件中使用这些例子。我们推测这就是本案的情况。这样一来,你就可以知道他们的理由是否充分了。

人工智能增强型搜索引擎不会消失。Perplexity也不会消失。我们期待未来有一天,我们能与媒体公司合作,集中全部精力和注意力,为客户提供创新工具。


About the Dow Jones lawsuit

On Monday, we got sued by the Wall Street Journal and the New York Post.  We were disappointed and surprised to see this.

There are around three dozen lawsuits by media companies against generative AI tools. The common theme betrayed by those complaints collectively is that they wish this technology didn’t exist. They prefer to live in a world where publicly reported facts are owned by corporations, and no one can do anything with those publicly reported facts without paying a toll.

That is not our view of the world.

We believe that tools like Perplexity provide a fundamentally transformative way for people to learn facts about the world. Perplexity not only does so in a way that the law has always recognized but is essential for the sound functioning of a cultural ecosystem in which people can efficiently and effectively obtain and engage with knowledge created by others.

Perplexity, from its founding moment, has always listed sources above answers and provided in-line citations for every part of an answer. We are glad that other AI chatbots have begun copying Perplexity's transparency and emphasis on sources in their products. In fact, the Wall Street Journal itself earlier this year ranked Perplexity the #1 overall chatbot in their “Great AI Challenge.”

The lawsuit reflects an adversarial posture between media and tech that is—while depressingly familiar—fundamentally shortsighted, unnecessary, and self-defeating.  We should all be working together to offer people amazing new tools and build genuinely pie-expanding businesses.  There are countless things we would love to do beyond what the default application of law allows, which entail mutually beneficial commercial relationships with counterparties like the companies here who chose to sue rather than cooperate. Perplexity is proud to have launched a first-of-its-kind revenue-sharing program with leading publishers like TIME, Fortune, and Der Spiegel, which have already signed on.  And our door is always open if and when the Post and the Journal decide to work with us in good faith, just as numerous others already have.  

Unless and until that happens, though, we will defend ourselves in this lawsuit. This is not the place to get into the weeds of all of that, but we want to make two quick points at the outset:

First, the facts alleged in the complaint are misleading at best. Cited examples of “regurgitated” outputs explicitly mischaracterize the source of the material. They are disingenuous in their description of what happened even in the specific cited instances, as well as in their broader depiction of what Perplexity is for (spoiler alert: it’s not for reprising the full text of articles that can be more directly and efficiently obtained elsewhere). And the suggestion that we never responded to outreach from News Corp. is simply false: they reached out; we responded the very same day; instead of continuing the dialogue, they filed this lawsuit.

Second, there is, we have learned in the short time since this lawsuit was filed, a disturbing trend in these types of cases: The companies that are suing make all kinds of salacious allegations in their complaints about all kinds of seemingly bad things they were able to coax the AI tools to do—and then, when pressed in the litigation for details of things like how they achieved such obviously unrepresentative results, they immediately disavow the very examples they put in the public record, and swear they won’t actually use them in the case. We presume that is what will happen here. And that will tell you everything you need to know about the strength of their case.

AI-enhanced search engines are not going away. Perplexity is not going away. We look forward to a time in the future when we can focus all of our energy and attention on offering innovative tools to customers, in collaboration with media companies.


[1] 麻策律师注:收入共享计划,指Perplexity通过相关问题功能引入广告。品牌可以付费在Perplexity的回答引擎界面和页面上提出特定的相关后续问题。当Perplexity从引用出版商内容的互动中获得收入时,该出版商也将获得分成。




敬请关注”法律检索“备用号”Legal Research Center"
       


重磅福利

关注“法律检索”公众号,后台回复“暑期学校”即可获取首届“大数据与法律检索”暑期学校课程PPT。回复“PPT”即可获得中国大学MOOC《大数据与法律检索》主讲人在深圳律协授课的PPT(六百多页干货)。

深圳律协培训课程《律师法律检索核心技能》B站地址

https://www.bilibili.com/video/BV18y4y137xu/

扫下方二维码即可免费学习最新一期《大数据与法律检索》慕课:


法律检索
不只是法律检索。
 最新文章