Perplexity CEO回应AI抄袭与版权官司,解释产品开发、谷歌竞争|Disrupt 大会现场实录

科技   2024-11-01 09:50   北京  

作者Jessica
邮箱JessicaZhang@pingwest.com

过去三天,美国科技媒体 TechCrunch 主办的 2024 Disrupt 大会在旧金山Moscone中心进行。这一硅谷原生、全球知名的老牌科技创投盛会,今年在AI持续席卷下热度更甚,吸引了上万名来自世界各地初创企业和投资机构的参会者。

在总共300多个环节里,明星AI搜索独角兽公司Perplexity联合创始人兼CEO Aravind Srinivas罕见现身的一场对话,让最大的Disrupt Stage分会场观众席爆满,堪称最受欢迎舞台之一。

图源:TechCrunch

在Aravind接受TechCrunch高级编辑Devin Coldewey访谈的半个小时里,两人贴脸开大,上来就提起近期把Perplexity推到风口浪尖的AI抄袭和内容来源争议,Aravind还对Perplexity被道琼斯集团起诉侵权做出正面回应;接着两人聊到AI原生搜索本质、Perplexity开发新功能的理念、与谷歌的比较、创作者利益保护、AI成本以及公司融资。Devin甚至把能叫上名字的科技巨头都过了一遍,挨个问Perplexity有没有收到他们的收购邀约。

一边是老媒体人的犀利敏锐,提问基本不留余地。另一边是新锐创始人的亦攻亦守,不紧不慢却未有让步。全程直给,涉及的话题热点很多,信息量颇大。

图源:硅星人

以下是硅星人在大会现场给大家带来的对话实录,敬请享用:

Delvin Coldewey:感谢你能参与!我想先问一个很直接的问题:你的公司如何定义“抄袭”?这有点突然,但我想要一个明确的答案。

Aravind Srinivas其实你可以直接问Perplexity。我们公司的定义其实和“抄袭”是什么有关。Perplexity一直都会标注来源,我们不会声称拥有任何内容的所有权。它实际上是从网络上获取内容,进行总结,以便用户能够消化这些信息,并提供信息的来源。这就像记者或学术人士的工作一样,只要有正确的引用文献部分就可以。

Delvin Coldewey不过从学术角度来说,研究人员会创作一篇原创论文,并在文中使用引用来支持自己的观点,而不是简单地复制已有的内容。

Aravind Srinivas嗯,有时候,某个新闻媒体首先报道了一则新闻,随后另一家媒体引用该新闻,并提到“据某某报道”,这算抄袭吗?

Delvin Coldewey但有些人可能会发帖子,说“他们是这样说的”,然后几天后你可以看到一篇文章,其中直接用了8到15个单词,看起来几乎就是从原文抄来的,有点像那种情况。

Aravind Srinivas是的,我们的确不是每句话都精准标注了确切的引用。但要非常明确的是,我们在2022年12月7日发布了这个产品,大概是两年前。当时大家都在用ChatGPT检查内容是否是最新的,我们是唯一一个能够提供参考文献的AI产品,其他的产品并没有引用功能。我们从一开始就关注这个问题,并且不断改进,以便在模型检测到特定来源时能更加清楚地标注。

Delvin Coldewey我能看出你非常重视这个问题。从一开始你们就展示了引用功能,而不是随口一说。我认为重新定义“抄袭”是很有必要的,只有明确了“抄袭”的定义,才能有效防止AI生成的内容涉及抄袭行为。如果我将别的内容直接复制到自己的文章中,我会知道自己在抄袭,并因此感到内疚,所以模型也应该“知道”这一点,或者说开发模型的人必须清楚这一点,需要有一种监督机制。

Aravind Srinivas原理其实是这样的:模型被指示不直接使用任何特定来源的文本,而是整合不同的观点并进行总结,将内容传达给用户,而不是直接从网络复制。随着模型在“指令跟随”技能上的进步,这一指令的执行效果越来越好。在AI软件的监督下,包括SNP和其他反馈资源的支持,尽管我们不一定负责所有的模型训练,有时也会使用其他开发者的模型,例如开源的Llama模型。当然,任何模型都不是完美的,仍然可以通过提示工程或提示注入来引导模型生成更合适的内容。

Delvin Coldewey关于提示注入的妙处,就是可以“用一句话总结这篇文章”。

Aravind Srinivas其实这并不是我们产品的主要用途。Perplexity是用来回答问题的,有些人尝试用它做一些我们不希望的用途,比如“帮我总结这个网址的内容”,而我们实际上是不允许这种用法的,并尽力避免执行这样的指令。不过说实话,AI领域还没有哪家公司可以一直保持防护措施。你总会发现新的情况,让原本的防护措施失效,然后我们再去修正和调整,使其足够安全地应用,不执行任何不必要的指令。

Delvin Coldewey关于AI驱动的原生搜索,这一概念我们已经在一些公司中看到过。谷歌在搜索领域的复杂化或许是最突出的例子。过去十年中,他们的这些变化可能并不受用户欢迎。作为一名科技记者,这是我20年职业生涯中见到的少数广受反感的平台变化之一。不过,看起来一些公司似乎注意到了谷歌的不足,想要填补这个空缺。你们是否有意接手谷歌未完成的部分?

Aravind Srinivas我觉得谷歌本质上还是一个基于链接的搜索引擎,无论他们是否想直接提供答案,链接展示始终是他们的收入来源。在财报会议上,他们明确提到,仅搜索广告每季度就能带来45亿美元的收入,这对他们的业务非常关键。尽管他们没有披露利润的具体细节,但我认为主要利润应该来自展示链接。所以他们有动力提供尽可能多的链接。虽然AI摘要在某些信息查询中开始崭露头角,但这并不是他们的主要模式。在谷歌每天五到八十亿次的查询中,大多数并不适合直接显示答案,否则将严重影响收入。

我们所做的,是创建一个用户可以直接提问的平台。相比之下,谷歌首页的搜索框并不是为了直接回答问题而设计的。谷歌的查询平均词数大约在2到3个之间,而Perplexity的查询则多在10到11个词,显然,Perplexity的用户更倾向于直接提问,而谷歌用户大多是查找一些简短的关键词,比如“某位亚洲明星”或“旧金山天气”等。

Delvin Coldewey我很好奇你们的一些应用场景。最近几周你们在推特上发布了大量的功能和用例,大约50个新功能,比如体育比赛功能。你们的数据是直接来自NFL,还是从别的地方获取的?

Aravind Srinivas我们通过与数据来源合作而获得相关数据,并加以处理。我们会确保数据准确,严格保证直接性和可靠性。

Delvin Coldewey所以这是让人们搜索“今天海鹰队的比分”之类的内容吗?还是他们想要过去20场NFL比赛的比分分析?

Aravind Srinivas更像是后者的情况。我们希望Perplexity成为一个用户可以随时提问并获得准确回答的地方。起初,我们的用户群体多是学术和研究导向的用户,就像早期的Facebook主要面向学生,Amazon则以图书起家。类似地,Perplexity在起步时吸引了许多学术、研究和知识导向的用户,但我们希望扩展到更广泛的用户群体。体育信息看似与知识无关,但实际上有很多体育迷喜欢深入分析数据,研究比赛,了解特定球员或球队的表现。如果用户错过了一场比赛,我们可以提供比分之外的实况评论、对比分析等更有深度的内容。

Delvin Coldewey就像我说的,你们发布了很多新功能,几乎每隔一段时间就会冒出一个新功能。你们有具体的策略,还是采用“散弹枪”策略,推出十个产品,看哪几个最终会被用户接受——你们是在寻找对用户真正有价值的功能吗?

Aravind Srinivas我们真地会仔细查看用户日志,了解他们在询问什么。实际上,在推出体育功能之前,我们优先考虑了金融领域,因为许多用户在进行市场研究、投资组合管理、加密货币和投资策略等方面的研究,同时也关注股票相关新闻。我们会观察哪些领域可以提供更好的服务,而不仅仅满足表面需求。体育也是类似的情况,有很多用户关心体育数据,而有时还会出现“幻觉”现象,比如在疫情期间,确保比赛数据的准确性就变得尤为重要。

我们的目标是覆盖用户习惯使用的搜索引擎上已有的各类内容,这样他们就没有理由回到传统的搜索界面。要改变用户已有几十年的使用习惯并不容易,但如果这是未来的趋势,我们就必须下功夫去满足他们的日常搜索需求,无论是软件开发帮助、研究规划,还是学术资源管理。我们还需要在本地化搜索、体育、天气、购物和旅行等方面继续努力。

图源:TechCrunch

Delvin Coldewey在那个诉讼案中,道琼斯(《华尔街日报》母公司)提到你们的Perplexity是“内容抄袭王国”。你们在公开回应中说,媒体公司可能希望这项技术不存在。但我觉得这样说不对,因为你们和《财富》杂志、《时代》周刊都有合作,原告也和OpenAI有合作。会不会是因为他们不喜欢你们提供的合作安排?

Aravind Srinivas他们声称我们没有回应,但事实上我们当天就回应了。我希望大家能理解,我们的意图是合作、沟通,共同推进。

Delvin Coldewey那么,如果你们真的要与他们探讨合作安排,具体会是什么样的?我很好奇这些分享机制,你们打算如何共享内容?

Aravind Srinivas我们推出了一个叫“Perplexity Publisher Program”的项目,几个月前已经上线。该项目的核心理念是严格管理内容授权,分为两种情况:第一类公司使用全网数据训练大型模型,这些模型会内化所有文本数据,并随着规模的扩大不断优化;而第二类公司只在特定查询时实时使用网络内容进行摘要,并不用于训练模型本身。我们向出版商解释我们属于第二种类型,这与第一类模型需要为内容授权支付费用不同。针对第二类公司,我们设计了不同的合作结构。

目前,几乎没有其他公司提出类似的方案。我们的思路是通过广告收入来支持合作,因为我们本质上是一个搜索产品。虽然我们直接获取内容来回答用户的问题,但我们仍属于大众市场的搜索领域,广告可以带来可观的收入。不同于传统搜索引擎,我们承诺会在查询层面与出版商共享广告收入。也就是说,如果我们在某次查询中获得了广告收入,而您的内容作为答案的一部分被引用,我们会分享相应的收入。随着我们业务的增长和广告盈利的增加,这种合作模式将为选择加入我们的出版商带来重要的收益。

Delvin Coldewey我觉得你们应该知道,出版商们的想法是,当有人在Perplexity上引用了我的文章内容时,他们并没有直接点击我的文章进行阅读,这样我们就失去了维持生存所需的流量和收入。说到底,新闻出版方的回应往往是:“你们说自己不与我们竞争,但实际上你们确实是在竞争。” 你对此怎么回应?

Aravind Srinivas我们不是一个新闻产品。没有人会来Perplexity获取每日新闻。

Delvin Coldewey那为什么你们还需要引用这些内容呢?

Aravind Srinivas用户来到这里是为了理解信息的含义。比如,一条关于GPU黑市交易的新闻,可能导致用户思考:“在这种情况下,我是否应该继续购买NVIDIA的股票?”这些问题并不是直接在新闻源上可以找到答案的,而是在Perplexity上可以进一步分析的。同时,用户并不是来Perplexity阅读新闻的,而是会直接去新闻源查看。这其实是两个不同的产品,但我们需要花时间让人们理解这个区别。还有一些网站可以直接粘贴网址并提取其内容,而这并不是我们要做的事情。

Delvin Coldewey那么对于那些内容创作者,比如制作YouTube视频、撰写文章、出版书籍的人,他们如何参与进来呢?他们该如何实现盈利?像谷歌、YouTube这种平台已经有成熟的盈利方式了。

Aravind Srinivas我们的出版商计划欢迎所有人加入。除了共享广告收入,我们还帮助出版商在他们的平台上建立AI助手或其他AI工具,让用户可以直接在网站上搜索内容。例如,用户在阅读一篇文章时,可能会有进一步的问题,我们会提供API积分支持,同时向所有媒体公司的员工免费提供Perplexity的企业版订阅服务。我们相信,我们的工具可以让内容创作更高效,特别是在做背景调查和事实核查时,Perplexity已成为一个广泛使用的研究工具,能帮助用户更轻松地完成深度研究。

Delvin Coldewey我很感谢你们的解答,尽管在获取来源的方式上我们可能仍存在一些分歧。接下来我想提到版权问题。这个领域相当复杂,是一个前所未有的知识产权法律难题,因此几乎没有现成的先例。所以是否有可能在某些情况下,无意中触犯到版权法?

Aravind Srinivas我已经在我的博客里回应过了,在任何法律下我们都会捍卫自己。

Delvin Coldewey你觉得法律需要做出改变吗,让IP保护更宽松?

Aravind Srinivas其实关于版权已经有很多明确的法律程序了,现行的版权法很多,并且已经有判例确立了事实本身不受版权保护。

Delvin Coldewey当然没错,但问题不只是关于事实。

Aravind Srinivas我们都不是律师,所以在这里无法解决这个争议。我认为事实应该平等分发给每一个人。设想一下,如果科学家们宣称拥有某些事实的权利,而其他人无法传播这些知识与真相,那将是一个什么样的世界。(台下一大片掌声)

图源:硅星人

Delvin Coldewey好,不说事实问题了。为什么你们要筹集那么多资金?

Aravind SrinivasAI的成本很高。目前GPU和数据中心都很昂贵,我们希望未来能降低成本,但现在开发这些模型需要大量投入,提供这些服务的公司需要通过收费来回收成本。我们观察到,API成本大约每4到5个月就会下降一半,如果这一趋势能再持续一两年,我们的模型成本将可能降低10到50倍,这对我们这样的成长型公司来说是极大的利好。

我们可以专注于增长,同时在短期内管理成本,因为我们知道成本会逐步下降。在这个过程中,我们也在摸索长期可持续的收入模式。我们认为AI产品的变现方式不仅限于订阅服务,虽然订阅模式对很多公司来说效果很好,我们也有不错的表现,但我们认为还有其他更好的方式,比如按使用量收费,而不是仅仅靠月费

Delvin Coldewey你觉得能从谷歌手里抢到一些收入吗?

Aravind Srinivas我不确定是否会是零和博弈。也许市场预算的分配会有所调整,比如现在市场营销费用大部分投给谷歌,未来可能会有95%投给谷歌,5%给Perplexity。但目前还不清楚这种变化是否会立即影响谷歌的广告收入。一般来说,新平台出现后不会立即替代已有的市场,而是逐渐融入。同时,我们会在不破坏现有收入的前提下,努力说服广告合作伙伴。

Delvin Coldewey最后一个简短问题,我列出几个公司名,你来回答是否收到过这些科技公司的收购邀约,只需要给我一个“是”或“不是”——准备好了吗?OpenAI?

Aravind Srinivas无可奉告。

Delvin Coldewey微软?

Aravind Srinivas无可奉告。

Delvin Coldewey谷歌?

Aravind Srinivas绝对没有!

(Delvin又问了Notion、Amazon、Meta、Elon Musk,Aravind的回答全是“无可奉告”,即便他和马斯克“是朋友”。)

Delvin Coldewey好吧,算了哈哈。

你今天早些时候发推文提到你的绿卡申请问题。对于那些在类似情况下经营着数十亿公司,但像你一样还没拿到绿卡的人,你有什么建议?这真得很让人震惊。

Aravind Srinivas我的意思不是我就应该因此获得所有优待。我对此有一些基本理解,美国移民系统对每个国家每年有固定的移民配额,而我来自印度,很多印度人希望移民美国,加上疫情造成的积压,这是进展缓慢的主要原因。我只是希望通过表达这个问题,引发一些关注。

Delvin Coldewey感谢你和我们分享。

点个在看,再走吧

硅星人Pro
硅(Si)是创造未来的基础,欢迎来到这个星球。
 最新文章