OpenAI 的产品管理与人工智能的未来: Kevin Weil访谈

文摘   2024-10-18 15:47   美国  

点击⬇️图标关注   抓住你的灵感💡瞬间


 播客&访谈类的编译和提炼获得不少用户的喜好和好评。多谢大家的鼓励!有个变动,我后面将总结提炼和访谈译文稿都附上了。希望你们继续支持!

做这些内容主要还是服务于自己对大模型领域前沿趋势的学习。如有任何问题,请联系我。——AILin师傅


本文根据与 OpenAI 产品与合作副总裁(CPO) Kevin Weil 的播客对话整理而成,探讨了 OpenAI 产品管理的独特性、发展战略、竞争格局以及未来展望等话题。(https://youtu.be/VsmEMUiPXIs[1])

产品管理在 OpenAI 的独特之处

Kevin Weil 首先分享了他在不同公司领导产品管理的经验,并指出 OpenAI 的产品管理与其他公司存在显著差异。他认为,产品管理在不同公司的差异很大程度上取决于创始人和公司文化。例如,Twitter 过于强调共识文化,导致行动速度缓慢;而 Instagram 则拥有像 Kevin Systrom 这样杰出的产品思考者,推动产品快速迭代。在 OpenAI,Sam Altman 是一位富有远见的领导者,他鼓励团队大胆思考,同时也为团队提供了探索和构建产品的空间。

然而,OpenAI 最大的不同之处在于其技术基础并非固定不变。在 Kevin Weil 之前工作过的所有公司中,技术基础通常是既定的,产品团队需要思考如何利用现有技术构建最佳产品,并了解用户需求和痛点。但在 OpenAI,乃至整个 AI 生态系统中,技术基础都在飞速发展。几乎每个月,计算机都能完成以前从未做到的事情。这种变化难以预测,有时只能隐约感觉到下一代模型可能具备的新能力,但具体表现如何,例如 80% 准确率、95% 准确率还是 99% 准确率,往往要等到模型真正成熟后才能知晓。而针对不同准确率的产品构建策略也截然不同。因此,OpenAI 的产品开发需要不断适应快速变化的技术环境,这是一个巨大的挑战,但也充满了乐趣。

这种快速的技术迭代不仅对 OpenAI 团队,也对开发者和用户提出了挑战。Kevin Weil 举例说,一位企业客户曾希望 OpenAI 能够提前 60 天通知即将发布的功能,以便他们更好地进行调整。他幽默地表示,自己也希望能够提前 60 天知道这些信息。

OpenAI 的开发者战略

OpenAI 面向消费者推出了 ChatGPT,同时也通过 API 为开发者提供服务。针对开发者,OpenAI 的核心理念是“更多的 AI 更好”。他们希望将最先进的模型和功能通过 API 提供给开发者,并不断降低成本、提高速度和安全性。OpenAI 拥有超过 300 万开发者用户,他们将 AI 应用于各个领域,推动 AI 的普及和发展。

Kevin Weil 认为,模型蒸馏技术将成为一项至关重要的技术,因为它能够降低 AI 使用门槛,拓展 AI 应用场景。他指出,AI 领域的发展趋势令人惊叹。与最初发布的 GPT-3 API 相比,如今的 GPT-4-0314 模型在性能大幅提升的同时,成本降低了 99%。这种成本下降趋势意味着 AI 将变得更加普及,应用场景也将更加广泛。

另一个令 Kevin Weil 兴奋的功能是实时语音 API。他分享了在首尔和东京使用 ChatGPT 进行实时翻译的经历。通过语音 API 和高级语音模式,他能够与不懂英语的当地人进行流畅的交流,这让他深刻体会到 AI 技术的变革力量。他认为,实时翻译功能不仅可以应用于商务场景,还可以改变旅游、教育等领域,甚至实现科幻作品中的“万能翻译器”梦想。

竞争格局与开源模型

谈到竞争格局,Kevin Weil 表示,开源模型的出现是件好事,它能够让更多人接触和使用 AI。他认为,开源模型和闭源模型并非非此即彼的关系,而是共同推动 AI 发展的重要力量。OpenAI 也积极参与开源,例如其语音转录模型 Whisper 就是完全开源的。

对于与云服务提供商的竞争,Kevin Weil 认为,由于 AI 市场发展迅速,竞争不可避免。微软是 OpenAI 的深度合作伙伴,他们通常通过 OpenAI 的模型进行 AI 创新;谷歌则是 OpenAI 的直接竞争对手;而亚马逊和 Anthropic 则在构建自己的平台和模型。Kevin Weil 认为,竞争能够促进各方进步,最终用户将受益于更优质、更安全的 AI 模型。OpenAI 的优势在于行动速度更快,更敢于在产品和技术上进行探索和尝试。

o1推理模型的产品化挑战

o1推理模型是 OpenAI 的一项重要突破。与传统的模型训练方式不同,o1模型能够进行推理。当面对问题时,它会像人类一样思考,提出假设,并根据自身知识验证假设,最终得出答案。这种推理能力使得零一模型能够拓展知识边界,而不仅仅局限于已学到的知识。

将o1模型产品化面临诸多挑战。首先,OpenAI 团队需要评估o1模型的适用范围。虽然它在科学、数学等需要推理能力的领域表现出色,例如在 GPQA 等研究生水平的科学测试中,o1模型的得分超过 90% 的研究生,但在代码编写、创意写作等领域的表现如何,还需要进一步验证。其次,零一模型需要时间进行思考,因此需要重新设计用户界面,例如在模型思考过程中,如何向用户展示其思考过程。

最终,OpenAI 选择在 API 中提供o1模型,并获得了开发者的积极反馈。Kevin Weil 认为,o1模型的推理能力将在未来发挥更大的作用,尤其是在解决复杂问题和实现 AI 代理方面。他建议开发者关注 AI 目前尚无法解决的问题,并针对这些问题构建产品,因为随着 AI 技术的进步,这些产品很快就能发挥巨大价值。

AI 的未来与商业化

关于 AI 的商业化,Kevin Weil 认为目前还没有确定的答案。OpenAI 不会考虑广告模式,而是希望让每个人都能使用 AI。他们致力于降低 AI 使用成本,并提供免费产品。但随着 AI 能力的提升,AI 的价值也将越来越高,例如o1模型能够在几分钟内完成律师助理需要花费数小时才能完成的工作。如何在实现商业化的同时,让更多人能够使用 AI,是一个需要思考的问题。

在规划 ChatGPT 产品路线图时,Kevin Weil 倾向于将 AI 系统视为人类进行思考。例如,在设计o1模型的用户界面时,他参考了人类思考问题的过程,为模型添加了“思考中”的提示,并展示其思考过程摘要。在开发语音模式时,团队也参考了人类对话的自然方式,避免模型表现得过于“热情”或“黏人”。他认为,模型的行为本身也是产品的一部分,模型的“个性”等特征也需要精心设计。

Kevin Weil 认为,未来 AI 模型的交互方式将更加丰富,例如支持语音交互、图像识别等。模型的输出也将更加多元化,例如支持多媒体内容。他认为,聊天界面作为一种人机交互模式,可能会继续存在并不断发展,因为它能够模拟人类的对话和协作方式。

模型价值观与安全性

关于模型的价值观,Kevin Weil 认为这是一个复杂的问题。OpenAI 发布了模型规范,并将其公开征求意见。如果模型的行为不符合预期,可能是因为它没有遵循规范,或者用户不认同规范。如果是前者,OpenAI 会将其视为 bug 并进行修复;如果是后者,则需要进行公开讨论和 debate。

在模型安全性方面,Kevin Weil 认为模型本身和围绕模型构建的系统都需要考虑安全性。OpenAI 会设定一些模型绝对不能做的事情,例如回答某些敏感问题或执行某些危险操作。同时,模型的行为也需要根据应用场景进行调整,例如在 ChatGPT 中,模型需要遵循更严格的规范,而在 API 中,开发者可以根据具体需求进行调整。

Kevin Weil 强调,OpenAI 相信迭代部署的理念。他们认为,将模型逐步开放给更多用户,并收集反馈,是提升模型安全性和推动社会进步的有效途径。

未来展望

Kevin Weil 对 AI 的未来充满期待。他认为,未来每个孩子都将拥有个性化 AI 导师,这将极大地提升教育水平。他认为,AI 技术的发展速度已经超过了应用速度,未来的关键在于将 AI 应用于 specific use cases,并利用私有数据进行模型微调。他鼓励开发者积极探索 AI 的应用场景,因为 AI 的普及将使世界变得更加美好。

最后,Kevin Weil 指出,模型的评估能力有限,这是一个重要的 insights。他认为,随着 AI 模型的快速发展,开发者将拥有巨大的机遇。

——————————————————————————————————

以下是访谈原稿。

一、OpenAI 产品管理的独特之处

Robert Nishihara: Kevin,你曾在多家公司领导产品管理工作,那么在 OpenAI,产品管理有什么不同?

Kevin Weil: 在某种程度上,产品管理在不同的公司是不同的,很大程度上取决于创始人和公司文化。Twitter可能过于强调共识文化,所以我们本可以更快地行动。Instagram 有 Kevin Systrom,我认为他是世界上最优秀的产品思想家之一。在 OpenAI,显然 Sam Altman 是一位有远见的人,他推动我们思考更大的问题,但也给我们留下了空间,让我们弄清楚我们需要构建什么,构建正确的东西。

但我认为最大的区别在于,在我之前工作过的所有地方,你都有一个固定的技术基础,你试图弄清楚如何利用它来构建你能构建的最好的产品,你试图了解你的用户,他们的问题是什么,但你从技术的角度来看,你在 OpenAI 和整个 AI 生态系统中使用什么。技术基础不是固定的,像每个月或每两个月,计算机就能做一些计算机在世界历史上从未能够做到的事情,而且你也无法完全预见到它的到来。有时候你会感觉到下一个模型会有这种新功能,你可以从迷雾中看到它,但你通常不知道,直到模型真正成熟,它在这件事上是 80% 的好,还是 95% 的好,还是 99% 的好,你为一个 80% 正确的东西构建产品的方式与一个 99% 的超级不同的东西构建产品的方式是不同的,所以,很多事情是我们正在动态地解决的,世界正在变化,技术正在发生如此迅速的变化,这是一个巨大的挑战,但这是一个有趣的挑战。

Robert Nishihara: 不仅仅是对你们,也对你们的客户,对吧?在你们的平台上构建的开发者?

Kevin Weil: 我最近在一个会议上与我们的一位企业客户进行了会面,他们问他们是否可以有一个提前通知。客户说,’我们会喜欢这一切都很好,我们很高兴,但你能给我们 60 天的通知,告诉你所有你正在发布的东西,因为它真的会帮助我们.’,我说:’我也想要提前 60 天的通知,了解所有的事情。’

二、OpenAI开发者战略

Robert Nishihara:  这是一个很好的观点。你提到了企业客户,所以你们同时服务于使用 ChatGPT 的消费者,以及使用你们 API 的开发者,对吧?由于这是一个开发者受众,让我们来谈谈这个等式的开发者方面。你能分享一些关于你们面向开发者的路线图的策略吗?

Kevin Weil: 我们昨天刚刚举办了开发者日,这真是太令人兴奋了,它发布了很多重要的版本。总的来说,我们的理念是,更多的人工智能对世界更有利,所以我们越能让人工智能掌握在开发者手中,他们就能用它做更多的事情,那就越好。所以我们尝试着将我们所有的前沿模型放入 API 中,我们尝试着带来新的功能,比如昨天我们刚刚发布了实时语音 API。

Robert Nishihara:  顺便祝贺一下,这真是太棒了。

Kevin Weil:  谢谢,谢谢。我们对此感到非常兴奋。我的意思是,我们昨天发布了蒸馏技术,所以你可以将更大的模型蒸馏成更小的模型,这些模型非常擅长做特定的任务,而且成本更低。总的来说,我们希望带来更多的智能,我们希望让它更便宜,我们希望让它更快,我们希望让它更安全,我们希望把它提供给 300 多万通过我们的平台使用 OpenAI 的开发者,因为你们都将帮助将更多的人工智能带到世界上,这将从根本上对世界各地的人们有利。

Robert Nishihara:  这些发布中,有没有哪一个是让你最兴奋的?

Kevin Weil: 我认为"蒸馏技术"将是一个根本性的重要技术,因为它将使人工智能有更多的应用可能。你知道这个领域的发展趋势有多疯狂吗?如果你回顾最初的API发布,我想不是GPT-3,然后比较今天GPT-4的成本,GPT-4是我们最强大的模型之一,我认为它的成本是GPT-3发布时的1%。所以它变得更智能、更安全,而且在不到两年的时间里,成本下降了99%。我不知道有多少行业能做到这一点,但这真是太了不起了。因为你获得的越多,人工智能就越普及,它就越便宜,你就能将它应用到越多的场景中,我们就能一起解决越多的问题。因此,我们的目标是让更多人能够使用它。所以我认为"蒸馏技术"是一个很大的进步。高级语音模型是另一个突破,我可以整天讨论它的应用场景。

Robert Nishihara: 我想呼应你这里的观点。我们在Ray中看到,每当你能让某些东西快10倍或便宜10倍,你就能开启更多的应用场景。

Kevin Weil: 几周前我在首尔和东京与那里的客户进行了一系列会谈。我们为很多会议安排了翻译,但之后你会发现自己只是在闲聊,想与人交谈,但有很多人,你知道,我不会说韩语或日语,他们也不会说英语,我们没有共同语言。所以我打开了ChatGPT,我说,"嘿,ChatGPT,我想让你做我的翻译。当你听到我说英语时,我希望你用韩语说出来;当你听到韩语时,我希望你用英语说出来。"这是在使用我们新的高级语音模型,如果你有Plus会员,今天就可以使用它。它真的做到了,我能够和一个人交谈,我的意思是,我们本来连两个字都说不出来,更别说进行完整的商务对话了。这真是令人深思,但你想想它的其他用途,它不仅仅关乎商业。想想旅行和旅游,如果人们不再害怕去他们不懂任何语言的地方,那会带来什么样的变化?像通用翻译器这样的想法已经存在很长时间了,以前它就像星际迷航里的东西,对吧?它曾经是科幻小说,现在你口袋里就有了这样一个设备。

三、竞争格局与开源模型的影响

Robert Nishihara:  我记得在 2015 年或更早的时候看过一些这样的演示,但它确实令人难以置信。让我们来谈谈竞争格局,开源模型对 OpenAI 的业务意味着什么?

Kevin Weil:  我很高兴它们是开源模型。我认为这不是非此即彼的,从哲学或使命的角度来看,它是关于让人工智能掌握在更多人的手中,我认为这很好。我也与 Mark Zuckerberg 密切合作过多年,我非常尊重他,这对 Meta 来说是一个超级聪明的策略。所以,我们做了一些开源工作,我们有 Whisper 模型,它可以进行转录,它是完全开源的。

Robert Nishihara:  你们有 Whisper 模型,对吧?

Kevin Weil:  是的。所以,我认为这很好,我们让人工智能掌握在更多人的手中,最终人们想要的是,他们会试图找到最具能力的模型,以最好的价格,也尽可能安全,更多的选择是一件好事。

Robert Nishihara:  如果你让想想 OpenAI 最好的模型和最好的开源模型之间的质量差距,你认为这个差距会扩大还是缩小?

Kevin Weil:  我们当然会尽最大努力让它扩大。

Robert Nishihara: 你如何看待与云服务提供商的竞争?他们拥有构建优秀模型所需的资源和数据。

Kevin Weil: 他们各自都很不同,对吧?从某种意义上说,大量竞争是不可避免的,因为这可能是世界上增长最快的市场。我们需要分别看待各个云服务提供商。微软是我们的深度合作伙伴,当他们用模型做创新时,通常是通过我们的模型。谷歌更像是直接竞争对手,而亚马逊则类似于Anthropic,他们在这个领域中游走,用Bedrock构建平台。但是,更多的竞争意味着更多的选择,竞争让我们所有人变得更好。由于这个领域存在激烈竞争,你们将获得更优秀的人工智能模型,这对世界来说是件好事。我们必须做一些大型云服务提供商做不到的事情,我们必须行动更快,在产品上以及在利用这些新模型的能力上承担更多风险,这就是我们的策略。

Robert Nishihara: 我对01和推理模型的发布印象深刻。你能分享一些将该模型转化为产品时面临的挑战吗?顺便问一下,谁用过01?

Kevin Weil: 哇,太棒了,几乎每个人都用过。关于01,我们面临了许多有趣的挑战。对于那些还没有使用过它的人,让我解释一下。想想我们一直使用的常规模型构建范式,从OpenAI 1, GPT-2, 3, 4, 5到未来的模型,它们基本上是通过在更大的预训练数据集上投入更多计算力来实现的。这种大规模预训练使模型变得非常广泛,积累了大量事实和知识,但它仍然是系统1的思维方式,对吧?你问一个问题,它就给出一个答案。

01的不同之处在于,它真正学会了推理。当它被问到一个问题时,它不会直接给出答案,而是会思考,形成假设,然后根据已知信息检验这些假设,确认或反驳它们,然后发展新的假设。这就像当我问你一个难题时,你会在脑海中思考一会儿,形成各种假设。01在后台做的就是这样的事情,所以它实际上能够推动知识的前沿。它不仅仅是利用学到的知识,还能进行推理并探索新的领域。这与简单地进行更大规模的预训练完全不同,你实际上是在问题解答时应用更多的推理。这是一种根本不同的模型扩展方式,特别擅长处理科学、推理和数学等纯粹推理领域的问题。

我们最初不确定的是它的普遍价值到底有多大。我们知道在数学和科学领域它表现出色。比如在GPQA这样的研究生水平科学评估中,它的表现超过了90%的研究生,这比之前的模型要好得多。但我们不确定这种能力对于编码或创意写作等ChatGPT常用任务有多大价值。我们想知道它是仅对小众群体有价值,还是能广泛应用,这直接影响了我们的产品开发策略。

另一个挑战是,01需要时间来思考。它在后台进行大量推理,所以我们需要找到合适的方式来展示这个过程。最终,我们决定给用户一个关于它思考过程的总结,然后再给出答案。这很有趣,因为它让用户能够了解答案是如何得出的。

尽管面临这些挑战,但好消息是反响非常好。我们将01放在API中,这让我们非常兴奋,因为我们知道开发者会有一些最具挑战性的使用场景。我们已经看到了很好的采用率,以及01能够完成的一些令人鼓舞的任务。

Robert Nishihara: 就你提到的广泛适用性而言,我理解有些最困难的科学研究任务,比如治愈癌症,需要具有强大推理能力的模型。而另一方面,有些任务,比如总结新闻文章,可能不需要那么多的推理能力。展望未来,你认为大多数任务会落在这个范围的哪个位置?

Kevin Weil: 这个问题很有趣。如果我们考虑一些最具经济价值的任务,目前01在某种程度上受限于上下文窗口的大小。我们正在改进这一点,未来它将有更大的上下文窗口,能够进行更长时间的思考。现在它能思考60到90秒,这在某些情况下已经很令人印象深刻了。有时我问它一个难题,它5秒钟就给出答案,让我无法质疑。但它通常会在60或90秒时达到极限。

你可以想象这样一个未来:你问它如何治愈某种特定形式的癌症,让它思考5个小时、5天,甚至5个月。所以我认为有些问题是需要大量思考时间的。而对于像"帮我总结这封邮件"这样的简单任务,情况可能会有所不同。

我认为,随着时间的推移,我们对AI模型的看法会发生变化。我们已经习惯了相当智能的模型,我们认为这是理所当然的。很快,更新AI模型就会像更新你的手机固件一样简单和频繁。

这让我想起了有人第一次尝试自动驾驶的经历。最初10秒他们可能会紧张地说"天哪,小心,那边有个骑自行车的人"。10分钟后,他们会说"哇,这是我见过最酷的东西"。但20分钟后,他们就开始感到无聊,在手机上查看邮件了。这说明我们适应新技术的速度有多快。

顺便说一句,如果你们中有人是从外地来的,在离开旧金山之前一定要体验一下自动驾驶汽车。这真的很神奇。但我们仍然习惯于这样一个世界,我们需要针对具体任务指导AI。比如说"这是一封电子邮件,我希望你帮我总结一下",然后我们会用这个总结去做其他事情。

Kevin Weil: 我认为我们将从人工智能为你回答问题的世界,转向人工智能在现实世界中为你做事情的世界,并为你完成任务,这些任务不是 5 分钟的任务,而是 5 个小时或 5 天的任务,甚至我认为是世俗的事情,商业,工作流程效率之类的事情,需要大量的推理才能在这个世界中制定一个更复杂的计划,然后付诸行动,定期向你汇报。所以我实际上认为 o1,以及推理能力,将成为未来更大的组成部分。

Robert Nishihara:  那么,这是否意味着每个在这个模型上构建产品的开发者都必须重新思考他们正在构建的产品的用户体验,以考虑到这些增强的能力,但也考虑到显著的延迟?

Kevin Weil:  我认为这更像是一种根本的哲学转变,你习惯于这种系统 1 级别的思维方式,你可以在人工智能中问它一个问题,然后得到一个答案,你将能够让人工智能为你做事情,它在未来将更具代理性,我认为在这一点上,这是一种不同的构建产品的方式。所以,是的,当然,像用户界面这样的东西会改变,因为事情需要更加异步,但我实际上,这就像以前不可能的产品将成为可能,如果我是一个开发者,如果我正在创办一家公司,我会思考那些人工智能今天还不能做的事情,并为那些用例构建产品,它们今天还不能完全工作,因为 3 个月或 6 个月后,它们将能够很好地工作,你将领先于其他人。

Robert Nishihara:  你对这里的开发者有什么指导吗?比如他们什么时候应该使用 o1,而不是其他模型?例如,你提到了编码,编码是一个好的 o1 任务吗,还是不是?

Kevin Weil:  是的,实际上,我们发现 o1 是一件非常擅长的事情,它是一个非常好的程序员,尤其是在你有难题的时候,如果你只是说,嘿,我需要你帮我写一个 Python 函数来排序这个列表,每个模型都能做到,但当你遇到真正困难的编程问题,需要你推理并做出很多权衡时,这就是 o1 真正擅长的领域。

总的来说,在这个快速发展的世界里,尝试思考人工智能还不能完全做到的事情是很有价值的。当你朝着这些方向构建产品时,你可能正在开发一个目前还不能完全发挥作用的产品,但在3个月后,它就能正常运作了,这将是一件非常棒的事情。
Sam Altman曾多次说过,如果你在开发某个产品时,害怕OpenAI或其他任何公司发布下一个模型,那么你可能没有在开发正确的东西。如果你只是在填补模型还没有完全掌握的领域的空白,那么这可能不是一个好的方向。
但是,如果你正在开发某些东西,而你迫不及待地想要看到下一个大型模型的发布,因为它会让你正在做的事情变得好10倍,那么这就是一个很棒的方向。因为这意味着你正在推动智能的前沿,你正在开拓以前不可能实现但现在刚刚变得可能的新产品领域。我认为这是最有趣的一系列事情。

四、推理模型 "o1" 的产品化挑战

Robert Nishihara:  这是一个很棒的启发式方法。那么,世界其他地区什么时候会赶上 o1 呢?

Kevin Weil:  明天,明年,12 个月后,谁知道呢?我的意思是,这就是这个行业的有趣之处,有太多东西有待发现,所有的实验室都在做非常好的基础工作,有时会有一些不同的重点领域,所以他们会各有千秋。

我认为这很有趣,这就像一个令人兴奋的,世界的一部分,有很多竞争,你必须做到最好,你必须工作得非常快,我们的工作是,在某个时候,其他实验室会弄清楚,我们构建 o1 的技术和o1 的方式,其中一些东西会随着时间的推移而扩散,我们的工作是,当他们做到这一点时,我们已经领先了三步。

我们真的觉得,特别是 o1,我们使用的技术有点像,我提到过,这是一种不同的扩展范式,它不像这种大规模的预训练运行,它是在推理时进行扩展,我们认为我们正处于这种范式的 GPT-2 阶段,我们看到了很多唾手可得的成果,我们可以很快地让这些模型变得更好,所以当人们赶上来的时候,我们会尽量领先三步。

Robert Nishihara:  这种引入额外的推理时间计算或复杂性的趋势,我认为与这个受众非常相关,特别是如果你在考虑为其提供动力的服务系统,它将会变得更加复杂。

五、AI 消费者产品的商业化模式

Kevin Weil:  当然。现在让我们来谈谈消费者产品,你为构建世界上一些最成功的消费者产品做出了贡献,对吧?Twitter、Instagram 和其他产品,最终社交媒体找到了通过广告获利的方法,对吧?那么,面向消费者的 AI 最终是如何获利的呢?是每月 20 美元的订阅,还是其他什么?

Kevin Weil:  这是一个非常有趣的问题。我不认为我们已经知道所有的答案。而且,我们的部分使命是将这项技术带给每一个人。世界上有很多地方,我们提供免费产品,而且我们将一直这样做,因为我们深信这一点。我们真的在努力让AI变得越来越便宜,这样我们就能在免费产品中提供更多功能。

但同时,也会有一些理由让人们愿意支付每月20美元的订阅费。然而,世界上有很多人无法负担每月20美元。所以,我们面临着一个两难的问题:一方面,如何分享我们创造的价值?比如,我们把一项以前需要花费8000美元的工作,在5分钟内以其一小部分的成本完成。另一方面,我们又如何将AI带给那些可能无法支付费用的世界其他地区?

Robert Nishihara: 这是一个悬而未决的问题。你认为最终会如何?会变成只需要几美元的API令牌费用吗?还是你认为我们能收取接近8000美元的费用?

Kevin Weil:  我真的不知道。我认为世界会发生变化,如果可能以3美元完成这些任务,你就不能长期收取5000美元,因为很快就会有人来以更低的价格提供服务。这些服务的价格很快就会降到接近实际生产成本的水平。所以,这是一个完全不同的情况。

六、ChatGPT 产品路线图与产品类比

Robert Nishihara:  当你在规划 ChatGPT 的路线图时,你是否有某些产品类比对你有所帮助,比如想,哦,这有点像搜索,或者有点像一个信使应用程序,或者类似的东西?

Kevin Weil:  这很有趣,实际上我个人发现的最好的类比是,试着把这些系统想象成另一个人,我给你举几个例子,也许,用 o1,、它会思考一会儿,对吧?

所以你可能有 30 秒或 60 秒的时间,有人问了一个问题,它正在思考答案,那么在这段时间里,我们在用户界面上做什么?

如果我问你一个难题,你不知道答案,大多数人不会只是开始滔滔不绝地说出思维链,只是开始不停地说话,因为他们在思考问题,大多数人也不会只是像,静音,然后转身凝视太空 60 秒,你有点像,你有点像定期更新。

所以这就是我们最终决定实际产品应该做什么?还有像语音模式,你会意识到,当你和某人说话时,与你写作时,它实际上是多么的不同。我不知道你是否曾经为自己写过一篇演讲稿,然后说出你写的话,感觉非常生硬,至少对我来说是这样,我必须改变我写作的方式,才能让它感觉自然,如果我要把它说出来,我们在让高级语音模式变得正确方面也遇到了同样的挑战,我们在构建它的时候,它总是会跟进一个像,你问它一个问题,它会给你一个答案,然后它会跟进另一个问题,感觉有点像它很需要你,有点像它在试图延长谈话,所以有一些有趣的方式,只是试着像。

好吧,我希望一个人在这种情况下做什么,这给了你一些关于 AI 应该如何表现的指导,因为它很有趣,在这些,模型本身的行为实际上就是一个产品、个性和其他东西,所以我们有产品经理和工程师,他们在思考我们应该如何塑造模型的个性。

Robert Nishihara:  这实际上是一个非常有趣的见解,这并不明显,但书面英语和口语英语是不同的语言。

Kevin Weil: 是的,我的意思是,至少对我来说,如果你把这个数字化然后读出来,我听起来可能会像个十足的傻瓜。所以在这方面用户体验非常重要。你刚才谈到了你们在用户体验方面取得的许多突破,当然,聊天界面是一个巨大的突破,语音模式是另一个。还有其他你们尚未推出,但你认为很重要的突破吗?

Kevin Weil: 嗯,我认为显然模型的响应需要变得更丰富。现在有很多文本往来,我们正在努力实现的一件事是,你应该能够像与另一个人互动那样与我们的模型互动。

我给很多人发了很多短信,今天早上也给你发了好几条。我们就是这样互动的,当然,这也是现在大多数人与ChatGPT互动的方式。但我也说话,我也看东西。我们希望你能够与模型对话,让它回应你;我们希望你能够举起手机,向模型展示你正在看的东西,并询问它关于现实生活中正在发生的事情。

我们已经谈到了Sora,这个模型可以动态生成视频。所有这些功能都需要自然而然地完全整合。我认为模型的响应会变得更丰富,你不会只得到文本回复,而是会得到多媒体内容,你还能对其采取行动。那里会发生更多的事情,我想这一点很明显。

看看聊天界面能维持多久会很有意思。因为我们正在转向更具代理性的行为,你可以要求模型在更长的时间内完成任务,它会向你汇报进度。我实际上认为聊天可能仍然会作为一种交互方式存在。它需要进化,但作为一个大致的模式,它可能会继续存在。因为它模仿了我们人类的互动方式,聊天和对话实际上是我们合作的方式。

所以如果你认为自己是在与越来越智能的AI合作,聊天只是一种对话模式,它可以与当今的人类进行扩展。我们会看到结果如何,这正是在这个领域进行开发的乐趣所在。

七、AI 模型的价值观与安全性

Robert Nishihara:  关于另一个话题,人们对模型过于左倾或右倾或政治正确表示担忧。如果你想到价值观,这是研究团队处理的事情吗,价值观是在训练期间或训练后内置到模型中的,还是在模型周围的产品层发生的事情?

Kevin Weil:  这些都是非常有趣的问题。顺便说一句,我怀疑即使我们对房间里的每个人进行调查,我们也不会达成一致意见。如果你问模型一些政治问题,有些问题人们的意见可能是50/50分裂的,显然在这种情况下模型不应该采取立场。但如果你问它地球是否是平的,这个问题上有99%以上的人意见一致,但不是100%,那么模型应该采取立场吗?如果意见是80/20呢?这些都是难题。

所以我们的做法是,我们发布了一个模型规范,我们给出了大量的例子,基本上是说,这是我们指示我们的模型遵循的规范。它就在那里,用自然语言写成,你可以去阅读它。我们公开征求意见,一直在收集反馈。

如果你不喜欢模型的行为,可能有两个原因:一是它没有遵循规范,二是你不同意规范本身。在第一种情况下,如果它只是没有遵循规范,那实际上是一个错误,我们应该去修复它。如果是第二种情况,即规范不是你希望的样子,那么这是一个我们可以进行的辩论。但至少我们有一个公开的规范,我们可以作为社会就此进行讨论。
这就是我们采取的方法,我认为到目前为止,效果不错。我们对规范进行了激烈的辩论,规范必须随着模型获得新的能力而发展。但到目前为止,它一直都很好。有一个可以进行辩论的文件,比起仅仅说"哦,我得到了这个答案,我不喜欢它,OpenAI,你去修复它"要好得多。所以这就是我们试图采取的方法。

Robert Nishihara: 我同意这是一个很好的方法。对于在模型之上构建产品的人来说,我们这里很多人不仅在构建模型,实际上还在构建围绕你们模型的系统。如果我在考虑安全和类似的问题——当然,安全可以意味着很多不同的事情——但如果我在考虑安全,什么是正确的分析单位?是模型本身,还是模型周围的系统和产品?

Kevin Weil: 从深度防御的角度来看,我们认为两者都是。有些事情我们希望模型永远不要做,永远不要回答,然后有些事情我认为会根据它所处的应用程序的上下文而改变。比如对于ChatGPT,我们会采取一系列观点,而如果你在谈论API,你就有更多的自由来采取不同的立场。如果你是核聚变科学家,有些问题我们不希望模型能够在ChatGPT中回答,但在专业环境中讨论这些问题可能是合理的。所以在某些方面,我们会明确表态,说模型不应该做某些事情,因为这是非法的,或者从根本上不是我们希望我们构建的产品能够做的事情。然后在其他方面,它会更加依赖于上下文,我们希望允许这种灵活性存在。

Robert Nishihara: 这很有意思。我很好奇,在编写这个规范,构思这个规范的时候,你发现哪些技能和为之做出贡献的人对做好这项工作最重要?

Kevin Weil: 实际上,从更广泛的角度考虑模型行为,我们雇佣了一批作家,他们可以帮助模型更好地表达自己,如果可以这么说的话,让它的情感表达更加准确。这也让我想起了一件事,当我100年前在Twitter工作时,Ev Williams说过一句话,这句话一直让我记忆犹新,在某种程度上也适用于今天的OpenAI。他的观点是,无论你公司内部有多少人,无论你有多少聪明人,公司外部都有更多聪明人。这对于任何涉及社会变革的问题都是如此。

这与OpenAI的相关之处在于,我们相信迭代部署的理念。所以在面对新技术和随之而来的所有具有挑战性的社会方面问题时,从安全到更平凡的事情,我们的信念是,将模型推向市场,并逐步将它们暴露给更广泛的人群,实际上是我们让它们变得安全的方式,也是我们慢慢推动世界发生积极变化的方式。这就是我们在这里采取的方法,这就是为什么模型规范是公开的。它就在那里,我们征求对它的意见,并根据来自世界各地人们的反馈来改进它,而不仅仅是根据OpenAI内部一群人的反馈。

Robert Nishihara:  这很有道理,实际上,我们从广泛的开源社区和来自许多不同公司的贡献中受益匪浅。

八、未来展望与开发者机遇

Kevin Weil:  当然。嗯,也许最后,你能分享一下你认为未来会是什么样子,以及你对什么感到兴奋吗?

Kevin Weil: 我认为这会很有趣。比如,我举了ChatGPT作为翻译的例子,这种体验确实令人震惊。我也对这样的事情感到兴奋,比如当每个孩子长大后都有一个个性化的导师。实际上,我有点惊讶这在今天还没有普及。可汗学院正在做一些有趣的事情,但似乎没有什么真正流行起来。我敢打赌,我们这里大多数人的孩子还没有使用这样的工具,更不用说世界各地那些可能不太了解AI的人了。但这感觉像是一件几乎不可避免的事情,当你看到孩子们接受个性化辅导与常规上学的结果对比时,我的意思是,这是一个倍数级的差异。实际上,我可以问你吗,这是否属于那种在OpenAI模型之上有很大价值可以创造的领域,还是属于那种下一个模型会让我的工作变得过时的类型?

Kevin Weil: 哦,我认为有很大的发展空间。我认为在某种意义上,我们正在接近或者已经到达这样一个点:我们不再受限于智能,甚至不再受限于模型的能力范围,而更多的是关于如何将它应用于非常具体的用例。这包括教它一些它可能不知道但可以学习的东西,应用非公开的数据集,利用你通过多年经营某种业务获得的私有数据,并让模型真正擅长于特定的领域。

我们不可能做所有这些事情,这就是为什么我们与可汗学院合作,例如,这也是为什么我们构建API。我们希望像你们这样的开发者去创造这些令人惊叹的应用,因为我们认为,越快将AI传播到世界各地,世界就会变得越好。所以我对此感到非常兴奋,我认为模型将以非常快的速度变得更好,这意味着我们所有人面前都有巨大的机遇。

Robert Nishihara:  关于评估受限的观点真的很有见地。Kevin,非常感谢你分享你的见解,很高兴与你聊天。

Kevin Weil:  是的,非常感谢你邀请我,谢谢。

参考资料

[1]

https://youtu.be/VsmEMUiPXIs: https://youtu.be/VsmEMUiPXIs

本文使用 Notion Nice 排版一键生成




以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。



 点击关注转发公众号     保持你对AI优质内容的敏感

AI趋势全天候
以AI之名,探索未知。 🧠观察行业,关照本心,时常好奇,时常喜欢猫。随缘私信交流
 最新文章