微软 AI CEO Mustafa :把 AI 当作新“物种”来思考它的潜力和风险|Bolt荐阅

企业   2024-11-06 16:01   上海  

《Masters of Scale》是由 LinkedIn 联合创始人 Reid Hoffman 主持的一档播客节目。邀请许多成功企业的创始人和领导者分享经验和见解。最新的一期节目,是 Reid Hoffman 与 Mustafa Suleyman(微软人工智能首席执行官、DeepMind 联合创始人)在 2024 年 10 月举办的 Masters of Scale 峰会重的对话。他们讨论了人工智能的风险和回报,Mustafa 解释了为什么他会用“物种”这个词来形容人工智能,也谈及他对 Agent 化未来的看法,以及为什么他认为当下是创业的好时机。

我们摘录了部分重点的内容,并做了整理和翻译,原播客内容可以点击「阅读原文」链接跳转收听。

图|播客 Shownotes


📝 内容摘要

1. 将 AI 比作“物种”:面对全新且未知的事物时,使用熟悉的比喻有助于我们更快的理解。将 AI 比作“物种”是因为 AI 具备某些类似于生物的能力,如感知和互动。这不仅形象,也有助于思考 AI 的潜力和风险。

2. 模型幻觉不是 AI 的缺点:AI 的 “幻觉”或创造力是其优势之一,人们希望根据输入的指令得到更多可能性,这种可塑性和模糊性正是我们所期望的,关键在于设定边界,防止 AI 获得过多自主权而带来风险。同时,AI 的设计应避免负面行为,促进人类更好的发展。

3. AI 的情商与智商同等重要:不仅要提高 AI 的准确性和速度,还要重视其情感能力和表达方式。这种能力对用户体验至关重要,尤其是在信息传递的方式上。

4. Agent 化的未来和 Co-pilot 的角色:AI 伴侣必须能够看到用户看到的东西,并且能感知用户的环境,从而更好地协助用户完成任务。尽管目前有许多概念验证,但全面实现还需时日。

5. 语音输入对 Agent 的影响:交互界面以及交互界面的形态,决定了用户能输入什么,语音输入会解锁与 AI Agent 交互的新方式,能够更自然地表达和交流,这将降低完成任务的门槛。

6. 与 Agent 互动对创造力的启发AI 极大的降低了人们获取想法和创意的门槛,并将扩大创造性思维的范围,同时 AI 可以帮助人们记录和实现他们的想法,类似于人类拥有第二个大脑。

7. 模型蒸馏和合成数据模型蒸馏技术在提升 AI 智能水平上发挥越来越重要的价值,未来的发展仍有很大空间,创业者应关注如何利用合成数据进行高质量微调。

8. 小模型的价值:小模型一定会是未来的发展方向,它能够在特定场景中提供高效的解决方案,我们将会将知识压缩到更小、更便宜的模型中,这些模型甚至可能会嵌入冰箱贴中。

9. 对 AI 创业的思考:目前我们处于过渡时期,在过去五十年的重大技术转型中,所有事物的结构都在重塑。当下是一个创业、扩张的好时机,这也是一个转变职业发展的时刻。即使不是创业者,只要你想积极行动,这都是一个值得关注的时刻。


🎙️ 访谈内容

1. Reid Hoffman:我听到你和其他人,有时候会将人工智能比作一个“物种”。这种视角如何帮助我们思考人工智能?在哪些方面它是一个好的视角?在哪些方面它可能会误导我们?

Mustafa Suleyman:当我们遇到一些特别新的东西,与我们以前见过的任何事物都不同,每一波新的技术浪潮确实都让人有这种感觉。想象一下第一次拥有电力的感觉是多么神奇和疯狂,或者第一次通过电话与大西洋对面的人交谈时的震撼。它让你从思维层面上增加了认知——世界还有这么多可能性。因此,每当这种情况发生时,我们会尽量找一个合适的比喻,将其与我们所知道的东西联系起来,以求更容易理解。它最终不会像我们已经知道的事物,但这是在它到来之前我们能找到的理解它的最佳方式。我提出数字物种的比喻,是因为如果我们退后一步,看看这些东西的能力时,“物种”是最接近的类比,因为它也带来了很多我们不想看到的问题。现在模型能够看到你所看到的、听到你所听到的,实时理解和与文本互动,并代表你采取行动。这些能力现在已经被越来越多的人运用。那么,一个准确的比喻,一个替代的词就是物种,而且我也认为这个词也对思考我们不希望 AI 做的事情有所帮助。


2. Reid Hoffman:那么,从谈论一个“物种”的角度,什么事是我们必须做的,什么事是我们必须尽量避免的,好让这个“物种”朝着正确的方向发展?

Mustafa Suleyman:我认为模型一个令人难以置信的地方在于,你输入什么,它不会给你 100% 你想要的东西。这也是软件的了不起之处,人们希望它能告诉我们一些我们不知道的东西。因此,我觉得“幻觉”实际上不是缺点。对我来说,是一种优势,或者将其称之为创造力。我们希望根据输入的指令得到多种可能的响应。而这种可塑性和模糊性正是我们所期望的。因此,让机器学习理解表达执行,而不是人类自己手动执行,这正是过去 15 年机器学习的核心所在,现在它已经能够做到了,这很好,但我们需要弄清楚的是,让机器学习的边界在哪里。

目前模型很少会做规递内省。机器学习的自我进化闭环都还必须需要人类监督。但我们可以看到,在 2025 年,这部分的工作成果会逐渐出现。我认为这是一个需要关注并且保持谨慎的地方。

另一个问题就是机器的自主权。显然,如果这些模型能够在任意数字环境中独立互动、创建自己的虚拟机,完全不需要人类监督和控制地在网页上操作,调用 API 等等,这将明显增加风险。这是我们应该非常担忧的两项能力。

积极的部分是,我认为 AI 极具创造力,我甚至认为 AI 将帮助我们发现自己最好的那一面。如果设计得当,AI 不会冷嘲热讽,不会对人下判断,不会说出羞辱人的话。而很多时候,反而人类会这样。一些人会写程序故意让 AI 变成这样,但这并不是不可避免的,是设计它的人的选择。

我认为,我们应该尽一切可能,在整个行业的生态系统、规范和价值观中限制这种可能性的发生。但一些人会这样做。我认为,这也给我们成为更好的自己提供了一个发展空间。几周前我读到一篇论文,讲了一些深信阴谋论的人们。而与聊天机器人长时间交流的人,相信阴谋论的倾向相对较低。我认为这有一个原因:聊天机器人相对更耐心、它不会对人下判断、不会贬低你,且始终如一,而且大部分时候基于科学文献提供证据。因此,我认为 AI 积极的一面确实会给人来带来很大的帮助。


3. Reid Hoffman:当你、Karen 和我创办 Inflection 时,我们设立了一个原则就是情商与智商同等重要。我想请你谈谈这对 Pi 意味着什么,为什么会这么设置,以及为什么不仅仅是对 Pi 这个产品而言很重要,而是对整个我们做的事情都有重要影响?

Mustafa Suleyman:我们通常将智商与这些东西挂钩:准确、速度、全面、相关,以及实时访问信息的能力。所有这些能力都在稳步提高。但我注意到的是,人们往往会认为“只要我把事实列出来,其他人就会懂的。”这是一种工程师思维。这种思维会忽视传递信息的媒介,也就是如何传递信息这件事的重要性。它会影响语调、风格以及模型的情感能力,问问题的深入程度等等。可能对大多数消费者来说,这种表达和获取信息的方式,比只是浏览和吸收维基百科信息更重要。因此,我认为这将是大家现在尝试解决的关键问题,也就是增加的关键的能力之一。


4. Reid Hoffman:谈到 agent 化的未来,给我们一些你的看法,从 co-pilot 的角度,你是怎么思考这个问题?在接下来的 2-5 年里,agent 将在我们的生活中扮演什么样的角色?

Mustafa Suleyman:我觉得第一步是,你的 co-pilot,或者说你的 AI 伴侣,必须能看到你所看到的东西。你在屏幕上、浏览器中、桌面上、手机上看到了什么,它就看到了什么。这意味着你的感官输入,它也能同步。这样,有时候你可能可以用一些相对模糊的语言调用它的记忆,比如:“你记得我看到的那个东西吗?”或者“那些东西在哪里?”这种理解是我们以前从未拥有过的。它使你的 AI 能够代表你采取行动,在浏览器中导航,调用 API,预定、购买和做计划。

当前我们已经有很多很酷的想法的演示,但我觉得我们离将它们投入生产还有一些距离。从之前的 AI 发展浪潮来看,在 GPT-3 之前,大约是在 2020 或 2021 年,大型语言模型还很不稳定。或者再参考语音识别和听写的发展历程。这个领域经历了 15-20 年的发展,在过去的 2、3、4 年里,准确率才到达了超过 99.5% 左右,并且个性化得到了增强。也正因如此,我们才看到越来越多的人选择语音输入这种交互方式,这部分是因为输入方式的变化,也是因为生成技术的进步。所以我觉得 agent 化的未来,还有几年才会实现。


5. Reid Hoffman:你认为语音输入会给 agent 的世界带来什么变化,一些额外的提高?生成式 AI 使对话能够顺畅进行,语音输入的效果得以提升,因为你只需与之交谈,它就能准确理解你的意思。

Mustafa Suleyman:是的,从抽象层面来看,交互界面以及交互界面的形态,决定了你能输入什么。搜索框和搜索引擎像一个信箱,让我们学会了使用搜索的语言,把我们的想法压缩成三到五个单词,甚至不算完整的句子。所以,我觉得语音体验的有趣之处在于,它让你在与计算机交互时解锁思维里的新的部分,因为你可以用完整的句子表达,可以自我修正,可以来回调整,还可以添加那些我们在即兴对话中会说出的内容,然后模型以段落的形式回应你。这和以往不同的是,你可能会想到一些以前从没有用这种“数字化的方式”去问和说的事情。

因为有了一个随时可用的 AI 伴侣,能完成任何你能在数字世界中完成的任务。而且我认为,人很可能会请它做一些自己现在在电脑上自己不会做的事情。我觉得这将是一个重大转变,因为完成某项工作的门槛将大大降低。既因为它几乎没有边际成本,也因为阻力大大减少。这样一来,你会想到一些之前没有想过的事情。


6. Reid Hoffman:那么与这些 agent 的互动,能给我们的创造力、灵感带来什么启发?

Mustafa Suleyman:想想你在一天中有多少随机出现的想法、疑问。如果你真的深入思考一下自己的潜意识,哪些时刻你会意识到“我在想什么”或“我想知道某件事”?这些想法几乎是当下不会被语言所表达出来的,一方面你身边不会有人时时刻刻倾听你的疯狂想法,除了你自己。而且人也没有时间打字记录,拿出手机记录的门槛也是很高的。比如说,我每天搜索大约 5-8 次,这已经投入相当多的精力了。

因此,如果获取这些想法的门槛降低,你能产生的创造性想法的范围就会扩大,而这些创造性的想法又会通过你的 AI 伴侣被记录和体现。我们将会完善记忆功能,我对此非常有信心。我们已经在网络上拥有记忆,而且能够在任何时候准确地从网络中检索信息。所以我们只是将这些信息压缩,以便为你的个人知识图谱服务。你还可以添加自己的文件、电子邮件和日历等等信息。这样一来,记忆将完全改变这些体验,因为进行有意义的对话或围绕某个创意进行有趣的探索,几次会话结束后,再回来时又不得不从头开始,这是相当令人沮丧的。我们完全忘记了之前讨论的内容。因此,我认为这是一个重大转变,因为不仅降低了你表达创造性想法的门槛,而且这些想法也不会被遗忘。你可以对那些你不记得的事情进行模糊的交叉引用,比如:“三周前我说的那个是什么?”就像拥有第二大脑,扩展了你的思维。这就是情商(EQ)如此重要的原因。


7. Reid Hoffman:我完全认同。那么我们现在来更具体地谈谈模型。有很多创业者在思考,接下来的几年应该如何看待这个不断演变的生态系统,以及应该关注哪些方面?

Mustafa Suleyman:好消息是,模型正在同时变得更大和更小,这几乎肯定会继续这样发展下去。过去一年里,一种新兴的方法开始流行,被称为“蒸馏”。大型、智能且昂贵的模型为小模型提供推理教学,而小模型能够进行来自 AI 反馈的强化学习,这种监督效果相当不错。

但是,规模依然非常重要。我们还有很大的发展空间。因此,我没有看到任何发展放缓的迹象。还有新的数据形式需要融入。当然,我们正在添加视频、图像等。其中我很感兴趣的是研究复杂的数字环境中的操作轨迹。比如从浏览器跳转到桌面,然后转交给手机,再从不同的生态系统切换,无论是在封闭的环境还是开放的网络中。我们正在努力理解这些操作轨迹,收集数据,使用监督性微调等方法。我认为这将带来很多令人大开眼界的结果。


8. Reid Hoffman:讨论数据的角度很多。一个比较经典的是,你能处理哪些数据,数据的质量如何?这方面的讨论网络上也已经有很多。但我认为人们忽视的一点是,新的数据将来自哪里。比如,我觉得合成数据很有趣,如果我们有这样的数据,我们可以训练出更好的小模型和大模型。那么,我们如何获得这些数据?如何确保它们的整合?创业者应该如何思考这一点?

Mustafa Suleyman:当你问聊天机器人一个问题时,那是一个问题,而不是提示词。当你写一个 3 页的风格指南,还加上了一些示例让 AI 模仿,那你写的是一个提示词。然后你对这个已经被提示的模型提问,提示词实际上就是你的数据。它是你高质量的指令集,指导你预训练的模型以特定的方式来输出。令人惊讶的是,模型仅凭几页指令就可以表现得很好,如果你用其他方式提示它,得到的结果完全不同。如果退一步,模型要想表现出细腻、精准和微妙,比如要表现出与你的品牌价值观或者你想做的产品高度一致,你必须提供数成千上万个“良好行为”的示例,并将其微调到模型中,这是一个持续进行的预训练过程,需依赖一些你已经非常确定的准确的高质量数据。现在好消息是,数万个示例在许多小众领域或特定垂直领域是很容易获取的。这也是当下的一个积极信号和优势。我认为在对预训练模型进行高质量微调方面,初创公司有很大的空间。


9. Reid Hoffman:创业者应该如何思考小模型的使用和部署?他们当中的很多人会使用微软、OpenAI 或谷歌等公司的先进模型和大规模模型来帮助他们。但创业者应该如何看待小模型带来的机会?他们如何能用小模型做一些有趣和特别的事情?

Mustafa Suleyman:我认为小模型无疑是未来。询问一个大模型问题,它实际上会激活数十亿条与当前查询无关的神经通路。而且更疯狂的是,它高效地完成了这一切。但实际上并不需要这样。如果你有一个明确的使用场景,我认为我们会将知识压缩到更小、更便宜的模型中,这些模型甚至可以嵌入冰箱贴中。冰箱贴是我能想到的最小的数字设备,或者它会在耳塞或可穿戴设备上等等。

我认为这种环境感知革命即将来临,尽管很早就有人预言过。但这就是知识压缩的轨迹,它走向极端人们就会拥有相当实用的功能,冰箱贴会知道它需要知道的信息。它可能在早上知道你进厨房了欢迎你,和你谈论冰箱里的东西,提醒你的日程。尽管目前人们还没有真正推动这一点,但任何两人团队都完全可以去探索这个方向。


10. Reid Hoffman:最后一个问题,你觉得人们在接下来的两天(活动)里应该思考什么问题?我给你一些时间思考,我先给出我的回答。对我来说,我们作为技术工作者,应该考虑引入哪些因素,以设计出更人性化的未来。人们常常认为“更人性化”意味着回顾人类在过去几千年中的表现,这确实是重要的一部分,但向前看同样重要,因为随着技术演进,人性也在演变。我们通过这些技术来进化我们的身份,通过现在的杯子、舞台、播客设备,这些都改变了我们作为人类的生活。所以,记住,我们有情感,有热情,有同情心,但这种情感如何在与技术的共舞中得到表达?这就是我提出的要思考的问题。你呢?

Mustafa Suleyman:我会说,问问自己,你是否准备好了 all in?因为目前是一个过渡时刻。我真的认为,在过去五十年的重大技术转型中,所有事物的结构都在重塑。我认为当下是一个创业、扩张的好时机,这也是一个转变职业发展的时刻。即使你不是创业者,只要你想积极行动,或者是一个爱组织活动的人,是一个研究者,这都是一个值得关注的时刻。因为,到 2050 年,世界会变得很不一样,现在是我们共同塑造和影响世界向何处发展的时候,没有什么是注定的。我们完全可以把世界变得更好,我认为我们在这一刻非常幸运,感到被科技赋能,同时也肩负着巨大的责任。


📮 更多阅读

Linear Bolt 
Bolt 是线性资本为早期阶段、面向全球市场 AI 应用专门设立的投资项目。它秉持线性投资的理念和哲学,专注在技术驱动带来变革的项目,希望帮助创始人找到实现目标的最短路径,不管是行动速度,还是投资方式,Bolt 的承诺是更轻,更快,更灵活。Bolt 已经在 2024 年上半年投资了 Final Round、心光、Cathoven、Xbuddy、Midreal 等 7 个 AI 应用项目。

线性资本
我们聚焦数据智能及其他前沿科技应用领域,相信Frontier Tech, Frontier Productivity, Frontier Life。
 最新文章