微软AI CEO最新访谈：大模型将继续带来出色性能现在是All in AI的时刻

科技 2024-11-03 17:01 北京

北京时间11月3日，商业播客和媒体Masters of Scale 在Youtube上放出了创始主持人Reid Hoffman（LinkedIn联合创始人和Greylock合伙人）与微软AI CEO Mustafa Suleyman在2024 Masters of Scale 峰会上的对话视频。

在访谈中，两人谈及了人工智能技术中情商的重要性、人工智能模型的演变，以及模型小型化为创业者带来的机会等话题。

针对模型的发展趋势，微软AI CEO Mustafa Suleyman认为，未来模型变大和变小将会同时存在，大型、非常智能且推理成本高昂的模型会教小模型，然后小模型可以从AI反馈中进行强化学习。

Mustafa Suleyman 表示，“规模仍然将继续在这个领域占据一席之地。我们有足够的数据，至少在未来两到三年内，规模化模型将继续带来出色的性能表现。”

他还对创业者们表示，现在已经到了全心投入AI，进行转型的时刻。“这是一个创立公司、拓展公司规模的时机，也适合转变职业轨迹，即便你不是创业者，甚至作为活动家、组织者或学者都应该密切关注。”

以下是对话全文，智能超参数编译，enjoy：

Reid Hoffman：你和其他人有时会将人工智能比作一个“物种”。那么，作为思考人工智能的视角，这样的比喻如何？在哪些方面是个好的视角？在哪些方面可能会误导？这种视角应该如何指导我们对未来的思考？

Mustafa Suleyman：当我们遇到一些本质上全新的东西，它与我们以前见过的任何事物都不同，每一波新的技术浪潮都会让人有这样的感觉。想想看，第一次使用电力会有多么不可思议和疯狂。或者通过电话线与大西洋对岸的人通话，那会是多么震撼。

它会让你对可能性的世界观增加一个全新的心智表征。所以，每次发生这种情况，我们都在努力寻找正确的比喻，将其与我们已知的事物联系起来。虽然它最终不会像我们已知的事物，但在它到来之前，这是我们最好的尝试。

我提出这种“数字物种”的比喻，因为当你退一步看这些事物的能力时，这确实是最接近的相似之处，尽管这带来了许多我们不希望它具备的特性。

我认为这也以正确的方式框定了“约束”的问题。这些模型将能够看你所见、听你所听、实时理解和互动文本，并代表你采取行动。这些能力正逐渐流行起来。

我认为，物种的比喻是我们最相似的替代选择，这也为我们思考我们不希望它成为什么提供了一个有益的框架。

Reid Hoffman：那么，我们应该做的最重要的一件事是什么？以及最不应该做的一件事是什么，以此来引导数字物种的发展？顺便提一下，我推荐Mustafa的书《即将到来的浪潮》，书中也深入探讨了这个问题。这是60秒的简述版本。

Mustafa Suleyman：我认为这些模型的一个不可思议之处在于，它们对于你的输入不会给出精确的答案。我的意思是，这有点像是软件的宏伟目标。我们希望它能告诉我一些我不知道的事情。

所以，所谓的“幻觉”这个词其实有点不恰当。我认为这并不是缺点，而是优点。

Reid Hoffman：叫它“创造力”吧。

Mustafa Suleyman：是的，创造力。我们希望在某些输入下能够得到各种可能的回应。而这种可塑性和模糊性正是我们所需要的。因此，让它们自己学习事物的表示，而不是我们手工设计这些特征，这正是过去15年机器学习的核心动机，现在它终于能做到这一点了。

但我们需要弄清楚的是这种学习的边界在哪里。

目前，几乎没有递归的自我改进，或者说，几乎没有一个闭环的自我改进是不需要人类直接监督的。但我们可以预见到2025年左右，团队会开始试验这个领域。所以我认为这值得关注，应该谨慎对待。

另一件事是完全的自主性。如果这些模型能够在各种数字环境中独立互动，生成自己的虚拟机，操作网页，与API互动等，风险显然会增加。因此，这两项能力是我们非常关注的。

Reid Hoffman：另一方面，积极的方面呢？

Mustafa Suleyman：我认为积极的方面是，它们会有极大的创造力。我认为它们会帮助我们与自己最好的一面互动。如果设计得当，这些模型不会刻薄、苛刻、羞辱他人——大多数人类会表现得很糟糕，但这些模型没必要如此。

有些人会编程，让一些AI伙伴具有这些负面特征，但这不是必然的结果，这是某些设计者的选择。我认为在根本上，我们应该尽一切可能限制这类东西出现在生态系统中，在标准和价值观方面要有所约束。

但有些人会这样做。不过我认为，这些模型有很多空间可以真正帮助我们展现最好的自己。

我三周前读到一篇论文，报告说一些持有阴谋论的人，在与聊天机器人交谈了一段时间后（大概是六周左右），他们相信这些阴谋论的倾向减少了。这是因为聊天机器人是有耐心的，它没有评判，不会贬低你，总是回来并通常基于科学文献，以证据为基础地交流。

因此，有很多有前途的迹象表明，积极的一面将会是令人难以置信的。

Reid Hoffman：事实上，我要提前问你一个我原本稍后要问的问题，我觉得这是个很好的时机。当你、Karen和我开始Inflection时，一个基本原则是情商与智商同等重要。请谈谈这对微软Phi 模型意味着什么，以及这种想法在整个行业中的重要性，不仅仅是对Phi而言。

Mustafa Suleyman：我认为可以将智商视为答案的准确性、速度、全面性、相关性，及其对实时信息的访问程度。所有这些方面都在稳步进步。

而我注意到的是，人们通常忽略了信息的传递方式的重要性。工程师通常认为，只要我陈述事实，人们自然会理解这是对的。然而事实证明，语气、风格、模型的情商、它们问你问题的方式，能反映出你可能使用的语言类型等，这些传递内容的方式对大多数消费者而言比客观地复述维基百科更重要。

所以我认为，这将成为关键能力之一。我认为每个人现在都在努力应对这一点，因为这个未来不仅仅关乎行动。人们可以清楚地看到，这也关乎个性。我非常感兴趣的是如何设计个性，因为这才是人们真正重视的部分。

Reid Hoffman：谈到未来的Agent，让我们来看一下它的愿景。在 Copilot的角度上，你如何看待未来两到五年 Agent将如何在我们的生活中扮演角色？从物种的层面到具体的应用，哪些方面对这些 Agent是重要的？

Mustafa Suleyman：Agent未来的第一步是你的 Copilot（副驾驶）——你的AI伙伴——必须能看到你所看到的东西。拥有一个能真正看到你屏幕上的像素、浏览器、桌面和手机上的内容的助手或伴侣，意味着它可以实时了解你的感官输入，这样你的AI伙伴就能观察到你所看到的东西。

然后你可以使用模糊的引用，例如“记得我看到的那个东西吗？”或“那些东西在哪儿？”这是一种我们从未有过的理解水平。这使得你的AI可以代表你采取行动。

这意味着在浏览器中导航，使用API，预订、购买和计划等。我认为目前有很多很酷的演示展示了这些功能。我觉得我们离能投入生产还差一段路。

回顾过去的几波发展，你可以看到类似的趋势。就像，在GPT-3出现之前，有一些模型，大型公司内部的LLMs（大型语言模型）等等，那可能是在2020年，2021年，它们真的很不稳定。

我认为，这可能就是我们在AQ（行动商数）方面所处的位置，让事情有50%，60%的时间能够正常工作已经很不错了。我们必须将它们提高到99%的准确率。

你可以在语音识别和听写技术中看到这一点。那已经是一个有15或20年的发展历史的领域了。只是在最近两三四年间才达到99.5%左右的准确率，并且已经实现个性化。

所以我们可能还需要几年才能实现这个目标。

Reid Hoffman：那么你认为语音输入的交叉点是什么？因为我完全同意。我实际上认为生成式AI的革命使得这种对话成为可能，从而大大提升了语音输入的效果，因为你不需要打字，可以直接对它讲话，然后它能够真正理解你在说什么。这种提升如何将 Agents的潜力更好地发挥出来呢？

Mustafa Suleyman：界面，界面的形状，非常抽象地说，决定了你能输入什么。因此，搜索引擎中的搜索框只是一个信箱式的输入框，我们学会了使用搜索的语言。

由于搜索引擎的搜索框仅是一个字母框，我们学会了“搜索语言”，把我们的想法压缩成一个三、四或五个词的短语，甚至不是一个完整的句子。

Reid Hoffman：平均长度大概是1.6个词，只是给你一个参考。

Mustafa Suleyman：确实是这样，也许是1.6个词。而关于语音体验的有趣之处在于，它似乎在与你的计算机互动时解锁了你大脑的新部分。因为你可以用完整的句子说话，可以自我更正，还可以来回切换，还可以加入我们随口讲出来的那些“杂话”。

模型也会以段落的形式回复你，这让你突然觉得，可以提出并讨论那些你原本不会去数字化的事情。

我认为这是一个很好的框架，它向我们展示了未来可能在行动方面发生的事情。因为你有了一个永远在身边的AI伙伴，它可以做任何你在数字世界中可以做的事情，你会让它去做那些你自己不会去做的事情，因为它太麻烦了。

这确实是一个大的转变，因为完成任务的进入门槛即将降低到几乎不存在。由于边际成本为零，摩擦也显著减少。因此，你会想到自己原本没想到去做的事，因为它变得如此方便。

Reid Hoffman：你认为这些工具如何帮助我们变得更具创造力？这种与 Agent的互动会带来怎样的灵感和启发呢？

Mustafa Suleyman：想一想你一天中会冒出的各种随机想法、事情或者疑问。如果你认真冥想一下你的潜意识，想想那些瞬间——“我在想什么”“我猜想”——它们几乎是“次语言”层面的想法。

这些通常不会被表达出来，因为你没有一个随时随地倾听你疯狂想法的人，除了你自己。而你也不会总是有动力去输入这些内容。实际上，拿出手机来输入也是一个很高的门槛。

我会在一天里进行多次搜索，但这还是有点麻烦。因此，如果进入门槛更低，那么你所能产生的创造性想法范围就会扩大，而这些想法可以在你的AI伙伴的帮助下得到具体体现。

然后，因为它们能够记住——这是另一个即将在行动之前到来的重要事情——那就是记忆。我们将搞定记忆问题。我非常相信，在2025年，永久记忆的问题将得到解决。

如果你想想看，我们已经在网络上有了记忆。我们现在可以相当准确地从网络上检索信息。Copilot的引用工作做得非常好。它能更新到15分钟前的信息，知道网络上新闻里发生了什么，等等。

所以我们只是在将这个过程压缩，以便为你的个人知识图谱提供服务。你可以添加自己的文档、电子邮件等个人信息。记忆功能将彻底改变这些体验，因为有意义的对话或对某些创造性想法的探索往往会持续几次对话，而不希望每次都从头开始。现在，我们的AI会记住先前的对话内容。

这不仅会降低表达创造性想法的门槛，而且这些想法不会被遗忘。这样你可以模糊地引用你之前说过的东西，例如“我三周前提到的那个事物是什么？”或“这与我们讨论的另一个事物如何相关？”

这就好比拥有了“第二个大脑”，它就像是你思维的延伸。这就是为什么情商的作用至关重要。

Reid Hoffman：那么让我们来讨论一下模型的技术细节。因为这里有许多企业家，大家都在思考这个领域在未来几年如何演变，以及需要关注的重点。

Mustafa Suleyman：好消息是模型正在同时变得更大和更小，这种趋势几乎肯定会继续下去。

近年来，一种新的方法开始流行，称为“蒸馏”。大型、非常智能且推理成本高昂的模型会教小模型，然后小模型可以从AI反馈中进行强化学习，并且这种监督似乎非常有效。

但规模仍然将继续在这个领域占据一席之地。我们有足够的数据，我认为至少在未来两到三年内，规模化模型将继续带来出色的性能表现。同时，我们还在加入新的模态，例如视频、图像等。

但我们真正关注的难点在于跨复杂数字服务的动作轨迹。例如，从浏览器跳转到桌面，再切换到手机，从不同的生态系统间转换，无论是在封闭环境中还是在开放网络中。

我们试图理解这些轨迹，收集大量这类数据，使用超文件和微调等技术进行优化。我认为这将带来许多令人印象深刻的成果。

Reid Hoffman：关于数据的讨论非常丰富，涉及许多角度，比如哪些数据可以运行，以及数据的质量。在网络上有大量关于数据集的讨论，但人们往往没有花足够的时间思考新数据的来源。

例如，我认为合成数据是一个有趣的领域。假如我们有这样的数据，我们可以训练出更好的小模型和大模型。那么企业家应该如何思考这些数据的获取方式以及它们的整合方法？

Mustafa Suleyman：我意思是，想想一个“提示”（Prompt）。不仅仅是一个问题，而是一组高质量的指令，指导预训练模型以特定方式行事。这种高质量的数据实际上是模型的“数据”。

当你写一个三页的风格指南，并附上模仿的例子时，那就是一个提示。然后你接着可以对一个已经被提示的模型提问。考虑到这一点，提示可以看作是你的数据。它是你高质量的指令集，给你的预训练模型提供了特定的行为方向。

这真的很了不起，模型可以仅仅根据几页的指示，表现得与一个以完全不同方式被提示的模型截然不同。这本身就很疯狂。

但如果你再退一步，从模型表现的角度来看，若要在细微差别、精确度和细致入微上表现出色，并真正遵循你的品牌价值或你想要创造的独特产品，你需要展示成千上万的良好行为示例，并将这些示例微调到模型中，这实际上是对某些高质量且准确的数据进行预训练过程的延续。

好消息是，成千上万的示例对于许多小众领域或特定行业来说是非常容易获得的。这就是一种优势。我认为在高质量微调预训练模型方面，初创企业有很多机会。这样，你会得到对你关心的行为政策更加稳定的遵循。

Reid Hoffman：企业家们如何看待小模型的使用和部署？显然，他们将利用微软、OpenAI、谷歌等公司的前沿模型来帮助他们，因为这些公司拥有数十亿美金的模型。但是小模型的独特性和机会又在哪里？

Mustafa Suleyman：我认为小模型将是未来发展的一部分。当你向一个非常大的前沿模型发出查询时，它会激活数十亿个并不相关的神经路径。

尽管它能够高效地进行搜索或引用大量节点，但并不总是有必要这么做。如果你有一个紧凑的用例，那么我们将知识压缩到更小、更便宜的模型中，它甚至可以放在冰箱磁铁上。

Reid Hoffman：我听你之前提过这个比喻——冰箱磁铁？

Mustafa Suleyman：对啊，我能想到的最小的数字化物品就是它了。也许它甚至不是数字化的。显然冰箱磁铁不会对量子计算了解很多，但它会知道它需要知道什么，以便在早上欢迎你，给你天气，谈论冰箱里可能有什么，可能没有什么，提醒你日历。

也许它只需要几千万个参数。目前还没有人深入探索这种可能性，但它完全可行，任何两人团队都可以进行探索。

Reid Hoffman：这也是为什么创业精神在这场会议中占有重要地位。我将继续我们最后一个问题的稍长版本，那就是：在未来，人们应该思考的关键问题是什么？

对于我来说，我想从我刚才说的内容中概括一下，那就是我们作为技术人员需要思考哪些因素，以设计一个更人性化的未来？当人们想到更人性化时，常常会联想到一些经典的概念，比如人类在过去几千年中的演变。这当然是一个重要方面。

但展望未来同样重要。因为随着我们技术的演进，我们的人性也在演变。我们通过这些技术进步来提升人性，无论是通过我们的播客设备，还是其他任何工具，这些都是改变我们作为人类的本质的一部分。

所以，别忘了，我们拥有情感和热情。当然，我们有同情心。但是，这些情感是如何在我们与技术的互动中得以表达的呢？这就是我想提出的一个重要问题。在给你几秒钟思考的时间后，希望你能考虑这个问题。

Mustafa Suleyman：我会说：问问自己，你是否全心投入了？因为现在真的是一个转型的时刻。

有充足证据表明，过去五十年间的重大技术变革重塑了整个结构。这是一个创立公司、拓展公司规模的时机，也适合转变职业轨迹，即便你不是创业者，甚至作为活动家、组织者或学者都应该密切关注。

在过去的五十年里，我们有足够的证据表明大型技术转型，所有事物的结构都得到了重塑。

我认为这是一个创立公司、扩大公司规模的时刻。这是一个真正转变职业的时刻，即使你不是企业家，即使你是一名活动家或组织者，如果你是一名学者，现在是真的需要关注的时候了，

因为到了2050年，这列火车将早已开走，世界将变得截然不同。这是一个我们确实有机会集体塑造和影响事物的时候。没有什么是一成不变的。

未来真的掌握在我们手中，我们有机会塑造一个对人类最有利的未来。我认为这是非常幸运的事情，能够在这个时刻活着，充满了力量，同时也肩负着巨大的责任。

Reid Hoffman：我完全同意。现在你就知道为什么我如此激动地以Mustafa来开启今天的活动了。让我们感谢他。

推荐阅读：

硅谷投资人谈科技巨头加码AI投资：因为AGI是帕斯卡赌注中的“上帝”

觉得内容有收获，请您加个关注，标个星～谢谢您

http://mp.weixin.qq.com/s?__biz=MzA5MzMwNTIzMw==&mid=2647893260&idx=1&sn=98f05f0df809bdb146e9736f0ec67523

智能超参数

看趋势，涨知识，开眼界。记录AI技术与商业。提供独立思考与理性价值。

AI大模型一周标讯：百度、阿里云、腾讯云、科大讯飞、火山引擎等中标

AI标讯｜国能陈家港电厂智能体数字员工“小智”研发项目，讯飞智元中标，金额710万元

AI标讯｜光大银行大模型GPU算力采购项目开标，广州南天电脑中标，金额1808万元

AI标讯｜重庆大足区大模型数智人采购项目开标，腾讯云中标，金额158万元

OpenAI份额大跌16%，Anthropic份额大涨一倍，成最大赢家！

英伟达披露：客户A、B、C第三财季合计贡献126亿美元收入

风投机构Thrive Capital揭秘：OpenAI最铁杆盟友，不走科技投资寻常路

AI标讯｜博时基金智能编码辅助系统项目开标，英捷创软LEANSOFT中标

AI标讯｜中国银联辅助研发AI模型采购项目开标，火山引擎中标

百度智能云第三季营收增长11%，AI贡献占比达到11%，沈抖说：基础模型对云越来越重要

AI标讯｜中信银行信用卡中心大模型训练服务器项目，新晨科技中标，金额636万元

AI标讯｜宝武智维大模型智能体服务框架构建项目开标，九章云极中标，金额113万元

2024年企业级AI支出现状：费用激增5倍，最爱AI编程工具，至少部署3个基础大模型

马斯克旗下xAI最新估值达500亿美元，年化收入约1亿美元

英伟达第三财季营收增长94%，净利润增长109%，毛利率略微下降

AI标讯｜中科院金属研究所先进钢铁大模型项目开标，清华大学中标，金额468万元

5分钟速览微软CEO在2024年Ignite大会上的主题演讲PPT：干货、要点都在这里了！

AI标讯｜基于大模型的国航之翼员工智能助手项目开标，科大讯飞中标

AI标讯｜太平洋保险集团大模型公有云服务流量采购项目，可利邦中标，金额58.7万元

AI标讯｜四川封面传媒行业大模型底座建设服务项目开标，阿里云中标

AI搜索引擎正在成为购物助理，Perplexity CEO说：AI需要实现从答案到动作的跨越

AI标讯｜津南数字产业创新基地大模型软件及服务采购项目，百度中标，金额7900万元

AI标讯｜广东邮电职业技术学院AI大模型应用实训室建设项目，讯飞智元中标，金额258.5万元

AI标讯｜西气东输面向智能体开发应用的数据服务项目开标，同方知网中标，金额100万元

AI标讯｜国家管网集团制程智能撰写软件采购及集成实施项目，瑞莱智慧RealAI中标

独家：2024年1-10月份，央国企大模型招投标项目都被谁拿走了?

阿里云季度营收环比大涨30亿元，AI驱动的公共云业务表现比大家想象的更优秀

50封往来邮件揭秘OpenAI的缘起、发展与矛盾

AI标讯｜福建鼓楼智脑AI智能问答系统项目开标，火山引擎中标，金额48.15万元

AI标讯｜上海徐汇区政务“云链数模”能力试点创新项目，腾讯云中标，金额7759万元

AI大模型一周标讯：科大讯飞、智谱AI、东软集团、亚信科技、云从科技等中标

AI标讯｜招商国科大模型应用场景算法开发服务采购项目开标，智谱AI中标

AI标讯｜中移动终端公司数字员工与业务场景智融能力研发采购项目，科大讯飞中标

AI标讯｜2024年审计大模型智库平台研发服务项目开标，东软集团中标，金额197万元

Scaling Law失效？大佬们各执一词，奥特曼说没有墙，施密特称模型性能还能提升100倍

AI标讯｜镇江单一来源采购微软Azure国际版GPT服务，神州数码中标，金额100万元

AI标讯｜中国电信重庆分公司AI智能体平台研发项目开标，云从科技中标，金额100万元

AI标讯｜昆明联通某单位Dali大模型中台技术服务项目开标，复深蓝中标，金额264万元

AI标讯｜山西移动AI智能外呼能力服务采购项目开标，科大讯飞中标，金额462万元

深度揭秘：马斯克如何快速建设10万卡超级计算机，并震惊AI竞争对手

AI标讯｜中译语通大模型对齐数据采购项目开标，网智天元中标，金额569.45万元

黄仁勋与孙正义笑谈当年：两人曾有三次机会成为英伟达最大股东

AI标讯｜厦门烟草大语言模型在营销业务场景中的应用研究项目开标，金额72.61万元

在一场新考试中，6个最前沿的大模型都败下阵来，解题率不到2%

独家：中国大模型中标项目监测报告(2024年10月)

AI标讯｜北京移动基于大模型的核心网智慧运维应用研究项目开标，项目金额180万元

百度创始人李彦宏：大模型不消除幻觉，就不会有应用

AI标讯｜中国信通院人工智能安全关键技术软件采购项目，浪潮云中标，金额138万元

Scaling Law提出者Ilya发声：大模型预训练效果趋于平缓，扩展正确的东西变得更重要

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

微软AI CEO最新访谈：大模型将继续带来出色性能 现在是All in AI的时刻

微软AI CEO最新访谈：大模型将继续带来出色性能现在是All in AI的时刻