点击⬇️图标关注 抓住你的灵感💡瞬间
“ 引言部分,总领全篇文章的中心内容。”
2024 年 10 月 2 日,第三届 IA 峰会,微软 AI 首席执行官 Mustafa Suleyman 与 Madrona 常务董事 Soma Somasegar 进行了一场名为“从 SaaS 到智能体”的炉边谈话,引起了广泛关注。Mustafa Suleyman 联合创立 DeepMind 和 Inflection AI。此次对话金句频出,体现了Suleyman在AI行业的深刻功底。重点探讨了 AI 如何影响行业、商业模式和日常生活。
他还分享了他的愿景:AI助理将很快改变我们生活、工作和与技术互动的方式。他不仅仅谈论工具或模型,他把人工智能重新定义为一种非常私人的关系,它能够适应、学习,甚至以我们尚未想象到的方式预测我们的需求。
人机关系:从工具到伙伴
未来的 AI 将不再仅仅是一种工具或应用,而更像是一种持续的、动态的伙伴关系。他设想 AI 将成为一个时刻在线、值得信赖的伴侣,拥有记忆和情商,能够通过语音、文本和视觉等多种方式与用户进行无缝互动。
智能的定义
Suleyman 不认同AGI的提法,提出另一种定义:智能意味着能够在正确的时间专注于正确的事情。如果 AI 能做到这一点(AI 能够在正确的时间将处理能力导向正确的子系统),将具有“元能力”,并突破仅靠扩展上下文窗口来提升能力的局限。
关注智商、情商和行动能力
AI 的发展将体现在智商 (IQ)、情商 (EQ) 和行动能力 (AQ) 三个方面。AI 的智商将不断提高,能够理解和处理更复杂的信息;情商的提升将使 AI 能够更好地理解和回应人类的情感;而行动能力的增强将使 AI 能够更有效地执行任务并与现实世界互动。这三个方面的协同发展将推动人机交互更加直观和自然。
AI商用之路
AI 雏形已经形成,但要实现真正的规模化应用,仍有很长的路要走。从 90% 的准确率提升到 99%,再到 99.9%,难度不亚于从 0% 提升到 70%。
AI 的未来:预测与洞察
Suleyman 认为,尽管当前 AI 领域蓬勃发展,投资和合作如火如荼,但准确预测未来三到五年的发展趋势仍然充满挑战。他提到互联网早期的例子,当时几乎没有人能预见到移动互联网的迅速崛起以及商业模式的转变。如今,虽然我们能够预测未来几年 AI 能力的提升,但这些能力如何组合,以及它们将如何影响现有的生态系统、激励机制和商业模式,仍然充满不确定性。
Suleyman 特别强调,机器学习人类语言的能力是一个划时代的突破。这不仅改变了人机交互的方式,还使每个人都拥有“编程”数字世界的能力。而这种编程能力,反过来也会影响人类的思维和行为。因此,AI 不再是一个传统的工具,而是一种动态、交互的存在,其输出结果并不固定,而是根据输入和环境不断变化。
他将 AI 比作一种全新的“设计材料”或“黏土”,要求开发者学会如何塑造它,以创造持续性的体验。不同于传统的编程,AI 模型会随着环境、用户反馈不断适应和进化,开发者无法完全掌控其发展轨迹。未来,开发者的工作将更多聚焦于塑造 AI 的语气、风格和个性,而非编写具体的规则和程序。
Mustafa Suleyman 的愿景:个人 AI 助手
Somasegar 提到,人们常犯一个错误:高估一年内能发生的变化,却低估十年内可能的变革。他认为,在展望 2028 年或 2030 年的 AI 发展时,想象力仍显不足。他特别提到 Suleyman 在 2024 年 3 月的 TED 演讲,Suleyman 认为,我们正处于一个拐点,一个新的数字物种正在诞生。
AI 的能力与挑战
Suleyman 承认预测未来充满挑战,但也表示在能力层面上,预测未来两到三年可能出现的功能是可行的。真正的难点在于如何将这些能力转化为产品、商业模式和生态系统。
在智商 (IQ) 方面,模型进展良好。事实准确性不断提升,幻觉现象显著减少,模型能够更高效地检索信息,并基于任意文档生成内容。随着计算量的增加,模型的可控性也逐渐增强。模型在指令遵循上表现更优,能更好地适应产品设计、行为策略和商业策略中的细微差别。
关于情商 (EQ),Suleyman 解释,尽管几年前一些人认为 AI 永远无法进行共情互动,如今它在文本和语音交互中已经展现出优雅、流畅的对话能力。这种自然、无缝的对话体验,正是微软发布的一些新功能的亮点。
至于行动能力 (AQ),他指出,AI 使用工具、与其他 AI 通信及进行推理的能力,与处理视频、图像、音频或文本并无本质区别。只要有足够的数据支持,AI 在行动能力方面也可能取得类似进展。在他看来,AI 的 IQ、EQ 和 AQ 都展现出了可预测的进步。
AI 中记忆的作用
Suleyman 强调,整合这些能力的关键在于记忆。虽然无限和完美的记忆尚未实现,但他相信在未来 18 个月内,AI 将具备强大的记忆功能,即使不是无限和完美的记忆,能够有效检索任意文档。
长期以来,智能的定义主要集中在通用人工智能 (AGI) 上,即一个核心系统能够在各种环境中表现良好。然而,Suleyman 提出另一种定义:智能意味着能够在正确的时间专注于正确的事情。如果 AI 能做到这一点(AI 能够在正确的时间将处理能力导向正确的子系统),将具有“元能力”,并突破仅靠扩展上下文窗口来提升能力的局限。
交互模式的变革
Somasegar 指出,人类之间的互动方式与人类与机器的互动方式不同。当技术的交互方式接近人类彼此之间的互动时,AI 的情商 (EQ) 愿景才会真正实现。
Suleyman 认为,要在大规模应用中取得成功,AI 必须具备低延迟、高精度、流畅性,以及良好的中断处理能力和合适的停顿时机。他强调,从 90% 的准确率提升到 99%,再到 99.9%,难度不亚于从 0% 提升到 70%。
微软发布会展示了具有情感直觉的 AI 雏形,但要实现真正的规模化应用,仍有很长的路要走。“对于大多数消费者而言,参数、模型等底层技术并不重要,重要的是 AI 的使用感受:它是否记得我?我是否信任它?它是否会礼貌地打断我?当它犯错时,是否能够优雅地处理?这些感受决定了用户是否会信任并持续使用 AI。” 这些感受直接决定了用户是否会长期信任和使用 AI。
AI 应用和大型语言模型的演变
Somasegar 提出,尽管 ChatGPT 令人惊艳,但真正的 AI 原生应用尚未出现。他询问 Suleyman 对此的看法。
Suleyman 认为,AI 原生应用的核心不是应用本身,而是用户与 AI 之间的关系。他的团队正在构建的是一种持久、有意义且值得信赖的关系。这种 AI 伴侣不仅能处理语音和文本,还能实时理解用户的浏览和桌面内容。过早将这种关系定义为应用或商业模式,可能会忽视其作为全天候、完全感知的伴侣的本质作用。
他鼓励团队深入研究 AI 的能力,并让体验和商业模式自然涌现。AI 的潜力不仅在于工具的使用,还在于与用户建立类似于人与人之间的私密关系。
大语言模型的讨论
Somasegar 提出,LLM 在过去四五年中经历了爆炸式增长。他询问 Suleyman,对于创业者而言,应关注模型层的控制,还是专注于更上层的体验和服务。
Suleyman 认为,预训练模型将被商品化,真正的优势在于微调。微调的反馈循环和高质量的人工团队是成功的关键。大部分问题不仅仅是技术问题,更是运营问题。 挑战在于如何建立反馈循环,并拥有训练有素、可靠的人工团队为模型提供方向性输入。Suleyman 认为,许多人过快地转向使用模型本身作为强化学习 from AI feedback (RLAIF) 的评判者,这可能有点操之过急。 要打造高质量的体验,需要将产品设计的知识和专业技能灌输给 AI 训练师,并快速地完成反馈循环,让他们与机器学习工程师紧密合作。
他强调,很多人过快使用 AI 自身作为强化学习(RLAIF))的评判者,忽视了人类训练师的重要性。打造高质量体验的关键在于将产品设计的专业技能注入 AI,并与机器学习工程师紧密合作。
最终,真正卓越的成果将来自于微调的循环和数据飞轮的建立,从而为客户创造巨大价值并赢得先发优势。
专业化 AI 模型和未来预测
Somasegar 询问 Suleyman 是否认为未来会存在多种类型的语言模型(LLM、MLM、SLM)共存,并服务于不同的用例,或者某种模型最终会胜出。
Suleyman 认为,未来不会出现一种模型统治所有领域的情况。他重申了对智能的定义:在正确的时间使用正确的工具。即使在当前的模型中,底层也部署了大量不同的模型。关键在于“路由器”,它能判断查询的复杂程度和稀有程度,并将其路由到合适的模型。未来,医疗、法律和金融等领域将会有专门的模型。然而,每个品牌、每个企业、每个影响者最终都可能拥有自己的 AI。甚至会出现 AI 优先的名人。正如 Suleyman 的朋友 Yuval Noah Harari 所说,下一场伟大的宗教可能由 AI 创立。尽管这听起来有些可怕,但他认为这很可能成为现实,因为AI 将变得非常有能力和说服力。
Suleyman 进一步指出,正如 AI 在回答问题时依赖多个底层模型,它还会实时查询其他 AI,即使这些 AI 不属于同一个生态系统。这种跨 AI 的信息获取速度将非常快,对商业模式的影响深远。传统的“围墙花园”策略可能不再有效。新的 API 是语言,语言将通过多种方式进行实时传输。到 2030 年,每个人都将拥有自己的 AI,就像今天每个人都有网站和应用程序一样。
Suleyman 承认,在高度竞争的环境中如何获取价值是一个难题。激烈的竞争将降低成本和价格,使个性化知识普及。然而,市场动态的具体走向目前仍难以确定。
Somasegar 回忆起大约八年前,福特等汽车公司曾预测到 2032 年实现完全自动驾驶,而 Elon Musk 则认为三到五年内就能实现。虽然 Musk 的时间表已经过去,但完全自动驾驶尚未成为现实。Somasegar 指出,尽管预测的时间可能不准确,重要的是创新正在快速发生。
Suleyman 强调,市场动态正在使生产成本接近零。这意味着,智能将变得廉价且普遍。智能的普及将极大地改变全球生产力和福祉,同时颠覆现有的激励机制和价值创造的分配结构。他提醒大家,不必纠结于 AGI 超级智能的概念,而应关注预测引擎变得廉价且人人可用的影响。人们对超级智能的拟人化设想过于夸张,而实际上,智能的发展会带来广泛的经济和社会变革。
AI 对软件开发的影响
Somasegar 询问 Suleyman 如何看待 AI 对软件开发的帮助,特别是 AI 系统创建另一个 AI 系统的可能性是否会加快创新速度。
Suleyman 认可 GitHub Copilot 等工具在软件开发中的显著作用,它们显著节省了开发时间,这一趋势预计还会继续。他还肯定了生成式体验的巨大潜力。
然而,关于是否会导致智能爆炸或递归自我改进的问题,Suleyman 认为现在下结论还为时过早。目前他没有看到这种情况,但未来我们需要谨慎对待这些系统的能力和激励机制。某些能力,如自主性,显然具有高风险,需要明确界定和监管,以便从法律角度进行干预。尽管困难重重,未来五到十年内,递归自我改进可能会增加风险。Suleyman 强调,监管的挑战在于如何在不阻碍创新的同时,控制这些高风险能力。
AGI、安全性和风险
Somasegar 指出,AGI 议题引发了两极分化的讨论。一部分人对它感到兴奋,另一部分则担忧潜在的风险。他询问 Suleyman,如何在高回报与高风险之间取得平衡,特别是在未来自主性真正成为现实时。
Suleyman 承认,自主性等能力的出现将带来高风险。他认为,我们必须关注 AI 系统的激励机制,并对高风险能力进行适当监管。同时,他提醒,监管的挑战在于如何在不扼杀创新的情况下,管理好这些风险。
Suleyman 提到,在 19 世纪 30 年代利物浦的第一次客运铁路启用时,由于人们对火车及其运作不熟悉,发生了致命事故。他指出,历史证明,新技术的风险常常需要时间去适应,而这在 AI 领域同样适用。当前的监管应该从以往的技术发展中吸取教训,避免重蹈覆辙。
给创业者的建议
Suleyman 鼓励创业者承担更多风险。他认为,成功的创业者必须全力以赴,将一切押上。他承认自己曾多次面临挑战,但如果创业者没有“我愿意牺牲一切”的决心,就难以实现突破。他认为,过度安逸只会阻碍创造力的发挥,推动创新的关键在于勇敢冒险,全心投入。
参考:https://www.youtube.com/embed/SzCpCbQ27Kk
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。
后台回复“Suleyman”,获取访谈原稿
点击关注和转发公众号 保持你对AI优质内容的敏感