👇关注公众号后设🌟标,掌握第一手AI新动态
本文内容整理自Satya Nadella接受Bg2 Pod Youtube频道专访,公开发表于2024年12月12日。原始内容参考:https://www.youtube.com/watch?v=9NtsnzRFJ_o
内容提要: 微软CEO萨蒂亚·纳德拉接受BG2播客访谈
人工智能时代的竞争与机遇:
萨提亚认为OpenAI代表了这个时代的新型公司,与谷歌、微软和Meta具有同等地位。 他认为人工智能领域的竞争将非常激烈,但不会是赢家通吃,尤其是在基础设施层。微软的优势在于其全球范围广泛的Azure基础设施。 他预测传统搜索将受到挑战,因为消费者更倾向于直接获得答案,而不是浏览多个链接。微软将通过Bing、MSN和Copilot等产品应对这一挑战。 他认为,未来的人工智能应用将更加依赖代理(agents),这将对商业模式和数据访问权限产生重大影响。他预见企业领域将出现代理与代理之间的接口,并通过许可来实现数据访问和货币化。 他关注人工智能的安全风险,认为操作系统需要提供更高级别的访问权限和安全防护措施。
微软在人工智能领域的战略:
微软对人工智能的投入由来已久,但在深度学习和移动领域错失了一些机会。 微软投资OpenAI的决策,基于对自然语言处理的长期关注,以及对Transformer架构和缩放定律的信心。 微软的人工智能收入主要来自API业务,以及ChatGPT、Copilot等应用的推理成本。 微软和OpenAI在人工智能领域拥有两年的领先优势,但这一优势可能难以长期保持。 微软正在利用人工智能提高生产力,降低成本,并推动自身业务收入增长。客户服务和GitHub Copilot是两个重要的例子。 微软的资本支出正在大幅增长,这与人工智能基础设施建设的需求密切相关。他认为这种增长最终会放缓,并趋于稳定。 微软对大型语言模型(LLM)的缩放定律抱有信心,但也认识到规模化训练的挑战,以及测试时计算(推理时计算)的重要性。 微软与OpenAI的关系既是合作又是竞争,未来可能会有更清晰的分工,但在消费者和企业领域都将存在竞争。
萨蒂亚·纳德拉简介
萨蒂亚·纳德拉(Satya Nadella)是印度裔美国企业家,现任微软公司首席执行官。他于1967年出生于印度海德拉巴,拥有印度理工学院孟买分校电气工程学士学位和威斯康星大学密尔沃基分校计算机科学硕士学位。 在加入微软之前,纳德拉曾在Sun Microsystems工作。
1992年,纳德拉加入微软,在公司里担任过多个重要职位,积累了丰富的经验。他曾领导开发了必应搜索引擎、Azure云计算平台等重要产品,并为微软的云战略转型做出了巨大贡献。 纳德拉的领导风格注重员工赋能和协作,他推崇“增长思维模式”,鼓励员工不断学习和创新。
2014年,纳德拉接替史蒂夫·鲍尔默成为微软CEO。上任后,他领导微软实现了显著的转型和增长,将公司从主要依赖Windows系统的软件公司转变为以云计算为中心的科技巨头。在他的领导下,微软的市值大幅增长,并巩固了其在科技行业中的领先地位。 纳德拉的成功之处在于其敏锐的市场洞察力和对技术的深刻理解,以及他能够有效地领导和激励团队的能力。 他被广泛认为是当今最成功的科技公司CEO之一。
访谈全文
主持人Brad: 很高兴能与你们在一起。你知道,当比尔和我谈论萨提亚,回顾你担任 CEO 的这段时期时,真是令人惊叹。你 1992 年加入微软。可能有些人不知道,你 2007 年接管了在线业务。2009 年推出了 Bing 搜索。2011 年接管了服务器业务并推出了 Azure,然后在 2014 年成为 CEO。
就在你成为 CEO 之前,一篇题为“微软的无关紧要性”的著名文章刚刚发表。自那以后,你把 Azure 的运营收入从 10 亿美元提升到了 660 亿美元。业务总收入增长了两倍半,总收益增长了三倍多,股价上涨了近十倍。
你为微软股东增加了近 3 万亿美元的价值。回顾过去十年,你认为为了释放价值并改变微软的航向,你所做的最伟大的改变是什么?这简直是取得了非凡的成功。
萨提亚·纳德拉: 是的。布拉德,我一直以来都是这样看待从 92 年到现在这段时间的,对我来说它就像一个连续的时期,虽然 2014 年的任命是伴随着责任的一件大事。但我的感觉是,本质上是把我们成功和不成功的模式进行匹配,然后多做前者,少做后者。从某种意义上说,就是这么简单。
因为我亲身经历了 92 年加入微软的时候,那时正是 Windows 3.1 发布之后不久。我想 Windows 3.1 是在 92 年 5 月推出的,我是在 92 年 11 月加入的。事实上,我当时在 Sun 工作,正考虑去商学院,然后我收到了微软的 offer。我说,也许我会去商学院,但不知何故,当时招聘我的老板说服我直接加入微软。这真是个最好的决定。说服我的事情是,我在 91 年的 Moscone 中心参加了 PDC,看到了 Windows NT 的演示。当时它还不叫 Windows NT。还有 x86。我说,天啊,在客户端发生的事情也会发生在服务器上。这是一家平台公司和一家合作伙伴公司,他们将乘风破浪。
然后,当然,互联网来了。我们成功地完成了转型,并做对了很多事情。例如,我们意识到了浏览器的重要性,参与了竞争,最终把浏览器这件事情做对了。然而,我们错过了搜索。我们觉得当时最重要的事情是浏览器,因为它更像一个操作系统,但我们没有理解新类别,也就是互联网的组织层,而这个组织层恰好是搜索。然后我们在移动领域有所涉猎,但我们并没有真正做好。显然,iPhone 出现了,但我们把云做对了。
所以,如果我回顾这些,现在我们正在进行第四次转型,也就是人工智能。在所有这些案例中,我认为重要的是,我们追求这些举措不仅仅是因为别人做了,所以我们也需要做一样的事情。有时候,快速跟进是可以的,而且也行之有效,但不应该出于嫉妒而做事。我认为这是我们学到的最艰难的教训之一。做这件事是因为你有做这件事的理由,并且你可以做得更好。这两者对我来说都很重要——品牌授权。杰弗里·摩尔曾经对我说,“嘿,为什么不做你的客户期望你做的事情呢?”我很喜欢这句话。
云就是这样一件事。事实上,当我第一次进入 Azure 时,人们会告诉我,哦,这是赢家通吃的市场,亚马逊已经赢了。我从来不相信这一点,因为毕竟,我在服务器领域与 Oracle 和 IBM 竞争过。我一直觉得,基础设施领域永远不会出现赢家通吃的情况。你所需要做的就是以一个有价值的主张进入这个游戏。
从某种意义上说,对我来说,很多转型都是为了确保你认识到自己的结构性地位。你真的需要很好地理解,你的合作伙伴和客户希望你赢,并允许你去做什么,然后先去做那些显而易见的事情。你可以说,嘿,这是战略的基础,但我认为这才是关键所在。
此外,还有一些事情需要培养,正如你所说,布拉德,比如使命感和目标感,以及你需要拥有的文化。这些是最必要的条件,甚至是为了让进球有真正的机会。然而,通过认识到你的结构性地位和授权,从而制定正确的战略,这大概是我希望自己做得还不错的事情。
主持人Bill: 萨提亚,在我们继续讨论人工智能之前,我想问几个关于转型的问题。而且,我只想呼应布拉德所说的,我认为你绝对是有史以来最好的 CEO 人选。我的意思是,3 万亿美元是前所未有的。第一,我读到一篇文章说,也许这不是真的,所以你要告诉我们,你给选择 CEO 的委员会写了一份 10 页的备忘录。这是真的吗?备忘录里写了什么?
萨提亚·纳德拉: 是的,是真的。是的,因为我认为我们的 CEO 选拔过程相当公开。而且在当时,老实说,一开始我完全没有意识到,第一,比尔会离开,第二,史蒂夫会离开,对吧?你加入微软,不是为了想着,哦,是的,你知道,创始人会退休,然后会有一个职位空缺,你可以申请。我的意思是,这不是我在微软成长时的思维模式。所以当史蒂夫决定在 2013 年 8 月退休时,这是一个相当大的冲击。
当时,我正在运营我们的服务器和工具业务,当时是这么叫的,Azure 也包含在其中,而且我玩得很开心。我甚至一开始都没有举手说,哦,我想当 CEO,因为这甚至不是我考虑过会发生的事情。最终,董事会的人来找我了,当时也有很多其他的候选人,甚至包括微软内部的。在这个过程中的某个时候,他们要求我们写一份备忘录。老实说,这很有意思。
那份备忘录,我说的每一件事,其中一个我使用的术语,后来也被我写进发给公司的第一封邮件中,包括环境智能和无处不在的计算。我把它简化为“移动优先,云优先”,因为我的公关人员过来对我说,这到底是什么?没人会理解环境计算是什么,或者是环境智能和无处不在的计算等其他概念。但这被转化为“移动优先,云优先”的方法。
你如何真正地走向世俗转变的方向?然后理解我们的结构性地位,思考微软云,我们有哪些资产,为什么 M365 很重要?事实上,我一直抵制的是,按照市场细分的方式来思考我们的云,对吧?市场将其细分为,哦,这里是 IaaS。甚至布拉德,他描述 Azure 的方式,对我来说,我不会把我的资本分配到这里是 Azure 的资本,这里是 M365 的资本,这里是游戏。我认为,嘿,这里有一个云基础设施。对我来说,这是公司的核心理论。
在此基础上,我有一系列的工作负载。其中一个工作负载恰好是 Azure,其他的包括 M365、Dynamics、游戏等等。从某种意义上说,这些都在那份备忘录中,并且几乎都应验了。当时的一个假设是,**我们的服务器和客户端业务的毛利率高达 98% 到 99%**。人们说,哦,好消息,你现在可以转向云,也许你会有一些利润。这就是转型。
我的直觉是,这会导致毛利率降低,但总潜在市场(TAM)会更大。我们将向更多的小企业销售,而且总的来说,甚至可以向上销售,比如消费会增加,对吧?因为我们已经销售了一些 Exchange,但如果你想想,Exchange、SharePoint、Teams——现在一切都扩大了。这就是我在备忘录中的基本思路。
主持人Bill: 是否存在任何文化转变的因素?我的意思是,CEO的聘用,世界上一直都有CEO被聘用,但其中许多都失败了。我的意思是,英特尔现在正在经历第二次重启。正如布拉德指出的那样,有人认为,哦,微软会成为下一个IBM或DEC,它最好的日子已经过去了。那么,你做了什么,你会建议新上任的CEO如何重启文化,并使其朝着不同的方向发展?
萨提亚·纳德拉: 是的,我认为我拥有的优势之一是,我是一个十足的内部人士,对吧?我的意思是,我几乎整个职业生涯都是在微软度过的。所以在某种程度上,如果我批评我们的文化,那也是在批评我自己。我的突破在于,这感觉不像是一个外人进来批评这里的员工;相反,它主要是指责我自己,因为我几乎是文化的一部分。我不能说任何我没有参与的事情。
我清楚地记得微软第一次成为市值最高的公司。我记得在园区里走来走去,包括我自己在内的所有人,都趾高气扬,好像我们是人类最伟大的成就。我们的才华终于在市值上得到了体现,不知怎么的,这种感觉一直伴随着我。我意识到,这正是你想要避免的文化。正如我常说的,从古希腊到现代硅谷,只有一个东西会使文明、国家和公司衰落:傲慢自大。
对我来说,最大的突破之一是,在我成为CEO的几年前,我的妻子向我介绍了一本卡罗尔·德韦克写的书。我在思考孩子的教育和养育时读了这本书,我意识到这是促进学习文化最好的概念之一。我认为我们在文化上的成功很大程度上归功于这种成长型思维的概念,因为它不是微软的商标,也不是来自CEO的某种新教条。它适用于工作和生活。你可以成为一个更好的父母、伴侣、朋友、邻居,以及管理者和领导者。
我们接受了这个想法,并将其定义为从“无所不知”转变为“无所不学”。这是一个你永远无法真正到达的终点,因为当你声称自己拥有成长型思维的那一天,就意味着你没有这种思维。这种思维方式对我们非常有帮助。文化变革需要时间、氧气和呼吸空间。它必须是自上而下和自下而上的,而且必须在各个层面逐步推进。
我与公司进行的每一次会议,包括我的高管团队,我都会以使命和文化作为开场。这是两个书挡。我也在我的框架中保持着高度的纪律性。在过去的近11年里,这个框架的弧线始终保持不变:使命、文化、世界观——环境智能、普适计算——然后是一系列具体的产品和战略。我深思熟虑地选择每一个词,一遍又一遍地重复它,直到我厌烦为止,但我仍然坚持这样做。
主持人Brad: 好的,说到这里,你提到了我们经历的阶段性转变。我听你说过,作为一个大型平台公司,大部分的价值获取,对吧,是在阶段性转变的头三四年内决定的,那时市场地位已经确立。萨蒂亚,我听你说过,基本上,微软在错失了搜索,在很大程度上错失了移动之后,又在云方面搭上了最后一班车,对吧?所以,当你开始考虑下一个大的阶段性转变时,似乎你和团队中的其他人,比如凯文·斯科特,很早就嗅到谷歌在人工智能方面可能领先,拥有DeepMind。你决定投资OpenAI。是什么让你相信这个方向的?与你们正在进行的内部人工智能研究工作相比。
萨提亚·纳德拉: 是的,这是一个很棒的观点,因为这里面有几个问题,对吧?首先,我们在人工智能领域已经投入了很长时间。显然,当比尔在1995年创立微软研究院(MSR)时,他就一直专注于自然用户界面。我认为第一个小组专注于语音。里克·拉希德来了,事实上,李开复也在这里工作过。我们非常专注于破解自然用户界面。语言一直是我们在意的东西,对吧?事实上,甚至辛顿也在这里工作过;当他在微软研究院驻留时,一些早期的深度神经网络(DNN)工作就发生了。然后谷歌雇用了他。所以,我想说,即使在2010年代初,我们也错过了一些本可以加倍投入的机会,而谷歌在同一时间加倍投入并收购了DeepMind,对吧?这实际上让我很困扰。
然而,我一直想专注于具体的项目。例如,Skype翻译是我关注的第一件事之一,因为它非常酷。这是你第一次看到迁移学习起作用,对吧?你可以用一种语言对进行训练,它会在另一种语言上变得更好。这是我们第一次可以说,哇,机器翻译也是一个深度神经网络。从这个意义上说,它是不同的。从那时起,我就一直对语言着迷。我和凯文一起,我记得埃隆和山姆第一次寻求Azure额度的时候。我们给了他们一些额度,当时他们更多地参与强化学习(RL)和Dota 2,这很有趣。然后我们停了一段时间——我不记得具体发生了什么——但他们最终去了谷歌云平台(GCP)。
后来,他们又回来谈论他们想在语言方面做什么。那是他们谈论Transformer和自然语言的时刻。我一直觉得,对我来说,那是我们的核心业务。这要追溯到我思考问题的方式,即理解我们的结构性地位。我一直都知道,如果能在某种模型架构方面取得非线性的突破,它将对我们有很大的帮助。比尔在我们整个职业生涯中一直强调的一件事是,数字领域只有一个类别:信息管理。他从图式化世界的角度来思考——获取人、地点、事物,并建立一个图式,对吧?
我们走了很多弯路,微软有一个臭名昭著的项目叫Winifest,其目标是图式化一切,以理解所有信息。最终,事实证明这是不可能实现的。因此,我们需要一些突破。我们认为,也许实现这一目标的途径是通过理解我们是如何图式化的。毕竟,人脑是通过语言、内心独白和推理来完成的。总之,这把我引向了OpenAI,坦率地说,引向了山姆、格雷格和他们的团队的雄心壮志。
还有一件事就是缩放法则(Scaling Law)。事实上,我认为我读到的关于缩放的第一份备忘录是达里奥在OpenAI时和伊利亚一起写的。那时我心想,让我们在这个方面赌一把,对吧?如果这会带来指数级的性能提升,为什么不全力以赴,真正尝试一下呢?一旦我们开始看到它在GitHub Copilot等产品中发挥作用,加倍投入就变得很容易了。但这就是它背后的直觉。
主持人Bill: 我认为,在之前的几次阶段性转变中,发生的一件事是一些老牌企业没有足够快地跟上步伐。你甚至提到了微软可能错过了移动或搜索之类的机会。我可以说,尤其是我年纪比较大,经历过这些转变,这次每个人都非常警觉。这是最警觉的一次。每个人都在精心准备,可能几乎同时站在起跑线上。我想知道你是否同意这种看法,以及你如何看待这场竞争中的关键参与者。你知道,像谷歌、亚马逊、拥有Llama的Meta,还有马斯克也加入了这场游戏。
萨提亚·纳德拉: 是的,这很有趣。说到你刚才的点,我总是会思考,对吧?如果拿90年代末来说,当时有微软,还有一些公司,然后剩下的就是其他的。有趣的是,现在人们谈论的是“七巨头”(Mag 7)。甚至可能不止这些,正如你所说,每个人都对它保持警惕。他们都有惊人的资产负债表。甚至,我认为,如果考虑到OpenAI,某种程度上你可以说它是“八巨头”(MAG-8),因为我认为这一代公司的代表已经在某种意义上被创造出来,那就是OpenAI。它有点像这个时代的谷歌、微软或Meta。
所以,有几件事。因此,我认为竞争将会非常激烈。我还认为,它不会是赢家通吃,对吧?因为可能有些类别是赢家通吃的。例如,在超大规模方面,绝对不会,对吧?我的意思是,世界也会需要多个遍布全球的前沿模型提供商。事实上,我认为微软拥有的最佳结构性优势之一是,如果你还记得,Azure的结构略有不同,对吧?
我们构建Azure是为了企业工作负载,具有大量的数据驻留。我们有60多个区域,比其他公司更多。所以,我们构建云不是为了一个大型应用程序。我们构建云是为了许多异构的企业工作负载,我认为从长远来看,这才是所有推理需求所在,它与数据和应用服务器相连接。因此,我认为基础设施层会有多个赢家。即使在模型层面,每个超大规模公司也会有一堆模型,以及围绕它们的应用服务器。
而且,每个应用,包括现在的Copilot,都只是一个多模型应用。所以,事实上,存在一个全新的应用服务器。就像每个人一样,曾经有移动应用服务器,也有Web应用服务器。现在呢?现在有了AI应用服务器。对我们来说,那就是Foundry,我们正在构建,其他人也会构建。会有多个这样的服务器。
然后在应用方面,我认为会有更多,我想说,网络效应总是会存在于软件层,对吧?所以在应用层,消费、企业等领域将会有不同的网络效应。所以,正如你的基本观点,我认为你必须按层结构进行分析。
在这七个、八个、九个或十个参与者之间,在堆栈的不同层都会有激烈的竞争。正如我经常对我们的团队说的那样,要注意那个不断增加价值的人,对吧?这就是你们都在参与的游戏,你们总是在关注谁是从半路杀出的新创业者。至少我会说OpenAI就是这样一家公司,它目前已经实现了“逃逸速度”。
主持人Brad: 是的,如果我们稍微思考一下,比如应用层,特别是关于消费者人工智能,萨蒂亚。你知道,Bing是一个非常大的业务。你我讨论过“10个蓝色链接”可能是资本主义历史上最好的商业模式,但是它正受到一种新模式的巨大威胁,在这种模式下,消费者只想得到答案,对吧?例如,我的孩子们会问,我为什么要去搜索引擎,而可以直接得到答案呢?所以,你认为,首先,在答案时代,谷歌和必应能否继续发展传统的搜索业务?然后,必应或者说你手下穆斯塔法(Mustafa)领导的消费者团队需要做些什么,才能与ChatGPT竞争,后者似乎已经在消费者领域脱颖而出了?
萨提亚·纳德拉: 是的,我的意思是,我认为首先最重要的是你最后说的那句话,即“聊天”与“答案”相结合。那就是ChatGPT,无论是品牌、产品,还是它正在变成有状态的。我的意思是,现在的ChatGPT不只是,你知道,事实上,搜索是无状态的。你知道,虽然有搜索历史,但我认为,这些代理会更加有状态。所以,事实上,这就是我为什么如此兴奋的原因。我一直尝试争取与苹果的搜索合作已经有10年了。所以,当蒂姆最终和山姆达成协议时,我是最兴奋的人,这更好。让ChatGPT达成交易比其他任何人都好,因为我们与OpenAI有商业和投资关系。
说到这一点,我看待它的方式是,与此同时,分发很重要,对吧?我的意思是,这就是谷歌拥有巨大优势的地方,对吧?他们在苹果上有分发渠道。他们是默认设置。他们显然是安卓上的默认设置。他们触及了广泛用户。因此,我认为,习惯不会消失,对吧?我的意思是,你只是在浏览器URL中输入你的查询的次数,对吧?我的意思是,即使现在,即使我想使用Copilot,我的大部分使用还是Copilot。如果我必须考虑必应和Copilot之间的选择,这很有意思,对吧?对于一些导航方面的事情,我会去必应。而其他几乎所有事情,我都会去Copilot,对吧?
我认为,这种转变正在普遍发生。我们可能离购物或旅行的其中一两个代理,甚至一些商业查询只差一步之遥。我认为,当一些商业意图也迁移到聊天时,传统搜索的堤坝就会决堤。现在,业务之所以基本保持稳定,是因为商业意图尚未迁移。我同意。但是,一旦商业意图迁移,就会发生突然的转变。
所以我认为,是的,这是一个长期趋势。我们管理它的方式是,在穆斯塔法的团队中,我们有三个产品,对吧?有必应、MSN和Copilot。所以,事实上,他对于这三者是什么有清晰的愿景。它们都属于一个生态系统。一个是信息流,一个是以传统方式搜索,然后另一个是这个新的代理界面。他们都与内容提供商有社会契约。我们需要推动流量。我们可能需要付费墙。我们需要有广告支持的模式,所有这些。这就是我们试图管理的东西。
我们有自己的分发渠道。我们仍然拥有的一个优势是Windows。我们可以重新审视这个问题。我们输掉了浏览器之战,对吧?甚至Chrome也成为了主导浏览器,这真是一场悲剧,因为我们曾经战胜了Netscape,却输给了谷歌。现在我们正以一种有趣的方式把它夺回来,通过Edge和Copilot。猜猜看?现在甚至Gemini也必须努力争取。
至少对Windows来说,好消息是它是开放的系统,对吧?ChatGPT有机会。Gemini有机会。你不需要联系微软。你可以尽你所能,然后超越它。但这同时也意味着,我们曾经失去它有时候是一件好事,因为你可以重新赢得一切。所以对我来说,即使是Windows的分发渠道,我的意思是,我总是说谷歌在Windows上赚的钱比整个微软都多。我是说真的。我的意思是,我说,哇,这对微软股东来说是最好的消息,我们输得如此惨重,以至于我们现在可以去竞争并夺回一些份额。
主持人Bill: 有一件事,大家都在谈论这些代理(agents),如果你稍微向前思考一下,你就能想象到各种各样的参与者都想在其他应用和其他可能在系统上的数据上采取行动。
而且,你知道,微软的处境很有意思,因为它控制着 Windows 生态系统,但它也在 iPhone 和 Android 等生态系统上拥有应用。 你对此怎么看?这个问题一部分与服务条款有关,一部分与合作关系有关。
苹果会允许微软控制 iOS 上的其他应用吗?微软会允许 ChatGPT 在 Windows 操作系统上实例化应用并从应用中获取数据吗?我的意思是,你明白这个问题。
当开始考虑搜索和商业时,这个问题就显得尤为重要。例如,Booking.com 会允许吉姆和我未经他们允许或不知情的情况下在其平台上运行交易吗?
萨提亚·纳德拉: 是的,我认为这是最有趣的问题,对吧?我的意思是,在某种程度上,目前还不清楚这究竟将如何发生。对其中一些问题,存在一种稍微过时的思考方式,也就是,如果你还记得,各种类型的商业应用是如何实现互操作的,对吧?它们确实使用连接器实现了互操作,而且人们拥有连接器许可证。因此,出现了一种商业模式,对吧?我的意思是,SAP 就是一个最经典的例子,你可以说,只要你拥有连接器,就可以访问 SAP 数据。
所以,我的一部分想法是,当代理与代理之间的接口出现时,类似的情况也会出现。目前还不清楚在消费者领域会发生什么,因为价值交换主要是广告和流量,而在代理化的世界中,其中一些东西可能会消失。因此,我认为在消费者方面,商业模式对我来说有点不清楚。
然而,在企业方面,我相信将会发生的是,每个人都会说,为了让你在我的行动空间中采取行动或从我的模式中获取数据,需要有一个与我的代理的接口,这个接口是需要获得许可的。我认为这是原因所在。例如,今天,当我访问微软的 Copilot 时,我拥有与 Adobe、我的 SAP 实例以及显然是我们的 CRM 实例 Dynamics 的连接器。
值得深思的是:我们最后一次真正使用商业应用是什么时候?我们为所有这些 SaaS 应用购买了许可证,但我们几乎不使用它们。通常,组织中的某个人会将数据输入到其中。然而,在人工智能时代,强度会增加,因为现在所有这些数据都更容易访问了,对吧?你只需一个查询即可。我可以直接说,嘿,我要和比尔开会。告诉我 Benchmark 投资的所有公司。这个过程涉及从网络和我 CRM 数据库中的所有信息中提取信息,并将所有信息整理在一起,然后给我一个笔记或摘要。
因此,在某种程度上,我认为所有这些都可以由我们以及这些连接来货币化。
主持人Bill: 但更明确地说,就像可能真的会很快发生的事情,因为已经有人在谈论它了,比如,你会允许 Windows 操作系统上的 ChatGPT 直接开始打开随机应用吗?
萨提亚·纳德拉: 现在,这很有意思。所以这种过度使用计算机的情况,谁来允许呢?是用户还是操作系统?比如在 Windows 上,坦率地说,除了设置一些安全防护措施之外,我无能为力。
我当然可以看到,如果它们变得更安全,我最大的担忧之一就是安全风险。如果恶意软件被下载,并且该恶意软件开始采取行动,那就变得非常危险了。我认为那些是我们将构建到操作系统本身中的,即某些提升的访问权限和特权,从而让这种计算机使用行为得以发生。
然而,归根结底,在像 Windows 这样的开放平台上,用户将拥有控制权。我确信苹果和谷歌会有更多的控制权,所以他们不会允许这样做。
在某种意义上,你可以说这是他们的优势。最终,这取决于反垄断法如何裁决所有这些问题,看看这一切将如何展开将会很有趣。
主持人Bill: 好的,你可以反过来想一下,然后我们就可以继续了。但是,你会允许 Android 操作系统,或者我们姑且称之为 Android AI 或 iOS AI,通过智能手机上的微软客户端读取电子邮件吗?
萨提亚·纳德拉: 是的,我的意思是,我们有点像,例如,今天,我一直在思考的一件事是,我不知道那是价值泄露还是真的对我们有帮助,对吧?我们授权苹果使用 Outlook 同步功能到 Apple Mail。这是一个很有意思的案例。我认为可能泄露了很多价值。但与此同时,我认为这是我们能够保持 Exchange 优势的原因之一,对吧?如果我们不这样做,问题会更加严重。
我认为,正如你所说的那样,如果我们正在构建,我们这样做的原因是,我们必须围绕 Microsoft 365 建立一个信任系统。我们不能只是说,嘿,任何代理都可以进来做任何事情,毕竟,这不是我们的数据。这是我们客户的数据,对吧?它将会是。因此,客户必须允许它。
客户的 IT 人员必须允许它。这不是我能设置的某种一揽子标志。第二件事是它必须有一个信任边界。因此,我认为我们会采取一种有趣的方式。这有点像苹果智能正在做的事情。把它看作是我们将围绕 M365 所做的事情。
主持人Bill: 我今天玩了很多。我强烈建议大家下载它。它非常有趣。
主持人Brad: 是的。所以,点击这个,你知道,穆斯塔法说过,2025 年将是无限记忆的一年。比尔和我从今年年初就开始谈论,我们认为下一个 10 倍的功能,你知道,听起来你同意 ChatGPT 的观点,它实际上是这种持久记忆与能够代表我们采取一些行动的结合。所以我们已经看到了记忆的开始,而且我也很确信 2025 年,似乎这个问题已经基本解决了。但是关于行动的问题,我什么时候才能对 ChatGPT 说,下周二以最低的价格在西雅图预订四季酒店?比尔和我在这个问题上争论了很多,而且看起来计算机的使用是这个问题的早期测试案例。但是你有什么感觉吗?从现在开始,这看起来对你来说是一个难题吗?
萨提亚·纳德拉: 是的,我的意思是,最开放的行动空间仍然很难。但正如你所说,有两件事或三件事真的很令人兴奋。除了,我只想说,我确信我们会谈论它,即缩放定律本身以及原始模型的能力。一个是记忆。另一个是工具的使用或行动。而另一个我想说的是权利,对吧?
也就是说,你知道,你有什么权限?你能得到什么? 你知道,你必须能够以安全的方式访问事物。必须有人对其进行管理,等等。因此,如果你将所有这三件事放在一起,并且这个代理将更易于管理,当涉及到行动时,它是可验证的,并且它具有记忆,那么我认为你就进入了一个完全不同的地方,可以进行更自主的工作。
我仍然认为,我一直认为的一件事是,我喜欢将 Copilot 作为人工智能的用户界面,因为即使在一个完全自主的世界中,你也会不时提出例外,你会请求许可,你会请求调用等等。因此,这个用户界面层将是组织层。事实上,这就是为什么我们认为 Copilot 是工作、工作成果和工作流程的组织层的原因。
但就你的基本观点而言,我不认为这些模型——我甚至会以 4o 为例,对吧?甚至不谈 O1。4o 在函数调用方面非常好。因此,你可以在企业环境中做的事情比在消费者环境中多得多,因为消费者网络函数调用很难。至少在一个开放的 Web 中,你可以对几个网站这样做。但是,一旦你说,“嘿,让我们去预订任何东西的机票”,如果后端出现模式更改等等,它就会出错。你可以教它如何处理。
这就是我认为 O1 可以做得更好的地方,如果它是一个可验证的、自动分级的 Rails 上的流程。但我认为我们可能还需要一年、一年半到两年的时间才能做得越来越多。然而,至少从企业的角度来看,可以去执行,“这是我的销售代理,这是我的营销代理,这是我的供应链代理”,它们可以做更多自主的任务。我们在 Dynamics 中内置了 10 或 15 个这样的代理,对吧?
甚至可以查看我的供应商沟通,自动处理我的供应商沟通,更新我的数据库,更改我的库存,我的供应。我认为这些都是你今天可以做的事情。
主持人Bill: 穆斯塔法提到了近乎无限的内存,我相信你已经听过或者内部也听到了。关于这一点,你有什么可以澄清的吗?还是说会有更多信息后续公布?
萨提亚·纳德拉: 我认为,在某种程度上,这个想法是为你的内存建立一个类型系统,这才是关键。它不是像我每次开始的时候那样...
主持人Bill: 我明白了。他说的好像你们在这个方面取得了内部技术突破。
萨提亚·纳德拉: 是的,实际上甚至有一个开源项目。我想是,我忘记了,好像是同一批做 TypeScript 的人在做这个。所以我们要做的是本质上把内存模式化,并使其可用,这样你就可以去... 就像每次我开始,假设我正在使用一些新的提示词。我知道如何根据我之前做的一切进行聚类。然后,这种类型匹配等等,我认为对我们建立一个内存系统来说是一个很好的方法。
主持人Brad: 那么,也许我们可以转向企业人工智能。萨蒂亚,你知道,微软的人工智能业务据说已经达到了 100 亿美元。你说这都是推理,而且你们实际上并没有把原始 GPU 租给别人进行训练,因为你们的推理需求太高了。所以,当我们思考这个问题时,外界很多人对大型工作负载是否正在迁移持怀疑态度。因此,如果你考虑一下人们今天正在使用的关键收入产品,以及它如何推动你今天的推理收入,以及它可能与亚马逊或谷歌有何相似或不同之处,我对此很感兴趣。
萨提亚·纳德拉: 是的,我觉得这是个好问题... 对我们来说,这个事情是这样发展的:你要记住,我们与 OpenAI 的大部分训练工作都更像是投资逻辑,对吧?所以它并没有体现在我们的季度业绩中。它更多地体现在我们投资的其它收入中。
主持人Brad: 所以这意味着是唯一体现在收入中的东西。或者损失,其他收入或损失,对吧?
萨提亚·纳德拉: 没错,没错。目前,它是这样显示的。所以,大部分收入,或者说所有收入,几乎都是我们的 API 业务。事实上,就像你说的,ChatGPT 的推理成本也在其中,所以那是另一部分。这个时代的热门应用是什么?ChatGPT、Copilot、GitHub Copilot,以及 OpenAI 和 Azure OpenAI 的 API,对吧?在某种意义上,如果你要列出十个最著名的应用,这些可能都会排在前四或前五名。因此,这些是我们增长的最大驱动力。
我们和 OpenAI 的优势在于,我们已经有两年的领先优势,几乎没有竞争。就像你说的,比尔评论说每个人都醒了,这可能是真的。但是,我不认为会再有像这样的两年领先优势了。谁知道呢?你可以这样说,然后有人推出了一个突然让世界惊艳的样本。但即便如此,我认为不可能再用另一个基础模型建立起这样的领先优势。我们拥有这个优势,这是一个重要的优势,帮助 OpenAI 通过 ChatGPT 建立了这种“逃逸速度”。
在 API 方面,我们取得的最大进展是获得了以前不使用 Azure 的客户,例如 Shopify、Stripe 或 Spotify。他们都是 GCP 或 AWS 的客户。突然之间,我们获得了更多数字原住民的标志,他们都在某种程度上使用 Azure。这为我们开辟了新的机会。
在传统企业方面,我认为我们面临的挑战是规模化。人们在一端使用 Copilot,同时在另一端使用 Foundry 构建代理。这些设计上的胜利和项目的成功是一个缓慢的过程,但它们开始规模化。考虑到我们在这个领域已经领先了两年,我对这项业务感到更加乐观。
我乐观的原因之一是,许多科技初创公司都在争夺少量 H100 配额,存在逆向选择的问题。在观察到 Sun Microsystems 在互联网泡沫期间的遭遇后,我总是担心这种情况。你不能追逐每个构建模型的人。事实上,即使在投资者中,情绪也发生了转变。现在,人们希望以更轻资本的方式运营,并在别人的模型之上构建。如果真是这样,那么所有最初寻求 H100 配额的人都可能会改变他们的方法。这就是为什么我们在战略上一直很谨慎的原因。
主持人Brad: 你认为对其他人来说,那些模型的训练和模型集群是他们人工智能收入的更大一部分,而不是你们的。
萨提亚·纳德拉: 我不知道。我的意思是,在这里我是在代表其他人的结果说话。我不知道。我的意思是,我回到之前的问题,其他热门应用是什么?对吧。我不知道它们是什么。我的意思是,它们在哪里,它们运行什么模型?它们在哪里运行?
而且我会说,这是我没有,我的意思是,显然谷歌的 Gemini,我不知道。当我查看任何这些人工智能产品的日活跃用户数字时,那里有 ChatGPT。然后是,你知道,即使是 Gemini,它的数字也让我非常惊讶。我的意思是,很明显,我认为它会增长,因为它具有所有的内在分布优势。
但有趣的是,并没有那么多。事实上,我们谈论更多的是人工智能的规模,但并没有那么多热门应用,对吧?有 ChatGPT、GitHub Copilot,还有 Copilot,以及 Gemini。我认为这是我会在日活用户中列出的四个。你还能想到其他的吗?
主持人Brad: 嗯,我认为有很多初创公司的用例开始获得一些关注,从下往上。它们中的很多都是基于 Llama 构建的,但是,你知道,
萨提亚·纳德拉: 但是如果你说,哦,那是 Meta 的。如果你说,日活用户超过 500 万的应用有哪些,我想
主持人Brad: 我认为扎克伯格会说 Meta.ai 当然有更多,等等。但我认为你说的对,就你提到的非附属应用而言。
萨提亚·纳德拉: 扎克的东西都在他自己的俱乐部里运行。我的意思是,他不是在公共俱乐部里运行。没错。是的。
主持人Bill: 在企业方面,显然编码领域竞争激烈,你们做得很好,有很多风投支持的玩家。在一些生产力应用程序方面,我对 Copilot 的方法有一个疑问。我想,马克·贝尼奥夫在这方面一直持批评态度,称其为 Clippy 2 或其他什么。你是否担心有人可能会从头开始考虑人工智能的第一性原理,以及在 Excel 电子表格中,如果做的是人工智能优先的产品,一些基础设施是否是不必要的?顺便说一句,CRM 也是如此,对吧?用户可能可以忽略许多字段和任务。
萨提亚·纳德拉: 是的,我的意思是,这确实是一个非常非常重要的问题。关于SaaS应用或业务应用,就拿我们自己的Dynamics来说吧。至少我们采取的方式是,我认为业务应用存在的概念,可能在代理(Agent)时代都会消解,对吧?因为如果你仔细想想,它们本质上就是带有大量业务逻辑的CRUD数据库 。而所有的业务逻辑都将转移到这些代理上。这些代理将进行跨存储库的CRUD操作。它们不会区分后端是什么。它们会更新多个数据库,所有的逻辑都将存在于所谓的AI层。
一旦AI层成为所有逻辑的所在地,人们就会开始替换后端。我们有些人,实际上,这很有趣。在我们谈话的时候,我认为我们看到Dynamics后端和代理使用的成功率相当高。我们将非常积极地尝试将其全部整合,对吧?无论是在客户服务方面,还是在其他方面,你知道,另一个令人着迷的是,不仅仅是CRM,甚至是我们所谓的财务和运营方面也在增长。因为人们想要更多AI原生的业务应用,对吧?
这意味着业务应用的逻辑层可以由AI和AI代理来协调。换句话说,Copilot到代理再到我的业务应用应该是无缝衔接的。现在,同样地,你甚至可以说,嘿,我为什么需要Excel?有趣的是,对我来说,最令人兴奋的事情之一是,Excel与Python的结合就像GitHub与Copilot的结合一样,本质上就是这样。
我们所做的是,当你有像这样的Excel时,顺便说一句,这对你们来说会很有趣,对吧?也就是你应该打开Excel,打开Copilot,然后开始玩,因为它不再像以前那样了。它就像拥有一个数据分析师。它不再只是理解你现有的数字;它还会为你制定计划,对吧?它会实际创建计划,然后执行它。这就像一个数据分析师使用Excel作为一种行列可视化工具来做分析的草稿本。
因此,Copilot将Excel作为一个工具,利用其所有操作空间,因为它能够生成代码,并且拥有一个Python解释器。事实上,这是一种重新概念化Excel的绝佳方式。在某个时候,你可以说,嘿,我可以生成所有的Excel。这也是真的。毕竟,有一个代码解释器,对吧?因此,你可以生成任何东西。
所以,是的,我认为会有颠覆性的变化。但是我们处理M365的方式是:首先,将Copilot构建为组织层,即AI的UI,并获取所有代理,包括我们自己的代理。你可以说Excel是我的Copilot的一个代理。Word是一个代理。它们是专门的画布,例如,当我处理法律文件时,我会将其移至Pages,然后移至Word,然后让Copilot跟进。进入Excel,然后让Copilot跟进。所以这是一种思考工作和工作流程的新方式。
主持人Brad: 你知道,今天我经常听到人们为之担忧的问题之一,萨蒂亚,是人们在这些投资上的投资回报率。你知道,你们有超过22.5万名员工。你们是否正在利用AI来提高生产力、降低成本、推动你们自己的业务收入?如果是的话,最大的例子是什么?你知道,也许更具体一点,当我们邀请黄仁勋来的时候,我问他,当他的营收增长两到三倍时,他预计他的员工人数会增加多少?他说25%。当被问及原因时,他说,好吧,我有10万名代理帮助我们工作。所以当你们的Azure收入增长两到三倍时,你们是否预计在员工人数方面也会看到类似的杠杆效应?
萨提亚·纳德拉: 是的,我的意思是,这个问题非常重要,对微软和我们的客户来说都是如此。我是这样看待这个问题的。我喜欢这个说法,我一直在学习关于精益生产对工业公司的影响。对吧?我的意思是,这很吸引人,对吧?它们都是GDP增长的推动者。这真是令人难以置信。他们对于精益生产的自律性非常高,好的工业企业可以明确地说,通过精益生产就可以增加两到三个百分点的顺风,即提高价值和减少浪费。这就是他们的实践。
所以我认为AI是知识工作的精益化。我们正在认真研究它,即我们如何真正去审视。这就是为什么我认为90年代我们经历过的业务流程重组又以一种新的方式回来了,那些可以思考端到端流程的人可以说,嘿,如何考虑流程效率?什么可以自动化?什么可以变得更有效率?
客户服务是一个显而易见的例子。我们正在按计划进行。我们花费大约40亿美元左右。这包括从Xbox支持到Azure支持的所有内容。这确实是一个非常重要的关注点,第一年是因为前端的转移率。然后最大的好处是代理效率,对吧?代理更快乐,客户更快乐,我们的成本也在下降。所以,我认为这是最明显的地方,而且我们的联络中心应用也做得非常好。
另一个明显的例子是GitHub Copilot。通过GitHub Copilot工作区,这个“代理化”的概念首次出现。你从一个问题到计划或到规范,再到计划,然后到多文件编辑。它彻底改变了工程团队的工作流程。正如我所说,M365 Copilot是一个全能工具,对吧?
给你一个感觉,即使在我自己的经验中,每次我与客户会面时,我想说,自1990年以来,CEO办公室的准备工作流程就没有改变过。事实上,我看待这个问题的方式之一是想象一下在PC出现之前和之后预测是如何发生的。曾经有传真、办公室备忘录,然后PC出现了。人们说,嘿,我只要把Excel表格放在电子邮件中发出去,其他人就可以输入数字,然后我们就可以得到预测。
同样的事情现在正在AI时代到处发生。我准备客户会议时,我直接进入Copilot,然后说,告诉我我需要了解的关于客户的所有信息。它会告诉我来自我的CRM、我的电子邮件、我的团队会议以及网络上的所有信息。它会进行汇总。我把它放到Pages中,然后实时与我的客户团队分享。所以想象一下这个层级;所有关于,哦,让我为CEO准备一份简报的概念都消失了。它只是一个查询而已。
我生成一个查询,如果他们想注释,就分享一个页面。所以我在与AI推理,并与我的同事协作,对吧?这就是新的工作流程,而且这种情况正在到处发生。有人给了我一个来自供应链的例子。他们说,供应链就像一个交易台,只是它没有实时信息。事实就是这样。你等到季度结束,然后CFO会过来敲你的头,说你犯的所有错误。
如果财务分析师能够实时提供见解,会怎么样?例如,如果你正在某个特定地区为数据中心签订合同,你应该考虑这些条款。所有这些实时情报都在改变工作流程和工作成果。
所以,有很多很多的应用场景。我认为,为了回答你的根本问题,我们的目标是通过AI创造运营杠杆,对吧?我认为员工总成本实际上会下降,我们的人均成本会上升,我的每个研究人员的GPU数量会上升。是的。我是这样看待这个问题的。
主持人Brad: 好的,明白了。很有道理。 接下来,我们来聊聊你之前提到的一点,关于模型缩放和资本支出(CapEx)的总体情况。我听过你谈论微软的资本支出。我想象一下,2014年你接任时,肯定没有想到现在的资本支出会是这个样子。实际上,你曾说过这些公司的资本支出看起来越来越像工业公司,而不是传统的软件公司。
你们的资本支出从2020年的约200亿美元,可能到2025年会高达700亿美元。而且,你们的资本支出回报率一直相当稳定,对吧?所以,当你观察资本支出与收入之间的关系时,会发现两者之间存在非常高的相关性。有些人担心这种相关性会断裂,甚至你都说过,可能在某个时候,资本支出需要超前于收入进行投入。
可能会出现一个我们需要为弹性建设的“空窗期”。那么,你对现在的资本支出水平有何看法?这会让你感到焦虑吗? 这种增长率何时会开始放缓?
萨提亚·纳德拉: 是的,我的想法有几方面。首先,我认为作为一家超大规模云计算服务提供商,这在结构上是非常有帮助的,因为在某种程度上,我们已经实践了很长时间。数据中心有20年的生命周期,而且你只在你使用的时候才需要支付电力费用。硬件设备的生命周期是六年。我们知道如何提高利用率。这里的好消息是,虽然它是一个资本密集型产业,但同时也是一个软件密集型产业。你可以利用软件来提高资本的投资回报率(ROIC),对吧?这就像早期人们问“超大规模云计算服务商如何赚钱?”一样, 新的超大规模云计算服务商与老牌主机托管商的区别在于软件,对吧?我认为这甚至适用于现在的GPU领域。
目前发生的一件事情,我认为是“追赶”。过去15年我们构建了云,突然云中出现了一个新的计量单位,它被称为AI加速器。因为现在每个应用程序都需要一个数据库、一个Kubernetes集群和一个在AI加速器上运行的模型。如果你说“我需要这三个”,那么你突然就需要构建这些AI加速器来为所有这些应用程序提供服务。所以,这种情况会逐渐趋于正常。第一步是完成基础设施的建设,然后工作负载会趋于正常,之后它会像云一样持续增长。
这是一方面。另一方面,是避免一些逆向选择问题。确保不仅仅是供应方面的问题,即不是所有人都只顾着建设,希望需求会随之而来,而是要确保在全球范围内,不同细分市场都有真实、多样化的需求。我一直在关注所有这些。我认为这就是管理投资回报率的方式。
顺便说一下,利润率会有所不同,对吧?这可以追溯到我们早期的讨论,当我考虑微软云的时候,一个原始GPU的利润率和Fabric加上GPU,或者Foundry加上GPU,或者GitHub Copilot添加到M365的利润率都会有所不同。所以,拥有一个投资组合在这里很重要,对吧?如果我观察微软,为什么微软今天在云领域有溢价?我们比亚马逊规模更大,增长速度比亚马逊更快,利润率比亚马逊更高,因为我们拥有所有这些层。这正是我们在AI时代也想做的事情。
主持人Bill: 萨蒂亚,关于模型缩放有很多讨论。显然,过去有关于将集群规模不断扩大10倍的说法,而且不是一次两次。xAI仍然在宣传朝这个方向发展。最近有一个播客节目,他们彻底颠覆了这个观点,他们说,如果我们不再这样做,那就太好了,因为我们可以直接转向推理,推理成本正在降低,我们也不必花费所有这些资本支出。我很好奇,这是同一个硬币的两种看法。但你对大型语言模型(LLM)模型缩放和训练成本以及未来的发展方向有何看法?
萨提亚·纳德拉: 是的,我首先要说,我非常相信缩放定律。事实上,我们在2019年所做的投资正是基于缩放定律,我仍然坚持这一点。换句话说,不要与缩放定律作对。但同时,我们也需要立足于一些不同的现实情况。一个是,随着集群变得越来越复杂,缩放定律中的指数增长将变得更加困难;我的意思是,进行大规模训练的分布式计算问题变得更加困难。
所以,前面存在挑战,但我仍然想说,我会让OpenAI的人来谈谈他们在做什么,他们正在继续进步。我认为预训练并没有结束;它还在继续。令人兴奋的是,OpenAI已经讨论过,Sam也讨论过他们使用O1所做的事情,对吧?这种具有自动评分功能的思维链非常棒。
实际上,基本上,测试时计算或推理时计算是另一种缩放定律。所以,你进行了预训练,然后你有了这种测试时的采样,它会生成可以返回到预训练中的token,从而产生更强大的模型,然后在推理过程中运行。因此,我认为这是一种提高模型能力的绝佳方法。
测试时计算或推理时计算的好处是,有时运行这些O1模型表明有两个独立的方面。当你使用它来生成用于预训练的token时,采样类似于训练。此外,当客户使用O1时,他们正在使用更多的计量单位。因此,你会获得相应的报酬。所以,这里有一个更稳健的经济模型,对吧?我喜欢这样。事实上,这就是我为什么说我在全球有60多个数据中心,拥有良好的结构性地位。
主持人Bill: 关于推理。是的,预训练和推理的硬件架构是不同的。
萨提亚·纳德拉: 没错。我认为最好的思考方式是,这是一个比例,对吧?回到Brad关于投资回报率的问题,我认为这是你真正需要建立一个稳定状态的地方。事实上,每当我与黄仁勋(Jensen)交谈时,我认为他说的对,那就是,你需要每年都买一些,而不是一次性买完。想想看,对吧?当你把一些东西折旧六年的时候,最好的办法是我们一直以来都在做的,那就是你每年都买一点,然后让它老化,让它老化,让它老化,对吧?你使用领先节点进行训练,然后在第二年,它会被用于推理。
我认为,这将是我们整个机群在利用率和投资回报率方面都将进入的稳定状态,然后需求将与供应相匹配。关于大家说“哇,指数增长停止了吗?”这一点,另一个因素是经济现实也会逐渐停止这种增长,对吧?在某个时候,每个人都会思考, “在经济上,什么是理性的做法?”那就是,嘿,即使我每年都将能力翻倍,但我无法销售这些库存。
另一个问题是赢家的诅咒,对吧?你甚至不必发表论文。其他人只需看看你的能力,然后进行提炼。这几乎是不可能的。这就像盗版一样,对吧?我的意思是,你可以制定各种使用条款,但你不可能控制提炼。这是一方面。
第二件事是,你甚至不必做任何事。你只需要逆向工程这种能力,然后以一种计算效率更高的方式去做。考虑到这一切,我认为人们会对其追逐程度有所限制。现在,每个人都想成为第一,这很好,但最终,所有的经济现实都会对每个人产生影响。网络效应在应用层,所以当网络效应都在应用层时,我为什么要花很多钱在某些模型能力上呢?
主持人Brad: 我听你说的,我相信,你知道的,所以埃隆说过他要建造一个百万GPU集群。我认为Meta也说过同样的话。我想总统也说过。
主持人Bill: 我认为他说的是200个,然后他有点开玩笑说要建一百万个。
主持人Brad: 我认为他开玩笑说要建十亿个。但是,你知道,事实是,与年初相比,基于你看到的关于预训练和扩展的情况,你是否改变了你的基础设施计划?然后我还有一个关于O1的单独问题。
萨提亚·纳德拉:我正在构建的,我会说,有点像10倍的增速,对吧?也就是,嘿,你怎么做,我们可以争论这个持续时间,比如是每两年?还是每三年?还是每四年?这里有一个经济模型。我认为,这是一个有点规范的思考方式,考虑如何清理你的库存,使其合理,或者另一种方式是你的设备的折旧周期。
除非你发现GPU的物理特性突然可以顺利地反映在我的损益表中,并且实际上利润率与超大规模计算商相同或更好,否则你无法购买。这很简单。所以我打算做的就是,不断前进并进行构建,基本上是,嘿,我如何推动推理需求,然后不断提高我的能力并高效地做到这一点。
我绝对相信这种方法,而山姆可能有不同的目标,并且他对此持开放态度,对吧?他可能说,嘿,我想构建,因为我深信AGI的样子,或者诸如此类,那就这样吧。因此,我认为我们之间存在一点紧张关系。
主持人Bill: 为了澄清一下,我听到穆斯塔法在播客上说,微软不会参与目前正在进行的最大模型训练竞赛。这是真的吗?
萨提亚·纳德拉: 嗯,我们不会做两次,对吧?毕竟,我们拥有知识产权。鉴于与OpenAI的合作关系,如果微软今天做两个不必要的模型,你将会创建一个冗余的训练集。是的。没错。所以我们非常克制,这也是我们拥有的战略纪律,对吧?
也就是说,你知道,我总是向山姆强调,我们把赌注押在了OpenAI身上,并说,嘿,我们将集中我们的计算资源。我们这样做是因为我们拥有所有知识产权。这就是我们所获得的回报。我们对此感觉非常好。
因此,穆斯塔法基本上是在说,嘿,事实上,我们的大部分重点也在于训练后,甚至在验证等方面。所以这是很重要的一件事。
因此,我们将把大量的计算资源集中在添加更多的模型适配和有意义的功能上,同时也拥有一支有原则的预训练团队,这使我们能够在内部进行一些操作。无论如何,我们针对不同的用例都有不同的模型权重和模型类别,我们将继续开发。
主持人Bill: 你对布拉德关于GPU投资回报平衡问题的回答,是否也回答了为什么你们将部分基础设施外包给CoreWeave,也就是你们之间的合作关系?
萨提亚·纳德拉: 我们那样做是因为我们都被ChatGPT和OpenAI API搞得措手不及。实在太多了,我应付不过来。是的,我们完全,我的意思是,是的,这不可能。我无法在供应链计划中做好任何准备,你知道的,比如,没有人知道会发生什么,对吧?22年11月发生的事情,就像晴天霹雳一样,对吧?因此,我们不得不赶上。所以我们说,嘿,我们不会太担心效率低下。这就是为什么无论是CoreWeave还是其他许多公司,我们都在到处购买。这很合理。那是一次性的事情。现在一切都赶上了。是的,所以那更多的是为了赶上进度。
主持人Brad: 你们仍然受到供应限制吗?
萨提亚·纳德拉: 我受电力限制,是的。我不是芯片供应受限。我们在24年绝对是受限的。我们告诉市场的是,这就是为什么我们对25年上半年,也就是我们财年的剩余时间持乐观态度。然后在那之后,我认为我们的情况会好转。进入26年等等,我们有一个很好的发展前景。
主持人Brad: 所以我听到的是,关于第二层思考,即在O1测试时所做的计算,以及在那之上进行的训练后工作,正在产生非常积极的结果。当你想到这一点时,这也是计算密集型的,因为你正在生成大量的tokens。你将这些tokens循环回到上下文窗口中,并且一次又一次地这样做。所以这会很快复合增长。黄仁勋说,他认为观察O1,推理将达到百万甚至十亿X,只是推理的需求将会急剧增加。在这方面,你是否觉得你有正确的长期计划来扩展推理,以跟上这些新模型?
萨提亚·纳德拉: 是的,我的意思是,我认为这里有两件事,布拉德,在某种意义上,考虑整个工作负载是非常有帮助的,整个工作负载。就像在代理世界中,你必须要有AI加速器。事实上,在OpenAI本身,增长最快的事情之一是容器服务。毕竟,这些代理需要一个草稿板来做一些自动评分,甚至生成样本,对吧?这就是他们运行代码解释器的地方。
顺便说一句,这是一个常规的Azure Kubernetes集群。所以从一个有趣的角度来看,甚至有一个比例,即常规Azure计算以及它与GPU和一些数据服务的关系。所以对于你的观点,当我们说推理时,这就是我为什么这样看待它,并说,你知道,人们认为AI与云是分开的。AI现在是云的核心组成部分。
我认为,在一个每个AI应用程序都是有状态的应用程序,都是代理应用程序的世界中,该代理执行操作。那么,经典的应用程序服务器加上AI应用程序服务器再加上数据库都是必需的。所以我回到了我的基本观点,那就是,嘿,我们建立了这60多个AI区域。我的意思是,Azure区域,它们都将为全面的AI应用程序做好准备。我认为,这将是需要的。
主持人Brad: 这很有道理。那么,让我们稍微谈谈。在这次对话中,我们围绕OpenAI谈论了很多,但你正在管理那里的巨额投资与你自己的努力之间的平衡。在Ignite,你展示了一张幻灯片,突出了Azure OpenAI和OpenAI Enterprise之间的差异。其中很多都是关于企业级的,你知道的,你带到台面上的东西。所以当你看到这种紧张关系时,也就是你与OpenAI之间的竞争,你是否认为他们,ChatGPT很可能会在消费者端成为赢家?你也会有自己的消费者应用程序。然后在企业方面,你们会分工合作。你如何看待与他们的竞争?
萨提亚·纳德拉: 我现在看待OpenAI的方式,是把它看作一家非常大规模的公司。它不再仅仅是一家初创企业;它是一个真正成功的组织,拥有多条业务线、多个细分市场和各种产品。我对待它的方式和对待其他重要的合作伙伴一样,我不认为他们只是简单的合作者。相反,我会考虑他们的利益和我们的利益,并探索如何使双方利益保持一致。
我认为OpenAI也是一个知识产权合作伙伴。我们为他们提供系统知识产权,作为回报,他们为我们提供模型知识产权。这种互惠关系凸显了我们对彼此成功的深切关注。此外,我还将他们视为一个重要的客户,这意味着我想像服务其他大型客户一样为他们提供服务,确保我们有效地满足他们的需求。
最后,还有一个竞合关系需要考虑。无论是消费领域的Copilot还是M365的Copilot,我都会关注我们的竞争与合作的重叠之处。最终,这些元素会有一些交叉,但我也认识到,他们与苹果的交易可以被视为对微软股东有利的。
关于API的差异,客户可以自由选择使用哪个API。例如,Azure有它自己的一套风格,如果一个Azure客户想使用其他Azure服务,选择Azure和Azure Mac会更简单。相反,对于那些在AWS上喜欢无状态API用法的客户,他们可以轻松选择使用OpenAI。通过这种方式,拥有这两种类型的分发方式也可以有利于微软的地位。
主持人Bill: 我想说,硅谷社区,甚至更广泛地说,整个商业界都对微软和OpenAI之间的关系感到好奇。我上周参加了DealBook的活动,Andrew Sorkin就此问题向Sam施加了很大压力。我想有很多事情你们不能说,但有什么是你们可以说的吗?据说正在进行重组,你知道的,转变为盈利模式。我猜想,埃隆也对此发表了一些看法。你们能告诉我们什么吗?
萨提亚·纳德拉: 是的,我认为,Bill,这些显然都应该由OpenAI的董事会、Sam、Sarah和Brad以及他们的团队来决定他们想做什么。我们希望提供支持。我的意思是,在这方面,我们是一个投资者。我想说我们非常关心的一件事是,OpenAI继续取得成功,对吧?我的意思是,这符合我们的利益。而且我还认为,这家公司是这个平台转型中的标志性公司。OpenAI做得好,世界会更好。因此,这就是我们最根本的立场。
之后,正如你所说,紧张关系出现的速度,就像所有这些合作关系一样,是显著的。其中一部分是竞争的紧张关系。另一部分是Sam作为一位令人难以置信的企业家,拥有伟大的抱负和想要快速前进的步伐。因此,我们必须平衡所有这些因素。他想做的事情需要得到满足,这样他才能有效地追求他的目标。此外,他也需要考虑到我们方面所要求的纪律,考虑到我们可能面临的整体限制。
所以我认为我们会解决好的。但这里的好消息是,我认为在这个框架下,我们已经取得了长足的进步。这五年对他们来说很棒。对我们来说也很棒。至少就我而言,我会继续坚持下去。我想尽可能延长这种伙伴关系。建立长期稳定的伙伴关系只会对我们有利。
主持人Brad: 当您考虑到,你知道的,单独的融资,以及将这两个业务分开时,你知道的,你们是否想相对快速地完成?我谈到过,我认为他们下一步,你知道的,如果他们成为一家上市公司会很好。你知道的,这是一个标志性的,你知道的,人工智能领域的早期领导者。您认为这是他们前进的道路吗?还是您认为它会保持我们现在的这种关系?
萨提亚·纳德拉: 这是我想小心谨慎的地方,Brad,我不想越界,对吧?因为在某种意义上,你知道的,我既不是,我们也不是董事会成员,我们像你们一样是投资者。归根结底,这取决于他们的董事会和管理层的决定。所以在某种程度上,我将接受他们给出的任何暗示。换句话说,我很清楚我希望支持他们做出的任何决定。对我来说,或许作为一个投资者,商业和知识产权伙伴关系才是最重要的。我们想确保我们在这其中保护我们的利益,如果可以的话,进一步加强这些利益。但我认为,现在,像Sarah、Brad和Sam这样的人都是非常聪明的人。对他们来说,为了实现他们的使命目标,什么才是最有意义的,我们就会支持什么。
主持人Brad: 也许我们应该结束并感谢您今天抽出这么多时间,但我想以开放与封闭这个话题来总结,以及我们应该如何合作以引导安全人工智能的发展。
所以也许我只是向您开放式地提问。您能跟我们谈谈您如何看待这些差异和争论以及这样做的重要性吗?
而且,你知道的,像Bill和我这样有很多开源的支持者。但是我们也听到了批评的声音,而且您也说过每个人都可以提炼出一个模型。所以我们会看到一些被用于我们不乐见的用途。
那么您认为我们应该如何作为一个国家和企业集合起来共同引导安全人工智能的发展?
萨提亚·纳德拉: 是的,我认为有两点。我认为我一直将开源与闭源视为创造网络效应的两种不同策略,对吧?我从来没有把它们看作是纯粹的信仰之争。我认为它们更像是,嘿,两种不同的方式,我的意思是,这就是为什么我认为Meta和Mark正在做的事情非常聪明,对吧?在某种意义上,他甚至试图将他的补充品商品化,对吧?这对我来说非常有意义。如果我处在他的位置,我也会这样做,对吧?那就是让全世界都达成共识。我的意思是,我认为他公开而雄辩地谈论了他希望成为LLM的Linux。
而且我认为这是一个很好的模式。事实上,我认为那里甚至有一个模式,你知道的,有时回到你们的一些经济学问题,我认为在博弈论上,一个联盟可能是一个比任何一个玩家试图独自完成的更好的模型。不像Linux基金会,那里的贡献主要是APEX的贡献,我总是说,如果没有的话,Linux就不会发生,事实上,微软是Linux最大的贡献者之一。IBM也是,甲骨文也是,等等。
我认为开源可能真的有它的位置——这是一种很好的机制,对吧?当多个实体走到一起并进行协作时,这是一种聪明的商业策略。那么,闭源可能在闭源的环境中也有意义。毕竟,我们有很多闭源产品。安全是一个重要但正交的问题。法规将适用,安全将适用于双方。人们可能会争辩说,嘿,如果每个人都在检查它,那么在一方面或另一方面就会有更多的安全性。
所以,我认为最好在资本主义中处理这些问题;至少,最好有多个模型,让它们之间存在竞争。不同的公司会选择不同的道路。我们应该非常严格,政府也会要求这样做。我认为现在科技界不可能说,嘿,我们稍后会看到意外后果会怎样。没有哪个政府、社区或社会会容忍这一点。
因此,所有这些人工智能安全机构都会保持相同的标准。此外,就您提到的国家安全而言,如果存在国家安全泄露的挑战,人们也会担心这一点。因此,我认为国家和国家政策将对这些模型中的哪一个以及监管制度是什么样子有很大的发言权。
主持人Brad: 真难以置信,我们进入后ChatGPT时代才仅仅22个月。但当我回想你们关于阶段性转变的框架时,你会发现,随着我们迈入人工智能时代,微软的地位非常有利。所以,恭喜你们过去十年取得的成就,真是令人瞩目。而且,你知道,这很棒。我想我和比尔都对看到你们的领导力感到兴奋,你、伊隆、马克、桑达尔等等,你们真的在为美国队在人工智能领域开疆拓土。你知道,我觉得我们都非常非常乐观,我们相对于世界其他国家将如何定位。所以,感谢你们抽出时间与我们交流。
主持人Bill: 萨提亚,非常感谢你抽出时间,我真的很感激。
萨提亚·纳德拉: 非常感谢。再见。谢谢,布拉德和比尔。谢谢。
参考资料: https://www.youtube.com/watch?v=9NtsnzRFJ_o,公开发表于2024-12-12
关注公众号后设🌟标,掌握第一手AI新动态