亚马逊向英伟达芯片发起冲锋

科技   2024-11-26 18:09   中国  

文丨天下
你没有听错,亚马逊居然想挑战英伟达AI,而且看起来很认真。
几天前,亚马逊向AI芯片创业公司Anthropic投资40亿美元,双方将携手开发Trainium芯片。加上之前的投资,亚马逊已经累计向Anthropic注资80亿美元。亚马逊希望在投资的刺激下,自家AI芯片可以广泛应用于训练和运行大语言模型(LLM)。

按照Anthropic的说法,有了资金支持,Anthropic将会选择AWS作为主要的云伙伴和训练伙伴,它还会帮助亚马逊设计Trainium芯片,帮助亚马逊打造AWS Neuron模型开发平台。

听口风,亚马逊深知自己无力单独抵抗英伟达,所以寻找Anthropic作为盟友,Anthropic应该也有同样的心态。投资消息宣布之后,英伟达股价下跌3%,只是不确定下跌是否真的和投资有关。

存在缝隙的合作

Anthropic以前主要使用英伟达GPU,现在如果大规模转向Trainium芯片,过程复杂,耗时费力,而且对AI模型开发者来说也存在不可预知的风险,这对亚马逊和Anthropic来说都是挑战。

Anthropic CEO Dario Amodei在言语中暗示,他们不会全面下注Trainium ,哪怕亚马逊又投资40亿美元,Anthropic也不会单纯依靠亚马逊。

Dario Amodei最近在旧金山参加会议时说:“我们使用英伟达芯片,也会使用来自谷歌、亚马逊的定制芯片。不同的芯片有不同的权衡,我认为每一种芯片都能带来价值。
2023年亚马逊首次投资Anthropic,总计40亿美元,投资附带一些交易条款。当时Anthropic曾说,它会使用Trainium和Inferentia芯片搭建、训练、部署未来AI模型,双方还会合作开发芯片技术。

到底Anthropic有没有兑现当初的承诺?我们无从知晓,但《The Information》不久前报道称,Anthropic放弃了亚马逊AI芯片,选择了英伟达GPU。报道还说,亚马逊之所以追加投资,主要是希望Anthropic多使用亚马逊芯片。

有理由相信,新投资到位之后,Anthropic会向亚马逊靠近几步。
在融资声明中,Anthropic强调双方将合作开发Neuron软件,它类似于芯片与AI模型之间的结缔组织(connective tissue),直接对标英伟达CUDA。CUDA有点像护城河,让英伟达GPU可以发挥出最大潜能,使得英伟达芯片很难被其它芯片替换。竞争对手也许能开发出不错的AI芯片,但很难跨越CUDA。

哪怕是亚马逊 挑战英伟达也不是易事

除了亚马逊,还有一些企业也想挑战英伟达AI芯片,在性能方面,有些芯片表现不错,但谈到市场份额、影响力(比如思想方面的影响力),它们都还相差很远。

亚马逊拥有庞大的数据中心,它有理由开发自己的芯片,这样可以节省金钱,不必过度依赖英伟达。英伟达的GPU芯片利润率高达70%,亚马逊不可能不眼红。

2020年时亚马逊推出Trainium和Inferentia芯片,目的就是降低对英伟达的依赖,让AI时代的云计算变得更便宜。

10月份,亚马逊CEO Andy Jassy在财报会议上表示:“当客户大规模部署时,它们很快意识到AI将会变得更昂贵。正因如此,我们向Trainium和Inferentia两款定制芯片进行投资,前者用于训练,后者用于推理。
就像其它挑战者一样,亚马逊也发现打破英伟达垄断地位并不容易。有些人认为障碍在于CUDA,有些人则说主要难点在于改变用户习惯。

5月份,Bernstein分析师Stacy Rasgon告诉媒体,没有什么企业大规模使用亚马逊AI芯片。

10月份,亚马逊CEO Andy Jassy透露,下一代Trainium 2正在加速前进。她说:“我们看到用户对这款芯片兴趣浓厚,我们已经与制造合作伙伴沟通过多次,试图生产更多的Trainium 2芯片,比原计划多。
Anthropic CEO Dario Amodei的意志并不坚定,他两头下注。Dario Amodei说:“作为一家独立企业,我们的使命是提供最好的服务。你看看我们在市场上的定位,看看我们的能力,就会知道我们有很多独立伙伴,比如谷歌、亚马逊,还有其它,我觉得这种策略是可行的。”

硬件可以一较高下 软件才是难点

AI芯片市场的规模达到1000亿美元,亚马逊想用自研训练、推理AI芯片分一杯羹,这是可以理解的。

为了达成目标,亚马逊设立一个类似创业公司的实验室,工程师开发电路板、研究散热系统,希望有一天能驱动AI负载。

虽然做了很多努力,但亚马逊的项目离成功还很遥远。

瑞穗分析师在报告中指出,虽然媒体频频炒作,说亚马逊AI芯片给英伟达带来很大威胁,实际上威胁很小。在其它挑战者身上,类似的报道也有很多,但它们暂时都无法威胁到英伟达。
相比于前代产品,Trainium 2的算力提升了3倍,存储增加了2倍,这可能是媒体吹捧的原因之一。

亚马逊工程师精简了设计,减少了内部组件,改善了散热。面对更强大的英伟达硬件,亚马逊追求成本效益,它的产品价格更低。

除了Anthropic,亚马逊还与Databricks达成5年合作,为Databricks提供更低成本的AI构建解决方案,销售给其它企业。双方合作的重点正是Trainium AI,在一些任务中,Trainium AI可以取代英伟达GPU,成本更低。

也就是说,在硬件方面亚马逊还是有胜算的,难点在于软件。
亚马逊倾力打造的Neuron SDK仍处在开发早期,对开发者来说不够便利,使用也没有那么容易。

亚马逊强推自研AI芯片还有一个原因,英伟达开发的Blackwell芯片要到2025年年初才能上市,AWS的许多客户受到影响。由于存在生产挑战,英伟达强迫AWS等待Blackwell芯片。AWS主管曾向媒体抱怨产品延迟到货的问题。

很多科技巨头都将枪口瞄准英伟达

除了亚马逊,还有很多企业正在开发自己的AI芯片,比如微软、Meta、OpenAI、谷歌、AMD、英特尔。随着生成式AI需求的持续增长,芯片将会成为争夺AI霸权的下一个战场。

几天前有消息称,OpenAI首席执行官奥尔特曼正在为人工智能(AI)芯片制造商Rain AI寻找投资者。

Rain AI是一家AI芯片创业公司,它也想挑战英伟达,奥尔特曼是该公司的股东。据报道,Rain AI准备融资1.5亿美元,估值达到6亿美元。
为了对抗英伟达,AMD斥资49亿美元收购AI基础设施企业ZT,收购后AMD的软件、系统研发能力将会得到增强。一直以来,ZT专门为数据中心设计、部署AI系统,

年初时有消息称,为了对抗英伟达,英特尔、高通、谷歌及其它一些科技企业准备联手应战。联盟的合作围绕软件展开,目标是引导开发者远离英伟达CUDA软件平台。

联军实力不容小觑,但咨询公司D2D Advisory的CEO Jay Goldberg认为,CUDA的地位不是一夜之间可以撼动的,它之所以如此重要不单只是软件能力,还有15年的使用历史。
Jay Goldberg称,许多代码是围绕CUDA开发的,CUDA与很多AI及高性能计算项目深度连接在一起,要改变现状需要解决惰性和依赖性问题。

英伟达的弱点在哪里

在AI硬件领域,英伟达的确独霸天下,竞争对手根本无力抵御,不论是多功能性还是原始性能,英伟达都能压制对手。

尽管英伟达取得了巨大成功,但仍然有一些风险因素在削弱英伟达的竞争力,例如,GPU的制造成本太高了,AI能耗也很高。

无数人在问:在未来几个月甚至几年内英伟达还能保持高增长吗?竞争对手能不能找到办法缩小差距?
AI半导体市场实际上分成两大板块,一块是训练,一块是推理。数据中心用GPU训练AI,推理发生在服务器或者边缘设备上。从本质上讲,想在AI市场站稳脚脚,可以从三个方向着手。

在训练市场,英伟达占据98%的市场份额,这种优势短期内不会消失。边缘AI推理市场是竞争对手可以重点关注的领域。

一些企业正在研发NPU(Neural Processing Units),它的能耗更低、更加专业化,可以取代GPU。NPU能加速处理AI任务,包括深度学习和推理任务,它还可以并行处理海量数据,可以用专门的片上存储器快速执行复杂的人工智能算法,以实现高效数据存储和检索。
虽然GPU处理能力更强,功能更多,但NPU更小、更便宜、更节能。在执行专业AI任务时,由于它采用特殊架构,性能反而有可能高于CPU。

简单来说,英伟达并非无敌,其它企业还是有机会的。
如果您有什么想说的,欢迎在评论区留言讨论!
投稿或寻求报道,欢迎私信“投稿”,添加编辑微信
如果您想要获取最新的科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会!
欢迎扫描下方二维码,加头部科技创始人、AI头号玩家俱乐部主理人晶总微信!

头部科技
头部科技是技术新世界的记录者、探索者和推动者。我们致力于普及细分场景的科技解决方案,打造科技和人才创新知识图谱。无论你身处技术公司或传统行业,在这里都可以找到智能化、数字化升级的案例和伙伴。在无限的时空中,和你共同探索科技原力是我们的荣光。
 最新文章