英伟达稳坐中国GPU市场王座,华为做出了重大AI芯片策略转向

文摘   2025-01-21 19:47   四川  

根据外媒英国FT最新发布的消息,在当下竞争激烈的中国人工智能AI芯片市场上,华为正全力以赴,力求通过助力本土公司将自家研发的AI芯片运用到推理任务当中,从而在英伟达所主导的中国人工智能AI芯片市场上获得更大的份额。

目前,中国领先的AI公司在训练大模型时高度依赖英伟达的GPU芯片。然而,华为并没有选择直接正面挑战英伟达在AI训练市场的优势地位。相反,华为将自己最新的Ascend AI芯片定位为中国公司在进行推理时的首选硬件。推理是指AI大模型根据用户输入提示生成回应时所进行的计算。华为押注AI推理将在未来成为市场上更大的需求来源,尤其是在模型训练的速度放缓、AI应用(如聊天机器人)更加普及的情况下。

“训练很重要,但训练次数并不多,”华为苏黎世实验室的推理加速高级AI研究员Georgios Zacharopoulos表示。“华为主要专注于推理,这最终会为更多客户提供服务。”根据公司员工和Ascend AI芯片客户的说法,华为专注于技术上较不具挑战性,但潜在市场利润较大的路径——将基于英伟达AI芯片训练的模型改造为可以运行在华为Ascend芯片上的模型。由于英伟达GPU芯片与华为Ascend GPU芯片使用了不同的软件,华为正帮助公司使用另一种软件工具,使这两个系统兼容。一位熟知英伟达在中国业务运营情况的人士表示,在英伟达内部,华为被视为在中国市场上最强的竞争对手。该人士还补充称,华为的芯片设计能力“十分先进”。

最近几年以来,美国出台了一系列越来越严格的限制政策,目的是不希望中国公司在人工智能等重要的前沿科学技术领域缩小与美国的差距,甚至超越美国。因此,与美国的OpenAI、谷歌等公司不同,中国公司无法获得最先进的英伟达AI GPU芯片。但即便如此,中国公司仍可获得英伟达为符合美国出口管制规定并且专为中国市场“特供”的H20芯片。尽管H20的性能相对较弱,但在中国市场上的需求依然旺盛,因为人们认为H20比国内同类产品更具优势。

202310月,美国再度加强出口管制,英伟达不能再向中国出售A800H800芯片。随后英伟达面向中国市场推出了性能降级版芯片H20L20L2。其中,H20基于Hopper架构,主要用于训练任务;L20L2基于Ada架构,适合用于推理任务。

分析师和华为的研究人员表示,由于技术问题,华为Ascend芯片目前还无法取代英伟达GPU芯片用于模型训练。例如,在训练规模越来越大的模型时,在一个更大范围的AI芯片‘集群’内,芯片之间的交互方式会出现故障。“尽管单颗Ascend芯片的表现不错,但在芯片间连接方面存在瓶颈,”伯恩斯坦中国半导体分析师林清远表示。“当训练一个大模型时,必须将其分解为更小的任务。如果某个芯片出现故障,软件需要找到一种方法让其他芯片接管,不能有任何延迟。”

华为也还面临另一个挑战,就是说服开发者放弃英伟达的CUDA软件。英伟达的CUDA软件以易于开发者使用且能够大幅加速数据处理而闻名,被业界视为英伟达的“制胜法宝”。不过,华为即将推出的升级版AI芯片——Ascend 910C,有望解决这些问题。一位不愿透露姓名的华为员工表示:“我们预计这一代新硬件将搭配经过改进的软件,从而对开发者更加友好。”

半导体咨询公司SemiAnalysis的估计显示,英伟达去年通过向中国交付100万颗H20芯片,在中国市场上获得了120亿美元的销售收入,销售的AI芯片数量是华为Ascend 910B芯片的两倍。“英伟达专为中国市场定制的H20 GPU芯片占据了中国AI芯片销售的主导地位。但随着华为扩大生产能力,这样的领先优势正在快速缩小,”SemiAnalysis首席分析师Dylan Patel表示。

另据分析师Claus Aasholm在近期发布的分析文章称,H20在中国市场上的销售异常出色,季度环比增长高达50%。“降级版H20系统表现好得令人难以置信,季度环比增长率达50%,是英伟达最成功产品,而H100季度环比增长仅25%。”按照Claus Aasholm的研究结果,英伟达H20的性能虽远落后于H100,却从中国获得了超过百亿美元的收入。从Claus Aasholm提供的可视化图表上可以看到,红色代表的是H20,从2023年第3季度到2024年第4季度,H20的销售收入不断增长——后一个季度都相比前一个季度大幅增长。在2024年中,有分析师在给客户的研究报告中写道,尽管H20的“纸面”能力低于华为的Ascend 910B芯片,但在实际使用中,英伟达的H20芯片“明显领先”,这要归功于H20卓越的内存性能。

再有,市场研究公司Omdia先前估计,微软在2024年购买了48.5万块英伟达Hopper架构芯片;字节跳动和腾讯分别订购了约23万块英伟达GPU芯片,其中就包括了特供版H20芯片——专为满足美国出口管制要求的性能降级版本英伟达Hopper芯片;Meta购买了22.4万块英伟达Hopper芯片;特斯拉/xAI、亚马逊和谷歌分别购买了20万块、19.6万块和16.9万块英伟达Hopper芯片。

业内人士称,华为在AI芯片领域的推进也受到了供应不足的制约,至少有两位潜在客户表示,他们未能获得所需的芯片。分析师指出,由于美国的出口管制,华为的制造可能面临挑战,导致中国的半导体厂商依赖过时的芯片制造设备。

专注于推理的策略还凸显了中国AI行业与美国的不同动态。美国的出口管制意味着中国AI公司并未参与与硅谷竞争对手如MetaxAIOpenAI等美国AI公司同样的比赛——构建大型英伟达GPU超级集群。“中国公司在玩一个不同的游戏。即使使用性能较弱的芯片,也能在推理上获得巨大的效率提升,这意味着他们可以更快实现商业化。”伯恩斯坦分析师林清远表示。他说,中国公司押注通过降低推理成本来保持AI竞争力,这也使得运行AI应用的成本变得更低。

在这样的“特殊”的环境下,有的中国AI公司探索出了别具一格的发展路径。比如,最近震动了全球AI界的深度求索DeepSeek,就是一个极具代表性的典型例子。

先前低调上线的DeepSeek V3模型,可以算是第一梯队AI大模型,却只用了2048张英伟达H800 GPU芯片、2个月不到时间训练完毕,计算预算也只有不到600万美元;在性能方面几乎追上了Claude 3.5 SonnetGPT-4o,如编程、数学等;每百万Token的价格可以压到不到0.5美金,是用十分之一的价格达到OpenAIAnthropic同级的水平。而且,DeepSeek最新又推出了推理模型R1,根据DeepSeek的测试,几乎可与OpenAIo1正式版推理模型媲美。外界的实测表明,在英伟达Hopper GPU芯片数量资源可能相当有限的情况下,DeepSeek R1模型的实际表现仅次于o1模型,而成本只有OpenAI o1的三十分之一。

我为科技狂Tech
专注于科技资讯解析分享
 最新文章