AI芯片,寒冬将至?

科技   2024-11-08 11:38   江苏  

Nov.

点击蓝字 关注我们

2024.11

进入11月以来,AI芯片波动明显。11月1日,AI芯片概念股整体下跌6.75%,主力资金净流出高达81.3亿元;到了11月4日,尽管微幅回升1.54%,主力资金却继续外流11.44亿元。


这些数据虽然只反映了AI市场的短期波动,但一定程度上揭示了AI芯片当前所面临的挑战。尽管该领域潜力巨大,资本市场的谨慎却映射出行业所承受的压力,以及投资者信心的波动。


作为智能产业的基石,AI芯片是推动智能化和数字化转型的关键技术。在AI技术迅猛发展的大背景下,AI芯片的需求一度激增。然而,面对地缘政治的局势、技术竞争的加剧以及市场需求的波动,AI芯片正遭遇新一轮挑战。

点击关注并星标与非网eefocus,

可领取20份行业报告、产业研究合集。

一重挑战:

美对华最终规则即将生效,格局恐生变

2024年10月28日,美国财政部发布了实施拜登于2023年8月9日签署的第14105号行政命令、即《关于解决美国在特定国家对某些国家安全技术和产品的投资问题的行政命令》的最终规则。要求美国人向美国财政部申报涉及受关注国家实体的相关受辖交易,并禁止美国人从事涉及受关注国家实体的相关受辖交易。


最终规则为实施行政令提供了具体的操作性法规,禁止或限制美国对中国半导体与微电子技术、量子信息技术以及人工智能等领域的特定投资,将于2025年1月2日生效。


全球供应链的紧张局势已经对我国AI产业产生了影响。英伟达、英特尔、AMD等芯片巨头的尖端AI芯片被限制向中国出口,同时,多家中国AI芯片企业被加入了“实体清单”,在产品研发、供应链、市场布局等方面受到了不同程度的挑战。


最终规则给AI芯片带来的直接影响之一是投资限制,可能会导致短期内中国AI芯片企业的资金来源受限,影响企业的研发和扩张计划。由于美国是全球半导体技术的重要发源地之一,这一限制可能会对中国AI芯片企业获取先进技术和资本造成一定的阻碍,短期的投入可能受到影响。


此外,最终规则的生效执行,无疑会进一步加剧竞争格局的变化。一方面,随着国内技术的进步和市场需求的增长,国产AI芯片加速技术追赶、并在关键环节实现自主可控的进程势不可挡;另一方面,国产AI芯片应更加专注于技术创新、探索不同技术路径在高端领域的突破,颠覆性技术可能是产业未来几年关注的重点。


同时,中国AI芯片产业链的布局需要进一步做出调整,比如在供应链、生产和销售等方面,以及在国际合作项目中的参与度等等,都需要彻底适应新的国际贸易环境。

二重挑战:

行业或将进入“挤泡沫”阶段

在全球芯片供应链紧张和地缘政治因素影响下,国产AI芯片被产业视为减少对外依赖、提升国际竞争力的关键。资本市场对AI芯片的投资热情一度高涨,尤其是在一些成功的初创企业和项目推动下,市场对国产AI芯片的前景普遍抱有较高期待。


以热门的GPU来说,是AI芯片近几年最受关注和追捧的赛道,壁仞、天数智芯、沐曦、摩尔线程等明星企业都融到了数十亿甚至上百亿的巨额资金。


不过,随着更多的资金和资源涌入AI芯片领域,商业化竞争也在变得更加激烈。今年8月底,GPU初创企业象帝先破产,成为国产GPU创业企业中第一家出现经营危机的企业。而按照该公司宣传目标,旗下天钧一号、天钧二号如果能规模量产,有望填补国内高性能通用GPU芯片市场空白。


融资遇难、裁员、降薪、估值下降等一系列危机,不仅对企业自身的生存和发展构成了威胁,也反映出整个行业在竞争加剧的市场环境中,在技术迭代、市场需求、融资环境等方面所面临的共同危机。象帝先是第一家,会是最后一家吗?


Gartner日前发布的《2024年中国数据、分析和人工智能技术成熟度曲线》显示,国产人工智能芯片正处于期望膨胀期。

这一曲线是将一项技术的舆论炒作关注度曲线和真实发展曲线合并后所形成的。各项技术发展细分为五大关键阶段:技术萌芽期、期望膨胀期、泡沫破裂谷底期、稳步爬升复苏期和生产成熟期五个关键阶段。


据Gartner方面的解析,当某项技术的舆论关注度达到顶峰时,实际上该技术的成熟度并不高,这也是最容易产生“泡沫”的阶段,半年前的大模型技术基本就处于该阶段。而随着舆论对这项技术的期望值开始趋于冷静,“泡沫”也会被慢慢挤出,很多企业也会在这个阶段被兼并,企业数量明显减少。


根据这一解析,国产AI芯片在经历期望膨胀期之后,可能会很快进入泡沫破裂低谷期。这也意味着,国产AI芯片市场可能需要经历一段调整期,通过更具创新力的技术和市场战略调整来恢复增长。


Gartner同时也指出,处在期望膨胀期也意味着技术已经足够成熟,并且能走向市场。未来两到五年,包括国产AI芯片在内的大量具有颠覆性或较高影响力的创新技术将会走向成熟,并实现大规模应用。

点击关注并星标与非网eefocus,

可领取20份行业报告、产业研究合集。

三重挑战:

需求波动,或将影响AI芯片局面

市场供需关系的变化也是关键挑战之一。从今年上半年开始,国内以阿里云为代表的云厂商启动算力降价策略,这可能会对国产AI芯片价格造成压力,迫使芯片厂商在成本控制和价格策略上做出调整;另一方面,市场竞争会变得更加激烈,芯片厂商需要推动技术创新和产品升级,以满足市场对高性能、低成本AI芯片的需求。


从国际市场来看,NVIDIA H100 GPU在2023年3月上市之后,因需求激增一度供不应求,其租赁价格从最初的每小时4.7美元一度飙升至每小时8美元以上。不过今年以来,一些算力租赁网站的报价可以看到,1x H100的一小时租赁报价已经降在2~3美元区间。


随着Blackwell GPU的推出,迭代升级势必会对前代产品带来一定影响。同时,造成价格下降的因素是多方面的,这些因素可能在中国市场同样存在,比如:一些预订H100的公司完成模型训练之后,转售或租赁闲置未使用的算力;还有一些公司不再从头训练新模型,转而微调开放模型,这一点在投资者中也有所反映,因为新的基础模型创建者的资金急剧减少,大多数小型团队已经转向微调。


并且在AI基础模型发展方面,文本和图像领域已经涌现出许多小型和中型AI基础模型。除非有明显优势,如超越Llama 3的性能、架构优势、显著降低的推理延迟或多语言支持等,否则少有新公司从零开始构建基础模型。这些变化映射到算力需求层面,都将给AI芯片的带来挑战,特别是在云端市场。

国产AI芯片,期待更多新故事

在全球生成式AI快速发展的背景下,国内智能算力的大幅度增长拉动了产业对AI芯片的需求,为AI芯片产业的发展提供了较大的发展空间。德勤数据显示,我国AI芯片行业市场规模呈现持续扩大的趋势,逐渐成为全球AI芯片市场的重要力量。2023年,中国AI芯片市场规模预计1206亿元,2018-2023年复合增长率高达80%。



云边端一体化,重视边缘和端侧机会

作为各行各业数字化转型的关键力量,边缘技术已经不再局限于工业场景,各行各业都在加以采用。除了制造业仍是领先行业,未来5年,金融服务、零售、运输和政府等行业将加快采用速度。这也意味着部署场景将从本地现场边缘解决方案(如用于制造工厂或矿山等),持续转向多地点部署——这些场景往往会部署近边缘/远边缘解决方案,即介于企业与最近的数据中心之间的边缘,无论是由企业/云提供商拥有,还是由第三方数据中心运营商安置在主机代管(colocation)设施中。


Omdia报告指出,到2027年,全球企业边缘服务市场规模将翻一番,达到2450亿美元。这显示了边缘服务市场的巨大增长潜力,其中边缘生成式AI技术的重要作用。


Omdia人工智能首席分析师苏廉节的最新预测中指出,2024年是边缘生成式AI的关键之年,从今年开始,边缘生成式AI将快速增长,AI手机、汽车、AI PC、人形机器人这四大方向前景看好。


具备边缘大模型的智能手机渗透率预计将在2026年急剧上升。2024年的总出货量预计为1.19亿部,占总量的10%。之后将逐年稳步增长,2028年将达到6.06亿部,复合年增长率为38%。


AI PC前景备受看好,预计2028年,AI PC渗透率约为79.5%。仿人机器人也是未来重要方向,预计到2027年,人形机器人的出货量将超过一万台。


此外,车联网也在成为下一个增长点。2022年,联网汽车渗透率达到整个汽车市场的22%,这一比例高于2014年的5%,反映了过去8年联网汽车销量的显著增长。2022年售出的车辆中有81%配备了互联功能,有望在2030年实现100%的车辆具备联网能力。


上述应用都将推动对AI芯片的更多需求:随着边缘和端侧设备开始生产越来越多的数据,原始设备制造商正在部署AI模型和AI推理芯片组来实时处理数据,以加快分析和决策。同时在情境感知方面,边缘大模型等导入,将推动AI芯片设计向更多样化、更高能效比等方向发展。



芯片路线更注重差异化创新

面向未来AI大模型的更高算力需求,国产AI芯片应该注重架构和技术路线方面的创新。目前,以鲲云科技为代表的数据流芯片、以千芯科技为代表的可重构芯片、以亿铸科技/后摩智能/知存科技为代表的存算一体芯片等等,都正在进行突破传统芯片路线的技术创新。


国际上的Cerebras Systems、Groq等AI芯片新秀,他们的创新技术路线也具有借鉴意义:


Cerebras因其晶圆级引擎(WSE)技术而闻名,尤其是最新的WSE-3芯片,这是一个专门为AI训练和推理设计的强大芯片,拥有4万亿个晶体管,提供125 petaflops的峰值AI性能,由900,000个AI优化的计算核心实现。


Groq的芯片技术路线则以低延迟为核心,其LPU(Language Processing Unit)技术采用了时序指令集计算机(Temporal Instruction Set Computer)架构,这意味着它无需像使用高带宽存储器(HBM)的GPU那样频繁地从内存中加载数据。这一特点不仅有助于避免HBM短缺,还能有效降低成本。借助LPU技术,Groq芯片每秒可以生成高达500个token,远超ChatGPT-3.5的每秒约40个token。Groq云服务搭载的Llama2或Mistreal模型在计算和响应速度上远超ChatGPT,显示了在AI推理方面的高性能。


这些专注于在AI训练和推理方向进行的技术创新,也给国内AI芯片初创企业带来一定启发,包括专注于特定领域的技术路线探索、在保持高性能的同时如何控制成本、通过软硬件协同优化提升整体系统性能等方面。

写在最后

中国AI市场正酝酿着巨大的机会。文中提到的这些短期的、局部的挑战,并不能代表中国发展AI产业的全盘局面,更不意味着AI芯片无法逾越的寒冬,我国AI芯片仍面临广阔机遇。


随着AI技术的不断普及和应用场景的不断拓展,对高性能、低功耗AI芯片的需求将持续增加,特别是在云计算、数据中心和边缘计算等领域。国产AI芯片技术的不断成熟和市场竞争力的提升,终将在国产替代和国产突破方面形成更强的竞争力,在广阔的市场前景中迎来蓬勃发展。

END

注:本文题图来自摄图网、作者自制、媒体公开资料、皆已授权。

行业社群

作者专栏

点点“在看”↘,与朋友分享你的世界


 请戳“阅读原文”,查看更多资讯

与非网eefocus
与非网(eefocus)定位为电子技术门户网站和工程师社区,专注于电子及半导体产业分析、市场动态和前沿技术,为电子工程师提供一站式技术资源库和信息服务平台。
 最新文章