10月9日,联发科新一代MediaTek天玑旗舰芯片——天玑9400正式亮相,成为安卓阵营首颗采用台积电第二代3nm制程的手机SoC。
平静已久的手机SoC赛道,由此画出了一道全新的起跑线。
全球智能手机在2016年以后进入存量市场,国产手机品牌带头围绕相机、折叠屏做硬件创新,在不断拉长的换机周期争取珍贵的单机利润增长,而作为性能引擎的手机SoC,这些年来却少有令人印象深刻的进步。
去年问世的天玑9300成为最近几年为数不多的令人惊艳的手机SoC之一,各项性能跑分力压同期的苹果A17 Pro和高通骁龙8Gen3。以天玑9300为开端,三巨头之间开始弥漫的硝烟,为新一轮竞争周期打了个前瞻。
2024年是智能手机新一轮换机潮的开始。伴随着各类硬件创新陷入同质化瓶颈,智能手机的较量回归最硬核的主线——手机SoC。而迎面赶上的生成式AI浪潮,也将给稳固已久的手机SoC竞争格局,带来不小的变数。
3nm的博弈
手机SoC的新竞争是从3nm的博弈开始的。
今年第二季度开始,全球芯片行业进入缓慢复苏期,台积电以营收同比达40.1%的高增独领风骚,去年下半年才正式开始接单营业的3nm占据晶圆总收入的15%。
手机SoC作为台积电3nm异军突起的主要推手,对于制程工艺的选择向来激进。从2007年进入智能手机时代开始,芯片制程每推进一代,手机SoC总能最早吃到螃蟹,3nm也没有例外。
台积电3nm的第一单是苹果A17 Pro,天玑9400是安卓阵营首颗采用台积电第二代3nm的SoC。业内透露,台积电3nm产能利用率已达100%,且严重供不应求,未来不排除5nm产线转换为3nm填补供应[1]。
手机SoC向3nm蜂拥而至的背后,是智能手机在明显放缓的硬件创新节奏中,越发尖锐的“性能-功耗”矛盾。
衡量手机SoC性能,简单理解就是单位时间里干的活越多,性能越高,但同时功耗也就越大,这就会直接影响手机的续航。
手机品牌在硬件上的“过分努力”加剧了这种矛盾。一个例子是折叠屏手机,其展开后屏幕尺寸相较于直板手机成倍增长,代价却是同样倍增的功耗,所以手机品牌才会急着将电动车还没普及的硅碳电池安上手机,核心就是为了解决功耗问题。
但由于存在SoC “性能-功耗”划定的硬件创新上限,种种手段不过是在螺狮壳里做道场,成全这个总要牺牲那个,而制程升级是个昂贵却能够一劳永逸的办法。
制程数字越小,代表晶体管体积越小,同样面积的芯片内能塞更多的晶体管,而电信号能在更短的距离内传输,提高了芯片的工作频率和运行速度,两厢综合,能带来芯片整体性能质的飞跃;同时由于制程越小、工作电压更低,使得功耗降低。
芯片行业有一句老话,“一代产品,一代工艺”,说的就是制程提升所带来的产品端性能和功耗的飞跃。
全球第一颗采用台积电4nm的手机SoC是天玑9000,问世至今已有3年,过去几年手机SoC发展进入瓶颈期,怪台积电不够努力也并非毫无道理。
如今3nm虽迟但到,越早用上的也就在手机SoC新一轮竞赛中确立了优势。
相比于苹果A17 Pro采用的初代3nm,天玑9400采用的第二代3nm在技术上更加成熟,而相比于采用4nm的天玑9300,在整体设计上也彻底放开了手脚。
CPU采用了“1+3+4”全大核架构,其中“1”是指Cortex-X925(代号黑鹰),是Arm全新一代超大核,对比上代X4性能提升36%,AI性能提升41%,是Arm五代超大核中性能提升最大的,直接对齐PC级CPU。
GPU采用了最新Immortalis-G925,是Arm史上性能最高、效率最高的GPU。同时成为业内首颗将PC端顶级OMM追光引擎引入移动端的SoC。
AI加速方面,全新搭载的NPU 890 AI性能跑分超过6700分,功耗降低了35%,具备率先支持端侧LoRA训练和端侧高画质视频生成,并面向开发者提供AI智能体化的能力。
台积电第二代3nm给了联发科更锋利的武器,但天玑9400的突破还在于日臻成熟的设计哲学,在“既要且要”的行业语境下,有了更明确的取舍和坚持。
9400突破了什么?
衡量手机SoC性能有一个基本公式:性能=时钟频率(每秒执行多少个周期) × IPC(每一时钟周期内执行多少指令)。产品迭代也主要围绕这两个维度做提升。
天玑9400的CPU部分沿用了天玑9300“1+3+4”的架构,主核“黑鹰”Cortex-X925时钟频率为3.62GHz,较9300的Cortex-X4的3.25GHz稳步提升,但更让业内瞩目的却是IPC进一步提升了15%。
外界常常将时钟频率视衡量性能更直观的标尺,但高频的代价往往是更高的功耗和更严重的发热问题,卡住了智能手机的脖子。
作为一种对便携性要求很高的设备,智能手机一方面不能像PC一样长期插电使用,电池容量又受限于体积,续航本就捉襟见肘;另一方面由于体积小,散热差,对发热极其敏感,如果GPU一样暴力堆核心怼性能,那大概率会收获一面能煎蛋的“平底锅”。iPhone早期被诟病的发热问题就来源于此。
因此更科学的设计思路,是在一定时钟频率的基础上,首先考虑尽可能地做IPC提升。
类似于CMOS图像传感器的“底大一级压死人”,IPC就是手机SoC的“底”,而提升IPC,考验的是芯片的架构设计,也是芯片设计公司内功的体现。
天玑9400的IPC提升主要来源于“黑鹰”Cortex-X925,作为Arm最新一代超大核,联发科深度参与了“黑鹰”的设计,新的架构带来最新优化的指令集,通过更科学的资源调度,例如线程分配,在不同场景中尽可能“物尽其用”,减少性能的冗余。
比如在浏览网页等一些无需高算力输出的场景下,SoC能够在相对低频的情况下,游刃有余地完成任务,使得整体功耗进一步下探。
IPC和功耗以外,天玑9400还突破了手机SoC在算力时代的另一个痛点——存储。
一颗SoC的基本运算流程是:CPU从内存调取数据,根据指令分配给GPU/NPU做对应的计算工作,再把结果重新返回给内存/缓存。
决定整个过程速度的除了CPU/GPU/NPU的计算速度之外,还有数据从内存调取以及输送的速度。随着CGN(CPU、GPU、NPU)性能的疯涨,与内存传输速度之间的差距也越来越大,也就是所谓的“内存墙”,决定了芯片算力的上限。
为此,天玑9400业内首个搭载了三星LPDDR5X 10.7Gbps,后者是目前全球最快的移动内存,性能较上一代提升了25%,功耗降低了25%。并以“黑鹰”架构为底,提升了缓存容量,缓存较内存距离CGN更近,数据传输耗费的时间更短。
自2021年推出天玑9000系列起,联发科在高端手机SoC的发展驶入了快车道。
从天玑9000采用台积电4nm,到9300系列果断抛弃大小核设计、领先业内采用全大核设计,联发科逐渐从追逐者转变成为了技术引领者——截至今年上半年,天玑9300仍霸占各大手机SoC性能天梯图、跑分排行榜的榜首位置。
天玑9400站在前代的肩膀上,重新对照消费者的真实需求,对纸面性能数字的实际效益进行了更深入的思考,和面向更长远未来的设计预埋。
在大模型入端浪潮迭起、即将深刻改变终端设备的当下,这种反思是必要且及时的。
AI手机由SoC定义
随着各大机构公开上半年销售数据,智能手机的复苏被一再确定。而在研报和手机品牌新品会上被频繁提及的“AI手机”,成为这一波复苏不可或缺的推手。
大模型入端是AI大模型浪潮的下半场,智能手机作为过去十几年体量最大的移动终端被赋予了重任:既要为大模型变现,又要利用大模型为智能手机贡献新的增长点。
但相较于手机品牌和机构的热闹,消费者对AI手机的概念仍然模糊,体验仍然鸡肋,根源在于AI手机的硬件核心——SoC还没到位。
调研机构IDC和Counterpoint都给出过AI手机的定义,共同将手机SoC列入“准入门槛”。
IDC认为,AI手机是搭载了满足AI算力需求的移动端芯片,并加载了深度学习AI功能的智能手机,且NPU算力必须大于30 TOPS[2],Counterpoint规定AI手机需要拥有集成或独立的神经网络运算单元(如APU/NPU/TPU),本身具备强大的AI算力[3]。
按这样的标准在市面上所谓的AI手机中挑挑拣拣,符合要求的所剩无几,因为算力“过线”的手机SoC,在很长时间里只有天玑9300、苹果A17 Pro、高通骁龙8Gen3,而搭载这几款芯片的AI手机其实并不算多。
图源:千际投行
天玑9400预告已久,早前就被传出已经被多家头部手机品牌旗舰机型锁定,也反映了这种“僧多粥少”的窘境。
作为AI手机SoC的新晋成员,天玑9400确实不负众望。除了算力的成倍提升和功耗可观的下降外,天玑9400的更大突破在于业内首个在端侧实现了推理和训练,并面向开发者提供AI智能体化的能力。
受制于电池容量、内存大小等硬件配置,目前终端设备执行复杂的生成式AI任务,大多是依靠云端协同的方式,即云端训练模型、终端用模型进行推理,但这种模式也面对诸如数据安全、传输速度等问题,始终会牺牲一部分消费者体验,例如流畅性。
天玑9400的解决思路是,在端侧直接实现训练和推理两条腿走路,既规避了数据安全和传输问题,又能让手机“越用越懂”。根据介绍,通过搭载天玑9400,手机可以在消费者夜间休息时,通过NPU做到低功耗训练,“睡醒的时候就越懂消费者一点。”
过去的十几年,相较于PC厂商跟随芯片大厂处理器的迭代节奏亦步亦趋、将“首发XXX处理器”作为宣传标语大写加粗,手机品牌在产品创新的维度上,总是有除了SoC以外更好的选择。
生成式AI浪潮催生了AI手机的诞生,将智能手机的竞争与手机SoC前所未有地紧密联系在一起,也将创新的压力从手机品牌的手上移交给了SoC厂商。
“30 TOPS的NPU”卡住了绝大多数SoC厂商,但这其实只是个基线。如今大多数生成式AI的应用还在APP层面,而大模型入端的未来在于AI操作系统(AIOS)的应用。
有机构测算,以苹果开发的多模态大语言模型Ferret-UI(参数量130亿)为例,以手机屏幕分辨率1920*1080、用户允许最长推理时间2s、硬件算力利用率60%测算,要AI生成一张高分辨率的图像所需峰值算力是99 TOPS[4]。
由此得出搭载AI OS的的处理器算力门槛在100 TOPS。随着AI大模型与手机软硬件更加深度的融合,对SoC算力的需求只会越来越大。
业界首发端侧视频生成、端侧LoRA训练、端侧混合专家(MoE)模型…在移动终端向着智能体化的发展路径上,天玑9400已在AI要地完成战略部署,带来近年来同领域内最大的一场革新。
性能向个别指标的倾斜,也将彻底颠覆SoC传统的设计思路,赛道的重塑已箭在弦上,看似热闹的AI手机SoC大军中,拿到入场券的实则比想象中更少。
1983年,摩托罗拉生产了世界上第一部手机DynaTAC 8000X(大哥大),30多个电路板上的几千颗晶体管,组成了重达2磅(907g)的机身,充电10小时,通话半小时。
1995年,LSI Logic为索尼PlayStation设计了第一颗SoC,将微处理器、JPEG视频解码器和3D图像引擎集成在一块电路板上,手机由此走上了“瘦身”之路,便携性加身,得以飞入寻常百姓家。
以此为起点,芯片制程的推进、晶体管的微缩得以让越来越多的零部件被加入机身,手机的“功能箱”不断壮大,兑现成每年指数级增长的销售额。回顾手机发展的历史,每一部令人印象深刻的作品背后,都有一颗SoC作为创新的引擎。
如今,生成式AI为智能手机勾勒了崭新的形态以及更不可测的未来,手机SoC再次担负起了落地的重担,为智能手机在AI终端的未来图景里力争一隅。
参考资料
[1] 台积电Q2财报全方位超预期将重点扩产先进制程,上调全年资本开支,科创板日报
[2] The Future of Next-Gen AI Smartphones,IDC
[3] Generative AI Phone Industry Whitepaper,Counterpoint
[4] 2024年AI手机行业研究报告,千际投行
[5] 警惕高价AI手机,远川科技评论
作者:何律衡
编辑:李墨天
视觉设计:疏睿
责任编辑:何律衡
封面图片来自ShotDeck