大规模XPU集成，大有可为！

文摘 2024-12-13 18:23 天津

随着技术需求的多样化和计算任务的日益复杂，传统的计算处理单元已难以满足快速发展的应用需求。这种背景催生了一种全新的计算架构——XPU（Extreme Processing Unit），它旨在通过高度集成化的方式，实现更广泛的计算优化。

XPU的应运而生

随着人工智能、大数据分析、高性能计算等领域的快速发展，传统的单一处理器架构逐渐暴露出局限性，无法满足多样的工作负载需求。为此，英特尔于2020年提出一个旨在提供跨平台的高效能处理能力的综合性计算架构——XPU。其核心优势在于其能够整合传统的CPU、高性能的GPU以及专用的加速器如AI处理器等，实现一种全新的、高度灵活的计算平台。

具体来说，XPU的主要技术优势包括：

更高的处理效率：通过在同一芯片或系统内部署多种处理单元，XPU能够在不同任务之间实现更高效的资源分配，大幅提升了系统的整体性能。
优化的能源消耗：XPU的设计注重能效比，能够在保证高性能的同时，降低功耗，延长设备的使用寿命，并减少散热需求。
对不同工作负载的灵活适应能力：XPU可以根据具体的应用场景，动态调整各处理单元的工作模式，确保在各种工作负载下都能保持最佳性能。

单一芯片or多芯片系统集成？

XPU技术不限于单一芯片的形式，它可以是集成在单一系统级芯片（SoC）上的多种处理单元，也可以是通过多芯片模块（MCM）技术组合的多个芯片。

XPU不仅是一种新的硬件单元，更是一种全新的计算架构理念。通过在同一芯片或系统内部署CPU、GPU、AI加速器等多种处理单元，XPU能够在保持各单元专长的同时，通过高效的交互与协调，大幅提升系统的整体性能和能效。

这种设计使得XPU特别适用于需要处理大量数据和复杂算法的现代计算任务，如大数据分析、机器学习、和高性能计算等。此外，XPU也支持Chiplet技术，即通过多个小芯片（Chiplets）的组合来构建更大规模的计算系统。

大规模XPU赛道，竞逐加速

在全球范围内，许多领先的半导体公司已经开发了XPU或类XPU的解决方案。Intel推出了其XPU生态，通过oneAPI软件桥接不同类型的处理单元，旨在创建一个无缝、高效的开发环境。AMD推出的Instinct MI300系列、Apple的M1、M2芯片虽然没有明确使用“XPU”这个名称，但其产品融合了CPU、GPU等多种计算架构，符合XPU的特点。

现阶段，企业正在进一步探索能够支撑大规模XPU集成的先进技术。

F2F 3.5D封装技术

2024年12月，博通宣布专门为下一代AI XPU推出3.5D eXtreme Dimension System in Package(XDSiP)平台，采用了业界首创的面对面（Face-to-Face,F2F）的3.5D封装技术。该技术通过将3D硅堆叠与2.5D封装结合，实现了超过6000mm²的硅片和高达12个高带宽内存（HBM）堆叠集成。相比传统的面对背（F2B）技术在互连密度和功耗效率上都有显著提升。这种创新的堆叠方式直接连接上下晶片的顶部金属层，提供密集且可靠的连接，具有最小的电气干扰和出色的机械强度。3.5D XDSiP平台包括IP和专有设计流程，可高效地对电源、时钟和信号互连的3D芯片堆叠进行设计。

Broadcom 3.5D XDSiP的核心优势

互联密度显著提升：相较于传统的F2B技术，3.5D XDSiP在堆叠芯片之间实现了信号密度的七倍增长。

功耗效率卓越：通过采用3D高带宽连接器（HCB）替代平面芯片间物理层（PHY），3.5D XDSiP在芯片间接口上的功耗降低了十倍。
延迟大幅降低：3.5D堆栈内的计算、存储及输入输出（I/O）组件之间的延迟得到了最小化。
封装尺寸紧凑：3.5D XDSiP使得中介层和封装尺寸得以减小，从而降低了成本并改善了封装的翘曲问题。

Custom HBM新型互连

与此同时，Marvell也在12月宣布联合三大HBM内存制造商Micron、Samsung和SK hynix面向超大规模数据中心客户，推出“定制HBM计算架构”，旨在通过优化HBM与XPU之间的互连方式，为下一代XPU提供更高的内存密度，并改进整体计算效率和功耗。

Marvell定制HBM计算架构图

HBM通过硅中介层上的标准线路与CPU或XPU连接，XPU通常包含两个或多个由DRAM堆叠和基底裸片组成的HBM堆栈。Marvell开发了一种新的自定义接口。这种接口占用较少的芯片空间，可实现同等空间内部署更多的HBM堆叠，增加芯片的内存带宽和容量，同时将接口功耗降低多达70%。

Marvell CHBM的优势

结语

下一代超大规模AI集群将是100K GPU xAI Colossus集群的10倍甚至更多。因此，面向未来计算平台，无论是XPU还是Chiplet系统集成，都将更加注重系统级的集成与优化，走向大规模集成的未来。我们期待通过架构的创新与变革，开启一个全新的计算时代，为人类社会带来更加智能、高效、可持续的计算解决方案。

- END -

声明：本文不构成任何投资建议。我们尊重原创，也注重分享；文字、图片版权归原作者所有，不代表本号立场。如有侵犯您的权益请及时联系，我们将第一时间删除，谢谢！

PREVIOUS REVIEW

相关阅读

创作不易，点赞鼓励！

晶上世界

晶圆之上，创芯未来。专注芯片、人工智能、大数据、云计算、物联网等晶上技术应用领域的科普和资讯报道。

最新文章

AI推理计算的可能终局：存算一体芯片！

Chiplet集成难题，怎么破？

中国芯片的2025：洗牌、反围堵、“死磕28nm”练内功

中美芯片角力最新动态——出口管制、实体清单、技术封锁

独家解码晶上技术——晶上探秘专栏重磅上线！

做越多赔越多，晶圆代工产业靠政府打续命针？

解锁Chiplet潜力：封装技术是关键

晶上系统：设计、集成及应用

日本芯片设备，卖疯了

Gartner 《2025 年主要战略技术趋势研究报告》

中国工程院《2024全球工程前沿》重磅发布，这项技术榜上有名！

一块芯片塞下12块HBM内存，3.5D封装又来卷了

进口芯片，都在变成“中国制造”

中微胜诉美国国防部，国产半导体设备现状如何？

中芯国际，跻身全球晶圆代工前三

大规模XPU集成，大有可为！

专访清华胡杨：开发晶圆级芯片，降低先进工艺依赖，通过系统重构大幅提升算力

魏少军教授：中国IC期待不依赖先进工艺的芯片设计技术

国际半导体巨头“向东看”：建立中国供应链

美国商务部BIS实体清单汇总（共800家）

隐藏黑马：这家小公司要改写Chiplet集成设计游戏规则？

中方决定！对美加强出口管制，为芯片制造关键材料

AI芯片竞争关键期，迎来定制化HBM

HBM制裁加码下的困境与出路

半导体设备，要变天了

互连技术革新，解锁未来网络“芯”密钥

第四届中国互连技术与产业大会即将召开！12月7日深圳，不见不散

分析丨ST官宣华虹代工40nm MCU

韧性铸就基石活力“智”向未来 IC China 2024在京开幕

高速互连赛道，进击中的“小巨人”

议程公布！ IC CHINA2024开幕式暨主旨论坛报告抢先看

玻璃基板的四大关键技术挑战

特朗普上台，这项半导体技术将登上C位！

最新！台积电回应“停供大陆7nm AI芯片”传闻

复杂网络驱动智能涌现——NICE读书会重磅上线

议程更新 | 一文了解IC China 2024

华为Mate 70来袭，麒麟芯片全系列对比

第二届集成芯片和芯粒大会倒计时四天！十大技术论坛精彩纷呈！

晶上联盟即将亮相IC China2024，诚邀您的莅临！

集成系统创新再攀高峰，芯和半导体2024 EDA震撼揭晓！

突发！美国对华半导体、量子计算和AI技术投资限制升级

国产智驾芯片公司地平线上市，实力几何？

中国车规级芯片创新实力前瞻

国产EDA巨头飞跃创“芯”，华大九天新品震撼发布！

国内先进封装玻璃基板项目汇总

平替的平替都来了，国产芯片卷成啥样了？

高密度互连，引爆后摩尔技术革命

展会资讯 | 巨擘齐聚，湾芯展SEMiBAY开幕式暨高峰论坛震撼来袭！

台积电凭什么引领3D IC设计革命

倒计时5天！展会资讯 | 一键收藏！湾芯展SEMiBAY观展攻略，助您轻松高效逛展！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉