中国AI芯片突破!全球首款碳基TPU问世,碳基AI时代或将来临?

百科   2024-09-05 22:22   湖北  

中国碳基AI芯片取得重大突破!北京大学等多家机构组成的团队,近日开发出一种全新类型的、全球第一款碳纳米管TPU芯片,能效极高,功耗极低,超谷歌AI加速器TPU1700倍,更不用说英伟达的GPU了,或成为解决全球AI能耗瓶颈的关键。而最关键的是,这项重大突破不仅仅是技术上的,更可能预示着一个碳基AI时代即将来临。这项研究已发表在7月22日《自然-电子学》杂志上。

AI模型的训练和推理需要处理大量的数据和复杂的计算,虽然英伟达的图形处理单元(GPU)极为强悍,迅速占领了全球AI加速器市场,但谷歌的张量处理单元(TPU)专为加速深度学习而设计,能效更高更省电,尤其是在AI推理任务中表现卓越。

只是谷歌的TPU通常设计为集群,专门针对谷歌TensorFlow框架进行了优化,主要用于谷歌的云平台及内部AI应用。而英伟达的GPU更通用,可以与各种深度学习框架无缝集成,所以获得了更广泛的应用,知名度更高,以致一芯难求。

然而随着AI应用的规模和复杂性不断扩大,硅的物理特性限制了其进一步缩小和提升性能的能力,硅基芯片的能效和处理能力已经面临瓶颈,迫使科学家们不得不寻找新的材料和技术来突破现有限制。

碳纳米管是一种由碳原子组成的微小管状结构,具有优异的导电性和机械强度。相比硅基材料,碳纳米管电子迁移率更高,开关速度更快,尺寸更小,密度更高,最关键的是它能耗极低,并具有极高的机械柔韧性,因而被认为是可以延续摩尔定律的下一代芯片的有力候选材料。

北京大学团队在这一领域取得了重大突破,开发出了全球首个基于碳纳米管晶体管的张量处理单元(TPU)。这款TPU由3000个碳纳米管晶体管组成,采用了一种名为收缩阵列架构的设计,可以像流水线一样同步处理多个计算任务,大幅提升了计算速度和效率。

所谓收缩阵列,是一种处理器网络,可以有节奏地计算数据并允许数据自由通过,类似于血液在人体中的流动方式,对于处理大量数据的AI模型至关重要。

通过封装在测试印刷电路板上的碳纳米管TPU,研究人员构建了一个五层卷积神经网络,在图像识别任务中准确率高达88%,而功耗仅为295μW,是所有新型卷积加速硬件技术中功耗最低的。

具体来说,这款碳基TPU的能效高达每瓦一万亿次运算,而谷歌的Edge TPU使用2瓦功率只能达到每秒4万亿次运算,这意味着碳基TPU能效超过了谷歌TPU的1700倍。

当然,碳基TPU虽然表现出极高的能效和潜力,但它仍处于早期研发阶段,要想在商业应用中全面取代硅基芯片可能还有很长的路要走。碳纳米管芯片目前制造复杂性和成本都较高,如何在大规模生产中保持稳定的性能和一致性,也是一个重大挑战。另外现有芯片制造工艺和设备都是以硅为基础的,重新打造一个行业无疑更是难上加难。

不过随着技术的进步和成本的降低,碳基芯片无疑将成为未来高性能计算和AI应用的一个重要方向。硅基到碳基,这是人类科技发展的必然选择吗?虽然我们还不知道,但中国科学家的突破,可能已为我们开发下一代芯片走出了关键的一步。

参考:

Si, J., Zhang, P., Zhao, C. et al. A carbon-nanotube-based tensor processing unit. Nat Electron 7, 684–693 (2024). https://doi.org/10.1038/s41928-024-01211-2




有趣探索
分享有趣有料的科学知识,咱们一起去探索!
 最新文章