台积电光计算!!!4层波导!512×512!EIC与PIC集成!

科技   2024-12-13 08:33   英国  

导读

近日,台积电研究团队发表了一项创新研究,宣布他们成功研发出世界首款用于生成式人工智能(GAI)训练的片上大规模数字光学计算系统(DOC)。这种革命性的计算系统可以显著提升能量效率性能(EEP),满足当代对高计算能力和低能耗的迫切需求。该工作以“Novel Parallel Digital Optical Computing System (DOC) for Generative A.I.”为题,发表在2024年美国洛杉矶举办的《国际电子器件会议(IEDM)》上。

世界首创:数字光学计算系统引领AI新时代

当前,生成式AI的普及加剧了对高能效计算技术的需求。传统的光学计算解决方案多集中于模拟架构或自由空间光学架构,但这些技术受制于精度、数据转换复杂性及扩展性等问题。研究团队此次提出的DOC系统采用了独创的多层低损耗光子扇出互联(PIFO)和电子-光子堆叠架构(EIC/PIC),结合台湾半导体制造公司的SoIC®技术,实现了数据移动和存储层级的革命性优化。

与传统电子设计相比,DOC能够扩展至更大规模的相干网络,以更低的每次乘加操作能耗(<0.08 pJ/MAC)达到更高速度。尤其是在512×512矩阵规模的大规模乘加计算中,该系统的能量效率提升超过20倍,进一步在更高精度应用中显示出巨大潜力。

技术核心:多层光子扇出互联的突破

为克服传统光学计算的瓶颈,DOC系统集成了先进的多层光子扇出技术。研究团队设计了一种全新的封闭式1对512扇出电路,能够以更小的路径损耗(-35 dB)实现高密度、多层次的信号传输。通过优化波导弯曲半径和层间光学过孔,这种系统不仅显著降低了功耗,还增强了系统的可扩展性和计算单元的灵活性。

相比传统的树状扇出架构,新设计的半对称扩展扇出结构控制了路径长度差异,使系统适配性大大增强。这种设计还允许计算单元的尺寸根据应用需求进行调节,无需牺牲能量效率。

图1. 芯片结构示意图

性能革新:能效提升20倍以上

在能效表现方面,DOC系统实现了远超当今最先进GPU的性能提升。其8位运算的能耗仅为0.08 pJ/MAC,与常规方法相比提高了20倍以上。而更高精度的运算则进一步扩大了能量效率的优势,使其在未来更大规模的矩阵运算中具备可持续扩展性。

图2.矩阵光计算示意图

此外,研究团队预计,通过优化制造工艺和元件设计,系统的能量效率还可以在未来进一步提升。例如,通过减小光学路径损耗和改进电光模块,该系统有望支持高达4096×4096矩阵规模的计算。

DOC系统的发布标志着数字光学计算领域的一次重大突破,为生成式AI的未来发展铺平了道路。其高能效、低功耗和大规模可扩展性使其成为下一代AI训练和推理的重要技术支柱。研究团队表示,随着系统集成和电子-光子技术的进一步发展,DOC架构的能量效率和性能将持续提升,为全球计算行业带来更加绿色和高效的解决方案。


仅供学术交流

欢迎学术工作来稿,无偿宣传。


微光知远
光电领域推广学术科普分享交流平台
 最新文章