MIT的Nature Photonics:光子深度神经网络芯片!!!只需前向训练!!!

科技   2024-12-03 08:27   英国  

导读

近日,麻省理工学院(MIT)的研究团队发表了一项创新研究,宣布他们成功研发出一种全新架构的光学深度神经网络芯片。这种单芯片光学神经网络通过全光域内的线性和非线性计算,显著提高了计算效率,并大幅降低了延迟。该研究以“Single-chip photonic deep neural network with forward-only training”为题,发表在国际顶级期刊《自然光子学》(Nature Photonics)上。

开启光学计算新时代

随着深度神经网络在人工智能中的广泛应用,传统电子芯片的能耗与速度逐渐成为瓶颈。研究团队开发的这一光学芯片能够通过光的强度与相位信息,实现超高效的矩阵运算与非线性激活操作。实验表明,该芯片完成一次推理的计算延迟仅为410皮秒,而每次操作的能耗仅为飞焦耳(femtojoules)级别。这一性能远远优于传统电子芯片,开启了光学计算的新纪元。

图1. 芯片架构示意图

技术亮点:全光域集成与创新非线性单元

研究团队通过全新的硅光子集成工艺,将所有关键计算模块——包括线性变换、非线性激活单元与相干接收器——集成到单一芯片上,实现了完全光域内的神经网络计算。

  1. 1.相干可编程光学非线性单元(NOFU)
    团队开发了一种新型非线性光学单元,通过电光自调制技术实现了无放大器的相干非线性操作。该设计不仅能在保持光信号相干性的同时进行激活函数计算,还大幅降低了功耗与延迟。

  2. 2.相干矩阵乘法单元(CMXU)
    利用马赫-曾德干涉仪(MZI)网络,芯片可以以极高精度执行线性代数运算,从而提升深度神经网络的整体性能。团队还通过软硬件结合的方法克服了硬件误差,进一步提高了计算精度。

  3. 3.现场训练(In-situ Training)
    团队创新性地实现了在硬件内直接训练模型参数的能力,摆脱了传统神经网络训练对电子计算的依赖。这一方法不仅提高了训练效率,还为未来的自适应光学系统提供了新思路。

图2. 芯片实物示意图


应用前景:从自动驾驶到量子通信

这一突破性光学芯片的出现为人工智能的实际应用提供了广阔前景。例如,在自动驾驶领域,该芯片可以以更快的速度处理激光雷达数据,从而实现实时决策。在量子通信与天文数据分析中,其低延迟和高能效的特点同样具有巨大潜力。此外,随着光学神经网络的规模不断扩大,这一技术还有望广泛应用于光学传感、边缘计算与智能通信领域。

本次研究不仅在硬件设计上取得突破,还结合了创新算法以最大化光学神经网络的潜力。例如,通过对硬件参数的实时优化,团队实现了在六类元音分类任务中的92.5%准确率,表现与传统电子计算系统持平。这一成果为光学神经网络的实际部署提供了实验依据,也为未来更大规模的系统开发奠定了基础。

研究团队表示,随着光学技术的进一步发展和硅光子工艺的提升,这一架构完全可以扩展到更大规模的网络。通过引入波长复用技术与多芯片集成,未来的光学神经网络有望在保持超低延迟的同时,实现更高的计算能力。此外,团队正在探索基于光学噪声的模型正则化方法,这或将进一步提升模型的鲁棒性和适应性。

这项研究不仅突破了传统电子计算的局限,更展示了光学计算在人工智能领域的巨大潜力。未来,随着这一技术的成熟,它有望在多个行业引发变革,从而推动整个科技领域进入全新的光学计算时代。



论文链接:

https://doi.org/10.1038/s41566-024-01567-z


欢迎学术工作来稿,无偿宣传。


微光知远
光电领域推广学术科普分享交流平台
 最新文章