Phys. Today | 线性光路的神经网络非线性计算

文摘   2025-01-20 17:35   江苏  



撰稿:Jack



导读

在数字化时代,人工智能和机器学习技术正以前所未有的速度发展,它们在图像识别、自然语言处理、自动驾驶等领域展现出巨大的潜力。然而,这些技术背后依赖的电子计算设备,尤其是深度神经网络,却面临着能耗高、效率低的问题。为了解决这一挑战,科学家们一直在探索利用光子而非电子进行数据处理的可能性。


最近,美国物理学会的Johanna L. Miller博士以“Nonlinear optical computing doesn't need nonlinear optics”为题在Physics Today上发表探索与发现(Search & Discovery)类型文章,总结了来自耶鲁大学与巴黎高等师范学院联合团队(Nat. Photon. 18, 1067–1075 (2024))、洛桑联邦理工学院(EPFL)团队(Nat. Photon. 18, 1076–1082 (2024))和马克斯·普朗克光科学研究所团队(Nat. Phys. 20, 1434–1440 (2024))提出的基于线性光路实现光学神经网络的创新方案。这些工作有望颠覆对光子计算的传统认知。




光子计算的基本概念

光子计算,是一种利用光子来执行计算的技术。与传统的电子计算相比,光子计算具有速度快、能耗低、带宽大等优势。然而,光子计算在处理非线性运算时遇到了难题。非线性运算是神经网络中不可或缺的一部分,它们负责模拟人脑中的决策过程,如神经元的激活或抑制。光学计算领域的传统观念认为,非线性光学器件是实现光学神经网络的重要条件。但是,光子之间的相互作用很弱,这使得光子计算在实现非线性功能时遇到了障碍。

图1:光子计算示意图。
图源:Nature Physics



光学神经网络:原理、优势与难题

神经网络是一种模仿人脑神经元结构的计算模型,它通过层与层之间的节点(神经元)传递信息。在神经网络中,每个神经元计算输入信号的加权平均值,然后根据结果是否超过某个阈值来决定是否激活,即产生10的输出,传递到下一层。


在神经网络中,大部分的计算是线性的,例如加法、减法和乘以常数。这些线性运算是光子计算的强项。例如,将两个光信号相加只需将两个光场叠加即可。更复杂的加权求和也可以通过光束分束器和相位移位器轻松实现。光子计算在处理线性运算时,其优势在于信息可以在光束中被紧凑地编码,并且可以在空间和时间上高效传输,从而实现高吞吐量和低功耗的数据处理。


然而,对于光子神经网络来说,最大的挑战在于最简单的计算部分:每个神经元的激活决策,这是一个非线性函数。虽然可以通过非线性光学或将信号从光转换为电再转换回光来计算,但这些方法削弱了光子计算的最大优势。幸运的是,神经网络对于非线性函数的性质并不挑剔。它不必是一个全有或全无的步进函数。实际上,大多数实现使用平滑的步进函数以便于计算,而且如果网络经过适当的训练,许多其他非线性函数也可以工作。

图2:基于光腔阵列线性光路实现可编程的神经网络训练。
图源:Nature Photonics

本文提到的三个研究团队分别提出了突破传统的研究方案,他们的共同点是:不依赖于非线性光学材料来实现非线性功能,而是通过改变数据编码的方式来实现。这种方法的核心在于,不是将数据编码在光场中,而是编码在与光相互作用的系统中的某一部分。这样,非线性函数可以轻松计算,神经网络的实现也随之变得简单。



耶鲁大学和巴黎高等师范学院的联合团队:从物理不可克隆到神经网络

研究人员研究光学非线性时,最初是为了创建一个物理不可克隆函数(PUF),用于实现物联网安全特性的数字指纹。他们使用了一个高尔夫球大小的球形腔室,部分内部衬有可重配置的微小镜子阵列,其余部分衬有漫反射涂层。当他们将激光束射入腔室的孔中时,光在内部反弹,然后以斑点模式从另一个孔中出现。这个看似简单的系统实际蕴含着深刻的原理。研究人员意识到腔室可以作为一个"储备池计算机"——一种特殊的神经网络。平均而言,光在退出前会在腔室表面反弹数千次,产生的斑点模式包含了输入数据中像素间丰富的相关性信息,这正是神经网络实现智能的基础。

图3:将多重散射腔作为被动、可调谐非线性光学信息处理器的概念示意图
图源:Nature Photonics


EPFL团队:可控的非线性光路设计

研究人员开发了一种更具可控性的方案。他们没有采用随机散射,而是精心设计了一条之字形光路,让光束在带有四个不同输入副本的空间光调制器上散射。每个副本中的像素都可以通过可训练参数进行调节,使系统能像传统神经网络一样进行训练。尽管光只经过四次反射,但已足够产生有效的非线性效应,成功实现了简单的图像分类任务。更重要的是,多次编码的设计使系统具有很强的抗噪能力。

图4:基于低功率连续波激光和衍射层实现神经网络非线性计算
图源:Nature Photonics



马克斯·普朗克光科学研究所团队:理论突破与双向信息流

作为理论物理学家,他们从数学本质出发,设计了一种基于双向散射的网络结构。不同于传统神经网络的单向信息流,在他们的设计中,光波可以在网络中双向传播。通过在神经元中编码数据和参数,系统自然产生了所需的非线性依赖。这个富有创见的设计正在与斯坦福大学的实验团队合作开发实物系统。初步模拟显示,这种光学实现可能将传统需要数小时的训练过程缩短到毫秒级别,展现出巨大的应用潜力。

图5:基于双向散射网络结构实现神经网络非线性计算。
图源:Nature Physics


总结

所有三个小组的努力仍处于原理验证阶段。由于他们的网络与传统神经网络处理数据的方式如此不同,它们是否能够扩展以与运行ChatGPT等人工智能应用的计算硬件相媲美,还尚未知晓。但这些不依赖于非线性光学材料来实现非线性功能,而是通过改变数据编码的方式来实现的光学计算,能够为未来新型高效神经网络物理计算架构提供新的途径。



论文信息

Johanna L. Miller; Nonlinear optical computing doesn’t need nonlinear optics. Physics Today 1 October 2024; 77 (10): 12–14. 

https://doi.org/10.1063/pt.vbbo.lurd

免责声明:本文旨在传递更多科研资讯及分享,所有其他媒、网来源均注明出处,如涉及版权问题,请作者第一时间后台联系,我们将协调进行处理,所有来稿文责自负,两江仅作分享平台。转载请注明出处,如原创内容转载需授权,请联系下方微信号。

两江科技评论
聚焦“光声力热”超构材料、凝聚态物理、生物医学、智能制造等领域,打造科研人便捷的交流平台,发布优质新鲜的科研资讯。
 最新文章