引言
人工神经网络(ANNs)在人工智能领域引发了革命,在图像识别、音频处理和自然语言处理等多种任务中展现出卓越的性能。然而,现代ANNs日益增长的计算需求促使研究人员探索受人脑启发的非常规硬件平台。硅基光电子技术作为神经形态计算的有前途的候选者脱颖而出,具有波长辅助并行性、固有线性处理能力和低功耗等优势。
ANNs的关键方面是激活函数,为网络引入非线性,使复杂的模式识别成为可能。在本文中探讨创新方法,利用无源光学谐振器中的相位到振幅(PTA)转换来实现全光学、可重构和功率无关的神经激活函数。
相位到振幅转换
这种方法的核心概念是在无源光学滤波器(如微环谐振器,MRRs)中发生的非线性相位到振幅转换。在这种方案中,信息被编码在光载波包络的相位中:
其中P是输入功率,m是调制指数,n(t)是范围从-1到1的归一化信号。
图1展示了相位梯度对基于微环谐振器漏端口的IIR光学滤波器透射率的影响。
光信号的频率由相位编码信息调制:
随着光信号频率因相位调制而变化,光学滤波器的透射率也随之改变。这个过程产生了非线性PTA响应,该响应与输入功率无关,使其非常适合低功耗应用。
作为可重构光子神经元的微环谐振器
为了演示PTA转换机制,我们将使用微环谐振器(MRR)作为光学滤波器。MRR漏端口的传递函数为:
其中s = √k,c = √(1-k),k是耦合系数,ζ = γ exp(-j(2π(f + df)Tring))。
图2
图2显示了通过PTA转换从单个MRR节点的漏端口获得的不同激活函数:
(a) Soft-plus函数
(b) Sigmoid函数
(c) 高斯函数
通过调整两个关键超参数 - 调制指数m和频率失谐df - 可以控制激活函数的形状。这使我们能够重现多种独立于输入功率且对相位不确定性具有容忍度的激活函数。
时延储备计算
为了展示PTA转换机制的实际应用,将实现一个时延储备计算(TDRC)方案,用于Santa Fe混沌时间序列的一步预测。
图3展示了用于Santa Fe混沌序列一步预测的TDRC设置。
TDRC设置包括以下组件:
1.输入处理:时间序列被归一化并与掩码矩阵相乘以进行维度扩展。
2.数模转换:处理后的输入转换为模拟信号用于光学调制。
3.光学调制:信号使用幅度调制(AM)或相位调制(PM)调制光载波。
4.光子储备:带有外部反馈环的MRR为储备提供物理存储。
5.光电检测和模数转换:光子储备的输出被检测并数字化。
6.线性回归:处理后的数据用于进行一步预测。
性能评估
使用幅度调制(AM)和相位调制(PM)方案评估TDRC系统的性能。使用的性能指标是归一化均方误差(NMSE)。
图4显示了(a) AM的反馈强度和频率失谐,以及(b) PM的调制指数和频率失谐的NMSE函数。
对于AM方案,在-4 GHz的负失谐和反馈强度η = 1时观察到最佳性能,NMSE为0.12 ± 0.019。
利用PTA转换的PM方案展现出更优越的性能。在4 GHz的失谐和1.1的调制指数下,达到了0.024 ± 0.004的最佳NMSE。
图5显示了AM(SR = 10 Gsa/s)和PM(SR = 10, 100 Gsa/s)的NMSE作为输入功率的函数。
PM方案在广泛的输入功率范围内优于AM方案,展现出更高的性能和更好的功率效率。即使在低输入功率(-10 dBm)下,PM方案也达到了0.041的NMSE,展示了PTA机制的功率独立性。
优势和应用
提出的基于PTA的激活函数具有几个优势:
1.功率独立性:即使在低输入功率下也能保持非线性效应,适合低功率应用。
2.可重构性:通过调整调制指数和频率失谐,可以使用单个MRR实现各种激活函数。
3.高速操作:系统可以以高达2 Gsa/s的速率进行处理(对于100 Gsa/s的采样率),适合高速应用。
4.集成:MRR的无源性质使其与硅基光电子集成兼容,这对大规模神经形态系统至为重要。
这项技术的潜在应用包括:
1.光学神经网络:基于PTA的激活函数可用于卷积神经网络和前馈网络,提供额外的可训练元素。
2.复值神经网络:PTA机制可用于实现复值ANNs的复杂激活函数。
3.全光信号处理:PTA非线性可用于诸如全光ASK到PSK转换等任务。
4.稳健光子结构:基于PTA的激活函数的功率独立性可以为硅基光电子结构中的高光学损耗提供稳健性。
结论
本文介绍了创新方法,利用无源光学谐振器中的相位到振幅转换来实现全光学、可重构和功率无关的神经激活函数。通过利用微环谐振器的非线性响应,我们可以创建对人工神经网络非常重要的各种激活函数。
与传统的幅度调制方案相比,该系统在时延储备计算方面表现出更优越的性能。其功率独立性、可重构性和与硅基光电子技术的兼容性使其成为未来神经形态计算系统的有力候选者。
随着该领域研究的进展,有望看到全光学神经网络的进一步发展,可能会产生更高效、更强大的人工智能系统,克服传统电子实现的局限性。
参考文献
[1] G. Sarantoglou, A. Bogris and C. Mesaritakis, "All-Optical, Reconfigurable, and Power Independent Neural Activation Function by Means of Phase Modulation," IEEE Journal of Quantum Electronics, vol. 60, no. 5, pp. 1-10, Oct. 2024, Art no. 8700206, doi: 10.1109/JQE.2024.3437353.
- END -
点击左下角"阅读原文"马上申请
欢迎转载
转载请注明出处,请勿修改内容和删除作者信息!
若需原文链接,可留言或私信沟通~
关注我们
关于我们:
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
http://www.latitudeda.com/
(点击上方名片关注我们,发现更多精彩内容)