DOI: 10.1126/sciadv.adm7569
集成光子平台利用光子作为信息载体,在光学信息处理领域扮演着关键角色。随着信息技术的飞速发展,对信息处理容量的需求不断增加。因此,集成光子平台需要满足两个基本要求:一是实现多功能化,即能够在同一平台上完成多种信息处理任务;二是实现超紧凑化,即减小平台的尺寸,以适应大规模集成和便携式设备的需求。传统上,基于光子晶体、微环或超表面的光子平台分别利用光子带隙特性,共振响应特性,相位调制特性而用于实现光子信息处理。然而,这些平台普遍面临尺寸较大的问题,难以实现高度集成。此外,直接扩展相同的单元结构来实现多功能化也面临诸多困难。尽管表面等离子体激元平台具有亚波长尺度的优势,但其内在损耗限制了大规模集成的可行性。而基于马赫-曾德尔干涉仪(MZI)的平台尽管可靠,但基本器件尺寸较大,面临单位面积计算能力增强的挑战。基于此,北京大学胡小永、龚旗煌团队提出了一种基于逆设计的超紧凑多功能大规模集成光子平台方案。通过结合伴随梯度算法和几何限制算法,该工作开发了一种高性能的逆设计固定耦合器(IDFC),其尺寸仅为4um×2um。该IDFC的插入损耗和干涉可见度分别测量为-0.48 dB和0.996,表现出优异的性能。通过构建的多功能光子平台集成了86个IDFC和91个相位调制器(PS),光子芯片的整体尺寸仅为3毫米×0.2毫米,与现有MZI基平台相比,集成密度提高了一个数量级。平台采用过完备的电极分布,使每个波导的相位调制能够独立调节,从而实现了任意形式的一维(1D)紧束缚模型量子模拟。一维拓扑模型的量子模拟:该工作展示了Floquet Su-Schrieffer-Heeger(SSH)模型和Aubry-André-Harper(AAH)模型的量子态演化,Floquet SSH模型的哈密顿量在时域内周期性变化,具有四个拓扑相,实验测得的平均保真度为97.90%(±0.52%)。对于AAH模型,实验测得的平均保真度为99.34%(±0.44%)。光子神经网络:该工作还基于光子平台上实现了手写数字的四类和八类分类任务,通过片上训练,测试集准确率分别达到87%和60%。在输入手写图像前,采用主成分分析(PCA)进行降维处理,以便将信息编码到光子平台上。研究进一步证明了该光子平台的可扩展性,通过模拟二维无序SSH模型的量子模拟和十类分类任务来展示。该工作构建的多功能集成光子平台基于逆设计的IDFC和相位调制器(PS),整体架构紧凑且功能丰富,如图1所示。平台主要包括输入生成器、光子处理器和复杂输出三个部分:1.输入生成器:包含14个IDFC和15个PS,形成7个马赫-曾德尔干涉仪(MZI),用于完全生成输入状态。输入生成器通过调制幅度和相位,将输入信号编码到光子平台上。2.光子处理器:包含54个IDFC和63个PS,形成27个MZI,是平台的核心计算单元。通过独立调节每个波导的相位,光子处理器能够实现任意形式的一维紧束缚模型量子模拟。3.复数输出:包含18个IDFC和21个PS,形成9个MZI,用于测量输出光强和相对相位。复杂输出部分可以根据具体任务需求,选择是否测量相位信息。整个平台的尺寸为3毫米×0.2毫米,与现有MZI基平台相比,集成密度提高了一个数量级。平台采用过完备的电极分布,使得每个波导的相位调制可以独立进行,大大增强了平台的灵活性和功能多样性。图1 提出了计算平台的方案
基于该光子平台,该工作完成了两项任务的验证:(i) Floquet SSH和AAH模型的量子模拟,其中输入发生器准备初始状态,光子处理器执行模拟,并测量最终状态;(ii)在片上训练用于手写数字分类的光子神经网络(PNN),其中经过主成分分析法pca压缩的输入图像经过网络层后产生分类结果。以八类分类为例。不过笔者该工作基于线性变换(如波导的相位调制和干涉效应)实现的手写数字识别任务称之为光子网络更贴切,因为神经网络的核心在于神经元的非线性激活函数所实现的高层次特征提取。
图2 实验实现任务的示意图
逆向设计作为该研究的核心创新点之一。具体而言,该工作是结合了伴随梯度算法和几何限制算法以实现了尺寸仅为4 μm × 2 μm的高性能逆设计固定耦合器(IDFC),并将IDFC作为构成MZI阵列网络的基本单元以实现超紧凑大规模的多功能光子平台的。将IDFC的设计区域等分为200 × 100个相同的单元,每个单元的尺寸为20 nm × 20 nm × 220 nm。利用MATLAB控制优化过程,并利用时域有限差分(FDTD)软件Lumerical FDTD Solutions模拟电磁场分布。具体过程如下:1.伴随梯度算法:首先基于该算法定义一个目标函数来描述器件的性能,利用梯度下降法优化该目标函数,从而找到最优的介电常数分布。在优化过程中,通过伴随场方法计算梯度,显著提高了计算效率。2.几何限制算法:进一步使用几何限制演算法来优化元件的几何形状,以符合互补金属氧化物半导体(CMOS)制程的限制。该算法设定了一个临界半径,该工作设置为240nm,对小于该半径的尺寸进行腐蚀算法(模拟物理或化学腐蚀过程,逐步去除器件上不需要的材料部分),对大于临界半径一半的尺寸进行扩展算法处理,直到满足设计要求。在连续优化阶段,每个单元的折射率在下限(1.444)和上限(3.476)之间连续变化。而在离散阶段,单位的折射率被强制为1.444或3.476,以满足材料的真实的条件。最终设计的IDFC的扫描电子显微镜(SEM)如图3所示,其几乎符合所设计的结构,且尺寸远小于传统多模干涉器(MMI)的尺寸。实验测得该IDFC的插入损耗为-0.48 dB,干涉可见度为0.996,表现出优异的性能。
量子系统的计算是一个广为人知的问题,因为希尔伯特空间的维数随着粒子数呈指数增长。一个潜在的解决方案是量子模拟,其定义是“计算机本身由量子力学元件组成,这些元件遵守量子力学定律”。在传统的量子模拟过程中,量子态的演化是通过薛定谔方程来描述的。而光子集成平台通过精确控制波导中的相位和振幅等参数,实现了量子态的幺正演化,从而模拟了复杂量子系统的动态行为,因此片上光子量子模拟具有计算开销小、计算速度快等优点,是一种很有前途的模拟平台。该工作使用集成光子平台上的可调相移器(PSs)来模拟量子系统的演化算子。通过调整PSs,可以实现哈密顿量的不同的参数设置,从而模拟不同的物理场景,结果如图4、图5所示。具体使用了两种模型进行量子模拟:Floquet Su-Schrieffer-Heeger (SSH)模型是描述一维晶格上具有交替跃迁系数的无自旋费米子的模型。通过引入时间域的周期性调制,该模型可以展现出不同的拓扑相。Aubry-André-Harper (AAH)模型是描述二维Chern绝缘体的模型,其拓扑不变量是Chern数。该模型在集成光子平台上的实现,展示了通过调整跃迁系数来模拟具有合成维度的物理现象的能力。在SSH模型的模拟中,观察到了拓扑边缘态的出现和传播,验证了Floquet SSH模型的拓扑相位图。该工作通过调整模型参数,在实验上实现了从拓扑平凡相到拓扑非平凡相的转变,并观测到了相应的拓扑边缘态。在AAH模型的模拟中,研究者研究了具有无序势的一维量子系统的能带结构和波函数演化。通过调节无序势的强度,研究者观察到了能带从闭合到打开的变化,以及波函数从扩展到局域化的转变,这些现象与理论预测高度一致。Floquet Su-Schrieffer-Heeger (SSH)模型和Aubry-André-Harper (AAH)模型的量子态演化任务的平均测量保真度分别为97.90%和99.34%。与量子模拟类似,神经网络在传统计算上是昂贵的。而光子神经网络为实现高效计算提供了平台。到目前为止,大多数PNN都是在计算机上训练的,然后将训练好的权重移植到光子硬件上,以测量推理任务测试集的性能。然而,由于制造误差、大规模器件均匀性和调制精度等不确定性,从计算机精确复制权重并将其逐个粘贴到光子硬件上是困难的。
因此,有必要采用片上训练的方法,使网络对制造误差不敏感,保持稳定的性能,从而实现更实用、计算速度更快、能耗更低的大规模PNN。
在该任务中,光子平台的前15个调制器可以用作广义输入调制,当与输入强度控制组合时,允许控制到网络的八个复值输入。系统的其余部分用作具有四层的PNN。该工作已经评估了网络性能,并将结果与计算机上的模拟训练进行了比较,其中包括两个关键任务:四类手写图像分类和八类分类任务,以展示该研究的PNN的多功能性和可扩展性。
该工作的数据集取自UCI Machine Learning Repository,PNN的输入由8 × 8像素的手写图像组成。四类问题对应于数字0、1、2和3,八类问题对应于数字0、1、2、3、4、5、6、7。对于四类问题,有1334个训练图像,200个验证图像和720个测试图像;对于八类问题,有2861个训练图像,200个验证图像和1443个测试图像。为了适配片上训练的PNN输入输出维度,使用PCA将数据的维数从64降到8,同时保留大部分数据方差。
基于数值梯度的网络训练:为了在PNN上进行片上训练,该工作使用有限差分方法测量输出到每个输入的梯度。该工作将调制器上的电压改变一个小值,并测量输出的相应变化。获得每个权重的梯度并用于PNN的梯度下降训练。为了进行比较,该工作使用PyTorch实现了PNN的模拟模型,使用相同的数据集,初始化和输入数据顺序进行了训练并使用相同的方法计算梯度。片上训练和模拟训练的比较显示了一致的准确性和训练模式。四类和八类分类任务与片上训练实现测试集的准确率分别为87%和60%,在比较与训练的计算机上的测试集的准确率为76%和69%(四分类任务上训练了260个epochs,在八分类任务上训练了123个epochs)。与在相同数据集上使用的计算机训练得到的神经网络相比,该网络的准确性较低的原因有两方面,一方面是网络包含的通道和可学习权重(总共91个)比提出的人工神经网络(LeNet-5为61706个)少得多,另外一方面就是该PNN并没有非线性激活函数。
总的来说,该工作通过逆设计方法实现了大规模、超紧凑、多功能集成光子平台,集成密度显著提高,为集成光子技术的发展提供了新的思路和解决方案。该平台不仅适用于量子模拟任务,还展示了在光子神经网络(PNN)和光学信息处理领域的潜力。片上训练的实现使PNN对制造误差具有鲁棒性,为实现更实用、更快速、更低能耗的大规模PNN提供了可能。
[1]Zhuochen Du et al. ,Ultracompact and multifunctional integrated photonic platform.Sci. Adv.10,eadm7569(2024).DOI:10.1126/sciadv.adm7569