Deep Neural Network Inverse Design of Integrated Photonic Power Splitters
DOI: https://doi.org/10.1038/s41598-018-37952-2
在集成光子学领域,光子功率分配器作为一种关键元件,广泛应用于光通信、信号处理及光量子计算等多个方面。随着科技的进步,对光子功率分配器的性能要求也日益提高,包括高传输效率、低反射损耗、以及精确可控的功率分配比例等。然而,传统的逆向设计亚波长纳米结构以实现控制入射电磁场到特定的透射和反射波前方法主要依赖于物理模型的解析解和大量的数值模拟,如时域有限差分法(FDTD)等,这些方法在计算复杂度和耗时上往往存在瓶颈,限制了设计效率和创新性。
与此同时,深度学习技术的迅猛发展为解决复杂物理系统的设计与优化问题提供了新的思路。深度学习,特别是深度神经网络(DNN),通过从大量数据中学习复杂的输入输出关系,已经在多个领域取得了显著成果,如图像处理、自然语言处理以及计算机视觉等。在光子学领域,深度学习的应用也逐渐受到关注,尤其是用于纳米结构光子器件的逆向设计,即根据目标光学性能直接生成器件的结构参数。NN 可用于预测拓扑的光学响应(正向设计)以及为目标光学响应设计拓扑(逆向设计)。
三菱电机研究实验室Mohammad等人提出了一种基于ResNet深度神经网络的新型设计方法,旨在快速、准确地实现集成光子功率分配器的逆向设计。该工作通过训练深度神经网络模型,使其能够学习光子功率分配器的拓扑结构与光学响应之间的复杂关系,进而根据用户指定的功率分配比例,直接输出优化的器件结构设计。这一方法不仅克服了传统设计方法的局限性,还大大提高了设计效率和准确性,为集成光子学领域的设计创新提供了有力支持。
当宽带光遇到具有不同折射率的障碍物时,它会沿其路径发生反射、折射和散射。纳米结构集成光子学功率分配器的目标是组织光学相互作用事件,以便散射前光互补的整体效果将光束引导到目标端口和功率强度。正向建模预测光子器件响应和逆向设计目标光学响应设计拓扑的示意图如图1所示,该工作首先利用Lumerical的有限时域差分(FDTD)仿真软件并结合优化算法生成了超过20,000个数值仿真数据,这些数据包含了不同拓扑结构的硅基绝缘体(SOI)波导和功率分配器的光学响应。这些数据被用作训练DNN的输入,以学习孔向量(hole vectors)与光谱响应之间的关系。DNN模型采用TensorFlow框架构建,并通过优化算法(如Adam优化器)进行训练。图1 DNN 预测和逆向设计过程概述
NN的输入数据是几个 20 × 20 个空穴矢量 (HV),每个矢量都由端口 1 (T1) 和端口 2 (T2) 的光谱传输响应 和来自输入端口 (R) 的反射(SPEC,21个离散数据点)。每个像素都是一个半径为 45 nm 的圆,使用常规光刻方法很容易制造。每个像素的二进制状态可以是 1 表示蚀刻 (n = n硅),而 0 表示未蚀刻 (n = n二氧化硅)。改变孔位置的折射率会改变功率分配器内部的局部有效折射率,以确定行波在器件中的传播路径。该工作使用各种数据集训练 DNN 网络。每个数据集都从初始条件、蚀刻孔密度和用于优化光谱响应的指标开始,共生成了大约 ~20,000 个蚀刻空穴向量作为数据,每个向量都与其传输响应相关联作为标签。测试集与训练集的直方分布如图所示。前向问题作为回归问题求解,我们使用高斯对数似然函数来训练模型。相比之下,逆问题作为分类问题来解决,其中我们预测表示孔位置的二进制向量。因此,我们使用伯努利对数似然分类器作为训练逆问题的损失函数。
针对前向问题和逆向问题问题,该工作也对比了两种深度神经网络架构。首先使用了一个具有多层结构的全连接深度神经网络(FCDNN),其中每一层包含100个神经元。层的数量被视为一个超参数,在数值实验过程中进行了优化。然而,我们发现增加FCDNN的深度并没有提高网络的性能。因此,我们采用了残差深度神经网络(ResNet)来提高训练深度,对于正向和逆向问题,我们都将训练深度增加到了8个隐藏层(见图2d,展示了常规DNN和ResNet之间的定量比较)。具体来说,FCDNN通常存在梯度消失的问题。因此,增加FCDNN的深度并不一定会提高性能。ResNet通过引入“恒等快捷连接”来规避这一问题,其背后的假设是优化残差映射比优化原始、无参考的映射更容易(见图2)。经验证明,ResNet在训练深层架构时比FCDNN具有更高的灵活性。主要思想是ResNet使用了一个额外的恒等函数,以允许梯度的平滑前向和后向传播。深度网络的由于隐藏层层数增加退化问题是在训练具体任务时不可避免的问题,对于现在有一个浅层网络,面向更大规模的任务,我们一般会想通过向上堆积新的隐藏层来建立深层网络,极端情况是这些增加的层什么也不学习,仅仅复制浅层网络的特征,即这样新层是恒等映射(Identity mapping),那么在这种情况下,深层网络应该至少和浅层网络性能一样,至少出现退化现象。图2 用于集成纳米光子学的逆向设计的普通 FCDNN 和 ResNet DNN架构对比使用深度 ResNet 的频谱预测如图3所示。该工作使用 16000 个(占总数的 80%)输入数据进行训练,使用 4000 个(占总数的 20%)数据进行测试。a、b 和 c 是三个代表性功率分路器的 ResNet 预测频谱响应与数值验证的频谱响应的比较。黑色、蓝色和红色分别代表端口 1 的传输、端口 2 的传输和输入端口的反射。实线是给定孔矢量的真实值,虚线是使用 ResNet 预测的光谱响应。
预测结果与实际结果的相关系数如下图所示,拟合 ResNet 预测的透射率值与端口 1 (a) 和端口 2 (b) 的真实透射率值。相关系数 R 在整个传动比范围内(0 到 1)都高于 0.995,并且随着传动率的增加而接近统一。灰色圆圈符号大小与梯度不确定性成正比。
对于逆问题,该工作通过在逆向网络中使用SPECs作为数据,HVs作为标签,并反转和优化该网络,来测试上述相同数据上的逆向建模。为了测试网络的泛化能力,该工作研究了网络在任意和不熟悉情况下的逆向设计性能,为此生成了一个参考表,其中包含每个端口的宽带恒定传输值,并将其作为逆向设计DNN模型的输入数据批次。预测的HVs可以从伯努利分布分类器中的0到1取任意值。随着训练轮次的增加,损失减少,分类收敛到0或1。生成的量化二进制序列包含模型未训练的特征,然后将其反馈到数值求解器中,以评估预测性能。接下来,我们运行独立的FDTD模拟来检查响应的有效性(图4)。在1550 nm中心波长下,对8种分割比(1:1、1:1.05、1:1.5、1:1.55、1:2、1:2.5、1:3和1:3.5)进行了数值模拟电场传播,展示了基于经典MMI的光束分离器的各种功率分光机制。在1:1和1:05分割的情况下,电场分布强度几乎是对称的。另一方面,对于不对称分光比的器件(如预期),电场强度是不对称的,并且光束路径在输出T2较大的一侧变宽。
[1]Cheng, J., Huang, C., Zhang, J. et al. Multimodal deep learning using on-chip diffractive optics with in situ training capability. Nat Commun 15, 6189 (2024).
免责声明
本公众号旨在传递与分享光学知识、科研资讯,所有内容、图片均已注明出处,且仅供个人学习、知识记录,不作为商业用途。如涉及版权或其他问题,请及时联系邮箱opto1thz8nm@163.com,我将尽快进行协调处理。欢迎需要宣传工作的同行私信投稿!