Banner
撰稿:邵屹峰
芯片缺陷检测是半导体生产中至关重要的一环。荷兰代尔夫特理工大学与乌得勒支大学的科学家们最近使用创新的成像技术,利用极紫外光测量芯片中纳米尺寸的三维结构。与传统的成像技术不同,该技术通过计算从采集的衍射数据中恢复重建样品的图像。极紫外光可以在光学检测中提供所需的高分辨率,但是由于对应的光学元件造价昂贵而没有被广泛地使用。该技术因为无需使用任何极紫外光成像系统,所以可以在保证成像质量的同时显著降低成本。随着极紫外光刻的日益增长,以及半导体芯片特征尺寸的日益缩小,具有高分辨率且高灵敏度的极紫外光计算成像将成为下一代极具竞争力的芯片缺陷检测的核心技术。
该成果以“Wavelength-multiplexed multi-mode EUV reflection ptychography based on automatic differentiation”为题发表在Light: Science & Applications。
研究背景
“成像”是半导体生产中的核心关键技术。光刻机通过一个微缩投影的成像过程将掩模板上的图案投影到晶圆上形成各种功能性的结构,比如晶体管。该过程与投影仪的原理类似,只不过光刻机是将图像缩小而不是放大。光刻机成像系统的分辨率决定着单位面积上的晶体管数量。原则上,晶体管的密度越高,芯片的性能越高且能耗越低。
根据摩尔定律的预测,晶体管密度每两年翻一番。该定律开始的时候是基于对行业发展的观察,但是现在已经变成了各个企业追求的目标。为了实现摩尔定律的预测,整个行业都致力于提高光刻的分辨率。其中最重要的也最有效的手段就是缩短照明光源的波长。从可见光,到紫外光,再到极紫外光,持续不断努力的最新成果就是ASML公司发明和制造的极紫外光刻机 ——人类有史以来制造的最复杂的机器之一。使用极紫外光刻机,在最新的3纳米技术节点中,台积电可以在每平方毫米制造约两亿个晶体管!
完成光刻后,芯片生产的下一环节是检测晶圆上的结构中是否存在缺陷。因为极少量的缺陷就可能极大地影响芯片的良率,所以及时的发现芯片中的缺陷可以避免含有缺陷的芯片进入生产流程中剩余的步骤(有时候甚至上千个步骤),从而显著地提高生产效率并降低生产成本。所以测量环节在半导体生产中不可或缺的一环。
检测晶圆上的结构缺陷其实也是一个成像过程。它的终极目标是获得样品(晶圆)上的结构的图像,并将其与目标结构对比。为了保证可以匹配极紫外光刻形成的特征尺寸,测量也应该使用极紫外光。但是因为加工制造极紫外光波段的光学元件比如反射镜极具挑战,所以极紫外光成像系统的造价十分昂贵。这导致半导体工厂通常由于无法负担而转向使用电子显微镜等替代方案。
其中一个挑战是极紫外光成像系统只能够使用反射镜而不是透镜。这是因为几乎所有材料都吸收极紫外光。而且为了获得足够的反射率,反射镜通常需要镀特殊设计的多层膜结构(也被称为布拉格反射体Braag Reflector)。该多层膜结构对于设计,材料特性和制造精度都有着极高的要求。其结构需要对入射光的角度和波长范围反复优化,实现最佳反射率以避免光强损耗。其制造也颇具挑战,有时候需要在弯曲的(非球面)镜面镀几十层膜而且每一层的厚度要达到原子级别的精确度。
另外,为了保证成像质量,成像系统的像差需要远小于光源的波长。对于波长在13.5纳米的极紫外光,这就要求成像系统中的每一面反射镜都被要以超高的精度加工成为理想的形状。同时,反射镜的表面也需要被打磨到足够的光滑(高度起伏不超过一个原子)以防止散射影响成像的对比度。总而言之,基于成本的考虑,测量工具中应尽量避免使用极紫外光成像系统。
在最近发表于Light的论文中,来自荷兰代尔夫特理工大学和乌德勒支大学的科学家们研究了一种创新的极紫外光成像方法。该方法不使用任何成像系统而是让反射光从物体到相机自由地衍射,再通过一系列计算从相机拍摄的衍射团案重建样品的图像。图1比较了传统的通过成像系统的方法与计算成像。
图1:传统成像(左)和计算衍射成像(右)的对比。在两种情况都需要用极紫外光照明晶元样品。但是计算衍射成像并不直接拍射样品图像,而是只拍摄样品衍射图案(由反射光在自由空间中衍射传播形成),再通过重建样品的反射系数间接地获得样品图像。与传统成像相比,计算衍射成像可以在不使用光学系统的同时却获得样品的振幅和相位。
研究亮点
现在我们介绍极紫外计算成像研究的三个要素:极紫外光源,测量方法,和重建算法。
传统的方法通常使用同步辐射或者自由电子激光产生极紫外光。此类光源设的大小通常相当于一个体育场馆。但是芯片测量工具需要足够紧凑使其能够被半导体工厂容纳。因此我们在研究实验装置中使用桌面型紧凑极紫外光源。这种光源通过高功率红外飞秒脉冲激光在惰性气体流中激发高次谐波产生极紫外光。该技术也获得了2023年的诺贝尔物理学奖。
图2展示了极紫外计算衍射成像实验装置。桌面型紧凑极紫外光源由红外飞秒脉冲驱动激光,脉冲压缩单元,以及高次谐波激发真空室组成。图3展示了在真空室中的等离子产生极紫外光的过程。红外飞秒脉冲驱动激光被聚焦到惰性气体流(氩气)中。整个真空室需要维持约10-5 帕的超高真空度,但是在两个气嘴中气压会显著的高于该真空度。在这张图中我们还能够观察到激发高次谐波的白色等离子(它将产生波长在10-20纳米范围的极紫外辐射)和粉紫色的被散射的残余红外光。
图2:极紫外光计算衍射成像实验装置. 产生极紫外光的难度极大,100瓦的红外飞秒脉冲驱动激光仅可以产生约1 微瓦的极紫外光辐射(相当于每秒钟产生1011 个极紫外光子)。为避免空气的吸收,这些极紫外光将在实验装置的真空环境中传播,在通过一对平面镜消除残余的红外激光后,通过另一对平面镜选择极紫外光波长范围(通常高次谐波包含会超过一个极紫外波长),最终再通过一个椭球镜将极紫外光聚焦到样品表面。
图3:高次谐波产生极紫外光过程. 照片中展示了通过真空室顶的观察窗拍摄的高次谐波产生过程。红外驱动激光(从左向右传播)被聚焦到高压氩气气体流中(仅存在于垂直方向放置的气嘴中)。明亮的白色等离子体产生波长在10-20 纳米范围的极紫外光。粉紫色(相机记录的伪彩)的光晕和光线来自于被散射的红外光。
ASML的极紫外光刻机中的光源通过激光等离子(laser-produced plasma:LPP)技术产生非相干的极紫外光,与其相比高次谐波(HHG)光源产生的极紫外光具有更佳的方向性与相干性。这一性质对计算衍射成像至关重要,因为通常降低相干性会增加计算的负担。
但是,HHG光源的能量转换效率及其的低:使用100瓦的驱动激光仅可以产生约1微瓦的极紫外光辐射(相当于每秒钟产生1011个极紫外光子)。这相当于低至一亿分之一 (10-8) 的转换效率。作为对比,光刻机中的LLP光源使用20,000瓦的驱动激光可以产生约250瓦的极紫外辐射。转换效率为0.125%。所以每一个极紫外光子都额外的珍贵。对芯片检测而言,1微瓦的辐射已经足够让相机拍摄到极紫外光与样品相互作用产生的衍射图案。
在实验装置中,我们将极紫外光束聚焦到样品表面,反射光从样品到相机经过自由空间衍射传播,然后我们用相机拍摄衍射图案的强度分布。在测量的过程中,我们还需要让聚焦光束扫瞄样品同时在每个扫描位置都拍摄一幅衍射图案, 并且样品在相邻的扫描位置上的照明区域需要有足够的互相重叠。这个特殊的计算成像方法通常被称为层叠成像(ptychography)。
不像其它扫描成像的技术比如扫描电子显微镜或者原子力显微镜,层叠成像在每个扫描位置并不只记录单一信号(样品图像的一个像素),而是可以重建样一整个区域的样品图像。这使得层叠成像的速度比其它扫描成像技术高几个数量级,因为每个重建区域通常包含上百万像素(比如我们使用极紫外敏感相机包含 2048×2048≈4 百万像素)。
扫描的机制也可以无限的扩展成像的区域。由于相临的样品照明区域部分相互重叠,重建的样品图像也可以免于拼接误差的影响。同时重叠也产生了冗余的信息(样品的信息被记录在不止一幅衍射图案中)。这些信息可以帮助我们通过计算校正实验参数,比如传播距离或者扫描位置的误差。后者对成像而言非常重要,因为高通量且高分辨的成像需要运动平台在高速运动的同时维持亚纳米级别的精确度。
计算衍射成像依赖强大的算法用扫描收集的衍射图案重建样品的图像。重建过程中我们需要使用迭代的方法“求解层叠成像的逆问题”。我们定义正问题为建立一个模型使我们可以基于模型参数模拟层叠成像的物理过程,对应的逆问题则是从实验数据中推导模型参数。实验数据是该模型的输入和输出,即扫描信息和衍射图案。图4展示了迭代求解的过程。在每次迭代中, 我们还需要一个目标(或者误差)函数来比较模型预测的和实验收集的衍射图案,然后基于此结果计算每个模型参数的梯度。目标函数通常需要考虑到相机和其它设备中噪声的统计分布。
图4:求解层叠成像逆问题的计算图. 在图中x 和y分别为模型的输入和输出,θ代表模型的参数。模型预测和实验收集的衍射图案分别为y* 和y。箭头代表了计算的方向:正问题向右(上),逆问题向左(下)。
计算衍射成像算法需要应对两个重大挑战:(1)模型通常非常的复杂,尤其需要考虑使用包含多个波长或者多空间模式(部分空间相干)的极紫外光源的情况;(2)算法需要使用巨大的算力。
我们基于自动微分技术,使用模块化的方法设计物理模型以应对第一个挑战。我们在论文中展示的模型包括了一系列互相连接的子模块。这些子模块负责计算光与样品相互作用,衍射传播,使用相机拍摄强度分布等过程。因为我们保证每个子模块的计算都是可以被微分的,所以自动微分技术可以不需要人工干预地计算整个模型对所有参数的梯度。该技术避免了传统的方法中因为计算过于复杂而无法人工推导公式的情况,也可以避免由于使用数值差分而导致的数值误差。自动微分的另一项优势是将不同的参数的迭代纳入到统一计算框架中。而传统方法则是需要对每个参数单独发明一种迭代方法。每种迭代方法互相难以兼容统一。和目前最先进的算法相比较, 我们的算法可以极大的提高计算速度和降低内存占用。
对第二个挑战我们使用GPU加速计算过程中的每一个步骤,从而极大地提升计算速度。GPU特别适合加速可以并行的计算,比如衍射传播中快速傅立叶变换(FFT), 可以达到几个数量级的速度提升。其它计算也可以通过矩阵化以尽可能从GPU加速中受益。
目前自动微分和GPU加速都已经成为主流的机器学习平台(比如TensorFlow,PyTorch,等等)的标准组成部分。这两个技术使得训练人工智能模型成为可能,从而驱动了人工智能的繁荣。现在它们则驱动我们的层叠成像算法中的优化引擎,使我们能够校正实验设备的参数,应对光源的退相干,和对色散的样品实现波长复用的图像重建。
图5:高次谐波极紫外反射式层叠成像重建结果. 我们通过优化超过2亿个模型参数,从而重建样品的图像和极紫外光照明的聚焦光场。优化也包括校正传播距离和扫描信息,重建相机的噪声分布等等。实验中我们使用2个极紫外光的波长,同时每个波长使用6个空间模式以重建照明光场。作为比较,早期的著名图像语言神经网络AlexNet64有6千万个参数,GPT-165有1.17亿参数,VGGNet有3.4亿参数,而GPT-3.5-turbo有1759亿参数。
总结
打造面对先进制程的下一代芯片缺陷检测设备是一项艰巨的任务。它需要先进的短波长紧凑光源(高次谐波极紫外光源),创新的成像技术(计算层叠成像)和使用与训练人工智能同样工具的强大的重建算法。
论文信息
https://doi.org/10.1038/s41377-024-01558-3
Banner
如下数据来自Web of Science,Light: Science & Applications的高被引文章数量在国内同类期刊中稳居领军地位。截至目前:
超过2000次引用的文章有1篇
https://doi.org/10.1038/lsa.2014.99
超过600次引用的文章有9篇
https://doi.org/10.1038/lsa.2013.28
https://doi.org/10.1038/lsa.2014.42
https://doi.org/10.1038/lsa.2016.17
https://doi.org/10.1038/lsa.2016.76
https://doi.org/10.1038/s41377-019-0148-8
https://doi.org/10.1038/lsa.2014.22
https://doi.org/10.1038/lsa.2015.137
https://doi.org/10.1038/lsa.2014.58
超过300次引用的文章有58篇
超过200次引用的文章有142篇
超过100次引用的文章有350篇
超过50次引用的文章有680篇
欢迎课题组投宣传稿
请扫码联系值班编辑
👇 关注我 👇