显示专题 | 全局损失和随机同质化训练策略助力二值图像相位全息图生成(OLT)

文摘   科技   2024-11-25 13:05   中国香港  
全局损失和随机同质化训练策略助力
二值图像相位全息图生成
Generating High-quality Phase-only Holograms of Binary Images using Global Loss and Stochastic Homogenization Training Strategy

本期导读

深度学习为计算机生成全息图(CGH)提供了一种非常有效的方法。然而,现有基于学习的CGH算法在为二值图像生成高质量全息图时可能会遇到重大障碍。
鉴于此,来自上海大学的研究人员提出了一种衍射模型驱动神经网络:负载均衡平滑全息(LSY-Holo),利用双分支架构全局结构相似性指数(Global_SSIM)损失函数生成纯相位全息图(POHs)。为了进一步优化二值图像模型,该研究引入了自定义二值数据集和随机均质化预处理方法(SHPM),从而缓解了重建图像中普遍存在的噪声过大问题。此外,这种深度学习方法还与迭代算法相结合,利用 LSY-Holo 快速生成的全息图作为 AdamW Holography(AH)算法的初始阶段,加快了迭代过程的收敛速度。LSY-Holo进一步扩展到三维场景,实现了不同深度的动态散焦和聚焦效果,并有效减少重建图像中的伪影。该工作近期发表于权威光学期刊《Optics and Laser Technology》上。

技术路线

LSY-Holo采用双分支结构和全局结构相似性指数测量损失函数来生成高质量的POH。这种方法增强了神经网络学习全局信息的性能,并提高了其解决反向传播中逆问题的能力。


图1.  (a) LSY-Holo采用的TPGN架构。(b)空间域和频率域的双域学习策略。(c)输出层包括一个 HardTanh层。


损失函数的设计对神经网络生成 POHs 的性能有重大影响,是优化训练过程的核心。为了提高 CNN 捕捉全局信息的能力,使训练更加全面,提出了 Global_SSIM 损失函数。Global_SSIM的基本原理是将两组像素之间的相似度作为训练损失的基础。如图2所示。

图2.  计算 Global_SSIM 损失函数的示意图。


该研究提出了随机均匀化策略(SHPM),能够减少输入图像频域中高频成分的比例。通过反复对输入图像进行随机均质处理,可以进一步减少高频成分。实验验证表明,经过两次随机均质处理后,二值图像的全息图重建质量达到最佳。如图3所示。


图3. 输入图像的随机均匀化预处理方法。

在基于AdamW优化器的相位检索迭代算法中采用Global_SSIM损失函数,从而提出了AH算法。使用 Global_SSIM作为损失函数能为AH算法提供更强大的性能。同时AH不会将随机相位作为迭代的初始状态,而是使用LSYHolo生成的POH。AH算法的流程图如图4所示。

图4. AH迭代算法流程图。

该研究搭建了基于时分复用的全息显示光学实验系统,对不同算法的绿色通道的光学重建结果进行了比较。如图5所示,LSY-Holo能增强对比度和均匀性的同时,大大减少了图像伪影。

图5. 不同算法的绿色通道的光学重建结果比较。

该研究也验证了三维彩色重建,表明LSY-Holo能够在正确距离重建图像,具有较好的清晰度及对比度,如图6所示。


图6. LSY-Holo的三维彩色重建结果。(a)三维场景的全焦图像。(b)三维场景的深度图。(c)和(d) LSY-Holo分别在300毫米和320毫米距离上生成的三维场景 POH 光学重建图。右侧为放大视图。

技术小结:该研究提出了LSY-Holo,用于快速生成二值图像的高质量 相位全息图。与现有的基于学习的方法相比,其采用了 Global_SSIM 损失函数来训练神经网络,从而充分利用了全局信息,实现了高质量的二值图像重建。TPGN中采用的双分支结构大大提高了神经网络的学习性能。在训练阶段,提出的二值数据集和SHPM有效地解决了二值图像重建中普遍存在的斑点噪声问题。将 LSY-Holo 与 AH 算法整合后,通过使用 LSY-Holo 生成的全息图作为初始阶段,减少了重建图像中的斑点噪声,加快了收敛速度。框架可扩展到三维场景,实现不同深度的散焦和聚焦效果,增强了重建图像的均匀性,最大程度地减少了伪影。


论文信息:

Q. Fang, H. Zheng, X. Xin, T. Zhang, X. Lin, and Y. Yu, “Generating high-quality phase-only holograms of binary images using global loss and stochastic homogenization training strategy”. Optics & Laser Technology, (2025).


技术详见:
https://doi.org/10.1016/j.optlastec.2024.112059

*该技术分享所涉及文字及图片源于发表论文和网络公开素材,不做任何商业用途。

回顾与预告


上期回顾:计算专题 | 从静态到动态,基于神经辐射场的水下场景表征(CVPR)欢迎点击查阅

下期预告:我们将不定期推荐学术领域具有代表性的计算显示和计算成像研究工作,同时穿插一些新型光学设计和VR/AR光机实现科普等的资讯分享,欢迎订阅关注,欢迎来稿交流。
Contact: intelligent.optics.sharing@gmail.com


INTELLIGENTOPTICSSHARING (I.O.S.) 运营以该领域的研究学者为主,非盈利非广告,希望能够结交共同兴趣方向的读者们,建立光学和计算机交叉学科领域内一个资讯分享交流的平台。如果喜欢,请点击“在看”和“点赞”,将有助于微信公众号平台对信息的定向统计及时推送,小编团队在此不胜感激,谢谢!!





END





IntelligentOptics
从光学理论到算法提升,以计算能力延展光学设计,追踪计算光学、成像、显示、VRAR等前沿资讯,抛砖引玉,欢迎拍砖及来稿交流
 最新文章