结构光将先进的图像处理与机器学习相结合,在创新实验中实现了高数据容量和准确性,从而增强了信息传输能力。结构光通过整合多自由度的空间维度,具有极大提高信息容量的潜力。最近,结构光模式与图像处理和人工智能的融合已在通信和检测等领域展现出强大的发展潜力。结构光场最显著的特征之一是其振幅信息的二维和三维分布。这一特点不仅能与成熟的图像处理技术有效结合,还能借助当前推动深刻变革的机器学习技术实现跨媒介信息传输。基于相干叠加态的复杂结构光场可以携带丰富的空间振幅信息。通过进一步结合空间非线性转换,可以实现信息容量的显著提升。结构光技术通过空间维度和机器智能得到增强,促进了信息传输和检测。北京理工大学的Zilong Zhang和南洋理工大学的Yijie Shen及其团队成员提出了一种基于复模相干叠加态及其空间非线性转换的增强信息容量的新方法。通过整合机器视觉和深度学习技术,他们实现了低误码率的大角度点对多点信息传输。在该模型中,高斯光束通过空间光调制器获得结构光的空间非线性转换(SNC)。卷积神经网络(CNN)用于识别光束的强度分布。通过比较基本叠加模式和 SNC 模式,可以发现随着基本模式的组成特征模式阶数的增加,HG 叠加模式的编码能力明显优于 LG 模式,空间结构非线性转换后的模式编码能力可以得到显著提高。
为了验证基于上述模式的编码和解码性能,我们传输了一幅 50×50 像素的彩色图像。图像的 RGB 维度被分为 5 个色度等级,共包含 125 种色度信息,每种信息由 125 个 HG 相干叠加态编码。此外,还通过 DMD 空间光调制器将大气湍流造成的不同程度的相位抖动加载到这 125 种模式上,并利用深度学习技术进行训练,形成数据集。进一步利用非线性转换,实现了对更高容量解码效果的分析,其中选择了 530 个 SNC 模式,通过卷积神经网络对这些模式的混淆矩阵进行实验测量,如图 2 所示。实验结果表明,由于结构特征更加明显,SNC 模式在显著提高数据容量的同时,仍能确保类似的低误码率,数据识别准确率高达 99.5%。此外,实验还验证了机器视觉在漫反射条件下的模式识别能力,实现了多台接收摄像机同时进行高精度解码,观察角度可达70°。论文链接:https://doi.org/10.1002/lpor.202470039