计算专题 | 从静态到动态，基于神经辐射场的水下场景表征（CVPR）

文摘科技 2024-11-19 11:20 中国香港

基于神经辐射场的水下场景表征

Neural Underwater Scene Representation

本期导读

神经辐射场在大多数水上场景的三维重建任务中都有很好的表现，但对于水下场景的重建效果却不尽如人意。这是因为神经辐射场是针对静态三维场景提出的表征方法，而水下场景中往往包含多种传统的神经辐射场无法处理的动态变化成分，导致现有模型无法精确表征水下场景。

为了提升水下场景的表征质量，来自北京大学、香港浸会大学的研究人员利用神经辐射场对光在水中传输过程的衰减、不稳定的散射和物体运动的复杂过程分别进行建模，同时提出了混合渐进的采样方法与两阶段的网络学习策略，对模型参数进行鲁棒优化，从而实现高质量的水下场景表征。该方法在不显著延长训练与渲染时间的基础上对水下场景表征的精确度超过了现有的最先进方法，同时也可应用到场景编辑的各项任务中，为水下图像恢复和水体迁移等任务提供便利。该研究工作被计算机视觉领域顶会CVPR 2024接收。

技术背景

神经辐射场（Neural Radiance Fields）是近年来提出的一种隐式三维场景表示方法。它使用神经网络将3D空间中的每个点表示为颜色和密度值。通过输入点的空间坐标和观察方向，NeRF能够预测该点在特定视角下的视觉特征。这种方法无需显式地存储3D几何信息，而是通过神经网络隐式地学习场景的完整表示。神经辐射场在大多数水上场景的三维重建任务中都有很好的表现，但对于水下场景的重建效果不尽如人意。这是因为水下场景中往往包含多种传统的神经辐射场无法处理的动态变化成分:

水中物体的清晰度与颜色是随着景深变化而动态变化的。同一物体离相机越远，观察起来就越困难。水固有的散射和吸收性质大大降低了光在水中传播时的清晰度和强度。散射导致光线偏离其原始路径，而吸收则降低其总体强度。因此，远处的物体看起来更加模糊，难以辨认，这对水下场景的准确观测构成了重大挑战。
水中的光照条件是随着时间变化而动态变化的。这种动态变化源于水的散射效应和环境光照条件的波动，通常受时间、天气、波浪、湍流和浑浊度等因素的影响。光线在不同的地方被折射、散射和吸收，造成了不均匀的光照条件。光照的变化不仅在空间上不同，而且在时间上也不同，导致从不同的角度观察到的光照情况随着时间的变化而不一致。这种光照的不稳定性使得精确建模水下场景的任务变得复杂。
水体中广泛存在的生物运动导致了场景中第三种动态变化成分。这些运动的物体违背了基于传统神经辐射场的模型中通常持有的假设：场景中的所有物体都是静态的。水下场景中物体的连续运动不仅改变了场景本身，还干扰了光路，为场景表征任务增加了另一层复杂性。

上述三种动态变化成分相互交织在一起，形成了水下场景独有的复杂动态性，导致现有模型无法精确表征水下场景。

技术路线

方法简述：该研究提出了一种如图1所示的解决方案，对传统的神经辐射场框架进行了扩展，实现水下场景的表征与重建。提出将水视为具有半透明性质的物体，将水体参数与场景中其他物体同时进行优化，并采用一种考虑水的吸收性质的三维渲染公式，对光在水中传播的物理过程进行模拟，解决了水下场景中物体清晰度与颜色的动态变化。此外，还提出了对数空间下的光照场神经网络和自适应的色调映射模块，对水下场景中光照条件的动态变化进行建模。为提高模型的运行效率，提出在精确重建水下场景中静态部分和水体参数之后，进一步对运动的物体进行优化。这是因为水下场景中静态部分与动态部分是相互独立的，且只有在静态场景与相机之间的动态物体才会对渲染结果有贡献，实现高质量的静态场景与水体表征与重建对于动态物体的重建具有指导意义。

图1. 方法整体架构

水体参数的建模方法：水中物体的清晰度与颜色随深度的动态变化主要由水对光的吸收性质导致。光在水中传播时，水只会允许其中一部分光线通过，吸收掉一小部分光线。基于此，该方法中将水体建模为半透明的物质，并在体积渲染的过程中考虑水体对渲染结果的影响。为了将水体的表示与神经辐射场相结合，该方法为水赋予了能够表达其性质的参数，包括体素密度和三通道的辐照度值。考虑到局部水域内的水体性质可以被近似认为是相同的，因此在对水体进行参数化的时候，赋予场景中所有水体相同的体素密度和辐照度。水体参数通过与场景参数进行加权融合的方式参与体积渲染过程，实现高质量的水下场景渲染。

水下光照建模方法：水下场景中存在明显且快速的光照条件变化，这是源于水的散射效应和环境光照条件的波动，通常受时间、天气、波浪、湍流和浑浊度等因素的影响。在考虑对水下的场景进行表征时，如果不考虑水下不断变化的光照条件，则这些光照变化会被错误地建模为物体表面的辐照度随视角或时间的变化，导致场景表征的不准确。该方法借鉴了神经辐射场对场景的隐式表示方式，利用一个光照分支MLP-I对场景中随时间变化的光照条件进行隐式表征，并搭配以一个色调映射器模块用来模拟相机曲线，实现更加逼真的水下图像渲染。

动态物体建模：水中广泛存在运动的物体，导致在使用传统神经辐射场对水下场景进行重建时，会产生由物体运动导致的伪影。该方法不对三维场景中的静态物体与动态物体进行区分，而是采用静态与动态两个不同的分支，对每个点分别学习静态场景参数和动态场景参数，再通过加权融合的方式得到每个点处的体素密度和辐照度。动态分支由一个多层感知机MLP-D组成，除了三维坐标外，还需要将输入图像对应的时间信息作为输入，表征动态物体随时间变化的运动轨迹。

实验结果：如图2和图3所示，通过与其他基线算法（Instant-NGP，Mip-NeRF 360, DynamicNeRF, Seathru-NeRF）相比，所提出的方法在不同数据集中对水下场景的表征质量上都具有明显优势。

图2. Seathru数据集上的结果

图3. 本工作提出的水下动态场景数据集上的结果

简单小结：

该研究提出了一种基于神经辐射场的水下场景表征方法。为此，先对复杂的水下场景进行了分析，总结出水下场景特有的影响场景表征质量的三种动态变化成分，即水中物体的清晰度与颜色变化、光照条件的变化以及广泛存在的运动物体。针对上述水下场景特有的动态变化成分，在传统神经辐射场的网络结构基础上，对水体部分进行了参数化，有效地模拟水对光的吸收与散射性质，并提出了混合渐进采样方式实现了对水体参数和场景物体参数的同时优化；设计了多层感知机MLP-I和色调映射器对水下场景的光照条件进行表征；提出了两阶段模型训练方法，实现了场景的鲁棒表征，同时对动态物体的重建提供了帮助该研究作提出的方法在定性与定量的水下场景表征实验评估以及用户调研结果中均超过了所有的对比方法，说明其在水下场景表征与重建任务中的优越性；也为水下场景的编辑任务提供了便利，编辑得到的高质量的水下图像恢复结果与逼真的水体迁移效果可以进一步应用于电影制作与虚拟现实等产业中。

论文信息：

Y. Tang, C. Zhu, R. Wan, C. Xu, and B. Shi, "Neural Underwater Scene Representation," in IEEE CVPR, 2024.

技术详见：

https://freebutuselesssoul.github.io/uwnerf/

*该技术分享所涉及文字及图片源于发表论文和网络公开素材经适当编辑,不做任何商业用途。

回顾与预告

上期回顾：成像专题 | 旋转扫描光场显微实现各向同性的高速三维成像（Optica）‍欢迎点击查阅

下期预告：我们将不定期推荐学术领域具有代表性的计算显示和计算成像研究工作，同时穿插一些新型光学设计和VR/AR光机实现科普等的资讯分享，欢迎订阅关注，欢迎来稿交流。
Contact: intelligent.optics.sharing@gmail.com

INTELLIGENTOPTICSSHARING (I.O.S.) 运营以该领域的研究学者为主，非盈利非广告，希望能够结交共同兴趣方向的读者们，建立光学和计算机交叉学科领域内一个资讯分享交流的平台。如果喜欢，请点击“在看”和“点赞”，将有助于微信公众号平台对信息的定向统计和及时推送，小编团队在此不胜感激，谢谢！！

END

IntelligentOptics

从光学理论到算法提升，以计算能力延展光学设计，追踪计算光学、成像、显示、VRAR等前沿资讯，抛砖引玉，欢迎拍砖及来稿交流

计算专题 | 基于局部高斯体密度混合表达的非结构化光场渲染（ACM SIGGRAPH Asia）

显示专题 | 半监督训练，衍射模型驱动的神经网络助力全息显示（Optica OE）

成像专题 | CardiacField：基于二维超声探头的心脏三维重建与心功能自动评估（Digital Health）

显示专题 | 基于视觉曼巴的高质量计算全息（OLEN）

成像专题 | 复杂场景实时非视域成像（Nature Comp. Sci.）

成像专题 | 阵列孔径-色彩编码助力快照式高光谱成像 (ACM ToG)

显示专题 | 全局损失和随机同质化训练策略助力二值图像相位全息图生成（OLT）

计算专题 | 从静态到动态，基于神经辐射场的水下场景表征（CVPR）

学术交流 | 香港大学前沿技术交流 Geometry Computing & Visual Media (2024)

成像专题 | 旋转扫描光场显微实现各向同性的高速三维成像（Optica）

显示专题 | 利用凹凸贴图对面元全息图视点依赖性照明实现（OPTICA OL）

显示专题 | 基于混合损失函数梯度下降的压缩光场3D显示（Optica OE）

显示专题 | 分米级深度、偏振可调、彩色3D超表面全息术（Nature Communications）

计算专题 | 成像应用中电磁逆散射问题的隐式解法（ECCV）

前沿资讯 | 港大计算光学+图形学方向小AP求贤博士、博士后、访问学者(生) v202409

显示专题 | 融合色彩感知优化的高保真全息显示（PhotoniX）

成像专题 | 计算光谱成像：光场编码与算法解码（综述）

感知专题 | 基于多功能超表面的单次拍摄高动态范围成像与感知（Optica OE）

成像专题 | 计算心脏超声成像：心脏三维成像与心肌运动跟踪（IEEE TMI）

显示专题 | 全卷积神经网络助力多深度三维全息图生成（Advanced Science）

成像专题 | 分层可分离的视频Transformer助力单曝光压缩成像 (ECCV)

显示专题 | 基于瞳孔掩膜的全息近眼显示多视点优化（OLT）

显示专题 | 对JPEG压缩友好的全息图生成：端到端压缩感知计算全息 (Optica OE)

感知专题 | Transformer+CNN助力全天候、自监督、单目深度估计（Neurocomputing）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉