综述推荐 | 神经辐射场的研究现状与展望

学术   科技   2024-10-18 16:28   北京  

点击文末 “阅读原文” 下载全文

李吉洋, 程乐超, 何靖璇, 王章野

浙江大学计算机辅助设计与图形系统全国重点实验室
江西求是高等研究院
之江实验室

引用本文: 李吉洋, 程乐超, 何靖璇, 王章野. 神经辐射场的研究现状与展望[J]. 计算机辅助设计与图形学学报, 2024, 36(7): 995-1013. DOI: 10.3724/SP.J.1089.2024.2023-00376

Citation: Li Jiyang, Cheng Lechao, He Jingxuan, Wang Zhangye. Current Status and Prospects of Research on Neural Radiance Fields[J]. Journal of Computer-Aided Design & Computer Graphics, 2024, 36(7): 995-1013. DOI: 10.3724/SP.J.1089.2024.2023-00376


随着元宇宙、数字孪生以及虚拟现实等概念逐渐成熟, 人们对这些领域的关注也越来越高. 尽管现有的计算机图形学技术已经拥有了一套完善的管线, 可以对复杂场景进行基于物理的渲染, 得到高质量且真实感强的画面, 但这需要对场景及物体进行几何建模、纹理设计、材质定义和光照设置等高精度的工作. 这些工作往往依赖专业的美术人员进行繁重的人工操作, 需要耗费大量的时间成本和金钱成本. 因此, 基于2D图片的3D场景重建以及渲染作为解决这一问题的关键技术, 成为了重要的研究方向.

神经辐射场(neural radiance field, NeRF)与传统的网格、体素、点云等离散显式表示方式不同, 它是一种对3D场景的连续隐式表示, 与离散显式表示相比, 其表达能力有大幅提升, 达到了当前最先进的视觉效果. 此外, NeRF作为一种全新的视点合成和3D场景重建方法, 在机器人和自动驾驶等多学科交叉领域也引起了广泛关注. 因此, 及时对现有工作进行总结具有很大意义. 本文梳理了NeRF的发展过程中有代表性的已发表论文以及所涉及的研究方向. 从NeRF的基础、优化与扩展、应用3个方面对相关工作进行了分析总结, 并讨论了其未来可能的发展趋势.


NeRF的基础

本节主要围绕NeRF的基础知识展开, 同时介绍了NeRF相关工作中常见的数据集和评价指标.

○ NeRF理论

原始NeRF使用了体渲染中常用的吸收和发射模型, 即场景中的每个点都设定为一个光源, 不但可以吸收光线, 本身也可以发射光线, 将场景的几何、材质和照明等信息全部包含在内. 整个神经辐射场的工作管线图1所示.

图1  神经辐射场的工作管线
○ 数据集

NeRF系列工作主要使用合成数据集和真实场景数据集. 原始NeRF以及后续扩展工作大多基于2D图片数据集, 而一些生成式模型则需要3D模型的数据集作为支撑, 相关数据集的关键信息如表1所示.

表1  常用数据集

○ 评价指标

本节介绍NeRF相关工作中常用的评价指标,包括峰值信噪比(PSNR)、结构相似度(SSIM)、学习感知图片块相似度(LPIPS)、Fréchet距离(FID), 各指标关键信息如表2所示. 

2  常用评价指标


NeRF的优化与扩展

对于NeRF模型本身的改进, 通过优化网络结构、模型压缩等方式加速训练及渲染过程, 还有一些工作致力于降低对输入图片的要求以及提高渲染质量. 本节从基础模型改进、加速训练与渲染、渲染结果优化、输入优化、模型压缩以及生成式模型6个方面展开, 分类如图2所示. 

图2  NeRF工作分类导图


NeRF的应用

NeRF在人、物及场景的建模中展现出巨大的潜力, 并有工作将其扩展到动态场景的表达. 此外, NeRF与生成式模型结合, 可以实现通过文本或者图像来引导三维模型生成的目标. 图3列出了一些关键工作的时间线. 

图3  NeRF关键工作时间线

在人体建模应用中,一些人体重建方法的信息对比如表3所示.

表3  人体重建方法对比



结    语

自从2020年NeRF提出以来, 其在模型效果、训练速度以及渲染速度上都有了极大的提升, 后续工作也扩展到越来越广泛的领域中, 并在许多传统方法存在局限的问题上取得了突破.

○ 国内工业界发展现状

NeRF出色的效果以及后续大量工作的优化与拓展, 为国内工业界带来了许多发展机会. 除了传统企业外, 一些新兴企业也在崛起, 其中一部分企业是由高校实验室孵化而来, 具有强大的科研能力, 例如主创人员主要来自浙江大学计算机辅助设计与图形系统全国重点实验室的相芯科技、像衍科技, 以及主创成员主要来自于上海科技大学的影眸科技等. 目前, 国内工业界主要将NeRF技术应用于元宇宙、虚拟数字人、物体和场景重建等多个方向.
淘宝将NeRF应用于商品的3D展示中. 阿里巴巴大淘宝技术部发布了Object Drawer, 只需要通过手机拍摄的视频以及简单的标注并上传, 就能在云端完成场景的训练. 用户在浏览器端可以从任意角度观察商品.
此外, NeRF还可应用于工厂的数字孪生和汽车的自动驾驶等领域, 而且在国外已经有一些科技公司开始尝试这些应用, 但在国内这些领域还有待探索.

NeRF最初是在学术界提出的, 在工业界同样有着广阔的前景. 然而, 要推动科研成果的实际应用需要学术界和工业界的紧密合作. 除了在算法方面持续努力外, 还需要在硬件方面建立自身的核心优势, 如扫描设备和计算芯片等. 只有实现软硬一体的发展, 并建立自己的生态圈, 国内科技公司才能走得更远

○ 未来工作展望

随着人工智能生成内容(AIGC)的爆火, 人们对3D内容生成的需求也越来越多, 而NeRF作为目前表现最好也是最热门的隐式场景表示, 在3D内容生成上已经表现出了巨大的潜力. 但目前仍存在着大型3D数据集缺乏、3D模型文件过大难以训练等问题, 如何对NeRF以及生成模型进行进一步的优化与组合将是未来一个非常热门的研究方向. 此外, 如何生成风格化的人物形象也是一个有趣的问题.

与传统的成熟的显式表示相比, NeRF目前还存在的一些问题, 虽然NeRF的渲染效果虽然已经有了很大的提升, 但其质量与传统的基于物理的渲染等方法相比还有不小差距. 如何进一步对NeRF的训练速度、渲染速度以及渲染效果进行优化, 仍然是一个重要的研究方向. 将NeRF在更多的领域进行更深入应用, 如自动驾驶、机器人、城市测绘以及数字人等, 也仍然需要研究人员进一步深入探索. 此外, NeRF虽然已经经过了3年的发展, 但目前还没有形成一套成熟的通用的工作流程, 因此其目前还难以真正大规模应用到具体商业场景中.

未来可以针对NeRF设计专门的硬件加速, 如上海科技大学的芯片设计团队提出了最新的ICARUS芯片定制架构. 鉴于NeRF巨大的运算量, 想进一步扩大应用范围甚至实现在移动端完成计算, 一款专用的支持NeRF算法的处理器芯片将起到非常关键的作用.

本文针对现有工作进行了梳理, 希望可以让更多的研究者了解这一领域, 并为后续工作提供有价值的参考, 也希望未来能有更多基于NeRF的创新与应用.




李吉洋: 硕士研究生, 主要研究方向为计算机图形学. 

程乐超: 博士, 副教授, 主要研究方向为视觉知识迁移.

何靖璇: 硕士, 主要研究方向为计算机视觉. 

王章野: 博士, 副教授, 主要研究方向为计算机图形学、虚拟现实、机器学习.



编辑:李姝昊
审核:赵敏


— END —

还没关注?点击下方“卡片”关注,获取第一时间资讯

综述推荐      


综述推荐 | 数据新闻可视化研究: 理论与实践

综述推荐 | 水下图像增强与复原技术进展与展望

综述推荐 | 开放环境下的跨域物体检测综述

综述推荐 | 基于叙事结构抽象的可视分析方法综述

综述推荐 | 监控场景下基于单帧与视频数据的行人属性识别方法综述及展望

综述推荐 | 面向超级计算机系统的可视化综述

综述推荐 | 数字图像多功能水印综述

综述推荐 | 基于RGB图像的三维人手姿态估计技术综述

综述推荐 | 数字图像多功能水印综述

综述推荐 | 基于条件生成对抗网络的图像翻译综述

综述推荐 | 基于单目RGB数据的三维模板物体跟踪算法综述

综述推荐 | 基于可视分析的训练数据质量提升综述

综述推荐|数字说话人视频生成综述

综述推荐 | 基于骨架的人体动作识别技术研究进展

综述推荐 | 面向计算机程序的可视化综述


合辑荐读      


合辑荐读 | 计算机技术与传统文化论文合辑

合辑荐读 | 几何建模与优化最新论文合辑

合辑荐读 | 目标检测、目标跟踪与重识别最新论文合辑

合辑荐读 | 医学图像处理最新论文合辑

合辑荐读 | 感知与交互最新论文合辑

合辑荐读 | VR/AR/MR最新论文合辑

合辑荐读 | 三维图形计算最新论文合辑

合辑荐读 | 可视化与可视分析最新论文合辑

合辑荐读 | 《计算机辅助设计与图形学学报》最新综述论文


整期论文速览


2024年第7期论文速览

2024年第6期论文速览

2024年第5期论文速览

2024年第4期论文速览

2024年第3期论文速览

2024年第2期论文速览

2024年第1期论文速览

2023年第12期-CAD几何引擎架构及算法专刊论文速览

2023年第11期论文速览

2023年第10期论文速览

2023年第9期论文速览

2023年第8期论文速览

2023年第7期论文速览

2023年第6期论文速览



声明

本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。




计算机辅助设计与图形学学报
《计算机辅助设计与图形学学报》官方平台。本刊创刊于1989年,EI、Scopus、北大核心、CSCD、CSTPCD、CNKI等国内外数据库收录,CCF推荐中文科技期刊A类、计算领域高质量科技期刊T1类。期刊官网:www.jcad.cn。
 最新文章