本期为TechBeat人工智能社区第614期线上Talk。
长按识别二维码,一键预约TALK!
光度立体视觉是一种通过分析从不同方向照射物体的图像序列来估计物体表面法线(三维形状的一种表示方法)的技术,其独特优势在于重建结果的高分辨率和精确细节。传统的基于帧相机的光度立体视觉数据采集过程复杂且耗时,通常需要捕获多曝光图像来合成高动态范围图像,从而准确地捕获物体表面的镜面反射区域,很难满足对动态目标的实时三维重建需求。事件相机具有高时间分辨率、高动态范围和低带宽要求的特点,为众多对实时性要求高的计算机视觉任务提供了有效的数据获取方式。“EventPS: Real-Time Photometric Stereo using an Event Camera”这篇论文首次利用事件相机的独特属性实现了实时的光度立体视觉。论文从事件相机成像模型出发,推导出事件触发与表面法线建立关联的“零化向量”信息,利用最优化与深度学习分别实现了光度立体表面法线估计的求解;配合自研的高速转台所搭建的数据采集系统和经过GPU优化的算法,实现了超过30帧每秒的实时表面法线重建,为高精度、高实时的三维数据获取提供了全新的解决方案。
1. 背景:介绍现有基于传统帧相机的光度立体视觉的局限性,及事件相机的优势;
2. 理论模型:从朗伯反射模型和事件相机数学模型出发,推导与表面法线最相关的“零空间向量”;
3. 实时算法:展示使用基于SVD的求解算法在各种物体上的实时性能;
4. 深度学习扩展:将现有深度学习光度立体视觉框架扩展到EventPS版本,适应一般反射率模型;
▼
EventPS项目主页:
https://www.ybh1998.space/eventps 项目主页包含了数据、代码、装置的3D打印文件,以及CVPR现场15分钟Oral录像。本项目得到了国家自然科学基金重点项目的资助。
实验室主页:
https://camera.pku.edu.cn/
北京大学相机智能实验室是由施柏鑫老师带领的团队,致力于计算摄像学研究。实验室承担了科技创新2030——“新一代人工智能”重大项目以及国家自然科学基金重点项目等国家级项目,发表论文200余篇(包括TPAMI论文25篇以及计算机视觉三大顶会论文85篇)。
实验室出版教材:
https://camera.pku.edu.cn/book
《计算摄像学:成像模型理论与深度学习实践》(机械工业出版社,2024年6月上市)以图像的物理形成过程和相机获取数字图像的原理为支撑,介绍计算摄像学中的基本问题、模型、理论及其用传统最优化、信号处理方法的解决方案。随着深度学习技术的发展带来的全新进展,介绍深度学习和计算摄像问题的结合与应用。
Talk·提问交流
▼
Talk·嘉宾介绍
北京大学 · 博士生
个人主页:
https://www.techbeat.net/grzytrkj?id=40611
长按识别二维码,一键预约TALK!
-The End-
如果你也想成为讲者
▼
关于TechBeat人工智能社区
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区