本期为TechBeat人工智能社区第636期线上Talk。
长按识别二维码,一键预约TALK!
然而,大多数现有的视频生成模型缺乏内容可控性,用户无法细粒度地定义生成的内容,这限制了视频生成模型在下游任务中的应用。如何提高视频生成模型的可控性,使其能够应用于下游任务,已成为一个值得研究的热点。
本次讲座将主要介绍我们最近在可控视频生成方面的研究,以及其在3D生成和3D重建等下游任务中的应用。
2. 视频扩散模型和基于视频扩散模型的3D生成
3. 基于视频生成模型的高保真新视角生成方法:ViewCrafter
论文链接:
https://arxiv.org/abs/2409.02048
代码链接:
https://github.com/Drexubery/ViewCrafter
Talk·提问交流
▼
Talk·嘉宾介绍
余旺博
余旺博,北京大学在读博士。研究兴趣为基于扩散模型的3D生成和视频生成,3D人脸Avatar重建, 以及图像风格化等底层视觉任务。在SIGGRAPH, ECCV等会议上发表多篇论文。
个人主页:
https://www.techbeat.net/grzytrkj?id=41744
长按识别二维码,一键预约TALK!
-The End-
如果你也想成为讲者
▼
关于TechBeat人工智能社区
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区