Talk预告|北京大学余旺博:探索视频扩散模型在3D生成和重建中的应用

创业   科技   2024-11-05 08:22   北京  

本期为TechBeat人工智能社区636线上Talk。

北京时间11月6日(周三)20:00,北京大学博士生余旺博的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: 探索视频扩散模型在3D生成和重建中的应用届时他介绍团队最近在可控视频生成方面的研究,以及其在3D生成和3D重建等下游任务中的应用。
Talk·信息
主题:探索视频扩散模型在3D生成和重建中的应用
嘉宾:北京大学 · 博士生 - 余旺博
时间:北京时间 11月6日(周三)20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/

 长按识别二维码,一键预约TALK!


Talk·介绍
Sora等视频生成模型能够在接收一段文本或单张图像输入的条件下生成高度一致的连续视频,在广告、游戏和自媒体等领域展现出强大的应用前景。

然而,大多数现有的视频生成模型缺乏内容可控性,用户无法细粒度地定义生成的内容,这限制了视频生成模型在下游任务中的应用。如何提高视频生成模型的可控性,使其能够应用于下游任务,已成为一个值得研究的热点。

本次讲座将主要介绍我们最近在可控视频生成方面的研究,以及其在3D生成和3D重建等下游任务中的应用。

Talk大纲
1. 图像生成扩散模型和其在3D生成中的应用

2. 视频扩散模型和基于视频扩散模型的3D生成

3. 基于视频生成模型的高保真新视角生成方法:ViewCrafter


Talk·预习资料

论文链接:

https://arxiv.org/abs/2409.02048

代码链接:

https://github.com/Drexubery/ViewCrafter


Talk·提问交流


在Talk界面下的【交流区】参与互动!留下你的打call🤟和问题🙋,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍

余旺博‍‍‍‍‍‍‍‍‍

北京大学 · 博士生

余旺博,北京大学在读博士。研究兴趣为基于扩散模型的3D生成和视频生成,3D人脸Avatar重建, 以及图像风格化等底层视觉任务。在SIGGRAPH, ECCV等会议上发表多篇论文。

个人主页: 

https://www.techbeat.net/grzytrkj?id=41744


 长按识别二维码,一键预约TALK!


-The End-


如果你也想成为讲者

 自荐 / 推荐 

单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~


关于TechBeat人工智能社区

TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!

更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区

点击“阅读原文”
预约本期Talk

将门创投
将门是一家以专注于数智核心科技领域的新型创投机构,也是北京市标杆型孵化器,由前微软创投在中国的创始团队于2015年底创立。公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。
 最新文章