活动通知：GAMES Webinar336期-相机可控的视频生成模型（8月22日）

学术科学 2024-08-19 22:14 广东

【GAMES Webinar 2024-336】

视觉专题

相机可控的视频生成模型

· 1 ·

报告题目

Enabling 3D Control in Video Generative Models

报告嘉宾

徐英豪

斯坦福大学

报告时间

2024年8月22号晚上8:00-8:30（北京时间）

报告方式

GAMES 直播间:

https://live.bilibili.com/h5/24617282

报告摘要

Controllability plays a crucial role in video generation, as it allows users to create and edit content more precisely. Existing models, however, lack control of camera pose. To alleviate this issue, we introduce CameraCtrl, enabling accurate camera pose control for video diffusion models. Our approach explores effective camera trajectory parameterization along with a plug-and-play camera pose control module that is trained on top of a video diffusion model, leaving other modules of the base model untouched. Yet, it remains challenging to generate a video of the same scene from multiple different camera trajectories. We further introduce collaborative video diffusion (CVD) as an important step towards this vision. The CVD framework includes a novel cross-video synchronization module that promotes consistency between corresponding frames of the same video rendered from different camera poses using an epipolar attention mechanism. Trained on top of a state-of-the-art camera-control module for video generation, CVD generates multiple videos rendered from different camera trajectories with significantly better consistency than baselines.

嘉宾简介

徐英豪为斯坦福大学博士后研究员，导师是 Gordon Wetzstein 教授，此前毕业于香港中文大学 MMLab，导师为林达华和周博磊教授。他的研究方向为生成模型和神经渲染。至今在 TPAMI、CVPR、ICCV 等期刊或会议发表二十余篇论文，Google 学术引用超过 2500 次。以第一作者身份连续四年在 CVPR、ICLR 等会议上，发表了 5 篇 oral/highlight 论文，曾荣获世界人工智能大会云帆奖金， CVPR 2020 最佳论文候选以及 Snap Fellowship 荣誉提名。

个人主页

https://justimyhxu.github.io/

· 2 ·

报告题目

NVS-Solver以及扩散模型

与新视点渲染相融合的一些理解

报告嘉宾

朱智宇

香港城市大学

报告时间

2024年8月22号晚上8:30-9:00（北京时间）

报告方式

GAMES 直播间:

https://live.bilibili.com/h5/24617282

报告摘要

报告将围绕以下两点展开：（1）如何快速的理解扩散模型，尤其是以随机微分方程的形式；（2）对于视频扩散模型与新视点合成的一些理解。

嘉宾简介

香港城市大学博后，导师为侯军辉教授。主要研究方向为计算机视觉，主要包括视觉生成模型，图像恢复，事件相机等。

个人主页

https://scholar.google.com/citations?user=d1L0KkoAAAAJ&hl=en

· 3 ·

报告题目

SV4D: 具有时间和空间一致性的

动态3D内容生成

报告嘉宾

谢一鸣

东北大学/Stability AI

报告时间

2024年8月8号晚上9:00-9:40（北京时间）

报告方式

GAMES 直播间:

https://live.bilibili.com/h5/24617282

报告摘要

本次报告将介绍我们最近提出的Stable Video 4D（SV4D），一种用于动态3D内容生成，且具有时间和空间一致的视频扩散模型。与以往依赖于分别训练的视频生成和多视图生成模型的方法不同，我们设计了一个统一的扩散模型来生成动态3D对象的新视图视频。具体来说，给定一个单目参考视频，SV4D为每个视频帧生成时间上连续一致的新视图。然后，我们使用生成的新视图视频来高效优化隐式4D表示（动态NeRF），无需大多数以往方法中使用的繁琐的基于SDS的优化。为了训练我们的统一新视图视频生成模型，我们从现有的Objaverse数据集中整理了一个动态3D对象数据集。在多个数据集上的广泛实验结果和用户研究表明，与以往方法相比，SV4D在新视图视频生成以及4D生成方面表现出色。

嘉宾简介

美国东北大学博士生，导师是Huaizu Jiang 教授。在此之前，他于 2019 年获得浙江大学学士学位，导师是周晓巍教授。他的研究重点是 3D 计算机视觉，特别是 3D 重建、感知和生成。他在CVPR、ICCV、ECCV、ICLR等顶级会议上发表了多篇文章。论文曾入围2021 CVPR Best Paper Candidates。2024年获得Apple Scholars in AI/ML PhD fellowship。

个人主页

https://ymingxie.github.io/

主持人简介

彭思达

浙江大学

彭思达，浙江大学软件学院“百人计划”研究员，博士生导师。2023年获得浙江大学计算机科学与技术博士学位。研究方向为三维计算机视觉，代表工作为EasyVolCap、Neural Body、PVNet。至今在TPAMI、CVPR、ICCV等期刊或会议发表四十余篇论文，谷歌学术引用3900余次，其中一篇一作论文获得CVPR最佳论文提名，在GitHub开源获得上万次stars。曾获得2023年全球IMC三维重建挑战赛冠军、2023年世界人工智能大会云帆奖-明日之星、2022 Apple Scholar、2020年CCF-CV学术新锐奖、2021/2023年中国CCF图形开源软件奖。

长按二维码，关注公众号

GAMES Website: http://games-cn.org

http://mp.weixin.qq.com/s?__biz=MzI0MTY1NTk1Nw==&mid=2247496355&idx=1&sn=66129327a124ecf022b4cd6e15a0e659

图形学与混合现实研讨会

GAMES官方公众号。GAMES主页:http://games-cn.org/

活动通知：GAMES Webinar347期-高性能物理仿真的设计与实践（11月7日）

活动通知：GAMES Webinar346期-Advanced Interactive AI Systems（10月31日）

活动通知：GAMES Webinar345期-交互式设计在数据降维和矢量图创建中的应用（10月24日）

活动通知：GAMES Webinar344期-智能图表生成与风格化（10月17日）

活动通知：GAMES Webinar343期-知识驱动的多模态数据探索（10月10日）

GAMES 2024在港科广举办，共探世界模型与具身智能前沿

活动通知：GAMES Webinar342期斯坦福-港大前沿技术交流之计算成像专题 (V)(9月28日)

活动通知：GAMES Webinar341期-高斯泼溅建模与渲染的前沿进展（9月26日）

活动通知：GAMES Webinar340期-智能CAD模型生成（9月19日）

GAMES视频号SIGGRAPH Asia 2024成果展示视频征集

活动通知：GAMES Webinar339期-几何配准与生成（9月12日）

GAMES003 “科研修炼手册” 主题研讨会通知

活动通知：GAMES Webinar338期-智能几何处理与生成（9月5日）

新增GAMES003《科研基本素养》课程答疑群进群渠道

GAMES003《科研基本素养》开课通知

活动通知：GAMES Webinar337期-弱约束视觉重建：从数字人到物理仿真（8月29日）

活动通知：GAMES Webinar336期-相机可控的视频生成模型（8月22日）

GAMES要开视频号啦！

活动通知：GAMES Webinar335期-Diffusion和大模型在low-level视觉中的应用（8月8日）

活动通知：GAMES Webinar334期-三维匹配问题前沿（8月1日）

活动通知：GAMES Webinar 333-Creative Applications in AR/VR（July 26th）

活动通知：GAMES Webinar332期-3D人-物-场景建模（7月18日）

活动通知：GAMES Webinar331期-虚拟场景的内容感知与生成（7月11日）

2024 年度“优秀图形开源项目”公开征集

活动通知：GAMES Webinar330期-Physics-based Inverse Graphics（7月4日）

活动通知：GAMES Webinar329期-CAD程序语义注释与曲线参数化新进展（6月27日）

活动通知：GAMES Webinar328期-CAD/CAM技术新进展（6月20日）

活动通知：GAMES Webinar327期-智能CAD（6月13日）

活动通知：GAMES Webinar326期-CAD/CAE技术新进展（6月6日）

活动通知：GAMES Webinar325期-研究生成长论坛：获奖论文的养成之路（5月30日）

活动通知：GAMES Webinar324期-多场景下可视分析系统设计（5月23日）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉