活动通知：GAMES Webinar335期-Diffusion和大模型在low-level视觉中的应用（8月8日）

学术科学 2024-08-05 22:41 广东

【GAMES Webinar 2024-335】

视觉专题

Diffusion和大模型在low-level视觉中的应用

· 1 ·

报告题目

DiffIR: Efficient diffusion model

for image restoration

报告嘉宾

夏彬

香港中文大学

报告时间

2024年8月8号晚上8:00-8:10（北京时间）

报告方式

GAMES 直播间:

https://live.bilibili.com/h5/24617282

报告摘要

扩散模型 (DM) 通过将图像合成过程建模为序列去噪过程，实现了 SOTA 性能。然而，与图像合成不同，图像恢复（IR）对于生成符合地面实况的结果有很强的约束。因此，对于 IR，传统的 DM 在大型模型上运行大量迭代来估计整个图像或特征图是低效的。为了解决这个问题，我们提出了一种高效的DM（DiffIR），它由紧凑的复原先验提取网络（CPEN）、动态IR transformer（DIRformer）和去噪网络组成。具体来说，DiffIR有两个训练阶段：预训练和训练DM。在预训练中，我们将真实图像输入 CPEN${S1}$ 中，以捕获紧凑的 IR 先验表示 (IPR) 来指导 DIRformer。在第二阶段，我们训练 DM 仅使用 LQ 图像直接估计与预训练 CPEN${S1}$ 相同的 IRP。我们观察到，由于 IPR 只是一个紧凑向量，因此 DiffIR 可以使用比传统 DM 更少的迭代来获得准确的估计并生成更稳定和真实的结果。由于迭代次数很少，我们的DiffIR可以采用CPEN$_{S2}$、DIRformer和去噪网络的联合优化，这可以进一步减少估计误差的影响。我们对多个 IR 任务进行了广泛的实验，并在消耗更少的计算成本的同时实现了 SOTA 性能。

嘉宾简介

夏彬，香港中文大学博士生，导师为贾佳亚。他的研究方向为AIGC，LLM，模型压缩，图像复原。

个人主页

https://zj-binxia.github.io/

· 2 ·

报告题目

RestoreAgent: Autonomous Image Restoration Agent

via Multimodal Large Language Models

报告嘉宾 Speaker

陈浩宇

香港科技大学(广州)

报告时间

2024年8月8号晚上8:10-8:25（北京时间）

报告方式

GAMES 直播间:

https://live.bilibili.com/h5/24617282

报告摘要

这篇文章提出了一种新的图像复原的解决方案，利用多模态大语言模型来解决现有图像复原技术在处理复杂场景中多重退化问题时面临的诸多挑战。文章首先深入分析了在处理包含多种退化的图片时，all-in-one模型存在的局限性，以及人为挑选恢复模型和不同恢复任务执行顺序的局限性，从而提出了新的智能图像复原系统：RestoreAgent。RestoreAgent能够自主评估图像退化类型和程度，智能确定最佳复原任务序列，为每个任务动态选择最优模型，并自动执行整个复原流程。RestoreAgent展现出卓越的决策能力，其决策性能要优于人类专家的决策结果，在处理多重退化图像时的表现显著优于现有all-in-one方法的性能。并且，该系统具有极强的灵活性和可扩展性，能够快速适应新的任务和模型，也可以根据用户的偏好来调整模型的决策目标。

嘉宾简介

陈浩宇，香港科技大学(广州)博士生，导师为朱磊教授。他的研究方向主要为图像恢复，多模态模型和图像生成。

个人主页

https://haoyuchen.com

· 3 ·

报告题目

CoSeR: Bridging Image and Language

for Cognitive Super-Resolution

报告嘉宾

孙浩泽

清华大学

报告时间

2024年8月8号晚上8:25-8:40（北京时间）

报告方式

GAMES live stream:

https://live.bilibili.com/h5/24617282

报告摘要

现有的超分辨率（SR）模型主要侧重于恢复局部纹理细节，往往忽略了场景中的全局语义信息。这种疏忽会导致在恢复过程中遗漏关键的语义细节或引入不准确的纹理。在我们的工作中，我们引入了认知超分辨率（CoSeR）框架，赋予 SR 模型理解低分辨率图像的能力。为此，我们将图像外观和语言理解结合起来，生成认知嵌入，这不仅能激活大型文生图扩散模型中的先验信息，还能帮助生成高质量的参考图像。为了进一步提高图像保真度，我们提出了一种名为 “All-in-Attention ”的新型条件注入方案，将所有条件信息整合到一个模块中。因此，我们的方法成功地恢复了语义上正确且逼真的细节，在多个基准测试中展示了最先进的性能。

嘉宾简介

孙浩泽目前就读于清华大学，师从杨余久教授，同时在华为诺亚方舟实验室实习。目前感兴趣的研究方向包括图像修复、基于Diffusion的图像生成与编辑、多模态模型等。

个人主页

https://scholar.google.com.hk/citations?user=aB2KirIAAAAJ&hl=zh-CN&oi=ao

主持人简介

徐晓刚

华为

徐晓刚目前就职于华为2012实验室中央媒体院。此前就职于之江实验室，担任研究专家（PI），同时兼聘于浙江大学计算机科学与技术学院CAD国家重点实验室，担任新百人计划研究员，主要研究方向为多模态内容生成与修复。徐晓刚于2018年在浙江大学信息工程专业获得工学学士学位，于2022年在香港中文大学获得博士学位，师从香港中文大学IEEE Fellow贾佳亚教授。徐晓刚在人工智能和计算机视觉领域累计发表共4篇国际顶级期刊论文（均为CCF-A论文，其中3篇为第一作者），22篇国际顶级会议论文（其中11篇为第一作者，3篇为通讯作者），多项中国发明专利（落地于阿里巴巴等公司平台），并且担任多个国际学术会议（包括CVPR, ICCV, ECCV, NeurIPS, ICLR, ICML, AAAI等）和国际学术期刊（包括TPAMI, IJCV, TCSVT, TMM, TNNLS等）的审稿人和程序委员会。主持和参与之江实验室优秀青年科学基金，浙江省鲲鹏计划，浙江省自然科学基金重大项目等。个人主页（xuxiaogang.com)

个人主页

https://xuxiaogang.com/

长按二维码，关注公众号

GAMES Website: http://games-cn.org

http://mp.weixin.qq.com/s?__biz=MzI0MTY1NTk1Nw==&mid=2247496248&idx=1&sn=194c88f69f48478b51205e262198ceaf

图形学与混合现实研讨会

GAMES官方公众号。GAMES主页:http://games-cn.org/

活动通知：GAMES Webinar347期-高性能物理仿真的设计与实践（11月7日）

活动通知：GAMES Webinar346期-Advanced Interactive AI Systems（10月31日）

活动通知：GAMES Webinar345期-交互式设计在数据降维和矢量图创建中的应用（10月24日）

活动通知：GAMES Webinar344期-智能图表生成与风格化（10月17日）

活动通知：GAMES Webinar343期-知识驱动的多模态数据探索（10月10日）

GAMES 2024在港科广举办，共探世界模型与具身智能前沿

活动通知：GAMES Webinar342期斯坦福-港大前沿技术交流之计算成像专题 (V)(9月28日)

活动通知：GAMES Webinar341期-高斯泼溅建模与渲染的前沿进展（9月26日）

活动通知：GAMES Webinar340期-智能CAD模型生成（9月19日）

GAMES视频号SIGGRAPH Asia 2024成果展示视频征集

活动通知：GAMES Webinar339期-几何配准与生成（9月12日）

GAMES003 “科研修炼手册” 主题研讨会通知

活动通知：GAMES Webinar338期-智能几何处理与生成（9月5日）

新增GAMES003《科研基本素养》课程答疑群进群渠道

GAMES003《科研基本素养》开课通知

活动通知：GAMES Webinar337期-弱约束视觉重建：从数字人到物理仿真（8月29日）

活动通知：GAMES Webinar336期-相机可控的视频生成模型（8月22日）

GAMES要开视频号啦！

活动通知：GAMES Webinar335期-Diffusion和大模型在low-level视觉中的应用（8月8日）

活动通知：GAMES Webinar334期-三维匹配问题前沿（8月1日）

活动通知：GAMES Webinar 333-Creative Applications in AR/VR（July 26th）

活动通知：GAMES Webinar332期-3D人-物-场景建模（7月18日）

活动通知：GAMES Webinar331期-虚拟场景的内容感知与生成（7月11日）

2024 年度“优秀图形开源项目”公开征集

活动通知：GAMES Webinar330期-Physics-based Inverse Graphics（7月4日）

活动通知：GAMES Webinar329期-CAD程序语义注释与曲线参数化新进展（6月27日）

活动通知：GAMES Webinar328期-CAD/CAM技术新进展（6月20日）

活动通知：GAMES Webinar327期-智能CAD（6月13日）

活动通知：GAMES Webinar326期-CAD/CAE技术新进展（6月6日）

活动通知：GAMES Webinar325期-研究生成长论坛：获奖论文的养成之路（5月30日）

活动通知：GAMES Webinar324期-多场景下可视分析系统设计（5月23日）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉