首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

明天直播 | ECCV 2024精选论文分享

科技 2024-10-28 17:01 北京

（本文阅读时间：5分钟）

2024年的ECCV大会于10月4日在意大利米兰圆满结束。作为计算机视觉领域的三大顶级会议之一，ECCV是全球计算机视觉研究者交流最新研究成果的重要平台。

根据此前粉丝朋友们的投票结果，我们邀请了票选人气最高的三篇ECCV论文的作者，于明天（10月29日）下午14:00，在微软亚洲研究院的直播间分享他们的前沿工作。欢迎大家锁定直播间！

直播信息

直播时间：

2024年10月29日（明天） 14:00-15:00

直播地址：

微信视频号“微软亚洲研究院”

B 站账号“微软科技”直播间

论文及讲者介绍

牟芯志

微软亚洲研究院

多媒体计算组研发工程师

牟芯志，微软亚洲研究院多媒体计算组研发工程师。现阶段主要在研究方向为视觉内容生成领域，包括图像和视频内容的生成、重建和压缩等。此前还进行过图像和视频内容检测和识别相关工作。

分享内容：

FontStudio: 用于生成连贯一致字体效果的形状自适应扩散模型

FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation

论文摘要：

特效字体生成任务需要在生成用户提示内容的同时，额外保证生成内容的轮廓与用户所提供的字符轮廓相似。我们提出的 FontStudio 框架，包含形状自适应扩散模型和形状自适应风格迁移算法，解决了非规则画布上的生成问题以及字符风格统一问题。

论文链接：

https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/07569.pdf

项目链接：

https://font-studio.github.io/

祁琳峰

微软亚洲研究院

多媒体计算组实习生

祁琳峰，博士五年级，导师为吕岩老师，目前在多媒体计算组进行实习及联合培养，研究方向为端到端的视频编解码。

分享内容：

神经视频压缩的长期时间上下文收集

Long-term Temporal Context Gathering for Neural Video Compression

论文摘要：

现有的视频压缩模型主要通过估计光流来利用短时间上下文，本篇论文额外引入长时间间隔的参考特征，并对参考特征进行聚类和类内特征搜索来提取长时间上下文，丰富上下文的多样性并抑制误差传播，从而提升模型的压缩性能。

论文链接：

https://www.ecva.net/papers/eccv_2024/papers_ECCV/papers/08346.pdf

张博文

微软亚洲研究院

视觉计算组实习生

张博文，博士四年级，师从郭百宁老师。目前在视觉计算组从事高质量生成模型的研究，已在多个计算机视觉顶级会议上发表过多篇论文，研究内容涵盖二维图像生成和三维物体生成等领域。

分享内容：

RodinHD: 使用扩散模型生成高保真3D头像

RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models

论文摘要：

RodinHD 旨在精确拟合并为用户生成高质量的数字化身。本篇论文首先解决了共享解码器拟合过程中的灾难性遗忘问题，实现了高质量数据拟合；其次增强了输入图像的在生成过程中的指导效果，并针对三维扩散模型修改了加噪过程，实现了高保真度数字化身生成。

论文链接：

https://arxiv.org/abs/2407.06938

项目链接：

https://rodinhd.github.io/

日程安排

14:00-14:20

分享内容：

FontStudio: Shape-Adaptive Diffusion Model for Coherent and Consistent Font Effect Generation

分享者：

牟芯志

14:20-14:40

分享内容：

Long-term Temporal Context Gathering for Neural Video Compression

分享者：

祁琳峰

14:40-15:00

分享内容：

RodinHD: High-Fidelity 3D Avatar Generation with Diffusion Models

分享者：

张博文

锁定直播间，我们不见不散！

你也许还想看：

http://mp.weixin.qq.com/s?__biz=MzAwMTA3MzM4Nw==&mid=2649502329&idx=1&sn=d21a6887c094d022d0813eb3d74bf978

微软亚洲研究院

微软亚洲研究院，专注科研26年，盛产黑科技

最新文章

Rust自动形式化证明、LLMs图模式理解、机械臂动作模仿

科学匠人 | 对话松下康之：以具身智能突破人工智能与物理世界的边界

对话《Nature》论文作者，揭秘AI2BMD背后的故事

近实时的全球碳预算，揭示2023年陆地碳汇能力锐减

AI2BMD登上Nature，以量子级精度推进蛋白质动力学

MarS：生成式基座模型时代的通用金融市场模拟引擎

明天直播 | ECCV 2024精选论文分享

如何泛化AI的深度推理能力？

简单而强大：DIFF Transformer降噪式学习，开启模型架构新思路

科学匠人 | 刘海广：发挥“生物多样性”法则的力量，寻找科学的新答案

VIS 2024最佳论文 | VisEval：推动自然语言生成可视化的全新评估框架

从预测风暴到设计分子：人工智能基础模型如何加速科学发现

ECCV上新 | 精选计算机视觉领域6篇前沿论文

Data Formulator：使用prompt就能轻松完成数据可视化

为什么你的LLMs玩不转外部知识？RAG分类学助你诊断！

守护记忆：多模态大模型为认知障碍患者带来全新的训练方法

科研上新 | 金融模型、LLMs结构化剪枝、多模态对齐、AI芯片深度学习编译器

开源工具RD-Agent：让研究与开发过程更智能

VALL-E 2，大幅提升语音大模型的稳健性与自然度

微软亚洲研究院2025校园招聘正式开启！

跨越模态边界，探索原生多模态大语言模型

明天直播 | ACL 2024精选5篇论文直播分享

代码摘要、生成、翻译、修复全覆盖... WaveCoder开启代码智能新篇章

集成大语言模型与产业数据智能，迈向“产业基础模型”

Microsoft Research Forum第四期来了！一起来看多模态模型的最新技术进展与应用

星跃计划 | 微软亚洲研究院北京+温哥华联合科研项目上新，聚焦大语言模型！

开启因果发现新范式！解密复杂系统的核心机制

微软亚洲研究院多项创新技术，弥合大模型低比特量化与终端部署间鸿沟

顶尖高校优秀学子齐聚微软亚洲研究院新星科技节，论道科研！

如何理解和探索大模型的多语言能力？

执业医师转型人工智能研究员，王子龙说“跨”才是关键

ACL上新 | 6篇精选论文带你看最新LLMs进展

周二直播 | AI for Science最新论文分享

USENIX ATC 2024最佳论文 | 微软如何提升云AI基础设施的可靠性

图像解码器；多头混合专家网络；视觉模型美学对齐；医学视觉任务适应基准

大语言模型应用如何实现端到端优化？

LSR-MP：突破分子模拟瓶颈，探索知识引导的AI范式

明天直播 | ICML 2024精选论文分享

nnScaler：重塑深度学习并行策略，大幅提升训练效率

ICML 2024 | 微软亚洲研究院邀你共聚机器学习领域盛会

完全激活稀疏大模型，Q-Sparse突破LLM推理效能

数据驱动模型提升电动汽车电池退化预测准确率

ProbTS：时间序列预测的统一评测框架

你应该知道的10个AI术语

实习 | 微软亚洲研究院“明日之星”开放岗位

脑启发设计：人工智能的进化之路

以智能化为舵手，引领现代计算机系统架构新航向

构建负责任且大规模的生成式人工智能的七个启示

AI赋能天气：微软研究院发布首个大规模大气基础模型Aurora

CVPR上新 | 从新视角合成、视频编解码器、人体姿态估计，到文本布局分析，微软亚洲研究院精选论文

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉