本期为TechBeat人工智能社区第626期线上Talk。
他与大家分享的主题是: “探索视觉感知的3D视角鲁棒性”,届时他探索和思考如何有效评估、增强视觉感知模型应对视角变换的鲁棒性,介绍团队在这一领域开展的系列工作,包括ViewFool、VIAT和Omniview-Tuning。
长按识别二维码,一键预约TALK!
获得鲁棒和不变(Invariant)的表征是计算机视觉领域的长期挑战。以往的深度学习鲁棒性研究侧重于针对L-p范数下的对抗扰动(Adversarial perturbation)。然而在复杂动态的物理场景下,存在诸多值得关注的自然扰动,而视角变换就是其中一种重要的扰动因素。
2. 有限视图下的视角鲁棒性评估算法
ViewFool: Evaluating the Robustness of Visual Recognition to Adversarial Viewpoints, NeurIPS2022
3. 视角不变性对抗分布训练
VIAT: Towards viewpoint-invariant visual recognition via adversarial training, ICCV2023
4. 迈向视觉-语言预训练模型的视角鲁棒性增强
Omniview-Tuning: Boosting Viewpoint Invariance of Vision-Language Pre-training Models, ECCV2024 Oral
5. 工作局限性与未来展望
Talk·预习资料
▼
论文链接:
https://arxiv.org/abs/1811.11553
论文链接:
https://arxiv.org/abs/2210.03895
代码链接:
https://github.com/Heathcliff-saku/ViewFool_
论文链接:
https://arxiv.org/abs/2307.10235
代码链接:
https://github.com/Heathcliff-saku/VIAT
论文链接:
https://arxiv.org/abs/2404.12139
代码链接:
https://omniview-tuning.github.io/
Talk·提问交流
▼
Talk·嘉宾介绍
阮受炜
个人主页:
https://www.techbeat.net/grzytrkj?id=41658
长按识别二维码,一键预约TALK!
-The End-
如果你也想成为讲者
▼
关于TechBeat人工智能社区
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区