【科研播报】NeurIPS 2024录用论文速递Part.2

学术   2024-10-03 19:13   北京  
近日,NeurIPS 2024 论文录用结果出炉!中国图象图形学学会老师多篇论文被录用。今天为大家带来其中13篇论文介绍,后续将持续更新,敬请关注~


CSIG图像智能边缘计算专委会推荐

A2PO: Towards Effective Offline Reinforcement Learning from an Advantage-aware Perspective

  • 作者及对应单位:Yunpeng Qing, Shunyu liu, Jingyuan Cong, Kaixuan Chen, Yihe Zhou, Mingli Song from Zhejiang University

  • 论文简介:离线强化学习通过离线数据集构造策略约束,但数据集中的行为策略的多样性会导致约束冲突。为解决此问题,本文提出优势感知策略优化(A2PO),通过条件变分自动编码器建模优势值,解耦行为策略的动作分布,并优化高优势值策略。实验表明,A2PO 在 D4RL 基准测试中优于优势加权方法及其他离线强化学习算法。

  • Paper链接:

    https://arxiv.org/abs/2403.07262



LG-CAV: Train Any Concept Activation Vector with Language Guidance (NeurIPS 2024)

  • 作者及对应单位黄启涵(浙江大学),宋杰浙江大学,薛梦琦浙江大学,张皓飞浙江大学,胡秉德浙江大学,王慧琼浙江大学,姜昊(阿里巴巴集团),王新根(浙江邦胜科技股份有限公司),宋明黎浙江大学

  • 论文简介:概念激活向量(CAV)可以解释深度神经网络内部的概念知识,解析深度神经网络的内部机制。然而,传统概念激活向量受制于训练样本数量而无法被广泛应用,本文提出了LG-CAV,利用视觉语言模型高效地训练概念激活向量,拓展了它的应用场景。


Improved Regret for Bandit Convex Optimization with Delayed Feedback

  • 作者及对应单位宛袁玉(浙江大学),姚畅(浙江大学),宋明黎(浙江大学),张利军(南京大学)

  • 论文简介:本文研究延迟反馈下的赌博机凸优化问题,提出利用分块更新机制对延迟和赌博机反馈的叠加影响进行解耦,建立了更紧的遗憾上界,在最坏情况下消除了现有遗憾上界在延迟相关项上与现有遗憾下界之间存在的间隔。


Dual-Perspective Activation: Efficient Channel Denoising via Joint Forward-Backward Criterion for Artificial Neural Networks

  • 作者及对应单位邱天(浙江大学),高晨超(大连理工大学),冯尊磊(浙江大学),雷杰(浙江工业大学),胡秉德(浙江大学),王新根(浙江大学),高艺(浙江大学),宋明黎(浙江大学)

  • 论文简介:为解决人工神经网络中的通道噪声干扰问题,本文提出了一种端到端可训练的双视角激活(Dual-Perspective Activation,DPA)机制。DPA 结合前向传播和反向传播的双重视角,在线建立联合判据并实时更新。在联合判据的引导下,DPA 快速识别无关通道,实施通道去噪。实验表明,DPA 机制可有效促进神经表征的稀疏化,并在多种主流深度模型架构上实现性能提升。


Transformer Doctor: Diagnosing and Treating Vision Transformers

  • 作者及对应单位胡佳聪(浙江大学),陈昊(浙江大学),陈可嘉(浙江大学),高扬(浙江邦胜科技股份有限公司),叶靖雯(新加坡国立大学),王新根浙江邦胜科技股份有限公司),宋明黎(浙江大学),冯尊磊(浙江大学)

  • 论文简介:由于Transformer的高复杂度,研究人员很难深入了解其内部机制。受到生物视觉中信息整合机制和合取错误的启发,本文首先验证了视觉Transformer的信息整合假设以及合取错误。进一步地,本文提出了整合约束方法来纠正错误,提升模型性能。


Vision Mamba Mender

  • 作者胡佳聪,曹安达,冯尊磊,张圣旭明,王毅,贾凌翔,宋明黎

  • 单位:浙江大学

  • 论文简介:Mamba在长序列建模中展现了出色性能,但是现有针对Mamba的优化方法需要大量的先验和试错。本文提出了一种系统的视觉Mamba修理方法,包括状态关联分析和关联得分定义,从事后识别模型内部缺陷并进行修理,从而对模型进行优化。


Model LEGO: Creating Models Like Disassembling and Assembling Building Blocks

  • 作者胡佳聪(浙江大学),高靖(浙江大学),叶靖雯(新加坡国立大学),高扬(浙江邦胜科技股份有限公司),王新根(浙江邦胜科技股份有限公司), 冯尊磊(浙江大学),宋明黎(浙江大学)

  • 论文简介:庞大的参数使得训练新模型变得越来越耗费资源。本文探索了一种无需训练即可获得新模型的范式,即模型拆解和组装。通过提出的具体的模型拆解和组装方法,可以像玩乐高积木一样任意拼装新模型,提高了模型的复用性。

  • Paper链接:

    https://arxiv.org/abs/2203.13453

  • Code链接:

    https://github.com/jiaconghu/Model_LEGO


Association Pattern-aware Fusion for Biological Entity Relationship Prediction

  • 作者贾凌翔(浙江大学),应宇晨(浙江大学),冯尊磊(浙江大学),钟子鹏(浙江大学),姚少伦(浙江大学),胡佳聪(浙江大学),段明江(浙江大学),王新根(浙江邦盛科技股份有限公司),宋杰(浙江大学),宋明黎(浙江大学)

  • 论文简介:深度学习在生物实体关联预测任务上发挥重要作用。现有研究集中于以实体为中心的信息映射,忽视了实体间潜在关联的作用。为此,我们提出一种基于关联模式感知的特征融合方法,以增强实体表征学习。该方法在多个数据集上较比SOTA方法最高提升约23%,其可解释性也支撑了在实际场景下的应用。


CSIG三维视觉专委会推荐

OctreeOcc: Efficient and Multi-Granularity Occupancy Prediction Using Octree Queries

  • 作者及对应单位陆宇航(上海科技大学),祝新革(香港中文大学),王泰(上海人工智能实验室),马月昕(上海科技大学) 

  • 论文简介:传统占据预测依赖密集网格,导致高计算需求和细节丢失。本文提出OctreeOcc,利用八叉树适应不同物体形状,结合图像语义信息提升准确性并通过修正机制优化结构。其性能超越其他方法,计算开销降低约20%。
  • Paper链接:

    https://arxiv.org/pdf/2312.03774

  • Code链接:

    https://github.com/4DVLab/OctreeOcc



Mining and Transferring Feature-Geometry Coherence for Unsupervised Point Cloud Registration

  • 作者熊恪峥(厦门大学)、项浩恩(厦门大学)、徐青山(南洋理工大学)、温程璐(厦门大学)、沈思淇(厦门大学)、Jonathan Li(滑铁卢大学)、王程(厦门大学)

  • 论文简介:该论文提出了适用于室外大场景的无监督三维点云配准方法INTEGER。该方法改善了户外环境中现有方法的伪标签质量问题,并解决了室外场景中点云密度变化的挑战。在KITTI和nuScenes上超过了现有方法。




3D Focusing-and-Matching Network for Multi-Instance Point Cloud Registration

  • 作者张力源(西北工业大学)、惠乐(西北工业大学)、刘奇(西北工业大学)、李波(西北工业大学)、戴玉超(西北工业大学

  • 论文简介:提出了一种用于多实例点云配准的三维聚焦与匹配网络,其核心思想是将一对多的匹配分解为多个一对一的匹配。首先利用点云聚焦模块来定位物体的中心,然后采用双掩码匹配模块来估计姿态。实验表明提出的方法在Scan2CAD和ROBI数据集上达到了最先进的精度。



Self-Distilled Depth Refinement with Noisy Poisson Fusion

  • 作者黎家骐(华中科技大学)、王一然(华中科技大学)、郑璟泓(华中科技大学)、黄子昊(华中科技大学)、鲜可(华中科技大学)、曹治国(华中科技大学)、Jianming Zhang (Adobe Research

  • 论文简介:本文提出以含噪泊松融合建模深度预测误差,通过理论分析前序工作缺陷并改进框架。采用自蒸馏提升噪声鲁棒性,网络优化深度图的同时生成更准确的边缘表征。方法在多个数据集上取得SOTA,能够预测高分辨率深度图。

  • Paper链接:

    https://arxiv.org/abs/2409.17880

  • Code链接:

    https://github.com/lijia7/SDDR


CSIG图像视频通信专委会推荐

Virtual Scanning: Unsupervised Non-line-of-sight Imaging from Irregularly Undersampled Transients

  • 作者:Xingyu Cui, Huanjing Yue, Song Li, Xiangjun Yin, Yusen Hou, Yun Meng, Kai Zou, Xiaolong Hu, Jingyu Yang

  • 单位:天津大学

  • 论文简介:本文提出了一种基于无监督学习的框架,旨在从不规则且欠采样的瞬态数据中实现非视域成像。为克服三维重建过程中测量一致性约束所存在的不确定性问题,设计了虚拟扫描策略以学习估计三维信号的值空间分量与零空间分量,从而实现高质量的非时域重建。此外,本文还设计了一种物理引导的无偏估计去噪器,显著提升了算法在低光子成像环境下的鲁棒性。通过在模拟数据及真实数据上的实验结果验证,本文所提出的方法展现出了卓越的重建性能与出色的泛化能力。



欢迎扫描二维码加入中国图象图形学学会

(http://membership.csig.org.cn)




图像图形领域高质量科技期刊分级目录
中国图象图形学学会科普活动、素材征集通知
中国图象图形学学会高校志愿者招募
中国图象图形学学会关于组织开展科技成果评价的通知
2024年CSIG图像图形中国行承办方征集中

中国图象图形学学会CSIG
发布图象图形技术的理论研究、应用推广、科学普及、专业培训、技术咨询、学术交流、出版专业书刊等信息,促进该学科技术的发展和在国民经济各个领域的推广应用。
 最新文章