第39届国际人工智能年会
AAAI 2025
近日,第39届人工智能领域国际顶级学术会议“AAAI人工智能大会” AAAI Conference on Artificial Intelligence (AAAI) 公布了2025年论文录用结果。北京航空航天大学未来区块链与隐私计算高精尖创新中心共有三篇论文获AAAI 2025录用。
AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议,会议涵盖了人工智能领域的各个方面,包括理论、方法、应用和实践,吸引了来自全球学术界和工业界的顶尖研究人员和从业者参与,交流最新研究成果、讨论前沿技术并且探讨未来趋势。本次AAAI2025 共收到12957篇投稿,其中3032篇被录用,录用率为23.4%。AAAI 2025 会议将于2025年2月25日至3月4日在美国宾夕法尼亚州费城举行。
三篇AAAI 2025论文中,研究成果涉及到隐私计算、大语言模型、三维建模等人工智能的相关领域。以下是论文的简要介绍:
Defending Against Sophisticated Poisoning Attacks with RL-based Aggregation in Federated Learning
作者:
王誉静、张海楠*、温思嘉、邱望洁、郭炳晖
(其中第一作者王誉静为中心23级硕士,通讯作者为张海楠老师)
摘要:
联邦学习容易受到模型投毒攻击,特别是那些为服务器精心设计的高级投毒攻击。传统的防御方法主要集中在更新评估或对人工设计的短视攻击进行鲁棒聚合。当面对高级的定制化投毒攻击时,这些防御方法的稳定性明显不足。因此,有必要开发适应这种高级投毒攻击的防御方法。我们发现,在CV和NLP任务中,在联邦学习中良性客户端表现出明显高于恶意客户端的数据分布稳定性。因此,可以通过观察客户端数据分布的稳定性来识别恶意客户端。本文提出了一种基于强化学习的自适应聚合方法AdaAggRL用于防御高级投毒攻击。具体来说,首先利用分布学习来模拟客户端的数据分布。然后,利用最大均值差异(maximum mean discrepancy, MMD)计算当前局部模型数据分布、其历史数据分布和全局模型数据分布的两两相似性;最后,基于上述相似度,利用策略学习自适应地确定聚合权重。在4个真实数据集上的实验结果表明,AdaAggRL防御模型对高级投毒攻击的防御性能明显优于基线模型。
代码链接:
https://github.com/TAP-LLM/AdaAggRL
AdaAggRL的概述
在MNIST数据集上,四种攻击类型下客户端当前数据分布与其历史数据分布的相似度统计结果随训练时间的变化。x轴表示客户端更新轮数,y轴表示当前和其历史数据分布之间的相似性
四种攻击下Cifar10数据集上全局模型的测试准确率变化
MaFeRw: Query Rewriting with Multi-Aspect Feedbacks for Retrieval-Augmented Large Language Models
作者:
王誉静、张海楠*、庞亮、郭炳晖、郑宏威、郑志明
(其中第一作者王誉静为中心23级硕士,通讯作者为张海楠老师)
摘要:
在真实的RAG系统中,当前查询往往涉及来自对话上下文的口语省略和歧义引用,需要重写查询以更好地描述用户的信息需求。然而,由于从查询重写到回复生成的过程漫长,传统基于上下文的查询重写模型对下游生成任务的增强效果甚微。一些研究人员试图利用带有生成结果反馈的强化学习来帮助重写模型,但这种稀疏的奖励在大多数情况下提供的有利指导很少,导致训练和生成效果不稳定。我们发现,用户的信息需求同时反映在黄金文档、检索文档和groundtruth中。因此,通过将这些多角度的奖励反馈给查询重写模型,可以获得更稳定、更令人满意的回复。本文提出了一种新颖的查询重写方法MaFeRw,通过整合来自检索过程和生成结果的多方面反馈来提高RAG的性能。具体来说,首先我们使用人工数据来训练一个查询重写器,即微调T5模型。然后我们设计了3个指标作为强化学习反馈:重写查询与黄金文档之间的相似性、排名指标和生成与groundtruth之间的ROUGE。受RLAIF启发,我们针对上述指标训练了三种奖励模型,以实现更高效的训练。最后,利用奖励模型的得分作为反馈,我们使用PPO算法探索最优的查询重写策略。在两个对话RAG数据集上的实验结果表明,与基线相比,MaFeRw实现了更好的生成指标和更稳定的训练。
代码链接:
https://github.com/TAP-LLM/MaFeRw
MaFeRw提供RAG的示例以及与T5 rewriter的比较。绿线表示rewriter和RAG的推理过程,红线表示反馈给MaFeRw的三种奖励指标类型
MaFeRw的框架。(a)三个反馈指标是:重写查询与黄金文档的相似度,真实答案与检索文档的相似度排序指标,以及生成与真实答案之间的ROUGE得分。相应的奖励模型是针对这些指标进行训练的。(b)在使用PPO算法训练重写器时,奖励由三个奖励模型的分数和重写的ROUGE组成
High-Fidelity Polarimetric Implicit 3D Reconstruction with View-Dependent Physical Representation
作者:
邱瑜,温思嘉*,张海楠,郑志明
(其中第一作者邱瑜为中心23级硕士,通讯作者为温思嘉老师)
摘要:
神经隐式方法在三维重建方面取得了显著的进展。然而,以往的方法往往假设目标对象具有与观察视角无关的特性,因此不能准确地重建具有透明度和高反射率等具有复杂特征的对象。为了解决这一局限性,我们提出了一种集成几何和偏振信息的偏振隐式三维重建方法,能够在复杂场景中产生高质量的表面重建结果。为了实现高保真表面重建,我们引入了一种依赖于视图的物理表示方法,它充分利用了反射的微妙物理特性。通过一种简单而有效的视图相关检测算法,进一步增强了重建过程,并利用光线追踪和偏振原理进行了优化。实验结果表明,该方法在真实数据集和合成数据集中都具有优越的性能。
我们的方法与先前工作的区别。我们提出的方法利用折射定律和菲涅尔方程,可以更准确的分析透明区域的光线路径
我们提出的算法的总体框架
针对具有复杂表面的物体三维重建可视化展示,我们所提出算法的重建质量优于先前的方法
与目前主流的偏振三维重建算法的倒角距离指标(↓)对比
与目前主流的偏振三维重建算法的角平均误差(↓)对比
来源:区块链与隐私计算高精尖创新中心
中文核心期刊
中国科技核心期刊
中国科学引文数据库来源期刊
CCF计算领域高质量科技期刊
我们在不断努力和完善中,期待您的关注和支持!