ECML PKDD(European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases)是欧洲地区一项重要的学术会议,专注于机器学习及知识发现领域。会议旨在促进研究人员、实践者和产业界的交流与合作,汇聚来自全球的专家,分享最新的研究成果、技术和应用。
由蚂蚁集团联合北京大学、北京师范大学撰写的论文《Subgraph Retrieval Enhanced by Graph-Text Alignment for Commonsense Question Answering》被ECML PKDD会议接收。该论文提出了通过图-文本对齐技术增强子图信息提取来解决常识问答的方法。
本文将知识图谱转化为子图向量数据库,并利用BFS和消息传递机制之间的相似性,采用了一种BFS方式的子图采样策略来避免信息丢失。此外,我们提出了一种双向对比学习方法来进行图-文本对齐,这有效地提高了子图检索和知识融合的效果。最后,本文通过一个预测模块将所有检索到的信息结合并进行推理。
在五个数据集上的广泛实验证明了框架的有效性和鲁棒性。
为了更深入地了解这一创新成果,我们邀请北京大学智能学院博士研究生、蚂蚁图计算团队研究型实习生——彭泊词,于2024年10月17日18:00至19:00,通过“论文秀Live#7”线上直播活动,与大家分享他的研究成果与独到见解。
论文亮点聚焦
1
提出了一个名为SEPTA的新颖框架,用于增强常识问题回答(CSQA)任务。该框架通过将知识图谱转化为子图向量数据库,并结合图-文本对齐的双向对比学习方法,提高了子图检索的准确性和知识融合的效率。
2
SEPTA框架通过BFS风格的子图采样策略来构建子图,并将子图的嵌入存储在数据库中。这种方式利用了BFS和消息传递机制之间的类比,使得从子图中学到的中心节点的表示可以与从整个图中学到的表示紧密对齐,从而避免了信息丢失。
3
在五个CSQA数据集上进行了广泛的实验。实验结果表明了SEPTA框架在所有数据集上都取得了更好的性能并在低资源场景下有着显著优势。
直播观看指南
观看时间:
2024年10月17日 18:00-19:00
观看平台:
微信视频号【蚂蚁技术研究院】、【蚂蚁技术AntTech】、B站【蚂蚁技术研究院】同步直播,敬请预约关注!