精选报告 | KLMVis: 基于知识图谱的检索增强语言模型可视分析系统

学术   科技   2024-11-22 18:24   北京  

点击文末 “阅读原文” 下载全文

沈健, 朱闽峰*, 马昱欣, 程司哲, 陈治彰, 严丹方, 陈为

浙江大学计算机辅助设计与图形系统全国重点实验室

浙江大学软件学院
南方科技大学计算机科学与工程系
浙江大学医学院附属第一医院放疗科

引用本文: 沈健, 朱闽峰, 马昱欣, 程司哲, 陈治彰, 严丹方, 陈为. KLMVis: 基于知识图谱的检索增强语言模型可视分析系统[J/OL]. 计算机辅助设计与图形学学报: 1-12[2024-11-22]. https://www.jcad.cn/article/doi/10.3724/SP.J.1089.2024-00393

Citation: Shen Jian, Zhu Minfeng, Ma Yuxin, Cheng Sizhe, Chen Zhizhang, Yan Danfang,  Chen Wei. KLMVis: Knowledge Graph-Based Retrieval Augmented Language Model Visual Analysis System[J/OL]. Journal of Computer-Aided Design & Computer Graphics: 1-12[2024-11-22]. https://www.jcad.cn/article/doi/10.3724/SP.J.1089.2024-00393

点击播放精选报告视频
感谢浙江大学硕士研究生沈健录制并提供论文讲解视频!感谢论文通信作者朱闽峰老师!本文为CAD/CG 2024大会推荐论文,同时也是CAD/CG与GDC大会精选报告论文。通过严格评审后,已被《计算机辅助设计与图形学学报》录用并在期刊官网最新录用版块上线。



大型语言模型(LLM)在文本生成、问答系统和自然语言理解等关键任务上的表现尤其出色. 但是, LLM仍然存在显著的短板, 如在回答特定领域问询时生成不正确的信息. 检索增强生成(RAG)通过整合外部数据库中的相关知识提升模型回答的精确性和可靠性; 在此框架下, 基于知识图谱(KG)的检索增强LLM技术被视为一种优秀的实践方案. KG是结构化且高质量的信息存储库, 可以显著地提升LLM在需要额外知识的任务上的表现. 该过程通常涉及从KG检索相关数据, 用检索到的信息丰富提示内容, 然后将增强后的提示输入到LLM中. 但是, 现有的方法在实践中面临着一系列挑战: (1) 检索到的信息与用户实际需求存在偏差. (2) 准确地评估外部知识带来的增强效果也是一个挑战. 因此, 当前缺少直观易懂的可视化方法展示知识的整合过程, 并且亟需透明且用户友好的评估机制和可视化方案.

为了有效地应对这些挑战, 本文提出一个KLMVis可视分析系统. 通过引入可视化界面和交互式工具, 对检索流程及增强后的结果呈现进行显著优化, 使得用户能够直接参与到知识的检索与筛选过程之中, 同时辅助用户理解LLM的推理逻辑并评估生成结果. 通过可视化手段, 展示基于问询中的话题实体检索获得的证据及其相关KG子图, 协助用户深入探索并筛选出有价值的证据; 当证据被选定并被提供给LLM后, KLMVis将呈现经过视觉增强处理的可视化文本输出以及包含生成逻辑的推理树, 辅助用户理解外部知识源与生成内容之间的联系, 并对增强后的推理结果进行综合性分析.


研究背景

基于KG的RAG方法分为3个步骤: 检索; 增强; 生成.

为了优化检索和生成的流程, 本文确定了一组系统的设计要求: 

R1. RAG过程的可视化. 

R2. 提升KG探索的灵活性与效率. 

R3. 增强模型决策过程的透明度与可解释性.



KLMVis和算法

KLMVis旨在展示基于KG检索增强LLM流程的中间步骤, 并提供交互界面帮助用户深入探索KG; 助力用户构建更精确的上下文提示, 提高LLM输出结果的准确性和可解释性.
1.  系统概述
KLMVis流程如图1所示. 

(1) 用户的问询以及选定的LLM和KG作为输入(图1中A部分). 
(2) KLMVis抽取出问询中的实体, 并将其与KG中已有的实体名称进行匹配(图1中B部分). 
(3) 基于匹配获得的话题实体(图1中C1部分), KLMVis从KG中检索相关证据, 包括路径证据和邻居证据(图1中C2部分). 
(4) 为了将检索结果与用户的想法对齐, KLMVis提供2个视图来辅助用户完成证据选择上的决策(图1中D部分). 
(5) 将证据和用户问询整合到输入提示中, 使得LLM能够基于外部知识来生成回答(图1中E部分).


2.  KLMVis界面
KLMVis界面遵循算法的处理流程, 如图2所示, 为用户提供了在算法各个阶段验证和调整输入/输出的能力. 

问询和实体视图(图2中A部分)提供了2项功能: 配置用户输入信息和管理话题实体. 
KG探索视图(图2中B部分)在KLMVis中扮演着关键角色, 旨在辅助用户深入挖掘与其查询密切相关的KG的子图. 
证据视图(图2中C部分)展示基于话题实体检索获得的路径证据和邻居证据. 
统计视图(图2中D部分)旨在展现话题实体的邻域实体的重要性程度, 借助桑基图的形式进行直观呈现. 
用户完成对KG的深入探索并提交所选的证据之后, 这些证据将作为用户问询的上下文一并提交给LLM进行推理. 最后, 结果视图(图2中E部分)便会展示LLM基于这些证据生成的推理成果.


实验与结果分析

1.  案例1. 疾病预诊
疾病预诊场景中, 用户希望通过描述自身症状了解自己可能患有何种疾病的信息. 用户描述道:“I have been feeling very fatigued lately and my ab-domen feels swollen and tender”. KLMVis呈现了3个话题实体: “Fatigue”, “Swollen abdomen” 和“Abdominal distention”, 同时陈列了多个证据及相关子图. 
用户将频繁出现节点“Jaundice”匹配并添加到话题实体中(图2中A1部分). KLMVis展示了基于更新后的话题实体, 检索获得的证据和KG子图. 用户利用证据视图的筛选功能, 通过审阅筛选结果之后, 确定了5条路径证据. 类似地, 通过使用统计视图, 用户在证据视图中选择了相关的4条邻居证据.
用户将所选证据提交给LLM进行推理, 结果视图展示出文本结果和推理树. 依据文本内容(图2中E1部分), 用户最可能患有肝硬化. 同时, LLM还提供了相应的药物治疗方案以及进一步所需的身体检查. 借助推理树(图2中E2部分), 用户可了解到LLM生成该结果所依托的各项证据.


2.  案例2. 百科知识探索
案例2中, 用户面对的是一个复杂的百科知识问题:“Who was the President of the United States during the Cold War and has also won a Grammy Award?”. KLMVis首先返回“Cold War”, “Presi-dent of the United States”和“Grammy Award”这3个话题实体; 进一步, 基于话题实体检索得到了相关子图和证据. 
观察统计视图(图3中B部分), 当前话题实体的邻域内实体在多个点上存在重合, 并特别关注到3个被分配了较高权重分数的实体. 借助证据视图中的路径证据筛选工具, 用户发现3条分别贯穿前述3个实体的路径证据(图3中C1部分); 随后, 用户转回到KG探索视图, 并利用路径高亮功能快速定位并找到了这2个实体; 借助邻近节点探索功能, 用户获取了它们的直接邻居信息. 用户勾选了涵盖这些信息的2条路径证据以及相关属性的邻居证据. 最终, 将证据提交给LLM之后, KLMVis呈现了答案.


用户评估

用户评估结果如表1所示.


结    语

本文提出的KLMVis旨在优化基于KG的检索增强流程, 提升增强后的模型输出的可解释性. 通过为用户提供直观界面和多维度的可视化组件, KLMVis有效地支持了交互式知识探索和生成结果解释. 通过2个案例及用户实验, 证明了KLMVis在提升检索质量、效率以及增强用户对模型推理逻辑理解方面的有效性. KLMVis显著地提高了信息检索和结果理解过程中的用户参与度和满意度. 
未来工作将聚焦于2个改进方向: (1) 鉴于当前系统在处理大规模KG时可能遇到的性能瓶颈, 以及子图节点众多导致的可视化效果不佳问题, 计划对后端处理逻辑和KG的呈现方式进行进一步优化. 包括采用更高效的检索算法和优化图布局方式; (2) 考虑到模型可解释性对于建立用户信任至关重要, 将探索更先进的模型可解释算法, 使得推理树更加可靠.




沈   健硕士研究生, 主要研究方向为可视分析.

朱闽峰: 博士, 研究员, 硕士生导师, 论文通信作者, 主要研究方向为人工智能、可视分析.

马昱欣: 博士, 副教授, 博士生导师, 主要研究方向为信息可视化、可视分析;

程司哲: 在校学生, 主要研究方向为可视分析; 

陈治彰硕士研究生, 主要研究方向为可视分析; 

严丹方博士, 副主任医师, 主要研究方向为肿瘤放射治疗及医学图像分析;

陈   为: 博士, 教授, 博士生导师, CCF会员, 主要研究方向为可视化、可视分析、大数据分析.



编辑:李姝昊
审核:赵敏


— END —

还没关注?点击下方“卡片”关注,获取第一时间资讯

精选报告      


精选报告 | 人机协同决策的异质多智能体路径规划
精选报告 | 基于再次事件估计的光学厚介质高性能渲染方法
精选报告 | 质心投票与相关性驱动的单幅图像模型配准

精选报告 | 面向逆渲染的室内场景光源建模

精选报告 | 室内数字三维场景评估方法

精选报告 | 基于紧凑型线性混合半侧蒙皮权重的神经辐射场人体表示方法


编辑推荐      


基于VSLAM的室内场景重建与虚实遮挡的边缘优化方法

融合局部和长距离信息的图像特征点提取

红外-点云的高精度注册及其微服务数字孪生系统应用

基于5G多接入边缘计算的云化PLC系统架构设计与应用


开源代码      


开源代码 | 基于循环双向Transformer的伪CT影像生成方法

开源代码 | 语义扩散对齐的多尺度感知医学图像分割方法

开源代码 | 基于EfficientNetV2的PCB缺陷检测算法


数据集      


数据集 | 自然场景盲文字符识别数据集


合辑荐读      


开源成果 | 开源代码/数据集成果合辑

合辑荐读 | 计算机技术与传统文化论文合辑

合辑荐读 | 几何建模与优化最新论文合辑

合辑荐读 | 目标检测、目标跟踪与重识别最新论文合辑

合辑荐读 | 医学图像处理最新论文合辑

合辑荐读 | 感知与交互最新论文合辑

合辑荐读 | VR/AR/MR最新论文合辑

合辑荐读 | 三维图形计算最新论文合辑

合辑荐读 | 可视化与可视分析最新论文合辑

合辑荐读 | 《计算机辅助设计与图形学学报》最新综述论文




声明

本公众号发布的所有原创文章欢迎转发和转载,但必须注明作者和文章出处为《计算机辅助设计与图形学学报》公众号;任何媒体、网站或个人不得对本公众号原创图文进行内容修改或摘编。除本公众号原创的图文之外,本公众号发布的图文旨在学术交流,版权归原作者所有,本公众号将不承担任何法律责任;非原创内容均已对来源作出标注,如有侵权,请留言与本公众号联系,我们将及时处理。《计算机辅助设计与图形学学报》拥有最终解释权。




计算机辅助设计与图形学学报
《计算机辅助设计与图形学学报》官方平台。本刊创刊于1989年,EI、Scopus、北大核心、CSCD、CSTPCD、CNKI等国内外数据库收录,CCF推荐中文科技期刊A类、计算领域高质量科技期刊T1类。期刊官网:www.jcad.cn。
 最新文章