近日,电子科技大学智能计算研究院在数据挖掘方向的研究成果《GraphTool-Instruction: Revolutionizing Graph Reasoning in LLMs through Decomposed Subtask Instruction》被数据挖掘领域顶级会议(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)接收。SIGKDD是中国计算机学会A类推荐会议。
研究院2024级博士研究生王荣正为论文第一作者,梁爽副研究员为通讯作者,论文合作者还包括电子科技大学陈麒至博士,张嘉晟博士和秦科教授,论文第一单位为电子科技大学。
在当前以数据驱动为核心的时代,图数据因其在表示复杂关系和网络结构方面的有效性而变得极为重要。然而,大型语言模型(Large Language Models, LLMs)尽管在自然语言处理等领域表现出色,但在处理图数据时面临着显著挑战,在图理解(Graph Understanding, GU)和图处理(Graph Processing, GP)这两个方面,LLMs的准确性仍然有待提高。
为了解决这些问题,本论文提出了一种新颖基于工具指令微调的方法——图工具指令方法(GraphTool-Instruction),该方法通过将图推理任务分解为三个面向图工具执行的子任务:图提取、工具名称识别和工具参数提取,以增强LLMs在处理图数据时的性能。这种方法不仅同时提高了图理解与图处理能力,还为图推理任务提供了一种新的、高效的解决方案。此外,本论文还开发了一个全新的图工具指令数据集GTools,包括20种不同类型的图推理任务,并基于此数据集开发了基于Llama3-8B的开源大语言模型GraphForge。
图工具指令方法
相关链接:
SIGKDD会议,全称为ACM SIGKDD Conference on Knowledge Discovery and Data Mining(国际计算机学会数据挖掘与知识发现专业组会议),是数据科学领域中最具影响力的国际学术会议之一,被中国计算机学会列入A类推荐会议。它由ACM(Association for Computing Machinery,国际计算机学会)旗下的SIGKDD组织主办,该组织专注于推动数据挖掘、大数据分析以及相关领域的研究与发展。
王荣正,智能计算研究院2024级博士研究生。曾获电子科技大学研究生学业奖学金一等奖;第十三届MathorCup高校数学建模挑战赛三等奖;电子科技大学优秀研究生。
来源:电子科技大学智能计算研究院微信公众号
中文核心期刊
中国科技核心期刊
中国科学引文数据库来源期刊
CCF计算领域高质量科技期刊
我们在不断努力和完善中,期待您的关注和支持!