划重点 →第三届“博览医书”杯中医药知识图谱大赛具体方案指导来啦 !

教育   2024-09-23 14:52   安徽  

9月1日-9月30日

第三届中医药知识图谱大赛报名阶段已开启!

知识图谱大赛的目的是什么?

任务内容是什么?

如何进行标准评定?

这篇方案指导给你解答!



比赛概述

本次比赛主要面向全国各大高校的学生、科研人员、企业开发者等。总体目标是利用知识图谱、大模型以及RAG(Retrieval-Augmented Generation)技术,构建一个智能中医问答系统,通过整合中医药知识,提供一个高效、准确且用户友好的问答平台。

为了实现这一目标,参赛选手可采用多种前沿技术手段。知识图谱能够将中医药领域的知识以结构化的方式组织起来,形成一张庞大的知识网络。这将使得系统能够理解并处理复杂的中医药概念和关系,为后续的问答提供基础支持。大模型技术在自然语言处理领域表现出色,可以实现对用户输入的自然语言问题进行深度理解,并生成准确、流畅的答案。RAG技术通过结合检索和生成方法,使系统在回答问题时能够同时考虑已有的知识资源,从知识图谱中检索到相关信息,并根据需要生成全面且准确的答案。

通过参与本次比赛,参赛者将能够全面展示其在中医药知识图谱、大模型和RAG技术方面的能力,推动中医药智能化发展的进程。



 比赛任务

数据收集与预处理

主办方将提供一份基础的中医药相关文本数据集(以中医治疗皮肤科为例),包括中医文献全文、中医文献题录、数据库(包括名医流派数据、中药数据、医案数据)、中医临床术语等。参赛队伍可在此基础上进行数据扩展,并对数据进行清洗、去重、分词、实体识别等预处理,生成适用于构建知识图谱的数据集

知识图谱构建

中医药知识图谱是一种基于大数据和人工智能技术构建的中医药知识库,通过收集、整理和分析大量中医药数据,形成一个结构化的知识体系。该体系涵盖中医药的基本理论、药物、方剂、疾病、诊断、治疗等各个方面的信息及其相互关系。在知识图谱中,实体和关系的定义与选择不同,图谱的呈现效果和状态也会有所差异。因此,知识图谱模式的设计,会直接影响图谱的准确性和实用性。

中医药知识图谱的主要功能包括:1)提供中医药知识的检索和查询服务,帮助用户快速找到所需的信息;2)支持中医药知识的推理和分析,例如根据病症推荐药物、根据药物推荐方剂等;3)促进中医药知识的传播和普及,为中医药的研究和发展提供数据支持。

中医药知识图谱的构建需要大量的专业知识和技术,包括数据挖掘、自然语言处理、知识表示、知识推理等。例如,编码器模型(如BERT、RoBERTa等)由于其独特的结构优势(通过对每个词进行编码,能够捕捉全局上下文信息,进而进行准确标注)近年来在速度、准确率和资源占用方面都取得了很好的效果。参赛队伍需要在知识图谱构建时,使用预处理后的数据,提取中医药相关的实体(如药材、症状、疾病、方剂等)及其关系(如“治疗”、“引发”等)。构建一个高质量的中医药知识图谱,确保实体和关系的准确性和丰富性。参赛队伍将基于主办方提供的测试集,使用F1值等评估指标来量化模型的表现;同时主办方将从设计合理性、准确率、多样性等方面综合考察知识图谱的质量。

问答系统开发

为了提高问答系统的准确性和专业性,参赛队伍需要设计并实现一个RAG(Retrieval-Augmented Generation)框架。该框架将知识图谱中的丰富信息与大型语言模型的强大处理能力相结合,为复杂问题提供更精确、更专业的回答。问答系统以上一步构建的知识图谱为知识源,利用其知识结构快速理解询问的语境和关键信息需求。

基于大模型技术构建智能问答系统有多种可行的技术路径。例如,可以直接调用闭源大模型API以快速构建系统;或选择本地部署开源大模型,并通过微调以提升模型在中医药领域的表现。鼓励参赛者探索不同技术路线,开发出具有特色和创新性的中医药智能问答系统。

为了实现高效的知识检索和答案生成,需要开发能够从知识图谱中精确检索相关信息的算法,并设计有效的查询机制,准确识别问题中的关键术语,并在图谱中定位相关的实体和属性,使系统能够迅速获取最相关的知识点。同时,需确保大模型能有效利用这些知识点生成正确合理的答案,使其不仅语言流畅、符合语法,还符合中医理论和实践。

为优化系统性能,获得更好的测评结果和比赛成绩,需提升知识检索速度、优化数据格式转换效率,并确保大模型的稳定性和响应速度。RAG系统的效果取决于检索、生成和数据质量等多个因素。检索环节涉及传统信息检索技术,如查询扩展、查询检索、排序算法和索引结构,而知识图谱则在多跳问答中展现出优势。通过RAG框架的应用,问答系统能够实现知识检索和答案生成的无缝集成,在专业性要求很高的中医药领域应用场景中大幅提升用户体验。

在中医药领域,问答系统的应用场景广泛,目标问题类型丰富多样,包括中医诊疗知识推理、名医思维链模拟、中医知识体系梳理、中医流派知识传承关系分析、中医辨证与治法探讨、药物功效与配伍分析等。这些问题涵盖了从临床诊疗到文献研究,再到中药研究等多个应用场景。例如:1)赵炳南在治疗皮肤病时,对于湿热壅盛、热重于湿型的患者,建议使用什么方剂加减进行治疗?2)赵炳南和张志礼在治疗急性湿疹时的主要不同点是什么?



评分标准

评分标准将围绕知识图谱的规模与质量、问答系统的整体性能与用户体验,以及参赛团队在决赛中的表现进行评定,具体如下:

1.   中医药知识图谱质量(40%):评估图谱的逻辑性、实用性、准确性、完整性、可扩展性,以及构建技术的创新性。

2.   中医药问答系统表现(40%):评估系统回答的准确性、流畅性、创新性,以及检索和生成效率。

3.   整体表现与创新(20%):考察系统的创新点与应用潜力,以及团队在决赛中的答辩和展示表现。



比赛流程

报名阶段

1.时间:9月1日-9月30日

2.参赛团队注册登录“博览医书——中西医百科数据平台(www.imedbooks.com)”,在大赛专区提交报名表,介绍团队成员(最多3人)和初步的技术方案,报名时间截至9月30日24时。

3.针对符合条件邀请参加的队伍,主办方将回复他们并提供比赛方案和相关数据,同时将他们加入活动群,以便后续发放相关通知。

初赛阶段

1.时间:9月1日-10月16日

2.参赛选手领取比赛方案和数据,准备参赛内容作品并在10月16日24时前提交参赛作品(包括构建的知识图谱、问答系统、大模型、技术报告、软件说明文档、演示文稿、系统演示视频等)。

3.主办方将在作品提交后提供测试集,参赛队伍需基于测试集评估模型和系统的表现并提交评估结果。

4.评委将评审并选出进入决赛入围队伍,进入决赛名单计划于10月22日公布。


决赛阶段

1.时间:10月22日 - 11月10日

2.地点:决赛将与“世界中医药学会联合会信息专业委员会学术年会(2024年11月8~10日,山东青岛)”共同举办。

3.内容: 进入决赛的参赛队伍,需针对作品内容进行展示、汇报与答辩。

4.评委将根据现场表现评分,主办方将在会上公布决赛结果。



注意事项

(一)所有参赛作品需为原创,严禁抄袭。

(二) 本次大赛奉行开放共享的原则,所有参赛作品和成果面向大众开放并免费获取使用。

(三)参赛作品著作权归作者所有。

(四)本次比赛最终解释权归主办方所有。



活动咨询

1.赛事组织及平台技术咨询

徐老师    18225840263

鲍老师    18753177330


2.竞赛活动咨询:

图书馆信息咨询部:0551-68129172


请把握好报名时间

期待你的加入!

图谱大赛

与你一同

共赴知识之旅

探索无限可能!




END


—安徽中医药大学图书馆—

审核| 叶红

审定| 周家宏

声明| 文章部分图文版权归原创作者所有,

如有侵权请与我们联系删除


安徽中医药大学图书馆档案馆
为广大师生服务,提供图书馆纸质和电子资源的宣传,信息共享等。
 最新文章