本文转载自中国针灸杂志
基于知识元理论的古代针灸医案标引模板构建探析
王琨翎子 杨峰刘文文 宋冰心 张煜 刘霞
中国中医科学院针灸研究所
参考文献:王琨翎子, 杨峰, 刘文文, 等. 基于知识元理论的古代针灸医案标引模板构建探析[J].中国针灸,2024,44(9):1077-1085.
针灸医案是对以中医理论和经络腧穴理论为基础,通过针、灸、熨等各种方法对经络、穴位予以刺激,以达到防治疾病目的的医疗实践进行的记录。这类记录有一定的格式和体例,旨在传承针灸诊疗过程中的经验和教训,以对后世医家起到参考或启发作用,但由于针灸技术较之方剂本草更注重技法操作和临证体悟,便使不少针灸临床经验成为了“只可意会,不可言传”之事,加之大多数医家平时诊务繁忙,很多临床经验散在于医方医论之后,或被其他医家转述记录,以碎片化形式得以流传,仅用传统的中医文献学研究方法并不便于对针灸医案的系统整理学习。基于针灸医案记录形式多样、书写风格各异、记载内容丰富、文献载体分散等特点,如何采用新方法对古代针灸医案进行整理和研究,构建系统化、高质量的针灸医案信息资源,是目前亟待解决的问题。
标引是针对文献的情报内容及某些外表特征,赋于文献检索标识的过程,也是建立检索工具和检索系统的主要工作内容,对针灸医案进行规模化标引是使用计算机对其进行整理挖掘的关键基础性工作。自柳长华教授将知识元理论引入到中医古籍数字化领域后,利用知识元表示方法对中医古籍进行人工标引解析,进而开展古籍数据挖掘的研究层出不穷,并取得了多项成果。实践证明利用知识元理论对中医古籍进行数字化建设是一种行之有效的方法,相较于重点关注文献主体内容的主题词标引,通过基于知识元理论的标引可以对中医古籍知识进行有效组织,厘清并揭示知识之间的关系,而且可以通过知识元挖掘和链接揭示隐性知识,为知识创新提供切入点。
笔者在充分把握古代针灸医案文献显性结构的基础上,探索其中的元数据属性和关联关系,为古代针灸医案标引构建基于知识元理论的模板,以指导古籍数字化研究者对其进行深度解析标引,为针灸理论挖掘和临床诊疗提供帮助。
1 知识元理论及其基本要素
2 古代针灸医案标引原则与元数据确定
2.1 古代针灸医案标引原则
本研究团队借鉴之前古籍标引规则与经验制定了古代针灸医案标引原则。
2.1.1 古代针灸医案知识体标引原则
知识体的划分是对古籍进行知识元解析标引的基础工作,它是知识系统中可以独立表达一个特定主题的不可再分解的知识单元,是由至少1个知识元构成的集合,具有将独立、分散的知识元链接构造成完备认知结构的能力。
在基于知识元理论的中医古籍标引工作中,知识体结构可分为两部分内容。一是书体显性结构的划分,标引时要充分尊重原文结构,强调原书的结构层次不能随意改动;二是全书内容的隐性结构,如依附于卷、篇结构下的主要内容,隐性结构解析是在书体结构基础上对所载内容进行进一步分析后对知识单元的标注。
2.1.2 古代针灸医案诊次标引原则
多诊次的医案十分常见,根据知识体的定义,全部诊疗过程中包含两个及以上诊次的针灸医案不可直接划分为一个知识体,应采取套标的形式,知识体范围的选取从初诊到最终诊次,其余各诊次都包含在同一知识体下,并以第某个诊次命名,这样才能体现医案内部的知识组织方式。划分原则如下。
(1)医案中明确记载复诊诊次的,每案的复诊按照文献记载划分,见图2。
(2)针灸医案中如并未明确分出复诊的各个诊次,当经仔细阅读后由标引者划分出复诊诊次,见图3。
2.1.3 古代针灸医案知识元标引原则
知识体标引后则要对其下内容进行知识元标引,对于经脉循行、腧穴定位、针灸证治等行文较为规整的内容,应严格按照对应的知识元属性进行标引;有关刺灸法等内容,如手法操作、针刺禁忌、灸法禁忌等,可对文献内容进行提练后确定名称,用相应知识元进行标引。
对于论述庞杂、不易精细标引的内容,应遵循“宜粗不宜细”的原则,提取元数据名称后粗略标引。标引时,应遵循由大到小的标引原则,即先标大概念、再标小概念,以准确显示层叠关系。相对而言,大概念粗标,大概念中的小概念细标。
2.2 古代针灸医案知识体系构建与知识元属性确定
在明确针灸医案知识体标引原则后,需确定其知识体系构成部分及各知识元属性,为后期知识元标引提供元数据支撑。《素问·刺腰痛论》中载有“分经、辨证、施治、选术”的学术思想,辨病-明证-归经-选穴-施术作为针灸临床的诊治思路,对古代针灸医案的记载内容产生了深远的影响。古代针灸医案不仅具有古代中医医案包括的主诉、病史、诊断、辨证等基本要素,还囊括了腧穴、经络、手法等特殊知识要素。
传统的中医古籍的分类体系都是着眼于文献本身,以文献分类为主,而基于文献单元的分类体系不能将一部中医古籍包含的知识内容完全揭示出来,因此,有必要建立一个能深入到针灸医案知识及知识属性层次的古代针灸医案知识体系,以适应计算机环境下的针灸医案知识元标引。
知识的构建多采用两种形式,一种是从学科领域角度,按知识分类标准,采取由上而下的方式建立;另一种是大量分析文献的主题,采取由下而上的方式建立。单独采用其中任何一种模式都可能存在弊端,前者可以全面考虑学科领域的内容,但可能与实际文献状况相偏离;后者则有适用周期的问题,所制定出来的体系可能仅适合过去和目前这一时段的信息组织。因此,本研究团队在充分分析针灸医案古籍文献的基础上,综合采取由上而下(即以知识体-知识元-语义类型-语义关联的顺序进行拆分,知识体量逐渐缩小)以及由下而上(即先对文献内容做预处理及主题分析,提取关键词和关键句,根据实际情况定义知识元结构)两种构建模式,设立了包含2个层次、7种类别、28个知识元数据、31种语义类型、15种语义关联的古代针灸医案标引模板(图4),再根据这些元数据构建古代针灸医案知识的相互关联,用于对针灸医案类古籍文献的知识元标引。标引员可以利用该模板开展基于知识元理论的标引实践,为古代针灸文献数据库形成奠定基础。
2.2.1 基本信息类元数据
基本信息类元数据包括医案名、患者信息、居处、时令。医案名元数据能够反映医案的分类,还能厘清医案的复诊情况,有导航式的作用。患者信息元数据包括患者性别、姓名、职业、官称等内容的描述。居处元数据是有关就诊地点或患者生活地点的描述。时令元数据描述的内容是与当前疾病的发生发展有密切关系的时间、气候、物候等因素。
2.2.2 病证表现类元数据
病证表现类元数据包括病史、病证名、证候表现、舌象、脉象。病证名元数据是描述疾病的名称或证候的名称。病史元数据内容为患者既往患病的情况以及此次诊疗前关于其他医生诊疗情况的记录。证候表现元数据是有关病证表现出来的症状体征内容。舌象、脉象元数据内容分别是证候表现中对舌象及脉象的描述。
2.2.3 诊疗思维类元数据
诊疗思维类元数据包括病因病机、辨证、诊断、鉴别、治则治法。病因病机元数据展示发病的原因和病证发生、发展以及传变的机理内容。辨证元数据展示医家对病证的病因病机、证候表现的综合分析。诊断元数据表示对疾病情况的判断。鉴别元数据则是与本病相似或相关的其他病证的描述。治则治法元数据为治疗病证的原则和方法相关内容。
2.2.4 治法疗效类元数据
治法疗效类元数据包括腧穴、经络、部位、操作、手法、方剂、疗效。腧穴元数据是医案中记载的治疗某病证用到的腧穴。经络元数据内容为与某病证相关的经络。操作元数据是医案中记载的针刺、灸法及其他外治法的相应操作过程、要领。手法元数据则是针刺、灸法及其他外治法的具体手法。方剂元数据内容为医案中记载的治疗病证使用的方剂和药物。疗效元数据主要描述治疗后的效果。
2.2.5 预后调养类元数据
预后调养类元数据包括预后、医嘱、宜忌。预后元数据是有关预测病证发展转归情况的内容。医嘱元数据是指医案中医家嘱咐患者病后调理或注意的内容。宜忌元数据定义为病证治疗过程中需要注意适用或避忌的内容。
2.2.6 失治误治类元数据
失治误治类元数据包括失治、误治。失治元数据内容是医案中记载的有关诊治不及时而拖延病情导致病证加重的内容。误治元数据内容是有关诊治不当的过程及其导致的后果。
2.2.7 评按引用类元数据
评按引用类元数据包括评按、引用。评按元数据是指对医案的评价,包括著者自评和他人评按。引用元数据是医案中关于某疗法或理论来源的信息。
3 古代针灸医案语义类型及语义关联建立
知识元内部均存在不同属性的语义类型,语义类型是构成知识元的基本要素,是知识元中完备表达单一概念的词、词组或短语,在知识元中具有不可分割性。单独的语义类型往往不能表示完整的知识,语义类型的相互关联是知识表达的关键,它们之间关联的含义,称之为“语义关联”,知识元内部和不同知识元之间均可互相建立语义关联。
语义类型与语义关联的标引是中医古籍知识组织系统化、网络化的重要步骤。近年来,学者们已经从中医“取类比象”的思维习惯及个性化语言表述特点认识到中医古籍所承载的知识与现代医学的不同。本研究为保证语义类型及语义关联模板的正确性,在团队多年基于知识元理论的中医古籍标引实践基础上,以针灸临床诊疗思路为纲,深入语境分析针灸医案素材库资料的语义成分,逐一确定针灸医案中元数据概念的语义类型以及语义间的关系,不断修正、补充、完善语义关联的构建。最终确定古代针灸医案标引模板中含有的语义类型共31个,分别为病证、病位、病性、病程、释义、病因病机、证候表现、治法、治则、部位、经络、腧穴、脏腑、疗法、操作、手法、壮数、脉象、舌象、生理、失治、误治、性别、方剂、药物、功用、疗效、宜忌、预后、书名、医家。语义关联共15种,具体关系组成如表1所示。
4 古代针灸医案知识元标引应用举例
及逻辑数据特点分析
前期由标引人员对古籍电子文本进行校对,划分书体结构后上传至标引系统,根据古籍具体内容,选择系统中的“针灸古代医案标引模板”进行知识元数据及语义的提取。现举例该模板下《针灸大成》中两则杨氏医案的知识元标引实例,并根据标引产生的半结构化数据将其逻辑关系解析为三元组形式。为处理语义关联中的部分一对多、多对多的逻辑类型,引入虚拟节点的概念将实体进行分组连接,从而生成知识图谱,可为针灸古代医案类古籍的知识元标引研究提供一定参考。
4.1 标引应用举例
例1:《针灸大成》卷之九杨氏医案第一则
医案原文:乙卯岁,至建宁滕柯山,母患手臂不举,背恶寒而体倦困,虽盛暑喜穿棉袄,诸医俱作虚冷治之。予诊其脉沉滑,此痰在经络也。予针肺俞、曲池、三里穴,是日即觉身轻手举,寒亦不畏,棉袄不复着矣。后投除湿化痰之剂,至今康健,诸疾不发。若作虚寒,愈补而痰愈结,可不慎欤!
此段内容可划分为一个医案知识体,根据内容主体,将其命名为“手臂不举案”,其余内容标引如表2所示。
在完成知识元及语义类型标引后,标引人员根据其属性选择适配的语义关联,为它们构建链接。以上标引结果可以构建“辨治关系”及“误治关系”两种类型的语义关联。具体语义关联内容与组成要素如表3所示。
医案原文:辛未岁,浙抚郭黄厓公祖,患大便下血,愈而复作,问其致疾之由?予对曰:心生血,而肝藏之,则脾为之统。《内经》云:饮食自倍,肠胃乃伤,肠癖而下血。是皆前圣之言而可考者。殊不知肠胃本无血,多是痔疾,隐于肛门之内,或因饮食过伤,或因劳欲怒气,触动痔窍,血随大便而出。先贤虽有远血、近血之殊,而实无心、肺、大肠之分。又有所谓气虚肠薄,自荣卫渗入者,所感不同,须求其根。于长强穴针二分,灸七壮,内痔一消而血不出。但时值公冗,不暇于针灸,逾数载,升工部尚书,前疾大作,始知有痔隐于肛门之内,以法调之愈。至己卯复会于汶上云,不发矣。
此段内容可划分为一个医案知识体,根据内容主体,将其命名为“痔疾案”,其余内容标引如表4所示。
以上标引结果可以构建“病因关系”“病位关系”“病证关系”“辨治关系”“引用关系”5种语义关联。具体语义关联内容与组成要素如表5所示。
4.2 逻辑数据特点分析
以上知识元标引产生的半结构化数据,可以为针灸医案的数据检索提供便利,除了提供一般的关键词全文检索外,还可以根据知识元语义检索和知识体属性组合检索,通过模糊查询的方式,根据知识导航实现知识元、知识体、语义成份之间的关联,达到知识精确检索、减少冗余的目的。除此之外,半结构化数据还可以通过实体提取、关系抽取解析等步骤,将标引产生的实体和关系生成为知识图谱。在图谱中可以用节点表示实体或概念,用边表示实体或概念之间的语义关系,从而展现不同知识体内容下的语义网络,将古籍中的隐性知识关联通过直观而丰富的形式表达出来。
如图5所示,“手臂不举案”的知识组织主要围绕该病证的辨证要点展开,该病的恶寒、困倦、喜穿棉袄、脉象沉滑等一系列症状使得医家容易将其判断为虚寒之症,故误采用补法。杨氏则判断该病病因为“痰在经络”,选针肺俞、曲池、手三里穴以疏通经络之痰湿,辅以除湿化痰之药以助针力,获得明显疗效,如误用补法则“愈补而痰愈结”。
图谱的展示形状以手臂不举这一疾病的一系列症状为核心节点展开,两侧分别以“误治关系”“辨治关系”为关键节点,连接不同治法和后果,可见杨氏记录该医案的目的是使读者明辨手臂不举伴随一系列虚寒假象的诊治思路,特地点明“沉滑”这一脉象,指出该病因在痰邪,治以化痰祛湿为要,以知识图谱形式展示的半结构化医案知识能够让读者快速把握该则医案的核心诊治思路。
如图6所示,“痔疾案”的知识组织围绕痔疾的病位、病因、证候、辨治4个部分展开。杨氏详细指出该病的病位在肛门之内,临床表现为大便下血反复发作,分析其病因在于饮食过伤、劳欲动气而触动痔窍,对长强穴进行针刺及艾灸均有明显疗效。
图谱的展示形状以痔疾这一疾病为核心节点展开,四周分别以“病位关系”“病证关系”“病因关系”“辨治关系”为关键节点,连接其诊疗思维及治疗方法要点,可见杨氏记录该医案的目的是使读者在明确痔疾的病位、临床表现及诱因的基础上,对长强这一腧穴采用不同的刺灸法来进行治疗,该图的大部分节点及关系也集中在“辨治关系”附近,以知识图谱形式展示的半结构化医案知识能够让读者快速抓取痔疾的治疗方法,医案中的“疗效”类语义也为该治疗方法提供了强有力的佐证。
5 总结与展望
知识元具有链接性特征,即知识元通过链接可以构造出新的知识体系,从而挖掘隐性知识、创造新知识。有研究者指出,中医学理论框架呈树状结构,但知识运作的方式却呈现网状结构,即知识树中的任意一点都与其他许多知识点产生横向或多向联系,可见针灸医案虽然是中医知识树中的一点,但其包含的知识信息却涉及中医理论体系的方方面面,这也与知识元的链接特点不谋而合。
近年来出现了利用知识元理论对针灸古籍和中医医案进行深度标引的探索研究,但均是先总结提练出针灸或中医的原则性诊疗思想,再结合代表性著作的内容而设立元数据标引模板,这样的模板可以降低标引难度,适配的古籍类型较多,但适配性宽泛的知识元与语义关联并不利于开展一些探索性、需要根据文献具体知识内容和语境建立不同知识关系的研究。而且较少的元数据反映了其语义文本所包含的信息量较大,文本包含信息量大,语义粒度便大,最终建立的知识网络可能具有一定局限性,不利于中医古籍的智能检索或规则挖掘等研究的开展。
本研究以针灸医案为抓手,同时以针灸临床诊疗思想和古代针灸医案的具体语境为参考,构建独属于针灸医案的知识元标引模板,在保留文本整体结构的同时构建出针灸医案文本中的隐性逻辑关系,生成的知识图谱显示知识组织完整、知识粒度较细化,说明在古籍数字化挖掘过程中,不能背离从不同类型古籍中客观收词的原则,并需基于一定语境进行深度分析,所构建的元数据和语义类型模板才能可信。
从体例与知识结构上来说,中医临证各科古籍的体例特点之一就是方论结合,针灸医案基本存在于针灸临证医籍和综合类医籍中,在针灸医案中出现的知识元很可能在书中其他论述内容里再次出现,这使得它们之间可以产生跨知识体的多向链接,这是基于知识元理论的中医古籍标引的一大特点,同时也是对标引人员和知识图谱构建人员的挑战。如何在使针灸医案内部知识组织化、系统化的基础上,让针灸医案知识与其他属性知识体内的知识进一步构建更为复杂的关联关系并清晰展示,突破知识图谱的三元组结构特征,还需要结合针灸古籍知识的丰富特征进行不断探索与完善。
从内容上来说,针、灸、中药三者历来被视为中医临床辨证施治的三大法宝,虽方法各异,但治病之理相同,针药结合是古代中医临床诊疗的常态,针灸医案中也不乏此类记载,通过对它们进行基于知识元理论的细粒度标引,有利于对针药并用适应证进行系统的总结与梳理,分析两者运用时对于疾病认识与辨证等角度的差异,有助于形成针药并用理论的完整体系,勾连针药并用之临床实践与理论构建。同时,在对不同病种的针灸医案进行标引时,根据临床需求和具体内容,着重标引带有专属疾病特点的语义类型,构建专病语义网络,会更加凸显针灸医案的临床价值,值得标引人员注意。
本研究对古代针灸医案进行了细粒度知识元标引和知识图谱构建,通过对古代针灸医案的深度挖掘、知识数字化提取与呈现,使得古代针灸医案中隐性知识显性化、各家学说系统化,对探索针灸古籍数字化的发展方向具有一定的启示,有助于构建大数据、智能化针灸古籍数据平台,以指导针灸理论挖掘及临床应用。
● 编辑 排版:罗宇婷
● 审核:徐晖
文章内容仅供思路参考,不代表本刊观点,非针灸专业人员请勿随意尝试。
购买中文杂志请先加支付宝好友
支付宝账号:zhenjiuguangfa@aliyun.com。沟通后转账。
微信原创投稿:zgzjgzh@163.com
特别说明
尊重知识产权、版权,所有精选、校排推送的论著,均以标准参考文献格式明确标识原作者及出处,若涉侵权,请联系我们删除。
因微信公号推文转载条件限定,为方便中国针灸学会“习经典”矩阵其他公号转载,标注原作者为“原创”,以示对原作者的尊重,并非本公号原创之意,请原作者、读者知悉。
公益科普传播,为同道“少走弯路”,为免针灸经典文献理论研究成“冷门绝学”,所有标注“原创”的文章均已开启“快捷转载”,所有账号均可转载此图文;真诚欢迎各位同道投稿针灸经典学习类优质文章,E-mail: 13810411860@126.com
中国针灸学会“读经典”系列活动
“习经典”微信公众号矩阵
主办单位:
承办单位:
中国针灸学会青年委员会
中国针灸学会针灸文献专业委员会
北京中医药大学针灸推拿学院
中国中医科学院针灸研究所
中国科协“鍼灸明堂”学风涵养工作室