点击蓝字
关注我们
人工智能如何与传统中医脉诊结合并应用于中医现代化
引言
“望、闻、问、切”是中医辨病辨证的主要方法,其中脉诊(切诊)占据重要位置。中医脉诊智能化作为中医诊断智能化发展的重要方向,近年来为研究热点。脉诊仪作为新兴的智能化诊断装备,主要涉及脉诊数据信息获取及辅助诊断两方面。脉诊的智能化主要集中在采脉与数据处理两个方面,采脉的难点主要集中在传感器及采集指,其数据来源以及处理方式目前行业内无统一标准,目前相关研究主要聚焦在脉图变化以及桡动脉超声方面。科学、规范、智能的数据标注方法对于脉诊仪的发展以及脉诊的标准化具有重要意义。
辽宁中医药大学李京、许斌教授团队撰文探讨了目前对于脉图的前端处理方法及人工智能、机器学习等应用于脉图数据标注的现状以及建议,以期推动中医智能化的发展,为脉诊客观化及中医现代化提供新的研究思路。原文已发表于《上海中医药杂志》2024年第10期人工智能与中医药前沿研究专栏。
专家简介
通信作者 李京主任医师
李京,医学博士,中西医结合博士后,主任医师,硕士研究生导师,首批全国中医药创新骨干人才。主要从事中医人工智能研究,中医内科疾病的临床与基础研究。主持及参与国家自然科学基金、中国博士后科学基金等国家和省市级科研项目10余项。近5年以第一作者或通信作者发表SCI及中文核心期刊论文30余篇,主编著作和教材6部,授权专利5项。兼任辽宁省细胞生物学会细胞损伤修复与组织重建专业委员会副主任委员;世界中医药学会联合会心血管专业委员会常务理事;中国医药教育协会中医药教育促进工作委员会常务委员;中国民族医药学会睡眠分会常务理事。
通信作者 许斌教授
许斌,医学博士,主任医师,教授,博士研究生导师,博士后合作导师,辽宁省名中医。现任辽宁省中医药科学院中医人工智能装备研究所所长,沈阳市中医人工智能医疗装备产业技术研究院院长;兼任中国中医药研究促进会副秘书长及中医人工智能装备分会会长,中华中医药学术流派联盟骨伤分盟副理事长兼秘书长,大医院网全国联盟主席,中国高等教育研究会外科分会副理事长,辽宁省中医药学会副会长等职务。主编及编写普通全国教育中医药类“十五”“十一五”“十二五”“十三五”“十四五”等规划教材《外科学》、《中西医结合外科学》教材9部,全国中医药行业首部蓝皮书《中医药国际交流合作发展报告蓝皮书(2022)》执行主编。主持参与国家级课题8项,省级课题9项。先后荣获国家级科学技术进步一等奖、省科学技术进步二等奖、国际科技合作奖等奖项以及全国中医院医疗管理优秀工作者、大医院网全国联盟优秀院长、中国中医药研究促进会优秀会长、沈阳市劳动模范、沈阳市五一劳动奖章获得者、沈阳市优秀科技工作者等荣誉称号。
1
脉图数据标注的特征分类
《中医诊断学》中将脉象特征要素分为8类:脉位、脉力、至数、脉律、脉长、脉宽、流利度及紧张度,任何脉的信息都可以从这8个要素进行解读。罗赞等通过对经典的28脉进行多维分析,提出脉象“八维度”的概念,即也是从8个要素客观化脉象。基于此,本研究也将以脉象的8个要素对脉诊数据标注进行探讨。
1.1 脉位
脉诊中脉动显现部位的浅深,提示不同的生理、病理状态。不同的脉位指得到的指感对应的不同的指压。费兆馥教授通过指压-指感趋势图来确定脉位的深浅,即建立横坐标为指压、纵坐标为指感的趋势图来确定脉位,具体可见图2。
图2 脉位变化曲线图
张炜对冠心病患者通过多普勒超声观测桡动脉,发现沉脉收缩期峰值流速、舒张末期血流速度以及搏动指数等血流动力学指数均高于正常脉象。
Mao等研究了基于仿生脉诊机器人的中医脉位智能检测方法,通过自研的仿生脉诊机器人收集200名受试者的10个脉搏波形数据并提取与脉位高度相关的关键特征,如脉搏峰值压力、脉搏波从开始上升到达到最高点的时间(S1)/脉搏波从最高点开始下降到结束的时间(S2)比值和体质量指数,研究发现这些特征与脉位显著相关,相关系数分别为-0.27、-0.29和-0.18。金氏脉学流派将脉动周期分为A、B、C三组,A组特点为由弱变强,B组为脉搏回落段,C组为间歇期,同时根据桡动脉轴心运动和外周流动情况分为浅、中、深以及底4个层次,其中,浅层和中层各有深浅两个层面,而底层只有浅层面。
1.2 脉力
脉力指的是脉搏的强弱,脉力分为虚实。实脉指感是有力的,虚脉指感是空虚无力的。王欣榕通过采取多种分类算法构建虚实预测模型比较正确率,最终筛选出支持向量机(SVM)算法进行虚实证的预测。纪泽云通过脉诊仪分析老年骨关节炎患者的脉图发现,其脉位多沉,脉势偏低平虚者其脉图主波高度(h1)低于对照组,脉图起点至主波最高峰处的时间跨度(t1)高于对照组。费兆馥教授利用脉象曲线的趋势来判断脉力,观察切脉压力由低到高变化时脉象趋势曲线峰值的变化,见图3。
图3 脉力变化曲线
1.3 脉长
脉长在中医诊断中指应指的轴向的范围,《中医诊断学》中对于脉长短的描述为“脉动范围超过寸关尺三部为长脉,应指不及三部,但见关部或寸、关两部为短脉”。可见对于脉长短的描述相对来说抽象,诊脉医师的主观感受较为重要。但古往今来也有对寸口脉直观长度的记载研究。《难经》中提到寸口脉长约2寸。王石等认为长脉多见于正常生理情况,短脉见于寸部被腕部韧带遮盖或尺部被肌肉脂肪掩埋。吴培通过总结既往研究提出成年人寸关尺的范围当在2.73~4.10 cm,具体长度还要参考不同个体的臂长(即鱼际横纹到肘横纹的距离),这个数值约等于其臂长的17.3%。除了直观地测量寸口桡动脉的长度,也有学者从中医诊断学的描述入手,通过测量寸口处关部及寸部的压力大小来对脉长进行描述。汤伟昌等通过测量寸上或尺下的脉搏指感强度来定义脉长短,并引入了指感阈值线(T)的观点。因为如果只是主观地感受寸口脉搏动的范围,那不同中医师的指端敏感度不一,对于同一脉象其感受到的搏动范围可能会有差异,因此汤教授通过测量寸口桡动脉搏两端即寸上或尺下超过T的个数来确定脉长短,见图4、图5。
图4 指感阈值测量短脉示意图
图5 指感阈值测量长脉示意图
1.4 脉宽
脉宽在中医理论中代表着脉动应指的径向范围的大小,与脉长类似,脉宽相对而言在中医诊断中的描述比较主观,不利于脉诊标准化的发展,因此针对脉宽客观化的研究较多。Chen等设计了一种信号采集系统,采用自调的微机电系统(MEMS)阵列式传感器采集脉搏信号,通过低通及高通滤波器及定制算法计量脉搏宽度。王钒宇等借助有限元分析方法,筛选出血管直径、血压差、皮肤弹性模量作为脉宽模型的高相关参数。还有研究通过构建位置和幅值的二维矩阵,观察插值后h1的幅值高度个数及区域来反映脉力,并计算最大主波幅值区域在纵轴(y轴)上的位点数,即可得到具体的脉宽值,见图6。
图6 主波幅值测量脉宽示意图
1.5 至数及脉律
脉率即每分钟的脉搏数,中医脉诊称之为“至数”,将其描述为“一息脉来四五至为平脉,一息五至以上为数脉,一息不足四至为迟脉”;迟脉、数脉类,主要是对脉率上的描述。《濒湖脉学·迟脉》言“迟来一息至惟三,阳不胜阴气血寒”“数脉息间常六至,阴微阳盛必狂烦”,正常人呼吸的频率为18~20次/min,迟脉和数脉的定义有一定的范围。曹淼等认为,以正常心率60~100次/min作为正常脉率,>100次/min为数脉,<60次/min为迟脉。脉律代表脉的节律,中医脉诊所说的结脉、代脉和促脉即是异常脉律的代表。沈无瑕等认为促、结、代脉象,实际上与西医学中心律失常有关联,促脉与快速房颤、不规则的期前收缩、心动过速等有关;结脉与窦性停搏、窦房传导阻滞、不规则的期前收缩等有关;代脉与规则的期前收缩、窦房传导阻滞、房室传导阻滞等有关。
1.6 流利度
流利度是指脉搏来势的流利通畅程度。流利度对应的脉象主要是滑脉和涩脉,滑脉的中医描述为如盘走珠,往来流利,应指圆滑。涩脉的中医描述为往来艰涩不畅,如轻刀刮竹。流利度的描述在中医学中较为抽象,其标注也是一个多维的过程。针对脉图来说,既往研究发现滑脉的脉图相比较于平脉其主波较为高耸尖锐,且主波中的B波与D波差距变大,中医师采脉时指感主要是来自于主波,滑脉的主波较平脉高耸且急促,反映到指感即在短时间内的剧烈的压力变化,这也能对应中医学中对于滑脉“如盘走珠,往来流利,应指圆滑”的描述。对于生理学的解释,滑脉多见于妊娠期女性,妊娠期女性的一个生理学特点是子宫和胎盘区域动静脉之间短路,因此外周阻力会变低,外周阻力变低,则左心室向主动脉射血时的阻力变低,短时间内主动脉内相比正常时被射入更多血液,则主波B波高耸急促。因此既往研究通过比较B波及D波的比值来研究脉搏的流利度。这样的比较有一定的生理学依据,但是随着三维脉搏波信息研究的发展,单纯的曲线比值似乎不太完备。也有学者通过直观地研究桡动脉来确定脉搏流利度,牛淑冬通过影像学技术发现脉搏的流利度与脉管直径、充盈血量以及血管轴心位移有关。目前三维脉图发展较为完善,在幅值及时间的基础上增加了位置这一物理量,见图7,因此在既往研究二维脉象曲线的基础上增加对于脉象位置与流利度的研究可能会有不一样的发现。
图7 三维脉图
1.7 紧张度
紧张度指脉管的紧急或弛缓程度。紧张度对应的脉象主要是弦脉和濡脉,弦脉的中医描述为“端直以长,如按琴弦”,即触摸如按琴弦般紧绷,濡脉浮细无力而软,轻按可得。王一飞通过研究脉图的曲线物理量比值来确定弦脉,并建立一种深度学习的脉象识别模型。温丽娟通过研究慢性荨麻疹的弦脉脉图特征发现脉图参数如反映动脉血管弹性的h3/h1>0.7,反映主动脉瓣功能的h4/h1>0.4,反映动脉顺应性、主动脉瓣功能或血容量的h5/h1<0.05,反映动脉管壁弹性、外周阻力或血容量的w1/t>0.2跟弦脉相关。还有研究通过纳入瞬时波强(WI)参数,实时跟踪动脉管径和动脉内平均血流流速的瞬时变化并通过公式计算多项参数来研究循环系统的动力学情况,以此表达心脏与血管之间的关系,并比较早期高血压弦脉和生理性弦脉的参数;结果发现,区分早期高血压弦脉组与生理性弦脉组的颈总动脉WI指标为压力-应变弹性系数(EP)、单点脉搏波信号传导速度(PWVβ)、硬化参数(β)、负向波面积(NA)、瞬时波强(W1),区分平脉组与生理性弦脉组的颈总动脉 WI 指标为EP、PWVβ、β、血管顺应性(AC)。对于脉搏紧张度的客观化研究,目前多采用研究二维脉图的物理曲线比值或直接对寸口桡动脉的血管特征进行研究。
2
脉图的智能化进展
2.1 脉图的前端处理
前文提到脉图作为一种重要的脉诊信息标注手段,其信号质量的高低对于后续人工智能神经网络的学习标注具有重要意义。然而由于桡动脉搏动时其周围组织及肌肉会不自主颤动等,实际测量的脉图会产生一系列的杂波,而且由于传感器对周围组织的压迫会导致反向脉图的出现。目前多采用阵列式传感器,相较于传统的单一传感器得到的特征参数更多,因此需要前端算法对脉图进行特征处理及提取,方便进一步与机器学习进行融合。Ji等提出一种基于带外源输入的非线性自回归神经网络(NARX)的脉搏采集交互模型,并利用径向基函数(RBF)神经网络设计了自适应控制策略,通过仿真实验和实验室测试,结果显示该控制系统在脉搏波采集过程中具有快速调整、较小超调和强抗干扰能力,显著提高了脉搏采集的精度和稳定性。Zou等对脉搏波的处理采用了时间序列相似度的方法,通过筛选、排序以及线性调整,生成阵列式的脉图,有效利用了阵列式传感器的空间多维特性。在滤波降噪方面,Cui等采用带通滤波器对脉搏信号消除杂波及基线漂移,对于脉搏波的定位及提取则采取香农能量包络线和希尔伯特变换方法。可以发现目前对于脉图的前端处理主要集中在滤波、降噪、去除基线漂移以及提取脉图主要特征方面,随着人工智能技术的爆发式发展,建立一种统一的脉图信号处理方法对于与神经网络深度融合具有积极的意义。
2.2 机器学习(ML)、神经网络(NN)与脉图数据标注的融合
随着人工智能技术的发展,神经网络、机器学习与中医脉诊的结合成为了可能,其主要采用的算法模型包括基本ML算法、NN算法以及集成学习算法三大类。见表1。
表1 不同算法分类比较
基本的ML算法主要依赖于人工提取的脉搏特征作为输入信息来构建脉象分类模型。然而,由于脉搏信号的复杂性,人工提取的特征难以全面反映脉搏信号的多维特性,可能导致部分细节信息的丢失,高效的ML模型训练通常需要大量标注数据。在脉象分类中,获取大规模、高质量的脉搏数据集可能具有挑战性,数据不足会影响模型的性能和泛化能力。此外,基于有限特征参数训练的脉象分类模型缺乏中医个性化诊断的特点,若要进一步应用于临床或实现个性化医疗的商业化生产,还需改进算法和方案。
相比之下,NN算法能够通过自学习特征来建立分类模型,减少对人工特征的依赖,从而有效提升分类效果,并为脉象分类模型的构建提供了新的方向。卷积神经网络(CNN)等深度学习模型,能够在大规模数据集上进行训练,从而捕捉脉搏信号的复杂模式和细节特征,提高分类精度。然而,NN通常被认为是“黑箱”模型,难以解释其内部工作机制,虽然NN算法可以提供高准确度的分类结果,但医师难以理解模型的决策依据,并且脉象数据中的异常值或噪声可能导致模型的误分类,因为NN算法可能会过度拟合这些异常数据。NN算法的性能高度依赖于参数的选择和调试,包括学习率、网络结构、激活函数等,参数选择不当可能导致模型训练失败或性能不佳,需要大量实验进行参数优化。
集成学习算法通过整合多个基础学习器,提升了模型的泛化能力和稳定性。典型的集成学习方法如提升树(boosting tree),通过组合多个分类器的结果,减小单一分类器的偏差和方差,提高整体分类性能。在脉象分类的研究中,集成学习算法展现了显著的优势,通过融合人工提取和自动提取的特征,实现了更高的分类准确度。然而,选择合适的集成策略(如bagging、boosting或stacking)和基学习器的组合,需要丰富的经验和实验,不同的集成策略和基学习器组合可能对不同的数据集和任务有不同的效果,选择合适的组合需要大量的实验和调试。其计算资源需求高、模型复杂性增加、难以调试和优化等缺点也限制了其在某些场景中的应用。
3
讨论
本文探讨了脉诊智能化设备中的数据标注问题,重点关注脉象特征标注的科学性和理论契合度。由于中医脉诊理论的表述较为抽象,数据标注容易出现“心中易了,指下难明”的困境。我们认为,基于桡动脉生理特征(如血管直径、血流速度等)的标注方法客观且直接,与人体生理病理联系紧密,但与中医脉诊理论契合度尚待提高。二维脉图的标注具有科学性,因其反映了桡动脉搏动在寸口皮肤处的幅值,符合中医脉诊理论的源头,即对于脉搏的直观指感体验。然而,随着技术的发展,三维脉图逐渐成熟,能够在二维基础上体现更多的桡动脉搏动信息,如脉管的三维运动等,其兼具脉图及桡动脉超声的优点。因此,本文提出从三维脉图入手研究脉诊数据标注的意义,以期为脉诊智能化的发展提供新的思路。
3.1 脉图数据标注存在的问题与解决方案
脉图数据标注存在的问题:①传感器的种类繁多,包括电容式、压阻式、压电式和复合式等,缺乏统一标准,不同传感器获取的脉图特征信息是否能满足后续处理要求存在不确定性;②采集指需模仿中医师的取脉手法,包括“举、按、寻”和“总按及单按”,以及采用“中指定关”法确定位置,但取脉压力、顺序、接触皮肤面积和角度缺乏行业内统一标准;③中医脉诊较为主观,供机器学习的临床数据集的脉诊结果是否能得到中医行业内的一致认可存在疑问。为解决上述问题,建立行业内规范化的标准是必要的,标准内容应包括传感器的材料选择、采集指的取脉手法和位置、脉搏波信号的前端处理以及三维脉图的标注特征提取方法等。此外,鉴于脉诊判断的主观性,建立能得到行业认同的判定专家组也是必要的。
3.2 脉象分类算法模型存在的问题与解决方案
为了解决当前脉象分类算法模型存在的问题,并进一步提升其在临床应用中的可行性和有效性,如下措施可供参考。①算法优化与创新:结合CNN和递归神经网络(RNN)的优势,开发混合模型,自适应地提取和学习脉搏信号的多维特征,增强分类效果;引入可解释性人工智能(XAI)方法,设计透明化的NN结构,提供模型决策的可解释性,提升医师对模型结果的信任和理解。②参数优化与调试:利用自动化机器学习(AutoML)技术,自动搜索和优化模型参数,包括学习率、网络结构、激活函数等,提升模型训练的效率和效果;采用多任务学习框架,结合脉象分类与其他相关任务(如病症预测、治疗效果评估)共同训练模型,提升模型的泛化能力和稳健性。③集成学习策略:开发动态集成学习算法,根据数据特征和任务需求,动态调整基学习器的选择和组合策略,提高模型的适应性和分类性能。结合bagging、boosting和stacking等多种集成策略,构建多层次、混合型集成模型,充分利用不同算法的优势,实现更高的分类准确度。
综上所述,未来脉象分类标注算法的研究应注重数据收集与预处理的标准性、算法优化与创新、参数优化与调试、集成学习策略的应用等方面的改进。通过研制统一标准的脉搏采集相关装置以及建立多中心、高质量、多类别的脉象数据集,结合中医学理论与现代ML技术,开发更加准确和高效的脉象分类模型,可为中医脉诊提供科学和客观的依据,推动中医智能化的发展。
【引用本文】
衣凯,张梦笛,郭沈,等.中医脉诊智能化设备数据标注的研究述评[J].上海中医药杂志,2024,58(10):5-10.
YI K,ZHANG M D,GUO S,et al.Research review on data annotation for intelligent pulse diagnosis devices in traditional Chinese medicine [J].Shanghai J Tradit Chin Med,2024,58(10):1-4.
作者:衣凯,许斌,李京等
编辑:黄博韬
排版:BU 会
新媒体编辑:徐天
新媒体审校:岳备
往期链接
1. 面向未来:人工智能技术在中医术语智能化、标准化研究中的应用
2. 从循证中医到智慧中医:自动系统评价技术和中医快速循证决策
3. 快来围观!人工智能如何在中医穴位定位技术中应用?
上海中医药
▇ 扫码关注我们
点击“分享”,共享更多中医药前沿