网络首发 | 大模型“涌现”视域下的智能健康医疗知识管理体系变革与创新发展

文摘   2024-09-23 08:03   湖北  


网络首发时间

2024-09-20

网络首发地址

https://link.cnki.net/urlid/42.1085.G2.20240920.0902.002

引用本文

顾东晓,赵旺,王晓玉,汤志伟,朱凯旋.大模型“涌现”视域下的智能健康医疗知识管理体系变革与创新发展[J/OL].图书情报知识(2024-09-20).

https://link.cnki.net/urlid/42.1085.G2.20240920.0902.002

Photo by Unsplash+ in collaboration with Alona Savchuk on Unsplash.


顾东晓  赵旺

合肥工业大学管理学院,合肥,230009

合肥工业大学数据科学与智慧社会治理教育部哲学社会科学实验室,合肥, 230009

王晓玉

安徽中医药大学第一附属医  院,合肥,230031

汤志伟

电子科技大学公共管理学院,成都,611731 

朱凯旋

合肥工业大学管理学院,合肥,230009

合肥工业大学数据科学与智慧社会治理教育部哲学社会科学实验室,合肥, 230009




目的 | 意义

_

大模型的“涌现”正在重塑健康医疗知识体系和知识管理方式,亟须深入探讨该现象与特征对健康医疗领域知识体系的重大影响、演化路径、管理方法与前沿应用。


研究设计 | 方法

_

通过全面分析大模型的“涌现”现象与特征,以此作为大模型“涌现”视域系统梳理健康医疗知识体系的组成要素和演化形态。在此基础上,提出大模型“涌现”视域下的健康医疗知识动态管理框架,并总结健康医疗大模型前沿领域的发展展望。


结论 | 发现

_

从大模型的“涌现”视域揭示了健康医疗知识体系三大要素之间以及体系内外部之间的相互作用与动态转化关系,提出了对应的动态健康医疗知识管理框架。


创新 | 价值

_

揭示了大模型“涌现”对于健康医疗知识体系与管理方式的潜在影响,提出了大模型“涌现”视域下健康医疗知识管理新模式。


关键词

_

大模型;涌现;健康医疗;知识管理;诊疗决策








_

1

引言


_


科学技术是第一生产力,是驱动管理变革的关键力量。信息技术作为现代科技不断发展演进,加快了人类迈向智慧社会的步伐,也推动着知识管理方式变革和服务模式创新发展。特别是在健康医疗领域,知识管理从依赖纸质案例到信息系统进行组织,极大地提升了对医疗服务的精准和可靠知识支持。然而,尽管这些进步卓有成效,但大多数知识管理系统仍旧处于静态,缺乏实时更新和交互功能,这限制了知识有效利用和动态管理的可能性。


随着人工智能的发展迈向通用人工智能时代,特别是大模型 “涌现”的到来,为健康医疗知识管理方式带来颠覆性的变革。研究发现,在大模型的快速迭代过程中,大模型规模的量变会导致其行为的质变,出现“涌现”的现象。这种现象能够为健康医疗领域带来革命性的变革,首先,大模型的“涌现”能够突破传统健康医疗领域新知识的获取能力。例如,大模型“涌现”出的多模态对齐的能力能够灵活地理解和处理以往无法应对的非结构化与多模态数据,生成人类之前无法获取的知识。其次,“涌现”现象在健康医疗领域复杂问题的决策流程中“涌现”出流程化管理的潜力。例如,针对医学文本转表格问题,大模型会首先列出解决问题的逻辑步骤,并按步骤进行有序处理和输出。这意味着知识管理的主体可以由医疗专业人员变为大模型,提供复杂问题知识管理的流程构建与优化功能。此外,大模型的“涌现”也能够成为健康医疗知识生产的新的一环,根据现有的通用医学知识和用户的交互指引提供再加工的成熟可靠知识。同时,大模型的“涌现”还可能为健康医疗领域带来新的风险与挑战。例如,“涌现”本身的不可预测性、偏差和不确定性等特征,可能会在健康医疗领域产生偏见与歧视、伦理与责任等问题,这些问题同样值得进一步讨论与分析。


本文拟以大模型的“涌现”为视域研究大模型时代下健康医疗知识管理的动态组织、精细获取、自动管理、可交互以及安全可靠问题。通过全面分析大模型“涌现”现象与特征,系统梳理大模型“涌现”视域下健康医疗知识的组成要素和演化形态,揭示“涌现”对健康医疗知识体系带来的潜在风险和挑战。在此基础上,设计面向大模型“涌现”的安全可靠健康医疗知识动态管理模式,并发掘大模型“涌现”本身在健康医疗领域潜在应用和挑战,为大模型时代健康医疗知识管理提供理论基础、实践方式与前景展望,推动大模型 “涌现”在信息资源与信息管理领域的理论创新与发展应用。



_

2

大模型的“ 涌现 ”现象与特征


_


2.1   大模型的“涌现”现象


“涌现”是复杂系统中的核心特征,引起了科学家们强烈的兴趣。根据维基百科的定义,“涌现”是指系统中许多小实体相互作用后产生大实体,而这个大实体展示出组成它的小实体不具备的特性。简而言之, 即1+1>2的现象。在物理、生物和计算机科学领域里,“涌现”现象被广泛探讨。


中国科学院院士陈润生指出,大语言模型中存在“涌现”现象。简而言之,大模型的“涌现” 是指在处理大量数据时,能够自主地学习、理解、发现和生成新内容,处理新问题的能力。这种能力并非由预先写定的代码指令所指定,而是从海量数据中学习到隐含模式和关系所获得。这种现象的出现是因为模型规模的量变导致其行为的质变。具体来说,是指当模型突破某个规模时,模型性能显著提升,表现出让人意想不到的能力。例如,语言理解能力,生成能力,逻辑推理能力等。


2.2   大模型“涌现”特征分析


目前对于大模型的“涌现”研究主要集中在对“涌现”是否存在、哪些因素导致以及表现特征的探究,而对于“涌现”视域下健康医疗知识管理体系与方法支撑缺乏针对性的分析和理解,有必要结合大模型的现有理论、方法以及表现性能来综合分析大模型“涌现”出的特征,从而把握大模型“涌现”视域下健康医疗知识管理的发展逻辑和方向。


基于现有的文献基础,本研究梳理了对健康医疗知识管理体系存在变革性影响的“涌现”出的特征,包括泛化能力、创造能力、隐含知识表达能力、复杂推理能力、归纳能力、意图理解能力、即时学习能力、知识迁移能力以及语言交互能力。它们的具体解释以及示例可以参考表1。这些能力共同推动现在的健康医疗知识管理进入崭新的时代――交互式动态知识管理时代。



_

表1   健康医疗知识管理场景下的大模型“涌现”特征分析


_


然而,与其他科学领域中的复杂系统“涌现”现象一样,大模型的“涌现”也具有复杂性、自发性和不可预测性等特点,表现出其内部复杂计算和学习过程的不可透明性、自发的知识获取能力,以及其发生时间的难以预测性。这些特性不仅赋予大模型在众多应用领域中的强大潜力,也为其在医疗知识管理过程中带来了新的不确定性挑战。



_

3

“涌现 ”视域下的健康医疗知识体系


_


大模型的“涌现”现象在健康医疗领域已经彰显出令人满意的潜力。例如,在糖尿病诊断方面,大模型通过学习大量医疗数据,能够自动识别患者病症,提供初步诊断意见。在医疗知识发现方面,大模型可以分析和总结海量医学文献和在线社交媒体数据,发现新的医学知识和趋势,为临床研究提供支持 。同样地,在患者支持方面,通过分析患者反馈和健康数据,大模型可以提供个性化的支持和管理服务,增强患者的医疗体验。这些应用场景展示了大模型“涌现”现象在健康医疗领域的广泛影响。然而,大模型“涌现”在以知识为核心的健康医疗领域的影响还未被深入探究。因此,有必要进一步研究其在健康医疗知识体系和知识管理中的应用及影响,以更好地理解“涌现”视域下健康医疗知识管理的发展逻辑和方向。


2022年1月,杨善林院士团队在《管理世界》上发表的文章《健康医疗大数据驱动的知识发现与知识服务法》,首次理清了健康医疗领域知识要素,将健康医疗领域的知识划分为通用医学知识、案例知识和推理知识。第一类是诸如医典、医学书籍、诊疗指南、临床路径等的通用医学知识,第二类是蕴含丰富专家知识的健康医疗案例知识,第三类是通过各种智能算法挖掘而获取的健康医疗推理知识。


然而,随着通用智能在健康医疗领域的快速应用,大模型的“涌现”逐渐成为健康医疗领域中知识生产的重要一环,同时也加速了健康医疗领域的数据和知识的高效利用与快速流通,并随着知识存储、处理与利用平台的发展成为人类知识的媒介与载体。然而,其内部计算和学习过程的不透明性、自发性和时间的不确定性也引发了知识更新过程中潜在的风险。在此背景下,健康医疗领域下的知识组成要素和形态正在潜移默化地发生变化,知识生成过程中的潜在挑战也悄然形成,共同塑造了“涌现”视域下的健康医疗领域新的知识体系与形态。如何安全可靠地开发利用新体系与形态下的知识,实现大模型时代下的健康医疗知识管理全面转型,不仅需要厘清“涌现”视域下的健康医疗领域知识要素,并阐述其潜在的形态演化规律,同时也需探讨“涌现”本身在医疗知识管理中的潜在挑战,确保应用的决策透明、安全可靠,并明确伦理规范与责任归属。


3.1   “涌现”视域下的通用知识演化


传统的通用医学知识主要是指包括医典、医学书籍诊疗指南、临床路径等医学通用知识,这类知识具有高度标准化与普遍接受度,能够为医护人员提供广泛的健康医疗背景信息、疾病知识、治疗方案和临床指导。


而“涌现”视域下的通用知识的演化则由缓慢沉淀、低效利用的状态转向快速转化、高效利用的状态。具体来说,以往通用医学知识的形成过程主要是由专家们通过大量的实践经验收集、抽象与总结形成行业内统一共识,这种形成过程是需要专家们经年累月去发现、思考和论证,费时费力。而随着大模型的广泛学习与理解医学文献,通过大模型“涌现”出的特征,事实知识和推理知识正在加速转化成通用医学知识。除通用知识的加速转化之外,通用医学知识也被内化成大模型内部复杂的参数,成为具有对话式简便交互工具的知识基础。相较于以往的规则利用等方式,大模型“涌现”出的交互式知识利用的方式可以主动结合用户意图来个性化利用相关知识解答健康医疗专业问题。


3.2   “涌现”视域下的案例知识


传统的案例知识主要指融入临床案例专家经验的健康医疗案例知识。这类知识包括了患者的基本信息、主诉、检验检查以及诊断治疗用药等信息,融入了对特定案例的特定专家的见解与经验总结,具有高度个体性和特异性。健康医疗领域旨在把这类基于患者情境的特定专家知识进行症状匹配,从而获得来自于相似案例的知识见解。


从“涌现”视域观察,案例知识的演化从依赖于属性特征不足的信息匹配及存在结果偏差的推荐,转变为患者多模特征深度理解及个性化无偏差推荐机制。大模型在不同病例中学习、比较与总结,能够产生不同于匹配算法所得到的更加深入见解,还能针对相似案例之间的细微差别进行个性化的推荐与解释。在此背景下,案例知识不再具有信息不足、语义有偏差等方面的潜在劣势,而是体现出患者多模特征深度理解和个性化知识调用的趋势。


3.3   “涌现”视域下的推理知识


传统的推理知识主要指基于各种智能算法挖掘而获取的知识。这类知识具有隐匿性和预测性,需要从在大量数据中挖掘潜在的模式、趋势和关联,从而预测得到知识,增强提高医疗知识精准性。


大模型“涌现”的出现,加速扩大了健康医疗智能推理知识的边界,由以往的点线面推理知识联结为健康医疗知识体系。以往由统计学习,机器学习等方法所发现的知识呈零散状态,发现的速度非常慢,这导致了推理知识的范畴不大,体系不完善。而大模型通过在广泛的医学领域内学习和模拟人类专家的推理过程,逐渐形成了解决复杂医学问题的能力。这包括但不限于疾病诊断、治疗方案的选择、药物相互作用的预测等。通过综合利用通用医学知识和案例知识,大模型能够进行复杂的医学推理,并生成可靠的建议和解决方案。这些建议和方案是由模型发现和生成的推理知识,它们能够综合通用知识和案例知识形成完整的“涌现”视域下的健康医疗知识体系。


3.4   “涌现”视域下健康医疗知识要素的关系


基于“涌现”视域下的知识演化分析,本文构建了“涌现”视域下的健康医疗知识体系(如图1所示)。从左边来看,大模型在大规模数据中通过抽象性学习的训练表现出“涌现”现象,自发地“涌现”出泛化性、创新性、隐含性、深度推理性、抽象性、即时性、适应性、交互性以及不可预测性等特征。这些特征共同促使大模型的“涌现”效应对以往的健康医疗知识体系产生吸纳、演进与整合等新变化。首先,从外部的知识来源进行吸纳新的健康医疗知识。这些外部的知识来源分别来自于数据科学、人工智能、智慧公卫、生物信息学、认知科学以及其他学科。为了形象化表示以上所有学科汇集到健康医疗知识体系中,图示中以虚线圆形表示可渗入的知识体系边,以橙色圆形表示的每个学科渗入到虚线圆中,表达每个学科与健康医疗的交叉领域知识正在受到大模型的“涌现”效应的影响被吸纳进入健康医疗知识体系中。而且每个学科互相之间又有交叉的领域。例如,认知科学和人工智能之间存在脑机接口和元宇宙的交叉学科领域。这些独立的、交叉的学科领域提供的先进的健康医疗知识也能够通过大模型“涌现”出的特征高质量、高速度和高可信地被吸纳进入健康医疗知识体系中。其次,这些知识互相之间可以相互演进,从而变成对应的知识类型。图示中理论知识、专家经验和智能推理知识分别代表了通用医学知识、案例知识和推理知识的核心,他们之间通过经验总结转化、发现与丰富的方式互相转化与演进。例如,案例知识作为理论知识可以通过“涌现”出的隐含和深度推理能力变成新的通用医学知识,同时也可以通过“涌现”出的抽象能力产生新的推理知识。三者在“涌现”出的特征下不断相互演化。最后,由“涌现”视域下演化而来的新通用医学知识、新案例知识和新推理知识构成了“涌现”视域下健康医疗知识体系。这一体系有三点重要的形态演化路径:



_



_
_

图1   “涌现”视域下健康医疗知识体系组成要素及形态演进

_


其一,从体系内部来看,以上三类知识彼此独立又相互依赖。独立之处在于分别聚焦在理论知识、专家经验和智能推理三个独立区域,而依赖之处在于案例知识中的经验总结可能被纳入通用医学知识的指南中,而推理知识的生成可能基于通用医学知识和案例知识的分析。此外,推理过程中得到的新见解可能反过来丰富案例知识库和通用医学知识。三者相辅相成,为健康医疗提供质量保障和知识创新。


其二,从体系外部来看,大模型“涌现”出的持续学习和自我更新能力确保了知识体系能够不断吸纳外部最新的跨学科研究成果,如将生物信息学、遗传学和人工智能等领域的最新进展整合到医学知识体系中,进一步丰富和完善了健康医疗领域的知识架构。这种跨学科的知识融合为解决复杂的健康医疗问题提供了新的视域和方法。


其三,从体系整体来看,在大模型“涌现”视域下,健康医疗领域的知识体系正朝着更加动态、整合和智能化的方向演进。这种演进不仅提升了知识的可访问性和应用性,还推动了医学知识从静态的信息向动态的、可交互的智能服务的转变。大模型“涌现”对健康医疗知识管理的影响延伸到人工智能和人机交互的更广泛领域,促使研究人员和开发人员提高它们的能力并应对相关挑战。


3.5   “涌现 ”视域对健康医疗知识体系的潜在挑战


大模型的“涌现”虽然带来了诸多益处,但其复杂性、自发性和不可预测性也对健康医疗知识体系带来了潜在的挑战与负面影响(如图2所示)。当模型参数达到一定量级后,大模型在少样本学习、多步推理、指导生成以及结果评估方面表现出“涌现”现象。然而,不可预测性仍然是其重要特征。在具体任务层面的表现和结果往往难以预见,这种不确定性可能为健康医疗知识体系带来知识偏差、模型鲁棒性、偏见与歧视,以及责任方面的挑战。



_



_
_

图2   “涌现”视域下健康医疗知识体系的潜在挑战

_


(1)知识偏差与误导:大模型在训练过程中可能会继承和放大训练数据中的偏差,这些偏差在“涌现” 过程中可能会导致错误的医疗知识和建议进入到新的健康医疗知识体系中,从而引入潜在的医疗安全风险。例如,模型可能会基于不平衡的数据,误导对某些疾病的诊断和治疗。这种偏差可能影响临床决策,带来健康风险。


(2)模型的鲁棒性与可靠性:大模型在处理复杂医疗任务时,其“涌现”本身的不可预测性可能导致不一致的结果,这对医疗知识体系的鲁棒性和可靠性提出了潜在的挑战。例如,在应对罕见疾病或特殊病例时,“涌现”视域下的医疗知识体系可能无法提供一致和可靠的建议,从而无法实现基于大模型的健康医疗智慧服务。


(3)偏见与歧视:大模型依赖于可能存在偏见的数据上进行训练,其“涌现”出的能力和结果可能产生或加剧社会、文化、性别、种族等方面的偏见与歧视。同时,由于其本身具有不透明性问题以及其所表现出的知识偏差与鲁棒性问题,也可能会导致医生或患者对医疗系统的不信任,进而影响健康管理结局。


(4)伦理与责任划分:在医疗决策中,当大模型的诊断或建议出现偏差和错误时,会带来潜在的医疗风险和事故。为了避免风险和事故的发生,需首先明确医务人员、开发者和模型的决策与责任边界,进而在决策和责任范围内执行安全可靠的决策。


为此,“涌现”视域下的健康医疗知识体系还需要针对以上四个层面的复杂问题,积极应对数据隐私保护、提高模型透明性、减少偏见与歧视、明确责任划分等挑战,确保大模型在健康医疗领域的应用安全、可靠。



_

4

“涌现”视域下健康医疗知识的

动态管理


_


以往健康医疗知识管理模式具有知识区域之间静态独立、知识范畴固定以及知识简单指令管理等特点,不再适用于大模型时代健康医疗知识管理的需要,有必要重新梳理“涌现”视域下知识管理的新逻辑,设计和开发“涌现”视域下的健康医疗知识动态管理框架,从而支撑“涌现”视域下健康医疗知识体系的高效利用和快速流通。另外,大模型“涌现”对健康医疗知识管理也带来了不可避免的风险和挑战,新的“涌现”视域下的知识管理模型不仅要考虑利用大模型“涌现” 去开发新的动态转化、更新和自动规划的知识管理框架,更需要针对“涌现”潜在风险与挑战设计和开发更加安全、可靠的不确定性管理和责任划分机制,从而保障“涌现”视域下的动态知识管理安全可靠。


4.1   融合In-context prompt与知识图谱、案例推理的知识再组织方法—从静态独立到动态转化


在与诊疗相关的医院业务系统中,如HIS(Hospital Information System)、LIS(Laboratory Information System)和CDSS(Clinical Decision Support System) 等,海量知识蕴藏于大量的静态医学文档中,难以有效实现动态循环和有效利用。然而,健康医疗诊疗决策对知识具有强依赖性,需要针对复杂多变场景下的特定决策信息需求开展动态知识组织、挖掘、推荐和服务。


大模型“涌现”出的特征能够在现有知识库基础上,根据具体任务再加工创造出成熟可靠的精准知识。具体来说,医学知识图谱是由医学专家构建的事实知识,它耗费人力物力但准确度高。而大模型“涌现”具有响应速度快,知识面广泛等优势,但是事实知识准确度不高。两者相互结合能够形成优势互补产生事实知识转化为通用知识的合力,成为大模型时代通用知识形成的新思路。除了知识图谱之外,健康医疗案例作为具有特定患者病症情境的准确专家推理知识,也能够成为弥补大模型幻觉的重要知识基础。大模型的“涌现”出的特征之一,就是可以使用设定好的prompt表达具体的知识融合指令,结合健康医疗知识图谱、案例知识结合,指导大模型进行有效的知识融合、组织与创造生成。


为此,本文在梳理“涌现”视域下医疗知识体系的基础上,针对该体系的知识融合再组织视角,充分利用大模型“涌现”出的即时学习特征,设计了一种融合In-context prompt与案例推理的知识再组织方法,来支撑大模型时代下健康医疗领域的知识融合、再组织和创造生成。如图3第一行矩形橙色块所示,该方法主要包括案例prompt的生成模块、健康医疗知识库检索模块、健康医疗知识图谱检索模块以及大模型推理模块。


在该方法中,设案例库(Case base)C 为(S,I,D), 其中S 为患者症状,I 为检验检查结果,D 为专家诊断结果; 知识图谱(Knowledge Graph)G 为(Er,R,El), 其中Er为知识根节点,例如症状、检查,El 为知识叶节点,例如发热、胸部发炎等,R为知识节点之间的关系,例如“属于”“相互并列”等关系。新案例(Query)Q为(SQ,EQ),Q ∉C。大模型为LM。案例Prompt的生成 模块使用新案例从案例库中检索到最相似的两个案例C1和C2和对应案例的知识图谱G关系与实体组合,然后共同输入到LM中生成针对新案例特定的个性化Prompt,C1,C2  ∊ C。


然后,将Prompt和新案例组合作为输入,输入到大模型进行个性化深度推理。


通过“涌现”出即时学习能力的In-context Learning方法,对案例推理的任务进行学习与总结,能够形成一个具有案例推理任务的prompt推理器,再加上检索到的相关的事实知识信息,输入到大模型可以产生个性化的推理知识,从而完成通用知识、案例知识和推理知识的融合再组织。


4.2   基于多模对齐的知识更新方法—从已知知识到隐性知识获取、知识更新


与诊疗相关的医院业务系统,往往知识的获取依赖预定义的规则和模式来处理数据获得知识,知识范畴仅局限于现有的知识总结和利用,且知识的更新也是周期性的或者需要人工触发的。深度学习模型虽然能提取非结构化多模态数据的潜在抽象特征,但无法 “涌现”出多模态数据中蕴含的以往无法识别的对齐知识。医学大模型(Medical-LM),特别是以CLIP为代表的涵盖文本、图像、视频、音频、分子结构等超过单个模态知识的大模型,是经过大规模特定医疗领域数据无监督预训练的模型,借助其“涌现”出的特征,可以更加深入和灵活地理解和处理这些复杂的数据类型,生成更多人类之前无法获取的知识,为决策提供多重证据支持。


为此,本文在梳理“涌现”视域下医疗知识体系的基础上,针对该体系的知识获取视角,设计了一种基于健康医疗多模态数据的特征对齐知识获取方法,来支撑大模型时代下健康医疗领域的知识获取与更新。该方法主要包括:图像特征提取模块,文本特征提取模块和图像文本信息融合模块。


如图3第二行矩形蓝色块所示,该方法的输入分别是患者的电子病历文本inputtext和影像输入inputimage,以及其他模态输入inputother_modality。方法的文本特征提取模块主要是利用预训练好的文本编码器Encodertext,图像特征提取模块是使用预训练好的图像编码器Encoderimage,其他模态使用相应的模态编码器 Encoderother_modality,通过获得文本、图片和其他模态的深层次特征表达,然后使用相似度矩阵乘法的方式实现文本、图像和其他模态的信息对齐。



_



_
_

图3   “涌现”视域下的健康医疗知识动态管理框架

_


大模型“涌现”出的归纳能力产生出的这部分信息对齐知识是人类以往无法获取到的新知识,它既可以作为模型推理知识以一种简便、快捷的方式为特定的健康医疗问题提供精准可靠的决策知识,又能够通过大模型的自我解释和专家的实践与论证可以精炼成相应的通用知识和案例知识,实现从已知知识到隐性知识获取、知识更新。


4.3   基于思维链的知识管理流程优化方法—从简单指令到自我规划


与诊疗相关的医院业务系统的知识管理主体是人, 知识管理的流程相对固化,无法形成灵活自动化的知识按需动态管理。大模型时代,特别是以思维链(Chain  of Thought, CoT)为代表的大语言模型“智能涌现”出的强大逻辑推理能力,能够让大模型在健康医疗领域复杂问题的决策流程中“涌现”出的流程化管理与优化的潜力。在大模型“涌现”的驱动下,CoT的流程管理能力加之大模型超强的概念推理能力,能够为医疗专业人员提供复杂问题多步骤知识管理的流程构建与优化功能。CoT除了增强大模型的推理能力外,还增强了大模型结果的可解释性、可控性和灵活性,这些性质非常符合健康医疗中自动化知识管理的需求。


“涌现”视域下的健康医疗中的知识管理主要是根据用户在健康医疗场景中的需求动态演化感知实时需求信息,并主动分析知识服务任务再到动态持续性的知识推理、发现和推荐的知识服务流程。为此,本文在梳理“涌现”视域下医疗知识体系的基础上,针对该体系的知识管理全流程视角,设计了一种基于思维链的知识管理流程优化方法,来支撑大模型时代下健康医疗领域知识的全流程管理。如图3第三行矩形黄色块所示,该方法主要包括:大模型CoT prompt生成模块和大模型多知识管理任务推理模块。


大模型CoT prompt生成模块主要是以大模型为知识管理主体的流程生成模块,它接受来自特定健康需求,医疗知识发现,健康医疗知识管理和动态持续性更新等知识管理需求,从而组织和优化具体执行推理的流程。而大模型多知识管理任务推理模块主要是根据以上的大模型CoT prompt生成模块所生成的CoT流程逻辑进行逐步推理,并将推理结果传入给下 一层推理层,从而自动化地完成整个复杂健康医疗知识管理的具体需求。


在该方法中,X为输入的健康需求和相应医疗知识的组合,Y为大模型输出的推理结果或知识管理决策。 则LLM利用COT方法的推理过程可以表示为寻找一个最优化的输出Y*,使得条件概率P(Y│X)最大化:


其中,条件概率P(Y│X)可以进一步分解为一系列步骤S1,S2,…,Sn的概率乘积,每个步骤Si代表了推理过程中的一个中间思考或知识整合点,这些步骤共同构成了整个推理链:


4.4   基于可解释的“人在回路”决策方法—从不可预测到安全可靠


大模型的“涌现”本身在具体任务层面上具有不可预测性,这种不可预测性为“涌现”视域下的健康医疗知识体系带来了知识、模型、决策和应用层面的潜在的问题和挑战,需重视数据隐私、伦理责任和模型解释性等挑战,确保大模型在医疗领域的应用安全、可靠和有效。为此,本文基于“涌现”视域下医疗知识体系的构建基础上,针对大模型“涌现”不可预测性对该体系带来的偏差和不确定性,设计了一种基于可解释的“人在回路”决策方法,弥补潜在的知识偏差和不一致性,从而安全可靠地支撑以上大模型时代下健康医疗领域知识管理方法。


如图3第四行矩形紫色块所示,该方法主要包括:基于“人在回路”的模型验证和校准方法与大模型推理过程自解释方法。“涌现”本身的不可预测性具体表现为“涌现”偏差和“涌现”的不确定性,这两个具体的特征可能导致大模型出现潜在知识偏差和不一致性问题,从而导致用户对大模型的结果产生偏见与歧视、责任认定的问题。为了切实解决大模型“涌现”带来的知识偏差、不一致性和责任认定问题,提出“人在回路”的模型验证和校准。该方法在决策的最终节点引入健康医疗专家,采用人机结合的验证方法和校准技术,可以减少模型输出的偏差和不确定性,从而消除由大模型引起的风险与责任争端。另外,针对偏见与歧视问题,引入大模型推理过程自解释方法。通过思维链工具促使大模型分步骤地显示表达自身的内在推理过程,以自然语言表达的透明方式帮助医生理解模型的诊断依据,从而使医疗专家能够理解和解释模型的决策过程,提高医疗知识体系的可信度和安全性。



_

5

“涌现”视域下健康医疗知识大模型的

典型应用


_


针对“涌现”的特征分析结果,本文构建了“涌现” 视域下的健康医疗知识体系。同时在此体系下搭建“涌现”视域下健康医疗知识管理的方法框架以支撑知识体系高效利用和快速流通。该套以“涌现”视域下的方法框架和知识体系能够支撑复杂的健康医疗场景的典型应用,例如医疗决策、中医诊疗与药物服务。为了印证“涌现”视域下的知识体系和方法框架在健康医疗行业领域的实际应用的有效性,本文以医疗决策、中医诊疗两个典型案例为应用场景,深入分析“涌现”视域下大模型在典型场景中的作用原理、服务模式与场景。


5.1   智慧医疗决策知识大模型


为了揭示“涌现”视域下新的知识管理模式在智慧医疗决策场景中的普遍应用,并推动“涌现”视域下新的知识管理模式在智慧医疗决策场景的前沿应用,本文借助WiNGPT大模型的技术特征,揭示“涌现”视域下知识管理模式在智慧医疗决策场景的潜在影响和变革潜力。


WiNGPT 是一款由卫宁健康公司发布的面向临床医疗场景中的多模态对话大模型,它主要通过收集大规模的通用文本数据和医疗文本数据来预训练大模型,再收集专家标注的指令微调数据集,在精细化的专家知识中进行精细调优。它的模型架构主要采用的是将DSVL图文拼接方案与LLava两阶段方案融合,并舍弃 DSVL中的多模态因果注意机制(MMCA)。图像层方面,采用LLava模型方案,增加LayerNorm 层,使模型保持训练时稳定性,促进收敛加快。如图4所示,模型经过两阶段的训练。第一阶段:冻结图像层和大语言模型(LLM)层,仅训练投影层(projection layer),投影层由两个Linear layer和一 个LayerNrom组合而成;第二阶段:冻结图像层,仅微调投影层和大语言模型层。经过两阶段的微调,大模型不仅学习到了临床医疗中的通用知识,还学习到了具有专家标注的精细化专家经验。



_



_
_

图4 “涌现”视域下新的知识管理模式在 WiNGPT 大模型中的应用

_


WiNGPT主要是集成于医护工作站来进行全方位临床智慧服务,它能结合患者的各类诊疗服务数据, 为医护人员提供病历文书生成、医疗质量监管、风险监测预警、医学知识服务以及诊疗过程优化、管理效率提升等场景的智能化服务,实现交互系统的数智化协作。WiNGPT在“涌现”视域下的知识管理的典型应用主要包括:医学知识问答、精准医学和个性化治疗、医学教育和培训与疾病预测和监测。例如,医学知识问答主要是利用WiNGPT回答关于医学、健康、疾病等方面的问题,包括但不限于症状、治疗、药物、预防、检查等。而精准医学和个性化治疗主要是利用WiNGPT分析大量的患者数据,为医生提供更个性化的诊断和治疗建议, 有助于精准医学目标的实现。不仅如此,WiNGPT还能够为医学生和医护人员提供更丰富、实时的学习资源,模拟真实场景,促进医学专业技能的培训和提升,实现医学教育和培训。最后,还能利用WiNGPT分析大规模的医疗数据,提高疾病预测和监测能力,尽早发现潜在健康问题,实现更有效的疾病预测与监测。


5.2   中医诊疗知识大模型


为了揭示“涌现”视域下新的知识管理模式在中医诊疗服务场景中的共性体现,进一步促进“涌现”视域下新的知识管理模式在中医诊疗服务场景的前沿应用,本文借助岐黄问道大模型的技术特征来揭示“涌现”视域下知识管理模式变化,这有助于推动新的知识管理模式的理论创新和实践应用,提升整个健康医疗行业的信息化和智能化水平。


岐黄问道大模型是一款基于已确诊疾病的中医诊疗大模型,它集成在中医临床智能辅助诊疗系统中,实现了从基层村级卫生室到三甲中医院的应用覆盖,积累了400多家等级医院、8,000多家基层医疗机构的用户。主要包括临床诊疗大模型和中医养生调理大模型,它能够基于患者症状、体征信息输出包括中药、经络穴位、食疗、茶饮等一系列多维度养生方案。它收集1,100万条中医知识图谱数据;1,500本中医古籍和文献数据;10万份真实中医专家医案数据;10万条脉象、舌象、经络、穴位数据;200万条真实的中医临床诊疗数据。它主要采用四层递进的训练方式:预训练→监督微调→奖励模型→ 强化学习(如图5所示)。首先,利用千万级的中医知识图谱数据和临床诊疗数据,微调通用预训练模型。最后,由中医专家共同参与,利用奖励模型-强化学习机制,最终形成这一大模型。



_



_
_

图5   “涌现”视域下新的知识管理模式在岐黄问道中医大模型中的应用

_


岐黄问道大模型主要应用在中医辅助诊疗、中医健康养生服务方面。首先是知病场景,输入患者“疾病-症状-体征”信息到基于已确诊疾病的临床诊疗大模型,大模型输出辨证结果、治则治法和中药方剂。而在亚健康养生场景中,输入患者提供的症状、体征信息,大模型输出个性化中医健康状态辨识结果以及一套涵盖艾灸、按摩、膏方、茶饮、膳食、汤羹等多维度的养生方案。



_

6

健康医疗大模型前沿领域发展展望


_


除了在医疗决策、中医诊疗以及药物服务方面,“涌现”视域下健康医疗大模型知识体系和知识管理方法框架还有更多具有前景的发展方向:语音辅助的意图理解与语言交互健康大模型,具备隐含知识表达和复杂推理能力的视觉大模型诊疗机器人和医防康养一体化的老年健康人机交互大模型,这些方向充分利用大模型“涌现”的特征,在健康医疗知识体系的基础上,可以为医防康养一体化的多元场景提供高质高效的健康医疗服务。


6.1   语音辅助的意图理解与语言交互健康大模型


语音辅助的自然语言交互技术可以理解和生成人类语言,具有实时便捷的交互能力,能够在老龄化社会中发挥重要的作用,这为缓解老龄化社会劳动力缺乏和适老化需求凸显等问题带来了新的希望。然而,目前的自然语言交互大模型大多仅聚焦在于文本,很少开展在语音方面的应用。因此,需要针对大模型“涌现”出的意图理解和语言交互能力进一步研究语音辅助的意图理解与语言交互健康大模型的具体应用。首先,大模型针对智能问诊与健康咨询场景与患者自然语言交互,收集病史信息,提供初步健康咨询与指导,减轻医生诊断与治疗的工作负担。其次,大模型还可以通过语音识别和理解,自动记录医生的诊断过程和病情描述,实现病历记录自动化。


6.2   具备隐含知识表达和复杂推理能力的视觉大模型诊疗机器人


医生无法观察到健康医疗图像中的隐匿细微的诊 断特征,这会造成漏诊和误诊,甚至健康医疗事故,对社会造成重大的经济损失。随着计算机视觉的理论发展和应用落地,计算机视觉大模型的进步将极大地推动诊疗机器人的发展。这些模型使机器人能够更好地理解和分析医学影像,以及在手术中提供精准的辅助。 所以基于大模型“涌现”出的隐含知识表达和复杂推理能力,计算机视觉大模型辅助诊疗机器人未来的应用可以考虑医学影像分析和手术辅助等典型医疗场景应用:医学影像分析主要是利用计算机视觉大模型识别X光、CT、MRI等影像资料高效准确地实现诊断,辅助医生发现病灶。而手术辅助主要是在手术过程中实时分析手术场景,解析手术中医生动作轨迹,提供精确的术中导航,帮助医生执行精确复杂的手术操作。


6.3   医防康养一体化的老年健康人机交互大模型


国家实施“健康中国”和“积极老龄化”战略以来,中央和地方先后出台医防融合、医养结合、康养结合、医康养一体化等系列改革新举措,大力发展医防融合以及医养康养结合的健康医疗服务模式,并最终向医防康养一体化方向发展。为此,需要面向医防康养一体化背景,针对大模型“涌现”出的归纳和语言交互能力研究“涌现”视域下老年健康人机交互大模型的典型应用。具体来说,可以从个性化健康管理,健康知识普及以及社区健康服务三个方面考虑医防康养一体化的老年健康人机交互大模型的应用。首先,综合利用医防康养一体化的老年健康数据,针对个体的健康状况、生活习惯和医疗历史,提供个性化的健康管理和预防建议。其次,还可以利用大模型的自然语言交互技术,以适老化的方式普及健康知识,提高老年人健康素养和自我管理能力。最后大模型还可以结合地理信息和社区资源,便捷搜索高质量的社区健康资源,为老年人提供便捷高质量的社区医疗、康复和养老服务信息。



_

7

结论


_


“涌现”视域下大模型驱动的健康医疗信息管理颠  覆了传统的静态健康医疗知识管理理念和研究范式,促生出“涌现”视域下新的健康医疗知识体系,迫切需要以主动需求感知、多模态理解、动态交互模式和人机交互可解释的知识管理框架,来安全可靠地支撑医疗决策、中医诊疗与药物服务等典型的应用和新兴的信息资源管理研究方向。本文通过系统地梳理大模型“涌现”现象本身和其特征,并探讨了“涌现”对医疗知识管理的复杂影响,对AIGC时代的医疗健康知识管理提 供了理论基础、实践方式和未来展望


大模型的“涌现”现象催生了健康医疗知识服务体系的重大变革,但其不可预测性也带来了潜在的风险和挑战。虽然通过加强人机协同的模型验证、提高透明度等方法,可以一定程度上应对大模型“涌现”机制明确以及生成内容存在偏见、歧视等挑战,但仍然需要进一步探索大模型“涌现”在各种实际应用场景中的存在的问题及其潜在影响,以确保大模型在医疗和中医药知识管理过程中的安全和可靠应用。



_

*参考文献略,请详见原文。


_




END







版式设计

陆澜


制版编辑

王淳洋





关注公众知识状态 / 引领学科发展潮流

Focusing on the State of

Public Knowledge

Leading the Development Trends of

the Discipline


网络首发 | 我国新型公共文化空间发展现状与未来展望

网络首发 | “附近”视域下城市书房建设创新路径——以武汉市为例

网络首发 | 检入新境:大语言模型引领的信息检索主题与知识关联演化分析

网络首发 | 从文化场景看“打卡”风潮:网络社群用户文旅打卡行为研究

网络首发 | 新型公共文化空间高质量发展的组态路径研究


图书情报知识
教育部主管,武汉大学主办,武汉大学信息管理学院和信息资源研究中心承办的“图书馆、情报与档案管理”综合性专业学术期刊。系全国中文核心期刊、CSSCI来源期刊、中国图书馆学优秀期刊、人大复印报刊资料重要转载来源期刊、国家社科基金资助期刊等。
 最新文章