1
引言
今年是大模型在企业落地的元年,特别在医疗领域,大模型的应用潜力尤为显著,它通过海量数据的深度学习,能够为疾病诊断、治疗决策和健康管理提供强大的智能支持。本文旨在深入探讨大模型在医疗行业数字化实践中的应用及其潜在影响。
1.1
大模型概念
想要理解大型语言模型的基本原理,我们可以从四个关键概念入手:算法,算力,数据和应用。
算法
是指将预训练的大模型通过服务的方式提供给用户,用户可以根据需求进行定制化的调用和集成。
算力
是大模型运行的基石,选择合适的算力服务器对于模型的训练和应用至关重要。
数据
医疗行业的公有和私有数据如何有机结合,以促进大模型在企业内部的落地,是一个关键问题。
应用
AI原生应用指的是从设计之初就融入人工智能元素的应用,它要求企业在应用开发过程中充分考虑到AI技术的特点和应用场景。
1.2
知识库
大模型加知识库是指将大规模预训练模型与丰富的知识库相结合,通过向量数据库存储和检索知识,利用知识问答链进行逻辑推理,以及借助提示词工程优化信息提取。这种概念提升了模型的语义理解能力,使得在处理复杂问题时,模型能够快速准确地从知识库中检索信息,并通过向量匹配和提示词引导,形成有效的问答流程,输出合理的结果。
1.3
AI Agent
AI Agent是指一个能够自主运作、感知环境并根据预设目标采取行动的人工智能程序。它通常具备一定的决策和学习能力,能在特定环境中执行复杂任务。
2
医疗企业做大模型的痛点
痛点一:数据质量和数量不足
在医疗企业构建大模型的过程中,数据质量和数量不足是其面临的首要痛点。以下是这一问题的三个主要方面:
a
医疗数据的特点
医疗数据具有高度的专业性、复杂性和敏感性。比如患者信息,它包括患者的基本信息、病历记录、检查报告、药物使用情况等。这些数据通常是非结构化或半结构化的,包含了大量的专业术语和缩写,使得数据理解和处理难度增加。此外,医疗数据中的异常值和缺失值较多,这给数据分析和模型训练带来了挑战。
b
数据收集、清洗和标注的困难
由于医疗数据分散于多样化的系统和格式之中,其收集过程往往需要进行跨系统和跨格式的数据整合。在数据清洗和标注阶段,由于医疗数据的专业性,需要有经验的医疗人员参与,以确保数据的准确性和可用性。然而,这样的专业人才相对稀缺,导致数据准备工作耗时且成本高昂。
c
数据安全和隐私保护问题
医疗数据涉及患者隐私,因此在处理过程中必须严格遵守相关法律法规。数据安全和隐私保护不仅关系到企业的信誉,更是履行法律规定义务的体现。在大模型训练中,如何确保数据在传输、存储和使用过程中的安全性,以及如何去标识化处理以保护患者隐私,是医疗企业必须面对的重要问题。
痛点二:算法和模型选择
算法和模型的选择是医疗企业在大模型构建中另一个关键痛点。
a
医疗领域特有的算法需求
医疗数据的特点决定了算法需要具备高度的精确性和鲁棒性。例如,在影像诊断中,算法需要能够识别微小的病变差异;在基因组学中,算法要能够处理大量的序列数据。这些需求对算法的设计和优化提出了更高的要求。
b
模型复杂性与可解释性的平衡
大模型通常具有很高的复杂性,能够捕捉到数据中的深层关系。然而,在医疗领域,模型的可解释性同样重要,因为医生和患者需要理解模型的决策依据。如何在模型的复杂性和可解释性之间找到平衡点,是医疗企业面临的一大挑战。
c
模型训练和优化过程中的挑战
医疗数据的不均匀分布、样本偏差等问题,会导致模型训练过程中的过拟合或欠拟合。此外,医疗数据的变化速度快,模型需要不断地更新和优化以适应新的数据分布。这些因素都增加了模型训练和优化的难度。
痛点三:政策合规要求
政策合规要求是医疗企业在应用大模型时不可忽视的问题。医疗行业是高度受监管的行业,相关的政策法规对数据使用、技术应用等都有严格的规定。例如,欧盟颁布的《人工智能法案》要求,诸如医疗设备这类高风险人工智能系统,其模型也将受到新的约束。医疗企业在大模型应用过程中,必须遵循这些政策法规,确保所有操作都在合法合规的框架内进行。
3
医疗企业中外大模型的选择
3.1
国内外大模型特点和发展趋势
国际方面,大模型如Open AI的GPT-4、谷歌的Transformer和BERT等,以其强大的语言理解和生成能力,引领了人工智能领域的新一轮热潮。这些大模型正朝着更加通用、更加高效和更加可解释的方向发展,同时,也在探索如何在保证性能的同时降低模型大小和计算成本。
国内方面,以百度文心、阿里云的通义系列、腾讯的混元等为代表的大模型也在迅速崛起。这些模型同样具有大规模参数和强大的语言处理能力,且更加注重本土化和垂直行业应用。
3.2
医疗行业模型评估
模型评估能力是衡量人工智能公司在整体设计和架构能力的一个重要环节。结合不同行业的特殊性,模型评估指标包括模型性能对比,可解释性,数据适应性,专家评审和安全合规性等诸多方面。同时,国家部委也在积极推动大模型的评估,科技部“人工智能基础模型支撑平台与评测技术”和工信部“大模型公共服务平台”项目,为我们提供了一个更为科学权威公正开放的大模型评测体系。
4
医疗行业大模型数字化实践
4.1
大模型的能力只是决定了应用的起点
A
医疗知识库
利用大语言模型对医疗专业知识的深刻理解,能够快速准确地回答内部用户提出的医学问题。
B
问答机器人
采用大语言模型处理医患对话,能够理解自然语言表达的问题,并给出专业的解答。它们在患者咨询、导诊等服务中发挥着重要作用,减轻了医护人员的工作负担。
C
内容创作
利用大语言模型生成医疗科普文章、研究报告等,帮助医疗机构和专业人士高效地创作内容,提高信息传播的效率和质量。
D
信息抽取
从大量的医疗文献、病历中提取关键信息,如症状、诊断、治疗方案等,为大语言模型提供结构化数据,支持更深入的数据分析和应用。
E
医疗的智能穿戴产品
通过小语言模型赋能的智能穿戴产品,可以在没有网络的情况下,利用模型对用户的健康数据进行本地分析,如心率监测、运动建议等,为用户提供便捷的健康管理服务。
4.2
场景适配度才是决定应用的上限
应用程序的设计旨在精准匹配特定的场景需求,以定制化服务为核心。场景至上,应用随之。以医疗教育服务为例,基于多模态模型的医疗影像和图片辅助教学,不仅要求模型具备对图像的深度理解能力,还要求其能够与医疗教育的具体场景紧密结合。这意味着,模型需要针对医疗专业的特点进行定制化开发,确保在教学过程中能够提供精准、实用的辅助信息,提升教学质量。
因此,如何深入理解客户,医院,医生和患者等用户的具体需求,提升用户体验,持续收集反馈数据,对模型进行优化,是大模型落地医疗企业的关键。随着模型能力的不断提升和场景适配度的深化,我们有理由相信,医疗AI将在提升医疗服务质量、促进医疗改革发展等方面发挥更加重要的作用。
4.3
AI应用的三种模式
AI原生应用的三种模式分别代表了人工智能技术在应用中的不同层次和复杂性:
#
AI嵌入模式
指将人工智能模型集成到现有的应用或设备中,使其能够执行特定的、通常是单一的任务,比如利用多模态能力在图片中识别物体。该模式应用针对性强,易于实现,且不会对用户原有的使用习惯造成太大影响。
#
Copilot辅助模式
能够理解用户的意图和上下文信息,提供辅助性的建议或操作。在这种模式下,AI应用更加智能,能够与用户进行交互,例如Siri、Google Assistant等,它们能够理解用户的语音指令,并能够根据上下文提供信息查询、日程管理等服务。
#
AI Agent模式
AI能够进行复杂的决策,并自主执行相关动作或任务。这种模式下的AI应用具有高度的自主性和智能性,能够在没有人类干预的情况下完成任务,甚至能够与其他AI Agent协作,以Multi-Agent形式组成协作网络。
4.4
医疗场景的数字化实践案例
项目背景
客户有大量的医疗行业文献需要分析,并及时检索到某些疾病和基因等相关资料,通过大模型能力能够快速收集并总结相关的前沿治疗方法。
相关实践
利用闭源模型的API与开源模型相结合,为企业提供私有化的混合大模型解决方案。包括采用闭源通用大模型的高级API服务,这对理解用户的语言和语义,以及上下文的通用能力打好了基础,采用开源模型框架,并结合企业特有的医疗数据,定制化训练专属模型,以适应特定的医疗场景,技术上,将集成后的模型部署在企业内部服务器或云平台上,确保数据不离境,符合行业法规要求。
最终,该医疗文献搜索分析平台不但能满足医疗文献的分析,发掘最新治疗方法的需求,也节约了大量人力资源,能够快速发现创新的诊疗方法,加速药物上市,真正为企业做到了降本增效。
总结
NNIT作为一家专注于服务生命科学行业的IT解决方案提供商,致力于帮助企业推动人工智能技术的深入探索与应用。展望未来,随着技术的不断进步,医疗大模型将更好地服务于临床决策、疾病预防和健康管理,为医疗行业带来革命性的变革。医疗企业应把握时代脉搏,不断优化模型能力,提升场景适配度,以抢占未来发展的高地。
参考资料:
[1]. 全球首部!欧盟《人工智能法案》正式生效(2024-8)