懂·AI | 人工智能崛起!盘点2023年发布的19个医疗领域垂直大模型(附试用地址、白皮书)

文摘   科技   2024-01-01 10:56   浙江  

关注并设为星标,
与我共同成长

“ hello,欢迎来到我的D-Life空间
这是我的第014篇原创 


——不懂行业的产品不是好产品——

今年2月,ChatGPT以60%的准确度通过了美国医学执照考试,我们不禁对大语言模型(LLM,Large Language Model)在医学领域的表现刮目相看。大语言模型在语言理解能力、生成能力、逻辑推理能力的提升,让我们看到了人工智能在各大领域不同场景下应用的可能性。而医疗领域,由于其特殊性(如数据隐私、循证医学专业性、任务特定性),更需要与通用大模型有所区分的医疗大模型的支持。2023年,可谓医疗大模型的元年,各大厂商紧跟热点,相继发布自己的医疗大模型。
小编将在本文中为您回顾2023年发布的19个医疗领域垂直大模型(含试用地址),并尝试回答几个问题:1)为何人工智能突然变聪明了?2)医疗大模型是如何实现的?3)医疗大模型的应用场景有哪些?4)这么多大模型大家的差异性在哪里?

一、回顾2023


回顾2023,各大厂商紧跟热点陆续发布自己的医疗大模型,笔者通过公开信息进行了一些梳理:



试用地址传送门:

1、香港中文大学(深圳)&深圳市大数据研究院(华佗GPT)

https://www.huatuogpt.cn/

2、云知声(山海大模型)

https://shanhai.unisound.com/

3、左手医生(左医GPT)

https://ai.zuoshouyisheng.com/publicize/home

4、百度(百度灵医Bot)

https://01.baidu.com/01Bot

5、大经中医(岐黄问道)

http://www.dajingtcm.com/dajinggpt

6、润达&华为云(良医小慧)

微信搜索【良医小慧】

7、商汤(大医)

可发送邮件备注联系方式及机构名称至sensecare-chat@sensetime.com获取邀请码后,登录https://chat.sensetime.com/申请试用账号。

8、科大讯飞(讯飞星火医疗大模型)

微信小程序-讯飞晓医


二、尝试回答几个问题

01 为何人工智能突然变得「聪明」了?


使用过GPT或者国内大语言模型的朋友都会有很直观的感受,好像人工智能真的“听得懂人话”了。想要理解为何AI突然变聪明了,就要了解以前的AI为什么笨,以及出现了怎样的变量使问题得到了改善。对于这个技术问题,小编按自己的理解尝试总结了下:

以前的AI主要受几个方面的制约:
1、法简单,主要是一种基于统计语言模型的关联推理基于规则库难以理解语境、上下文语义理解、复杂任务处理。
2、训练数据有限,且数据需要标注才能做训练应用,数据量、准确度、成本投入都会严重影响训练效果。
3、训练缺乏自我更新机制。训练完成后人工智能不能随着时间和经验完成自我迭代。

几个变量的出现,使得上述问题得到了改善:
1、2017年Transformer架构发布,使得NLP(自然语言处理)实现了跨越式的发展。简单来说,通过这个架构的注意力(Attention)机制,AI可以做到长距离语义关联捕捉(能理解上下文了),也可以通过关注文本中的关键信息,理解词与词之间的关联,以及更深入地理解语境。举个可能不恰当的例子,当我在段落里出现“我爱去医院”的信息时,他不会理解成“我是爱去医院看病”,而是会结合上下文做出正确理解“我爱去医院了解市场接触客户”。
2、光能做语义理解还不够,还需要提升训练的数据量。2018年GPT提出自然语言的新的训练范式——无监督学习,相比监督学习(在有标准答案的有限数据集上训练),可以通过海量的无标记自然语言数据进行训练学习,并在无监督训练的学习过程中通过prompt工程来让人类标注想要的回复,并进行监督学习来微调。
3、RLHF(reinforcement learning from human feedback)人类反馈强化学习技术,将人工智能的答案与人类的偏好进行对比,形成奖励机制,使模型可以自己理解,自我更新。

02 医疗大模型是如何「实现」的?

与通用大模型相比,医疗大模型需要在文本知识、任务执行等方面更符合医疗领域的专业性。目前除了从0-1开始预训练的方式以外,通常厂家可通过3种策略(基于通用大模型继续进行预训练、使用指令和任务微调、使用提示工程进行强化)获得医疗垂直大模型,3种策略可以单个使用也可以组合使用。


1、预训练。基于通用大模型继续进行预训练,可以极大降低从0-1的模型生成成本,节省研发时间。在通用大模型的文本生成、语义理解、文本检索等能力的基础上,企业利用自身在医疗领域内的积累和公开及半公开医疗专业数据,在生物医学领域完成进一步的预训练,使得更加符合生物医学的表达方式和术语应用,使得大模型更好地应用于医疗领域。


2、任务微调。在已经预训练好的大模型基础上,通过特定任务的微调,使其在特定数据集上的性能提升,或者通过监督学习/强化学习,使大模型更好的响应和理解医疗领域内的知识。


3、提示工程。通过设计和构建输入提示来控制大模型的输出,从而提高生产内容的准确性和可靠性。


03 医疗大模型的「应用场景」有哪些?


我们可以从患者服务、临床治疗、药械研发几个角度进行梳理

  • 患者服务:健康问答、智能导诊、健康管理检验解读...

  • 临床治疗:病历生成、辅助诊断、影像标注、智能随访、患者教育、报告生成...

  • 药械研发:文献检索、新药研发、器械研发...


(来自公开报道)


04 这么多大模型大家的「差异性」在哪里?


存在的差异可以从产品技术壁垒、应用场景、部署策略三个角度来观察


1、技术壁垒(用了什么语料知识库、有多少个参数、有多强的算力...)

知识、数据、算法、算力是拉动大模型运作的四大马车。

  • 知识,决定了大模型的“认知深度”和“表现力”,是解决问题和推理的基础

  • 数据,是大模型的“学习材料”,数据的质量、数量、多样性,决定了大模型的学习能力和泛化能力

  • 算法,指导模型如何“思考”、如何处理数据、如何推理决策,决定了大模型的学习效率和表现水平

  • 算力,为大模型提供必要的计算基础和硬件支持,决定了大模型的处理速度,影响了应用的实际性能


因此我们看到各大厂商的发布会上也都会秀自己的各大指标,比如10亿~1000亿的模型参数、各种来源各种形式的训练数据...


(来自公开报道)

(来自公开报道


2、应用场景

应用场景必定和企业自身的行业积累、客户案例息息相关,能落地的大模型才能证明解决方案的可用性和应用效果。各厂商在首个落地应用也各有不同,如微脉的CareGPT,主要致力于在真实的医疗服务场景中充分发挥健康管理价值,实现预防、咨询、预约、康复的全周期智能化健康管理能力。如医渡科技的YiduCore,专注于医院的科研、管理和临床辅助决策等。


3、部署策略

对于医疗领域内的落地,特别是toB端的解决方案,企业充分考虑了客户需求,百度灵医Bot,推出了三个版本,Lite版(私有化部署、可根据客户算力资源进行不同量级的参数调整)、定制版(对有高质量数据和研发能力的客户,针对特定场景,提供定制化模型训练和调优)、旗舰版(千亿参数、公有云服务、开箱即用)。


(来自公开报道



最后,由“Mobile First” 到“AI First”,医疗领域的应用系统都值得通过AI、通过大模型完成智能化服务的跃迁。新一轮的产业升级正在开始,躬身入局,才能有新的机遇,与君共勉。


资料参考:

公开宣传、政府公开文件等

如有侵权,联系删除


关注公众号回复“医疗大模型”获取「信通院2023人工智能白皮书、知识产权法律问题研究报告」,密码为12357。




END




整理不易,期待大家点赞、在看

每天都要懂一点的董同学
欢迎与我一起,每天懂点医疗政策、行业动态、产品技能... 我是董同学,一名普通的医疗健康创新实践者、互联网医疗产品经理