回顾2023,各大厂商紧跟热点陆续发布自己的医疗大模型,笔者通过公开信息进行了一些梳理:
试用地址传送门:
1、香港中文大学(深圳)&深圳市大数据研究院(华佗GPT)
https://www.huatuogpt.cn/
2、云知声(山海大模型)
https://shanhai.unisound.com/
3、左手医生(左医GPT)
https://ai.zuoshouyisheng.com/publicize/home
4、百度(百度灵医Bot)
https://01.baidu.com/01Bot
5、大经中医(岐黄问道)
http://www.dajingtcm.com/dajinggpt
6、润达&华为云(良医小慧)
微信搜索【良医小慧】
7、商汤(大医)
可发送邮件备注联系方式及机构名称至sensecare-chat@sensetime.com获取邀请码后,登录https://chat.sensetime.com/申请试用账号。
8、科大讯飞(讯飞星火医疗大模型)
微信小程序-讯飞晓医
01 为何人工智能突然变得「聪明」了?
与通用大模型相比,医疗大模型需要在文本知识、任务执行等方面更符合医疗领域的专业性。目前除了从0-1开始预训练的方式以外,通常厂家可通过3种策略(基于通用大模型继续进行预训练、使用指令和任务微调、使用提示工程进行强化)获得医疗垂直大模型,3种策略可以单个使用也可以组合使用。
1、预训练。基于通用大模型继续进行预训练,可以极大降低从0-1的模型生成成本,节省研发时间。在通用大模型的文本生成、语义理解、文本检索等能力的基础上,企业利用自身在医疗领域内的积累和公开及半公开医疗专业数据,在生物医学领域完成进一步的预训练,使得更加符合生物医学的表达方式和术语应用,使得大模型更好地应用于医疗领域。
2、任务微调。在已经预训练好的大模型基础上,通过特定任务的微调,使其在特定数据集上的性能提升,或者通过监督学习/强化学习,使大模型更好的响应和理解医疗领域内的知识。
3、提示工程。通过设计和构建输入提示来控制大模型的输出,从而提高生产内容的准确性和可靠性。
03 医疗大模型的「应用场景」有哪些?
我们可以从患者服务、临床治疗、药械研发几个角度进行梳理
患者服务:健康问答、智能导诊、健康管理、检验解读...
临床治疗:病历生成、辅助诊断、影像标注、智能随访、患者教育、报告生成...
药械研发:文献检索、新药研发、器械研发...
(来自公开报道)
04 这么多大模型大家的「差异性」在哪里?
存在的差异可以从产品技术壁垒、应用场景、部署策略三个角度来观察
1、技术壁垒(用了什么语料知识库、有多少个参数、有多强的算力...)
知识、数据、算法、算力是拉动大模型运作的四大马车。
知识,决定了大模型的“认知深度”和“表现力”,是解决问题和推理的基础
数据,是大模型的“学习材料”,数据的质量、数量、多样性,决定了大模型的学习能力和泛化能力
算法,指导模型如何“思考”、如何处理数据、如何推理决策,决定了大模型的学习效率和表现水平
算力,为大模型提供必要的计算基础和硬件支持,决定了大模型的处理速度,影响了应用的实际性能
因此我们看到各大厂商的发布会上也都会秀自己的各大指标,比如10亿~1000亿的模型参数、各种来源各种形式的训练数据...
(来自公开报道)
(来自公开报道)
2、应用场景
应用场景必定和企业自身的行业积累、客户案例息息相关,能落地的大模型才能证明解决方案的可用性和应用效果。各厂商在首个落地应用也各有不同,如微脉的CareGPT,主要致力于在真实的医疗服务场景中充分发挥健康管理价值,实现预防、咨询、预约、康复的全周期智能化健康管理能力。如医渡科技的YiduCore,专注于医院的科研、管理和临床辅助决策等。
3、部署策略
对于医疗领域内的落地,特别是toB端的解决方案,企业充分考虑了客户需求,如百度灵医Bot,推出了三个版本,Lite版(私有化部署、可根据客户算力资源进行不同量级的参数调整)、定制版(对有高质量数据和研发能力的客户,针对特定场景,提供定制化模型训练和调优)、旗舰版(千亿参数、公有云服务、开箱即用)。
(来自公开报道)
最后,由“Mobile First” 到“AI First”,医疗领域的应用系统都值得通过AI、通过大模型完成智能化服务的跃迁。新一轮的产业升级正在开始,躬身入局,才能有新的机遇,与君共勉。
资料参考:
公开宣传、政府公开文件等
如有侵权,联系删除
END
整理不易,期待大家点赞、在看