今年5月,由清华大学智能产业研究院(AIR)智慧医疗团队完成的论文“Agent Hospital: A Simulacrum of Hospital with Evolvable Medical Agents”研究获得了海内外人工智能社区和医学社区的广泛关注和讨论。
共同通讯作者为AIR助理研究员马为之、AIR执行院长刘洋。
随后在9月,由AIR孵化的无锡紫荆智康科技有限公司(简称“紫荆智康”)成立,目标是实现Agent Hospital的应用落地,利用人工智能为人类提供低廉、便捷和优质的医疗服务。
这两天,由紫荆智康开发的“紫荆AI医生”系统上线,首批来自21个科室的42位AI医生正式亮相,定向邀请专业人士对AI医生的疾病诊断能力进行内部测试。
“紫荆AI医生”系统后续将对AI医生的更多核心能力进行公开测试,预计将于2025年上半年正式向社会大众开放使用。
以下视频来源于
清华大学智能产业研究院
△Agent Hospital介绍视频
紫荆AI医生亮相
回顾Agent Hospital的研究工作,其核心理念是通过建立“闭环式”医疗虚拟世界,实现AI医生的加速进化。
Agent Hospital对真实医院的设施和流程进行模拟,尤其是建立了超拟人、广分布、多样化的AI患者,对于AI医生在虚拟世界中通过大量诊疗实践进行进化发挥了关键的作用。
△Agent Hospital:医疗虚拟世界
所谓“闭环式”,是指Agent Hospital覆盖了从发病、分诊、问诊、检查、诊断、治疗、取药、康复的完整流程,并且要求AI患者必须及时反馈AI医生所开具的治疗方案的效果,这对于AI医生根据反馈不断总结反思至关重要。
这种数据闭环在真实世界很难获得,因为很多人类患者离开医院后就不再回去,人类医生不清楚人类患者是完全康复还是转到其他医院治疗。
所谓“加速进化”,是指Agent Hospital是一个时间加速器,虚拟世界内的时间流逝速度是真实世界的约100倍,AI医生可以在真实世界的很短时间内就完成虚拟世界中的漫长进化。
AI医生的可进化性是Agent Hospital最大的独有技术特色。
实验表明,AI医生的能力进化曲线已初步符合Scaling Law(规模定律):
如果AI病人满足超拟人、广分布和多样化的条件,那么AI医生诊治的AI患者数量越多,能力就会变得越强。
“紫荆AI医生”系统的发布,将贯通虚拟世界与现实世界,让AI医生使用现实世界的数据在虚拟世界的时间加速器中继续加速进化,这样一来,AI医生的能力将提升到新的高度。
△科室概况
基于该方法,紫荆智康构建了“紫荆AI医生”系统,进一步扩展了Agent Hospital的科室覆盖范围,完成了第一批医生智能体(后文统称为“AI医生”)的构建。
目前,已从呼吸科扩展到图中共21个科室,将满足社会大众的绝大多数诊疗需求。
每个科室方向,紫荆智康将挑选了十余种常见疾病,构造多样的患者合成数据用于AI医生的进化,目前累计覆盖了300余种疾病。系统对这些疾病进行了专门的优化,对于在支持疾病列表之外的疾病,系统也能够提供相当高质量的诊断分析。
紫荆智康已经构建了超过50万个来自不同国家地区、覆盖各个年龄段、患有不同疾病的AI患者。
这些AI患者可以是人类患者在虚拟世界的数字化“分身”,也可以由人工智能大模型结合权威医学知识库和少量公开人类患者病例自动合成。这些AI患者像人类患者一样,有完整的治疗数据记录,可以跟医生进行交谈。AI患者的合成充分考虑了地域、年龄、性别、职业等因素对于疾病的影响,并且可以根据需要精准控制AI患者在各项因素上的分布。
AI医生是Agent Hospital的核心,也是“紫荆AI医生”系统的主要发布对象。目前构建了42位AI医生,每个科室设置了2位AI医生,一位来自国内,一位来自国际。之所以区分国内医生与国际医生,是因为不同国家和地区的疾病分布、诊断标准和治疗方案存在差异。以肺癌为例,中国医生将主要遵循中国国家卫生健康委员会发布的《原发性肺癌诊疗指南》进行诊断和治疗,美国医生则主要遵循美国NCCN发布的《非小细胞肺癌诊疗指南》。未来,将会有更多的AI医生陆续亮相。
“紫荆AI医生”目前设置了三种模式:游客、患者和医生。
在游客模式中,用户以游客身份了解紫荆医院;在患者模式中,用户以患者身份进入紫荆医院;在医生模式中,用户以医生身份进入紫荆医院。
现阶段,游客模式对公众开放,用户无需注册便可以进入游客模式,了解系统的主要情况;患者模式只对定向邀请的专业人士开放,用户在收到邀请码后需进行注册,然后可以登录进入系统;医生模式目前正在开发中,暂不开放。
目前,系统仅开放对AI医生诊断能力的测试,后续将开放治疗能力和对话能力的测试。用户可以创建AI患者,选择最多三个AI医生进行疾病诊断,并对AI医生生成的诊断意见进行评价。虽然紫荆智康开发团队已经对AI医生做了多轮能力测试并取得了很好的结果,但仍需要医学专业人士给出专业评估意见,这对于进一步完善系统具有重要的意义。
△ “紫荆AI医生”登录界面
紫荆智康最新开发的“紫荆AI医生”系统已经开始针对首批AI医生的邀请制测试(链接放在文末,目前仅支持PC端访问中文版页面),后续会支持移动端访问并开通英文版。
据悉,系统预计在2025年第一季度启动公开测试,让更多用户能够与Agent Hospital中的AI医生交流。
以医疗智能体为代表的智慧医疗应用新方向正在开启,事实上,Agent Hospital系统构建中对于医学AI发展,他们有着自己的见解和思考。
Agent Hospital:医疗版《西部世界》
今年大模型全面落地,医疗行业正在成为在互联网大厂、科技公司业务布局新据点。截至目前,业内医疗领域大模型数量已经超过百个。
与传统大模大模型应用范式不同的是,紫荆智康选择了大模型智能体这一智慧医疗应用方向。
大模型智能体灵活度高、适应性强,能够有效对医疗场景赋能。紫荆智康的目标就是打造超强医生智能体,为人类提供低廉、便捷、优质的健康服务。他们认为,未来AI医生将辅助人类医生完成绝大多数工作,人类医生将主要负责最终决策。
那么,智能体技术为医疗行业的赋能提供了新的可能性。紫荆智康的Agent Hospital正在规划打造一个医疗版的《西部世界》。
在这个“西部世界”中,有人类患者、人类医生、AI医生、AI患者这几类角色,他们彼此之间进行交互就能创造出崭新的应用场景和方式。
首先,AI医生可以辅助人类医生进行患者的诊疗,这也是智慧医疗领域最受关注的应用落地方向;
其次,AI患者可以用于人类医生的教学培训,来自各个科室的医生/医学生,通过跟AI患者对话、看检查报告,然后给出诊断方案,然后再来看这个方案是对还是错。并且这个过程试错成本为零,你完全不用担心因为犯错而造成什么影响。与此同时,你还可以查看这个患者所有其他医生的诊断结果,他们是怎么看这位患者的。
再次,如果同时采用AI患者和AI医生,就可以进行宏观层面的沙盘推演。例如:模拟北京市的一个5万人居民社区,我们可以随机设定每个家庭的遗传病史或发病情况,同时考虑季节变化可能引发的疾病。此外,还可以设定医院的设施和医生的能力。通过这样的模拟,在突发大规模疾病时,判断当前医院的布局和能力是否足以应对。
最后,如果是AI医生面对人类患者,AI医生则可以完成健康咨询等院外服务。
紫荆智康相信,未来人类医生的定位和角色也将发生显著的变化。
在学习阶段,他就已经在和AI患者打交道了,而在真正诊疗过程,AI将与医生形成一种我们称之为“孪生”的关系。这种孪生,目标是创造一个人类医生的“分身”,即智能体,它能够不断学习和模拟医生的行为,最终100%复制医生的决策。
这意味着当遇到患者时,AI分身所做的决策将与医生的决策完全相同,从而大幅提升诊疗效率。
同时,这个分身收集的数据越多,它就能学习得越好,越像医生本人,成为医生的一个克隆、一个镜像。
当我们拥有一个完全独立的AI医生时,其他的AI医生甚至人类就可以与他进行一起会诊和讨论,助力医疗水平提升,让人类享受更高质量的健康服务。
智慧医疗的未来发展
如果将时间维度拉长,现在可能正是医疗核心痛点的破局时刻。
从科技互联网开始变革医疗以来,经历了这样三个阶段——
第一,互联网+医疗。
第二,AI+医疗。
第三,AI大模型+医疗。
第一个阶段,互联网+医疗,核心是线上问诊成为了可能,让问诊可以在线化,突破了时间和空间的限制。一定程度上打破了医疗最大的挑战——资源分布不均。
但互联网+医疗,并没有根本性变革医疗现状,更多还只是锦上添花。
因为在推行几年后,业界开始发现带来了新的问题,比如原本就时间紧缺的专家医生,因为在线问诊,时间被进一步挤占,工作时长和强度都提升,但并非来自效率上的改善。患者这一端,也被反馈没有及时的人文关怀,并且因为相隔屏幕,医患之间的信任感更加难以建立,体验上的问题始终存在。
第二阶段,是感知视觉AI突破后,AI在影像等领域,可以提供医疗助力。当时包括谷歌在内的AI巨头,都对AI医疗影像的前景非常乐观,并且专门打造了专用硬件、落地在一些专科诊室,希望能够加速优质医疗资源的普惠。但最后未能如愿。
原因有两方面,一是专用硬件的成本。不仅是采购成本,也包括学习和使用成本,增加了门槛;二是决策式AI面临的泛化性挑战,落地相对比较局限,于是最后只能在限定又限定的场景发挥作用。
不论互联网+还是第一波AI医疗浪潮,医疗行业的数智化升级,最核心的挑战还是——医疗数据匮乏。
在医疗领域,数据资料的隐私特点之外,本身的数据在线化、数字化程度就不高,更别说能够基于高质量数据,来实现高质量的AI模型搭建。但现在,大模型特别是AI Agent的思路,似乎是一种根本性变革。
因为就在Agent Hospital的案例中,启动本身并不对医疗数据有严格要求,小数据甚至零数据都可以,虚拟医院里的AI Agent,就好像AlphaZero里学习围棋的AI一样,在“游戏”的边界里夜以继日学习、探索,追求最优解,直到达到人类医生的水准和水平,在整个训练过程中,人类医生更多是审视和判断,适当给出反馈。
这不就是GPT实现AI能力跃迁和突破的方式吗?只不过过程中更主要的是合成数据,而人类的反馈则是最专业的医生。
如果Agent Hospital里的AI Agent能力达到了一定的阶段,它就能上岗成为医生的专业助手了——距离医生的分身又近了一步。而且考虑到AI大模型范式下,技术的泛化性大大提升,从专科到全科的跨越,比人类本身的周期肯定要更快、效率要更高。
另外,Agent Hospital还创造了一个全新环境,在医生的培养体系中,这个环境体系可以无缝融合。之前对医生的培养,更多需要医院、病例实习跟进,面临时间和空间上的限制。但是如果在Agent Hospital中,人类实习医生,可以像驾校学习、模拟考试一样,不断积累自身的能力,利用不断强大的各个AI Agent交互,完成上岗前更真实、更高效地实习成长。
所谓三年高考五年模拟,以后医生上岗,或许也会在虚拟医院的系统里,练习、应对、获得检验和认可,最后实现能力的提升和认证。
所以可以明确的是,Agent Hospital至少拥有成为医疗培训体系中AI增强的一员,既对医生上岗提升有直接帮助,也不会增加额外的应用门槛,克服了过去医疗数智化进行中的挑战。
当然,如果沿着AI大模型强泛化性的能力特点,展开思考,又会发现,Agent Hospital这样的落地和应用,不止于医院。
一切涉及熟能生巧、学练结合的专业工种,不都需要这样的角色和系统吗?
所以如此看来,Agent Hospital只是这种范式在医疗场景下的尝试,这个“宇宙”,想象空间巨大,仿佛打开了一扇全新的潜力之门。
清华AIR这四年
除了Agent Hospital这一孵化项目之外,清华智能产业研究院更多的进展也有了阶段性曝光。
依然按照创办者张亚勤院士设定的三大方向推进:智慧交通、智慧物联以及智慧医疗。
智慧交通方面,产业化合作进展更为瞩目。
身兼Apollo理事长的张亚勤提到萝卜快跑在武汉的落地。目前武汉已经是全世界最大的无人车城市。另外,跟滴滴、毫末智行等都有相应的合作。
今年6月,清华AIR正式落地无锡,成立AIR无锡创新中心,推动面向产业的科技创新发展。比如像华为智能车前CTO陈亦伦带队,联合百度发布的首款支持实车部署的开源端到端自动驾驶系统AIR ApolloFM,目前已经率先在无锡部署。
而今年爆火的具身智能方向,有前DJI大疆创新机器人大牛周谷越教授带领的求之科技公司。
智慧物联方向,如今随着当前大模型技术与产业发展,清华AIR的AIoT团队迎来了关键的转向。张亚勤透露,目前他们正在沿着绿色计算展开推进。比如运用到降低数据中心的能耗、减少端侧模型的延迟等等。
而像智慧医疗这一方向,人工智能的发展,给生物医药领域带来更为广阔的应用场景。今年化学诺奖颁给了AI就是例证。
在清华AIR研发进展中,也可以说是多方面开花。
比如在单细胞理解注释上面,聂再清教授团队与清华系创业公司水木分子合作构建和开源了单细胞身份理解大模型LangCell。这是首个无需标注即可进行新细胞类型注释的模型,可以将它理解为“细胞的百科全书”。
还有在药物筛选方面,兰艳艳教授团队用大模型在药物筛选过程中寻找靶点,目前已经被Nature子刊接收。
马剑竹教授团队则主要在蛋白质生成方向推进,在原子层面探索基础大模型。今年6月他们联合百图生科提出的单细胞基础大模型scFoundation,登上Nature子刊。
另外在制药方向上,彭健教授的华深智药在产业化上发展神速,已经跻身独角兽级别。
……
清华AIR创办这四年,虽然低调,但火种已经沿着张亚勤院士最初设定的三大方向播下。现在,有点“勇攀珠峰,沿途收获”的意味了。
官网邀测链接:
https://www.tairex.cn/agent-hospital/