厉害!这位江山人为AI锻造一双“慧眼”

政务   2024-11-01 14:29   浙江  



  11月1日,浙江日报整版刊登了医学人工智能科学家郑冶枫。这位为AI锻造一双“慧眼”的科学家,其实是江山人,1975年生,1993年毕业于江山中学。1998年和2001年于清华大学电子工程系分别获得本科和硕士学位,2005年博士毕业于美国马里兰大学电气与计算机工程系。2006年至2017年在西门子医疗美国研究院工作。

  郑冶枫是国际电气和电子工程师协会会士(IEEE Fellow)、美国医学和生物工程学会会士(AIMBE Fellow)、IEEE医学影像杂志副编。作为最早把机器学习引入医学影像分析的“探路者”,他发明的投影空间学习法广泛用于医学影像中器官的快速检测与分割。回国后,他担任腾讯杰出科学家和天衍实验室主任。2024年7月全职加入西湖大学,受聘工学院教授,创立医学人工智能实验室。


  15分钟,这是一位病理科医生完成一次CT结果诊断大致需要的时间。

  5秒,这是一套人工智能辅助影像诊断系统完成同样任务大致所需的时间。

  不仅仅是医学影像诊断,在复杂而精微的医疗过程中,AI正展现出优化效率和精度的巨大潜能。计算机视觉犹如一双敏锐而智慧的眼睛,赋予机器感知和理解世界的能力。

  医学人工智能科学家郑冶枫可以称作这双“眼睛”的锻造者。

  在西门子医疗美国研究院工作10余年,郑冶枫是最早把机器学习引入医学影像分析的开创者;回国之后,他担任腾讯杰出科学家和天衍实验室主任,负责科技部新一代人工智能开放创新平台(医疗影像)的研发,拥有500多件专利。不久前,郑冶枫全职加入西湖大学工学院,着手创立医学人工智能实验室。

  郑冶枫有一双清澈、明亮的眼睛。眼前的他,穿着简单随意的休闲服和帆布鞋,与记者“解码”AI的过程中,他没提到自己漂亮的履历,也没有说这个前沿学科“高精尖”的概念。“我们更关注高端技术的落地,让它切实地为医生和患者提供帮助。”郑冶枫说。

爱好长跑 跑过“寒冬”和“炎夏”

  晨曦时分,整个校园还未苏醒,一个穿着一身运动装的清瘦身影出现在西湖大学的跑道边。刚来学校不久,“路还走不明白”的长跑爱好者郑冶枫已经重启他的晨练计划。

  在某种程度上,跑步和做科研很像。

  跑步,不分寒冬和酷暑,科研也一样。正是保持着平稳的心态和均匀的“配速”,郑冶枫“跑”过人工智能的“寒冬”和“炎夏”。

  有一组数字让郑冶枫很感慨。今年6月下旬,他参加计算机视觉领域的一次顶级会议时,与会人数达到了1.2万。而2003年他第一次参会时,只有1200多人,“10倍的差距。”

  当时,社会上几乎没有关于人工智能的讨论,对于让计算机自主学习这件事,哪怕是业内人士也仍然犹疑和观望。

郑冶枫(右)带队参加计算机视觉国际顶级会议。受访者供图

  本世纪初,郑冶枫进入医学影像分析领域时,主流的方法是基于优化,也就是通过不断调试参数来优化结果。他发现,传统方法可以调整的参数太少,就算训练图像增加到成百上千张,模型的性能也不会发生太大变化。

  “而机器学习的上限大不一样。只要样本数量足够,随着数量增加效果就会有显著提升。”即使外界对此的争议声从未中断,郑冶枫仍坚信这股颠覆性的力量。

  这位最早的“机器学习派”正是靠一腔热情在“寒冬”里点燃了一把火——2006年,第一个标志性成果“投影空间学习法”诞生了。

  “这个方法用于医学影像中器官的快速检测与分割。”郑冶枫举了个例子,“我们把目标器官或者像肿瘤这样的病灶,从图像中勾勒出来,过程有点儿像手机上的自动抠图。”设置通用的框架,运用标注的数据进行大量训练后,机器学习便展现出惊人的能力,完成一次测算仅需要零点几秒。

  这一技术在2011年获美国专利授权,被评选为当年的托马斯·爱迪生专利奖。

  为了颁奖典礼,郑冶枫第一次隆重地打扮自己。平时一身“程序员套装”的他按照着装要求,临时租来了一套精致的燕尾服,还特地搭配了一个黑色的领结。

  在爱迪生实验室里,获奖的科学家们高举酒杯,致敬这位伟大的先辈,也敬自己,更为那在漫长前夜里坚守的信念和勇气。

  “这项发明不单意味着荣誉和实用价值,它证明了机器学习的巨大潜能。”这项技术也是今天“深度学习”的初始样态。

  后来的故事人尽皆知,AI开始一路狂飙。2016年,一场“人机对战”比赛中,机器人AlphaGo的胜利宣告了人工智能时代的到来。

  而经历过“寒冬”的郑冶枫,对今天火热的AI世界始终保持着冷静。

  “因为医疗领域对于人工智能的容错率是极低的。”郑冶枫说,“技术最终直面的对象是患者。”他记得在医院进行相关项目的临床实验时,观摩了一场心脏瓣膜置换的手术。

  “投影空间学习法”被用于确定需替换的损坏瓣膜的三维位置,从而将人工瓣膜通过大腿根部微创的口子,一路输送到指定的部位并完成置换。“病人躺在床上。我当时挺紧张,如果微创手术不成功,就需要进行直接开腔手术了,死亡率是10%。”郑冶枫回忆,最终手术很成功。

  由此,他对每一项技术发明都进行了极其严格的前瞻性试验——在算法和各方面条件都不能改动的情况下进行,误差控制在5%以内,需要几千例患者受试通过。

  “在寒冬时葆有热忱,在热潮中冷静前行。”如果要寄语,这位过来人会这样告诉每一位追逐AI风口的年轻人。

郑冶枫(左二)课后与学生交流。西湖大学供图

健步如飞 不是“跑代码”就是“跑医院”
  成天在实验室里对着电脑“跑代码”,这是大多数人对郑冶枫工作的误解。

  尽管已经入职了一段时间,郑冶枫位于西湖大学的办公室仍几乎是空无一物。他在这里待的时间并不多,除了去教室上课,去的最多的地方是医院。

  “周五要和超声科的专家会面,周日要和放射科主任聊聊,还打算去社区医院看看……”郑冶枫分享他的日程表,眼前这位回归校园的学者,口中时常蹦出“合作伙伴”这样的惯用词,这是他在工业界形成的习惯,也从那里带回了丰富的经验。

  “在工业界将近20年,受到的训练就是我做的东西必须‘接地气’。”郑冶枫说,因为,一篇论文可能发表后就“躺”在那儿了,最多有人引用一下,研究成果没有对社会产生太多价值。

  而医疗人工智能天然就是一个应用学科。“只有这个算法真的用到医院去了,才能真正服务和帮助到病人。”2018年初,郑冶枫回国加入腾讯天衍实验室,组建起一支13人的核心算法团队。

  腾讯天衍实验室专家研究员魏东是其中一位团队成员。“那时候,团队成员负责不同的病种,眼底疾病、宫颈癌、肺炎等疾病的筛查,需要我们和医院保持密切的交流。”魏东说。

  这支小而精干的队伍,风格和负责人郑冶枫一致,“细致且追求效率”。

  魏东有最切身的感受。很难想象,作为一位医学人工智能领域知名期刊的编辑,郑冶枫会逐字逐句地修改每一位团队成员的论文。通常魏东收到的反馈版本,上面有密密麻麻的批注,甚至细致到语法的纠正、参考文献的格式。

  “跑医院”和“跑代码”并列为他们最重要的工作内容。这时候,郑冶枫展现出一位长跑爱好者出色的身体素质。魏东的印象里,郑冶枫总是健步如飞。

  “跑”得多了,对医生的需求和痛点了解更多,他们的研发领域也不断拓宽——从一开始的医学影像分析,到研发可以导诊和挂号的对话机器人,训练一位有着更全面本领的AI医生:会“看”影像,会“读”病历,会“做”检查,还会给出临床诊断建议。

  同样,他们也发现了更多问题。比如医院间存在的信息化孤岛,合作的医院科室间传图像,有时甚至需要拿个U盘拷来拷去;不同医生标注的数据质量差距很大,机器没法适应。“一会儿告诉机器是A,下一个同样图像又告诉它是B……训练就崩溃了。”

  “要挖掘医生的一些痛点,比如我刚才提到的智能辅诊项目,一开始只做某个疾病的判断,后来又应用于病历的质量控制、智能开药等。”郑冶枫说。

  在这个过程中,不管是新涌现的一线需求,还是难以回避的棘手问题,都让研究有了一个精准的“靶心”。

  基于7万余例的标注数据,团队打造出了医学影像行业的专属大模型“腾讯觅影”,一共上线了6个病种的辅助诊断产品。

  在2020年新冠疫情最严峻的时刻,这套系统帮助武汉大学附属中南医院影像科团队,为武汉的一家医院实现了拍片后2分钟内即出具准确影像诊断报告,在两个月内累计为2.4万多名患者进行了肺部CT诊断。

  讲到这里,他一向平静的语气变得有些兴奋:“我们的AI,达到了医生的水平,落地到基层帮助患者。”

  从事与医疗相关的工作,郑冶枫足够严谨,工作上很少有外露的情绪。实际上,他并不是一个很严肃的人,对新潮事物也充满好奇心。“有一次我们团建玩密室逃脱,邀请郑老师,没想到他真来了。”魏东笑着说,“更意外的是,他连玩密室逃脱也冲在最前面呢。”

时不我待 以“倒计时”心态做科研

  “如果倒推的话,我的学术生涯很可能还剩下12年。”聊起在西湖大学的规划,郑冶枫的回答有些让人意外。他说,自己是以“倒计时”的心态在做科研。

  48岁这年,郑冶枫做出回归学界这一人生拐点的决定,他有着一种时不我待的紧迫感。

  今年4月,郑冶枫在西门子期间的同事、早前全职加入西湖大学的杨林向他发出邀请,并向校长施一公推荐了他。不到半个小时,郑冶枫接到了来自施一公的电话。而后仅仅过了3个月,郑冶枫就完成工作的交接,站上了新的跑道。

  “在这样的年龄,从业界到学界,是不是一个鼓足勇气的跨越?”最近,郑冶枫常常被问到这个问题。

  复盘一路的轨迹,郑冶枫在大学读书期间都在进行文本图像识别的研究,在西门子美国研究院和腾讯从事的医学图像分析是计算机视觉的分支。对他而言,来到西湖大学创立医学人工智能实验室,不算是一种“从这头到那头”的跨越,这个轨迹更像一个“圆”,一直有个不变的圆心——医学人工智能。

  不同之处在于,工业界更聚焦承接产业的需求,解决一两年内的研发问题;而在学界,则鼓励更自由、开放的前沿探索。

  医疗影像AI发展到今天,赛道已经非常拥挤。据不完全统计,国内涉足医疗影像AI的企业超过100家。研究方向也比较重叠,主要集中在肺结节、眼部疾病等少数几个病种,而在脊柱、腹部等复杂部位诊断的尝试则相对较少。

  郑冶枫的理想是研发出医疗领域的通用人工智能——也就是一个多模态大模型。在做好基础病种诊断的同时,力求差异化,涉足更多新的疾病。

  医生在看诊时制定个性化的诊疗方案,要参考结合很多信息数据,比如,家族病史、当前的症状、影像检查的结果 还有基因测序结果等等,每个信息来源都可以认为是一个模态。

  郑冶枫和团队希望,将所有关于病人的图像、数据、文字等多种形式的复杂信息进行集成,综合生成诊断结果或治疗方案。这一过程中,不同样态数据的对齐和融合,是打造这个大模型最有挑战性之处。

  2023年3月,中共中央办公厅、国务院办公厅印发《关于进一步完善医疗卫生服务体系的意见》,明确鼓励“互联网+”医疗服务和人工智能等技术应用,为他注入了一股更强大的信心。

  最近,他正忙着“招兵买马”,目前已经组建起一支11个人的新团队。“如果再用‘倒计时’推算,培养周期5年,大概还可以培养将近20名博士生。”为自己深耕的领域培养新一代专家,这是郑冶枫最有成就感的事。

  在带领新团队时,他将延续以往的管理风格,继续做一个比较“放手”的人,希望能够给学生乃至整个实验室的团队,提供方向性的指导和把握。“‘医疗+AI’是一个交叉领域,学生只要有一些计算机的经验,有热爱、喜欢和专注就可以,原先学习的专业并不那么重要,专业不一样反而会激发出新点子。”

  站在新的起点眺望,医疗AI这条道路还远远望不到尽头,“百米赛跑,我们才刚刚起步。”郑冶枫说。目前AI在信息理解的精度和深度上和人类仍然有较大差距。“很多时候,人工智能能力被神化了,比如说100%的准确率,超过人类专家,这是不现实的。”

  郑冶枫坦诚地谈论这些问题,但也有一种笃定,像20年前坚信机器学习的性能一样——大模型所带来的生产力的提升,毋庸置疑。技术路线没有问题,他们走在一条正确的道路上,“逢山就开路,遇水就搭桥”。从这个“圆心”出发,“半径”在不断延伸。







往期推荐:

虎山运动公园游泳馆建设进入收尾阶段

今起,这些新规将影响你我生活

江山市召开第21号台风“康妮”防御工作部署会


来源:浙里衢州

编辑:江涛

责编:徐丽兰

终审:陆天旺



小布温馨提醒

由于微信修改了推送规则

没有经常点“在看”的小伙伴们

可能无法及时收到我们的推送哦

看完后别忘记在文末点下“赞”“在看”

记得将“江山发布”加为星标

不容易错过江山的权威信息发布

喜欢就把文章分享到朋友圈吧


觉得内容不错,

点个“在看”分享给更多人!

江山发布
权威信息发布平台、热点事件回应平台、民生信息服务平台、城市形象展示平台。
 最新文章