上次说到Waston Health成立,意图在医疗健康领域大展拳脚。这确实是个充满钱景的领域,为了健康、生命、长寿,无论穷人富人都会付出大笔的金钱。这次,把突破口放在肿瘤上。 凭借IBM强大的市场能力,与很多医院和大学、研究机构达成了合作。国外就不说了,看看国内的:
相信大家可能不少人听过Waston医生的大名,但实际见过啥样的没几个,这是基本界面,在给出了患者的基本情况(文本)后,Waston给出治疗方案建议,比如下面这个乳腺癌患者,就建议先化疗,8个月后进行外科手术,再过1个月转放射治疗。对于第一阶段的化疗,给出了所需的药品名称和使用顺序,可谓十分细致。
那么对于每一种药品,既往的使用效果怎么样呢?也会列出以前案例的使用情况和统计情况,包括论文分析和来源,2年生存率,4年生存率,给医生比较可靠的参考。我们说医生越老越值钱,其实就是时间长了,医生见的案例多了,形成了自己的大数据系统,这是非常有价值的(码农:Excuse me?),一个三甲医院医生相当于每天都会采样几十人,20年下来样本量非常大,会在头脑中形成非常实用的统计模型。但并非每个医生这样,有些罕见病大医院也未必见过几个2、3线城市、农村或中小医院的医生的样本量要小得多,有个知识储备非常充足的AI助手是很有用的。
那用了这个药有什么不良反应吗?现在的医生做诊疗都很谨慎,避免误诊,否则麻烦很大,连自己都有受伤或生命危险。每个病患的情况不一样,有的不良反应对一些人可能不算什么,但对另一些人是不能承受的。这里会把每种药物可能的不良反应都列出来加上一些数据材料分析。
整个过程还是通畅合理的,除了:水土不服。
这个不服,包含医疗数据/共识和市场策略两方面, 不仅仅是在中国市场,基本在所有合作的医疗机构都出现。DeepQA被设计成能够从非结构化的文本中提取信息,但医疗领域的语言,与日常使用的语言有很大差异,去过医院的同志应该都有体会。举个例子,这是一张典型的彩超检查单的文本:
====================
黑白B超检查所见:
肝脏形态、大小正常,实质回声欠均匀,实质内探及两个囊肿,大者约9x6mm,位于左叶。肝内胆管未见扩张。门静脉内径正常。
胆囊大小、形态正常,壁欠光滑,未见结石及占位。肝外胆管不扩张。
胰腺大小、形态及回声未见明显异常。
脾脏不大,脾静脉内径正常。
双肾大小、形态正常,实质回声均匀,集合系统探及散在点状强回声。双侧输尿管不扩张。
膀胱充盈差。
前列腺大小约44x31x29mm,包膜完整,内部回声欠均匀,内可见强回声钙化灶。双侧精囊腺目前未见明显异常。
检查诊断:
肝囊肿
胆囊壁欠光滑
双肾点状强回声一结石、钙化均不除外
前列腺轻大伴钙化
====================
读一遍,你有没有感觉,虽然每个字都认识,但读着怎么这么别扭,语序都是倒装句,“XX不XX,XX未XX,XX欠XX”,双重否定“钙化均不除外”,缩写“前列腺轻大”。每个医院每个医生的写法都不一样,但医生都看的心领神会,明明白白。但让机器读可就要了命了,那个时代还没有大语言模型,也没有Attention/Transformer这样针对文本处理的神经网络,NLP方面还是传统的实体识别、关系抽取、意图分析之类的小模型,对这种与日常语言差异很大的文本,必须要重新标注、训练,这是个漫长而痛苦的过程,因为医疗知识过于专业,只有经过专业医疗训练的人才有能力标注,而医生哪有空做这个,何况连医生们自己可能都意见不一。
数据的限制太大,那就使用钞能力吧:
10亿美元收购Merge Healthcare,它可以分析乳房X线照片和MRI;
2.3亿美元收购ePhytel,可协助患者沟通;
26亿美元收购分析复杂医疗数据的Truven Health Analytics。
收购这些公司主要就是为了合法的医疗数据,收购后,这些公司的员工被大量裁员。有了数据之后的训练过程非常漫长和艰苦。要有一大批计算机科学家和医生、药剂师收集一个参考数据库,并加入病例学习,然后询问上千个问题。事实上,Watson 并不会自我学习,他给出的错误答案会被研究者们评估,再手动调整 Watson 的算法,保证最后输出的答案是有价值的。
然后,到了中国,语言风格完全不一样,诊断的指南也跟国外不一样,用药也不一样,亚洲人的体质跟老外也不一样。中国的中医案例中还有大量的阴阳五行内容。(Waston:我还得学算卦?你给我讲讲什么是Qi?)
IBM大中华区首席医疗顾问李明指出,Watson在学习中国病例、本土化过程中需要电子病历,这就考验着医院信息化的程度;同时,临床数据不仅是病患的检验检查报告,还涵盖了生活日常内容,如何实现有效整合亦是问题所在。
有采用过Watson的中国医生表示,给出的治疗建议更倾向于纯粹的西医思路,未见得就完全适用于中国患者。他们认为,部分中国医生在调理患者的时候或多或少会有中医的一些影子,但目前Watson尚不具备中西医结合的能力。
也有医生指出,例如Watson提出的建议药物,国内尚未上市;又或者是并未推荐某些标准药物。
Waston被设计成确诊疾病后提供个性化的诊疗方案,跟医生期望的辅助诊疗也有不小的差距。连图灵奖得主Yoshua Bengio也不看好这种AI医疗模式,他认为:“在医学文本文件中,人工智能系统无法理解其模糊性,也无法了解人类医生注意到的微妙线索。” (Yoshua大神镇楼)
那么市场方面呢?
为使Waston本地化,与杭州认知网络科技有限公司合作,提供销售、服务及客户支持等服务。Watson肿瘤解决方案在华初始版本仅支持英文,杭州认知提供部分中文翻译支持,其中包括药物标签与诊疗指南。此外,还将基于中国医药规定汉化用药指南。
另一个比较重要的合作伙伴是2017年签约百洋集团,作为Waston基因和Waston影像解决方案的独家分销商。百洋医药集团董事长付钢在接受记者采访时曾表示,使用Watson肿瘤解决方案均自费,价格是4500元/例。
后来,由于推广后发现医院在没有了解产品时收费很困难,改为了将Watson账号以很低的价格卖给医院,并不限制使用例数,先让医院和医生熟悉、参考,再探索收费模式。
这样的方式,与一开始中国医疗AI的初创公司的“入院之路”并没有什么区别,但都活的比较艰难。
2022年,IBM把Watson Health的医疗数据和分析资产出售给私募股权公司Francisco Partners,根据彭博社的报道,此次交易涉及的资产总价值约为10亿美元。
IBM在医疗健康方面轰轰烈烈的10年努力,花了几十亿美金,烟消云散。
复盘Waston Health,有几个值得思考的点:
数据是否代表广泛的特征分布:
通过收购短时间内取得了大量数据是正确的决定,但这些数据是否能代表各国和各个不同文化背景的医学知识?
由此开发的知识模型和逻辑如何适应?
与医疗机构数据的连通性:
在与所有的医疗机构合作时,都会面临这个实实在在的问题,患者病历如何与Waston打通?
如何与医院的系统连接?
这涉及跟HIS,PACS系统的连接。
技术限制:
从非结构化的文本和图像中取得准确的信息,了解“疗程”的概念和不同案例间微妙的联系,理解不同文化对医疗的影响,即便现在也是巨大的技术挑战;
对医生的价值是什么:
Waston给出的诊疗方案基本都是很标准的,医生的评价是:
Waston给的方案我都知道,我希望能告诉点我不知道的。
(跟医生不一样,医生又会觉得Waston有问题);
过度的市场宣传:
Waston的背景,是IBM在长期业务下滑的一针强心剂,工程上的成就还未达到技术突破的程度,但市场宣传给人的印象仿佛是可以自动诊疗替代医生了(你让医生怎么想),成为资本的一种市场策略(过度吹嘘拔高),也造成后期国外的医疗机构纷纷终止合同。
Waston,是IBM在人工智能辅助医疗方面一次伟大而悲壮的尝试,受资本急功近利的影响,加上技术上不够成熟,落地周期过长,历时10年而陨落。近百年来,也只有IBM才有能力做这种昂贵的尝试,即便是失败,也有其积极的意义,指出了一些道路不可行或时机尚未成熟,给后来者一些教训——但历史不断证明,人类学到唯一教训,就是不会从历史中学到任何教训。
近年,Google使用深度强化学习在围棋领域出现了突破,AlphaGo让人类震惊,类似的技术平移到AlphaFolder,实现了蛋白质结构预测,为精准医疗的实现迈进了一大步,不过这是另一个故事,有空另开一帖。而IBM就像一位被遗忘的长者,孤独的徘徊在潮流之外。
Waston的故事,就到这里了,遗憾没有看到一个灿烂的结果。但IBM作为百年的科技巨人,虽然步履阑珊,但从未停下前进的脚步。官僚主义、骄傲自大、资本的贪婪、领导层的短视,曾经、正在给IBM带来致命的伤痛,但它顽强的忍受和生存,全球广大的工程师、研究者才是IBM的中坚力量,才是IBM的核心竞争力,他们默默无闻长期的坚持和努力,铸造了IBM的百年老字号和发展的基石。虽然现在暂时处于低谷,但,好的Gamer都是多方下注,不会把鸡蛋放在一个篮子里面,下一集,会介绍IBM的隐藏工具箱,说不定会开启下一个颠覆式的新时代。
往期精选