首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

哈佛推出全新类ChatGPT癌症诊断AI，登上Nature！准确率高达96%

科技 2024-11-10 12:33 北京

新智元报道

编辑：静音

【新智元导读】能够执行多种任务，识别19种癌症类型，预测患者生存率……哈佛医学院研究人员提出CHIEF，一种多功能AI癌症诊断模型，表现出类似于ChatGPT的灵活性，远超其他现有的癌症诊断模型。

近日，来自哈佛医学院等机构的科学家们开发了一种名为CHIEF（Clinical Histopathology Imaging Evaluation Foundation，临床组织病理学成像评估基础）的多功能AI癌症诊断模型。

并于9月4日登上「Nature」。

论文地址：https://www.nature.com/articles/s41586-024-07894-z

值得一提的是，尽管最近出现了其他用于医学诊断的病理图像基础AI模型，但CHIEF是第一个能够预测患者预后并在多个国际患者群体中验证的模型。

工作原理

当前，大多数AI癌症诊断系统通常被训练来执行特定任务。例如，检测癌症的存在，或分析肿瘤的基因特征，且通常仅适用于少数几种癌症类型。

相比之下，全新的CHIEF模型则具有类似于ChatGPT的灵活性——不仅能够执行多种任务，而且还能识别不同癌症类型需要特别关注的区域。

通过读取肿瘤组织的数字切片，它可以检测癌细胞并根据图像中观察到的细胞特征分析肿瘤的基因特征。

此外，还可以预测多种癌症类型的患者生存率，并精确定位肿瘤周围组织的特征，即肿瘤微环境。这些特征与患者对手术、化疗、放疗和免疫治疗等标准治疗的反应有关。

更进一步的，CHIEF还具有生成新见解的潜力——它发现了此前未被认为与患者生存相关的特定肿瘤特征。

研究团队指出，这些发现进一步证明了AI可以帮助临床医生高效、准确评估癌症，包括识别可能对标准癌症疗法反应不佳的患者。

论文主要作者，哈佛医学院Blavatnik研究所生物医学信息学助理教授Kun-Hsing Yu

模型训练与表现

首先，CHIEF在1500万张未标记的图像上进行训练，这些图像被分成多个模型可能需要特别关注的部分。

然后，CHIEF在6万张全切片图像上进行了训练，其中包括肺、乳腺、前列腺、结肠、胃、食管、肾脏、脑、肝、甲状腺、胰腺、宫颈、子宫、卵巢、睾丸、皮肤、软组织、肾上腺和膀胱等组织的全切片图像。

这种训练方法，使得模型不仅关注图像的局部，还能够结合整个图像，将某一局部的特定变化与整体联系起来。从而，CHIEF在进行癌症分析时能够考虑更广泛的背景信息，更全面地解读图像，而不是仅仅专注于某个特定区域。

训练完成后，研究团队在19400多张全切片图像上测试了CHIEF的性能。这19400多张全切片图像来自全球24家医院和患者群体中收集的32个独立数据集。

总体上，CHIEF在以下任务中比其他最先进的AI方法高出36%：癌细胞检测、肿瘤起源识别、预测患者结果、以及识别与患者治疗反应相关的基因和DNA模式。

无论肿瘤细胞是通过活检还是手术切除获得，CHIEF的表现都同样出色。无论使用何种技术对癌细胞样本进行数字化处理，它的准确性也同样高。

研究人员表示，这种适应性使CHIEF能够在不同的临床环境中使用，而当前大部分AI癌症诊断模型通常只能在通过特定技术获取的组织中表现良好。

CHIEF的4种应用

癌症检测

CHIEF在癌症检测中的准确率达到了近94%，测试涵盖了15个数据集，其中包含11种癌症类型。

在另一个涵盖5个活检数据集的测试中，CHIEF达到了96%的准确率，其中包括食道、胃、结肠和前列腺在内的多种癌症类型检测。

当研究人员用数据集之外的手术切除肿瘤切片来测试CHIEF时，模型的准确率超过了90%。

模型注意力得分的可视化显示，CHIEF准确识别了黑色素瘤、肺癌和肾癌的癌变区域

分析肿瘤的基因特征

肿瘤的基因构成包含了未来肿瘤发展和最佳治疗方案的关键线索。为了获取这些信息，肿瘤学家通常会对肿瘤样本进行DNA测序。

但由于将样本送往专业的DNA测序实验室需要一定的成本和时间，世界各地普遍没有进行常规的详细的基因组分析。即使是在资源充足的地区，这一过程也可能需要数周时间。

不过，这是AI可以填补的空白。

研究人员称，对于图像中特定的基因组异常，识别其细胞模式，可能提供一种快速且经济的替代基因组测序的方案。

CHIEF在预测肿瘤的基因变异方面优于现有的AI方法。这种新的AI方法成功识别了与癌症生长和抑制相关的多个重要基因特征，并预测了肿瘤在各种标准癌症疗法过程中的关键基因突变。

CHIEF还检测到了特定的DNA模式，这些模式与结肠肿瘤对一种称为免疫检查点抑制的免疫疗法的反应效果相关。

在观察全组织图像时，CHIEF识别出54个常见突变癌症基因中的突变，总体准确率超过70%，优于当前用于基因组癌症预测的最先进AI方法。

研究团队使用CHIEF模型来预测特定基因突变，这些突变与FDA（美国食品药品监督管理局）批准的靶向治疗方法的效果有关。研究涉及的18个基因分布在人体的15个不同解剖部位。

CHIEF在多种癌症类型中都达到了高准确率。在检测一种名为弥漫性大B细胞淋巴瘤的血液癌症中的EZH2基因突变时，CHIEF达到了96%的准确率；在检测甲状腺癌中的BRAF基因突变时，CHIEF的准确率达到了89%；在检测头颈部癌症中的NTRK1基因突变时，准确率为91%。

CHIEF 在预测癌症类型的组织病理学图像中的基因突变状态方面取得了很高的成绩

预测患者生存率

基于初次诊断时获得的肿瘤组织病理图像，CHIEF能够成功预测患者的生存期。

总体上，CHIEF预测高风险和低风险死亡率的能力在来自17家不同机构的患者样本中得到了测试和验证。

在所有研究的癌症类型和患者群体中，CHIEF能够区分长期生存的患者和短期生存的患者。CHIEF的表现比其他模型好8%。

在患有晚期癌症的患者中，CHIEF的表现比其他AI模型高出10%。

识别不同癌症类型需要特别关注的区域

该模型在图像上识别出与肿瘤侵袭性和患者生存率相关的明显模式。

为了可视化特定的区域，CHIEF在图像上生成了热图。当人类病理学家分析这些由AI生成的热点时，他们发现了一些反映癌细胞与周围组织相互作用的有趣信号。

模型注意力的可视化显示了肺癌患者生存预测中的重要区域

其中一个特征是，在长期生存者的肿瘤区域中，免疫细胞的数量比短期生存者更多。Yu指出，这一发现有其合理性，因为更多的免疫细胞可能表明免疫系统已被激活来攻击肿瘤。

在观察短期生存者的肿瘤时，CHIEF识别出了一些需要关注的区域。这些区域的特征包括各种细胞成分的异常大小比例、细胞核上更多的非典型特征、细胞之间较弱的连接，以及肿瘤周围区域中较少的结缔组织。

这些肿瘤周围还有更多的死亡细胞。例如，在乳腺肿瘤中，CHIEF指出组织内的坏死（或细胞死亡）是一个需要关注的区域。另一方面，生存率较高的乳腺癌患者肿瘤周围，更有可能保持类似于健康组织的细胞结构。

研究团队指出，与生存率相关的视觉特征和需要关注的区域因癌症类型而异。

参考资料：

https://scitechdaily.com/96-accuracy-harvard-scientists-unveil-revolutionary-chatgpt-like-ai-for-cancer-diagnosis/

https://hms.harvard.edu/news/new-artificial-intelligence-tool-cancer

http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652537436&idx=2&sn=54496dafb25793296a760da9d7f6ca13

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

最新文章

周鸿祎黑客短剧震撼首秀，直接带火纳米搜索！搜学写创，开启AI搜索3.0时代

数字孪生心脏全球首次实现0.84秒超实时模拟！智源突破计算极限，180倍性能提升

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

当AI创造AI，就是库兹韦尔「奇点」临近时？人类正处于自我改进AI爆炸边缘

招人！新智元邀你勇闯ASI之巅

十年再登巅峰！刚刚，Ilya和GAN之父斩获NeurIPS 2024时间检验奖

AI卷翻科研！DeepMind 36页报告：全球实验室被「AI科学家」指数级接管

AI造芯Nature论文遭围攻，谷歌发文硬刚学术抹黑！Jeff Dean怒怼：你们连模型都没训

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，Mamba作者点赞

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

招人！新智元邀你勇闯ASI之巅

Sora半夜泄露3小时，物理效果惊人！奥特曼急拔网线，艺术家抗议被白嫖

逃回大厂！谷歌天才科学家Yi Tay——639天创业血泪史

打破LLM数据孤岛！Anthropic革命性MCP让大模型解锁全网数据，AGI要来了？

AI视频两巨头开战！Runway秒生现实大片，Luma动嘴创作电影

「学术版ChatGPT」登场！Ai2打造科研效率神器OpenScholar，让LLM帮你搞定文献综述

揭示Transformer「周期建模」缺陷！北大提出新型神经网络FAN，填补周期性特征建模能力缺陷

UC伯克利：给大模型测MBTI，Llama更敢说但GPT-4像理工男

招人！新智元邀你勇闯ASI之巅

GAN之父新冠后惊传罹患双重顽疾！听力减退心动过速，全网求医

OpenAI怒斥Scaling撞墙论！o1已产生推理直觉潜力巨大

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：覆盖8种语言，超4500种任务

世界模型挑战赛，单项奖金10000美元！英伟达全新分词器助力下一帧预测

招人！新智元邀你勇闯ASI之巅

Claude 3.5两小时暴虐50多名专家，编程10倍速飙升！但8小时曝出惊人短板

新晋AI编程神器干翻Cursor！首创实时感知无限用，估值12.5亿华人初创震惊AI界

扩散模型=进化算法！生物学大佬用数学揭示本质

招人！新智元邀你勇闯ASI之巅

美国教授痛心：UC伯克利GPA 4.0计算机本科生，毕业即失业？ML博士直呼太卷后悔转行

英特尔错失AI芯片浪潮，从放弃收购英伟达开始

一只暹罗猫竟是论文作者！谷歌学术20岁，创始人首次公开最魔幻学术故事

招人！新智元邀你勇闯ASI之巅

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

5年浴火，800余岁巴黎圣母院重生！马斯克激动转发，AI数字建模创奇迹

首个可保留情感的音频LLM！Meta重磅开源7B-Spirit LM，一网打尽「音频+文本」多模态任务

机器人训练数据不缺了！英伟达团队推出DexMG：数据增强200倍

招人！新智元邀你勇闯ASI之巅

全面进攻谷歌！OpenAI被曝打造浏览器，已挖Chrome创始大牛

预定下一个诺奖级AI？谷歌量子纠错AlphaQubit登Nature，10万次模拟实验创新里程碑

宝可梦GO「偷家」李飞飞空间智能？全球最强3D地图诞生，150万亿参数解锁现实边界

OpenAI薪酬大曝光！奥特曼身价145亿，年薪只有55万

世界最大AI Agent生态系统！微软推出全新「自主AI智能体」，10万企业工作流被改变

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你「LLM+外部数据」的正确使用姿势

招人！新智元邀你勇闯ASI之巅

OpenAI看好的方向，文心智能体技术抢先爆发！

「全球最严榜单」，阶跃拿下中国TOP 1！杀入世界前五，超过GPT-4o紧跟o1-mini

收敛速度最高8倍，准确率提升超30%！华科发布MoE Jetpack框架 | NeurIPS 2024

405B大模型也能线性化！斯坦福MIT最新研究，0.2%训练量让线性注意力提分20+

招人！新智元邀你勇闯ASI之巅

美国AI曼哈顿计划793页文件曝光！全力研发AGI，十大战略直指中国

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉