TMI2024 | 阿大、同济等提出TraCoCo，用于3D医学图像半监督分割

学术 2024-10-29 11:45 北京

将 ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯

编辑 | ScienceAI

3D 医学图像分割方法已经取得了成功，但它们对大量体素级标注数据的依赖是一个需要解决的缺点，因为获取这些标注的成本很高。

半监督学习（SSL）通过使用大量未标注数据和少量标注数据进行模型训练，解决了这一问题。

最成功的 SSL 方法基于一致性学习，即通过最小化从扰动视图中获得的模型响应之间的距离来实现的。这些扰动通常在视图之间保持空间输入上下文的一致性，这可能导致模型从空间输入上下文中学习分割模式，而不是从前景对象中学习。

在最新的研究中，澳大利亚阿德莱德大学（The University of Adelaide）、同济大学等机构的研究人员提出了 TraCoCo，这是一种一致性学习 SSL 方法，它通过改变输入数据视图的空间输入上下文来进行扰动，使模型能够从前景对象中学习分割模式。

此外，该团队提出了一种新的“Confident Regional Cross entropy (CRC)”损失，该损失提高了训练收敛性，并保持了对共训练伪标签错误的鲁棒性。该方法在多个3D数据基准上达到了最先进的结果，例如左心房（LA）、胰腺CT（Pancreas）、和脑肿瘤分割（BraTS19）。该方法在一个 2D 切片基准——自动心脏诊断挑战（ACDC）上也取得了最佳结果，进一步证明了其有效性。

文章地址：https://ieeexplore.ieee.org/abstract/document/10695462

代码地址：https://github.com/yyliu01/TraCoCo

背景

3D医学图像分割方法虽然已取得成功，但它们依赖于大量体素级别标注数据，这是一个亟需解决的问题，因为获得这些标注的成本非常高。为了克服这一挑战，半监督学习（SSL）通过结合大量未标注数据和少量标注数据来训练模型，从而减少对标注数据的需求。

最成功的 SSL 方法基于一致性学习，通过最小化模型在未标注数据的不同扰动视图下的响应差异来实现一致性。然而，这些扰动通常保持视图之间的空间输入上下文较为一致，这可能导致模型从空间上下文中学习分割模式，而不是从前景对象中学习。

为解决这一问题，研究人员提出了一种新的 SSL 方法，称为 Translation Consistent Co-training（TraCoCo）。TraCoCo 通过改变输入数据视图的空间输入上下文来扰动视图，使模型能够从前景对象中学习分割模式。

同时，该研究还提出了一种新的 Confident Regional Cross-Entropy（CRC）损失，该损失旨在提高训练的收敛性并保持对共训练伪标签错误的鲁棒性。

Translation Consistent Co-training (TraCoCo)

TraCoCo是一种基于互助学习（Co-training）框架的方法，该框架通过翻译一致性（Translation Consistency）来扰动输入数据的空间上下文，从而减少模型对背景模式的“记忆”，确保模型专注于前景对象的分割。

模型框架

TraCoCo 包含两个初始参数不同的独立网络（通常为 VNet或 3D-UNet）。输入数据通过随机裁剪生成两个子体积（sub-volumes），这两个子体积的空间上下文不同，但在体素网格中存在重叠区域。

模型目标

为了确保模型在不同空间上下文下的前景分割结果一致，TraCoCo 引入了多种损失函数，包括监督学习损失、半监督学习损失和翻译一致性损失。本文的方法实现通过最小化以下损失函数来进行训练：

其中，分别由监督学习损失，半监督学习损失，和翻译一致性损失组成。

监督学习损失（Supervised Learning Loss）

监督学习损失通过带标注的数据集 D_L 进行计算，包括体素级交叉熵损失（Cross-Entropy Loss）和 Dice损失，用来优化模型的分割性能。损失函数定义为：

Translation Consistency Loss

Translation Consistency Loss 主要目标是确保模型在不同空间上下文下的分割结果一致。具体实现过程如下：从训练体积中随机提取两个中心不同的子体积

损失函数定义为：

其中，公式 4 是 Kullback-Leibler（KL）散度，用于计算两个子体积在重叠区域的分割结果之间的差异；公式 5 是基于负熵的正则化损失，用于平衡训练体素中的前景和背景类。

半监督学习损失（Semi-supervised Learning Loss）

半监督学习损失用于强化两个模型之间的分割一致性，Confident Regional Cross-Entropy (CRC) Loss, 其定义为：

3D CutMix

为了进一步提高训练的泛化性，本文采用了 3D CutMix 技术。实现为随机生成一个 3D 二值掩码，该掩码包含一个随机定义位置和尺寸的“1”方块。掩码应用在未标注数据和伪标签上，定义为：

实验

本文在四个公开的 3D 医学图像半监督分割数据集上进行了实验，包括：

左心房（Left Atrium, LA）：100 个 3D MRI 体积，其中 80 个用于训练，20 个用于测试。

胰腺 CT（Pancreas-CT）：82 个对比增强的 CT 扫描，采用特定的预处理步骤。

脑肿瘤分割 2019（BraTS19）：包含 335 个脑部 MRI 样本，每个样本包含四种扫描类型（T1, T1-ce, T2, FLAIR）。

自动心脏诊断挑战（ACDC）：该数据集包含 100 个心脏 MRI 扫描，本文使用了其 2D 切片进行半监督学习。

实验设置：采用了 VNet 和 3D-UNet 作为模型架构，实验评估指标包括Dice、Jaccard、平均表面距离（ASD）和 95% Hausdorff 距离（95HD）。实验结果显示，TraCoCo 在这些基准测试上均优于现有的最先进（SOTA）方法，特别是在标注数据较少的情况下。

总结

本文提出了 TraCoCo 和 CRC 损失在 3D 和 2D 医学图像分割任务中的有效性，证明了其在减少对背景模式的“记忆”以及提高前景对象分割精度方面的能力。

未来的工作计划包括扩展 TraCoCo 到更多复杂的医学图像任务，并在多模态医学图像中探索其半监督学习能力。

人工智能 × [ 生物神经科学数学物理化学材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展。

欢迎关注标星，并点击右下角点赞和在看。

点击阅读原文，加入专业从业者社区，以获得更多交流合作机会及服务。

http://mp.weixin.qq.com/s?__biz=MzI3MjM3ODk0NQ==&mid=2247503529&idx=2&sn=2f089b79a81723b1ff5b19b6b7382fc7

ScienceAI

机器之心旗下媒体，关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展。

登Nature，AI设计DNA开关，MIT团队实现精确的细胞控制

分类准确率达99%，山大团队提出基于对比学习的基因数据分类方法

准确、高效、物理有效，中科大、北大提出「两段式」分子对接统一框架DeltaDock

丹麦首台AI超级计算机，NVIDIA技术加持，服务于量子计算、清洁能源、生物技术等领域

TMI2024 | 阿大、同济等提出TraCoCo，用于3D医学图像半监督分割

科学实验室走向全自动化，机器人融合AI，加速科学发现，Science子刊观点

不懂AI、不会编码？如何轻松拿捏AlphaFold准确预测蛋白结构

Nature 子刊，化学语言模型自动设计多靶点配体

AI 驱动化学空间探索，大语言模型精准导航，直达目标分子

AI搞科研？西湖大学发布「AI科学家」Nova，效果比SOTA竞品提升2.5倍

成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊

1.1亿个结构DFT计算，Meta推出OMat24，AI驱动材料发现开源化

Nature子刊，北大陈语谦团队提出多模态单细胞数据整合和插补的深度学习方法

速度提高1000万倍，AI快速准确预测等离子体加热，助力核聚变研究

从结构准确预测蛋白质功能，东北大学「CNN+GCN」统一框架，优于现有方法

仅8B参数，可与GPT-4媲美，上交大团队构建多语言医学大模型

准确预测蛋白质功能，中山大学基于几何图学习的酶工程新方法

几秒完成化学反应，每天筛选上万反应，浙大、之江全自动高通量AI「机器人」

中国科学院核聚变最新进展，AI 加速等离子体参数预测

Nature子刊，香港浸大、英伟达团队多模态深度语言模型，用于复杂的宏基因组研究

AI 驱动的「科学搜索引擎」如何加速你的课题进度

水和算法有何相似？用物理学来理解大语言模型

化学空间导航仪：流生成式AI引导分子属性控制

AI发现超16万种新RNA病毒？阿里云、中山大学合作研究登Cell

化学诺奖为何颁给「AI+生物」，凭什么Baker独占一半？

快多个数量级，清华更高精度、更泛化的深度学习电子结构计算方法登Nature子刊

Nature子刊，基于量子实验数据进行机器学习，用于解决量子多体问题

AI再夺诺奖！2024诺贝尔化学奖授予蛋白质计算领域三位科学家

诺奖颁给交叉学科，对「AI for Science」意味着什么？

从预测风暴到设计分子，微软的 AI 基础模型如何加速科学发现

精准预测流产风险，上海交大等开发可解释AI算法，为早期预防带来希望

中国科学院团队发布GeneCompass：解析基因调控密码，打造干湿融合新范式

如何用生成式 AI 定义我们的未来？看看微软怎么说

更简单、更清晰，解析核酸、蛋白、细胞等结构，AI实现快速分子模式挖掘

Science 发文，高通量蛋白质组学和人工智能的革命

中国科大、科大讯飞团队开发ChemEval：化学大模型多层次多维度能力评估的新基准

灵巧的机器人，DeepMind推出两个基于AI的机器手系统和未知场景「生成式AI」应对策略

同时生成蛋白序列和结构，David Baker团队序列空间扩散新模型登Nature子刊

新「AI科学家」？MIT整合多智能体，实现材料科学研究自动化

OpenAI o1 在医学领域的初步研究，我们离 AI 医生更近了吗？

机器学习辅助催化剂设计，天大团队开发通用且可解释的描述符

中国科学院物理学家利用机器学习揭示原子核壳演化

Nature子刊，川大团队机器学习结合MD，预测蛋白质变构，助力药物研发

23亿参数，Transformer架构，NASA、IBM发布「天气+气候」通用AI模型Prithvi WxC

上交大、复旦中山团队开发糖尿病专用大语言模型，助力个性化糖尿病管理

准确率87.6%，南农、国防科大、苏大等发布显微图像分类AI新方法

借助谷歌AI工具，科学家揭示「生物蛋白如何应对恶劣条件」

全球首个真实场景城市内涝监测大模型

首个多模态地理科学大模型「坤元」

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉