还在卷单细胞?肿瘤图像数据高分生信新思路~

文摘   2023-09-15 12:38   黑龙江  

导语

        激素受体(HR)在分子水平上的状态对于乳腺癌的准确诊断和有效治疗至关重要。同时,乳房X光检查是检测乳腺癌的有效筛查方法,可显著提高生存率。然而,诊断乳腺癌的分子状态涉及病理活检,这可能会影响诊断的准确性。为了非侵入性地诊断乳腺癌的激素受体(HR)状态并减少手动注释,本研究提出了一种弱监督深度学习框架BSNet,该框架可以检测具有HR状态的乳腺癌和良性肿瘤。BSNet 基于在2017-2018 年期间黑龙江省哈尔滨医科大学肿瘤医院的 2321 例女性的多视角钼靶图像的训练,并在外部队列中进行了验证。BSNet在测试集和外部验证集上的平均AUC分别为0.89和0.92。BSNet在HR状态的非浸润性乳腺癌诊断中表现出色,使用多个钼靶图像的视图,没有像素注释。BSNet描述了乳腺癌亚型的高维乳房X线摄影,这有助于为早期管理选择提供信息。

背景介绍




今天小编为大家带来一篇基于多视角钼靶图像的半监督深度学习算法预测HR分子状态发表在6分+Computational and Structural Biotechnology Journal的思路。题目为Developing a weakly supervised deep learning framework for breast cancer diagnosis with HR status based on mammography images

数据介绍




      用于钼靶图像分析的数据集由 2321 名女性组成,她们在 2017 年至 2018 年期间在哈尔滨医科大学肿瘤医院进行的普通人群筛查中接受了数字乳房 X 线摄影扫描。该数据用于研究中的训练、验证和测试。HR +患者被归类为ER或PR检测呈阳性的患者,而HR患者被归类为ER和PR检测呈阴性的患者。本研究共涉及2321名患者的乳房X光检查数据,其中包括850名被诊断患有良性疾病的患者和1471名乳腺癌患者。在乳腺癌组中,920名患者为HR +,551名患者为HR-。这些病例包括286例管腔A例,634例管腔B例,303例Her2阳性过表达,248例被归类为三阴性。每位参与者都接受了完整的全视野数字乳房 X 光检查,包括多达四张图像,包括左乳房和右乳房,具有颅尾(CC)和中外侧斜(MLO)视角,总共产生 9284 张乳房 X 线摄影图像。训练和测试集中HR状态、年龄、IHC亚型和Her2状态的分布见表。基于年龄的图像分布没有显示出任何显着差异。由于HR+ / Her2-是乳腺癌最普遍的亚型,因此本研究中的乳房X光检查数据符合通常观察到的分布。外部验证集随机选择,由190名患者组成,2018年至2019年期间在哈尔滨医科大学肿瘤医院共拍摄了760张钼靶图像。该数据集包括127例良性肿瘤,以及28例HR+乳腺癌和35例HR-乳腺癌。本研究包括所有具有四个完整视图、无损伤和临床信息以及免疫组织化学(IHC)的钼靶图像。

研究设计




目前,基于钼靶图像的乳腺癌HR状态预测尚未得到广泛探索,大多数研究需要大量的注释信息来开发基于乳腺X线摄影图像的深度学习模型,对良恶性肿瘤进行分类。本研究避免了乳腺X线摄影图像的像素级手动标注,拓展了基于乳腺X线摄影图像的深度学习模型在乳腺癌HR分子状态诊断和预测中的应用。首先,本研究收集并预处理了所有乳腺癌钼靶图像,并开发了一个弱监督学习框架BSNet。通过与不同的特征整合方法和基线模型的性能进行比较,结果最终表明BSNet在HR分子状态乳腺癌的非侵入性筛查中具有优越的性能。

具体来说,研究将HR+乳腺癌920例、良性肿瘤850例、HR-乳腺癌551例2321例钼靶图像按9:1分为训练集和测试集,按照五重交叉验证对训练集进行分级划分;然后,BSNet通过定义钼靶图像特征转换模块、特征提取模块和预测模块,将患者分类为HR+乳腺癌、HR-乳腺癌或良性肿瘤。BSNet允许将四张图像输入在一起,通过特征提取模块整合四张图像的特征,馈送至提取的图像特征,然后使用全局平均池化层来池化特征嵌入。最后,将图像特征传送到决策模块,BSNet输出3类的概率值,并通过识别概率值最高的类别作为输出来确定钼靶图像的类别标签。其中使用包括全连接层和softmax函数的决策模块将乳腺癌分为三类:HR+乳腺癌,HR-乳腺癌和良性肿瘤。对于训练过程,本研究采用五重交叉验证方法在训练验证数据集上训练和调优BSNet。该测试集用于评估BSNet的性能,并应用外部验证集(190例的钼靶图像)来测试BSNet的稳健性。

结果解析




01  特征整合方法比较
为了确定BSNet的最佳特征整合操作,本研究使用AUC指标将全局平均池化的性能与最大池化和平均池化进行了比较。我们的研究结果表明,与其他特征集成方法相比,全局平均池化实现了最高的性能。具体而言,在测试集上,全局平均池化实现了0.89的微平均AUC和0.88的宏平均AUC,而在外部验证集上,它获得了0.92的微平均AUC和0.90的宏平均AUC。通过测试集上的最大池化获得的微平均值和宏平均AUC值分别为0.57和0.69。类似地,它在外部验证集上分别获得了0.47和0.71的微平均值和宏平均AUC值。本研究还评估了均值池化积分方法的性能。测试集上的平均池化方法的微平均AUC为0.72,宏平均AUC为0.68。同样,在外部验证集上,平均池法的微平均和宏平均AUC分别为0.72和0.68。就每种类型肿瘤的性能而言,与最大池化和平均池化方法相比,BSNet全局平均池化所达到的AUC在HR+乳腺癌,HR-乳腺癌和良性肿瘤中最高。结果表明,全局平均池化特征整合方法提取钼靶图像特征更有效。此外,本研究利用全局平均池化特征通过使用梯度加权类激活映射来创建特征热图,这使我们能够识别对预测肿瘤类型具有重要意义的图像区域。这些结果表明,BSNet具有捕获乳腺癌异质性的潜力,用于乳腺癌HR分子状态的非侵入性筛查。

02 模型的比较方法

鉴于在大型数据集上训练的预训练模型的多功能性,它们可以有效地应用于各种医学图像分类任务,以准确识别图像中的突出特征。因此,本研究使用AlexNet,Vgg16,ResNet18,ResNet34和ResNet50根据复杂程度比较模型的性能。这些模型的主层数分别为 8、16、18、34 和 50。本研究首先根据多视图钼靶图像和分类任务的同时输入,将这些模型的结构修改为基线模型。具体来说,我们将第一层的通道数从3个调整为1个,并为每个基线模型定义了全连接层,以适应当前的分类任务。对于Vgg16,ResNet18,ResNet34和ResNet50,我们定义了两个全连接层,对于AlexNet,我们定义了一个全连接层。用于比较的基线模型的结构如图所示。

由于ResNet-22用于预训练的钼靶图像数据集不是公开的,因此本研究在ImageNet数据集上使用基线模型(如ResNet34和ResNet50)的预训练权重。研究将预先训练的模型参数加载到相应的基线模型中,这些模型都在本研究中涉及的钼靶图像数据集上进行了微调。本文利用网格搜索方法为基线模型选择调整参数。候选参数值列于表中。采用交叉熵损失函数和亚当优化器对基线模型进行训练。研究应用了提前停止以避免过度拟合,这意味着如果验证集上的AUC连续80个epoch未能改善,训练过程就会提前终止。

03 模型的比较结果
本研究在测试集和外部验证集上将BSNet与其他基线模型(AlexNet、Vgg16、ResNet18/34/50)的性能进行了比较。BSNet在测试集上的指标为 0.892(微平均AUC)、0.884(宏平均AUC)、0.972(良性AUC)、0.900(HR+ AUC)、0.764(HR- AUC)、0.780(准确性)、0.777(分别为 0.760(召回率)和 0.768(F1 分数)。

04  BSNet网络服务器平台的开发
为了增强 BSNet 的可用性,本研究创建了一个方便的钼靶图像诊断分类系统,可在 http://bsnet.edbc.org 上获取。BSNet Web 服务器使用开源 Dash 框架开发,训练后的 BSNet 模型存储在后台,方便数据科学家构建分析 Web 应用程序。我们通过定义布局属性来确定 BSNet Web 服务器的内容。创建 BSNet Web 服务器是为了分析乳房 X 线摄影图像并确定乳腺癌的 HR 状态。用户可以选择上传患者的“PNG”格式的四视图钼靶图像。一旦用户点击“提交”按钮,存储在后台的BSNet模型将被激活并开始计算。BSNet 网络服务器将通过集成输入和多视图钼靶图像的特征提取来输出三种乳腺疾病分类的概率。这些分类包括 HR+ 乳腺癌、HR- 乳腺癌和良性肿瘤。本研究根据概率值最高的类别确定案例的类别。
讨论




本研究开发了一种无需像素级注释的弱监督乳腺癌诊断人工智能模型,用于诊断乳腺癌并预测 HR 状态。研究的结果表明 BSNet 的性能优于其他基线模型。此外,我们还开发了网络服务器,可以更方便地诊断乳腺癌患者的HR状态,实现无需穿刺的精准医疗。然而,还需要付出额外的努力来实现稳定的模型,以促进临床应用中乳腺癌分子特征的非侵入性评估。研究表明钼靶图像可用于对乳腺癌的HR亚型进行分类,并实现乳腺癌的非侵入性分子状态诊断。



往期推荐


分析专辑


单细胞scRNA | R包绘图 | 免疫浸润分析 | 肿瘤纯度评估工具 | 数据库


文章解读专辑


多区域进化文章精读 | 高分文章精读 | 免疫微环境文献解读


招聘信息


招聘


点击红字即可进入专栏!

文字均为原创,欢迎读者分享或转发到朋友圈,任何公众号或其他媒体未经许可不得私自转载或抄袭。
由于微信平台算法改版,公众号内容将不再以时间排序展示,建议设置“作图丫”公众号为星标,防止丢失。星标具体步骤为:
(1)点击页面最上方“作图丫”,进入公众号主页;
(2)点击右上角的小点点,在弹出界面选择“设为星标”即可。


点个在看你最好看




计算表观遗传学
“计算表观遗传学(Computational Epigenetics - CEPI)”公众平台致力于表观遗传领域的科学研究,汇集领域内数据分析、算法开发及平台搭建,领航表观前沿,共同探索表观遗传调控机制。
 最新文章