【论著】基于CT图像人工智能机会性自动评估腰椎骨量的应用研究【2024年6月第4期】

学术   2024-10-29 18:00   北京  

点击标题下「蓝色微信名」可快速关注

摘要

目的探讨人工智能(AI)定量CT辅助诊断系统基于CT图像机会性评估腰椎骨量的可行性及价值。方法回顾性收集烟台市烟台山医院(2022年6—12月)和烟台毓璜顶医院(2023年9—10月)50岁及以上行胸部低剂量CT、常规剂量CT平扫及增强CT检查者548例的图像纳入研究,使用AI定量CT辅助诊断系统与定量CT测量软件分别测量受检者的平均体积骨密度(vBMD)并根据vBMD绝对值进行骨量分类(骨量正常、低骨量、骨质疏松)。以定量CT结果为参考标准,分别计算AI评估腰椎低骨量+骨质疏松、骨质疏松的敏感度、特异度、阳性预测值、阴性预测值、准确性及F1-score值,绘制受试者工作特性曲线,比较AI定量CT辅助诊断系统与人工分析在诊断效能上的差异。使用 Kappa一致性检验评估两种方法判断腰椎骨量的一致性,计算AI进行骨量分类的宏观平均值。结果548例(男性319例,女性229例)受检者,532例AI骨量分类准确。AI识别低骨量+骨质疏松的敏感度、特异度、阳性预测值、阴性预测值、准确性、F1-score值及曲线下面积(AUC)值分别为97.78%、98.71%、99.04%、97.03%、98.18%、0.98、0.982,识别骨质疏松的敏感度、特异度、阳性预测值、阴性预测值、准确性、F1-score值及AUC值分别为99.00%、98.88%、95.19%、99.77%、98.91%、0.97、0.989。AI与定量CT进行骨量分类的一致性较好, Kappa值为0.954(P<0.001)。AI进行腰椎骨量分类的宏观敏感度、特异度、阳性预测值、阴性预测值、准确性、F1-score值分别为97.38%、98.49%、96.77%、98.42%、98.06%、0.97。结论AI定量CT辅助诊断系统可准确自动进行腰椎骨量分类,及时检出骨质疏松患者,有望在大规模骨质疏松筛查中发挥更大优势,具有较高的临床实际应用价值。


焦自梅王曦刘钦鹏赵文雷张国伟谢海柱刘凤杰戴政君4

1烟台市烟台山医院影像科,烟台264000;2济南市第二人民医院影像科,济南250000;3烟台毓璜顶医院影像科,烟台264000;4慧影医疗科技(北京)股份有限公司科研部,北京100192

通信作者:刘凤杰,Email:fjliu@cmu.edu.cn


近年来,我国骨质疏松症的患病率及发生率明显增加,骨质疏松常导致脊柱压缩性骨折等严重后果,从而给个人及社会造成巨大的医疗经济负担1-2]。目前骨质疏松症仍未受到患者充分重视,资料显示50%以上的骨质疏松性骨折的患者从未接受过骨质疏松症的筛查3]。及早发现骨质疏松症并进行早期干预具有非常重要的临床价值。


利用定量CT(quantitative computed tomography)基于CT图像的机会性筛查已被证明可以准确地测量腰椎体积骨密度(volumetric bone mineral density,vBMD)4-6],但需要经验丰富的放射科医师进行人工手动处理7],且需要定期利用体模进行校准。人工智能(artificial intelligence,AI)是一种模拟人类智能思维和行为的科学与技术,AI发展受到计算机科学、数学、生物学和认知心理学等学科的影响。它涉及机器学习、计算机视觉、自然语言处理、专家系统和机器人技术等多个领域。随着计算机硬件的不断发展和算法的不断改进,AI技术得到了快速发展。现在,AI已经广泛应用于各个领域,如医疗保健、交通、教育、金融、农业等,具有较高的社会效益和经济效益。随着医学AI的快速发展和广泛应用,其已成为医学各学科的关注热点。在基于医学影像图像的椎体自动分割8-9]、骨密度的自动测量9-10]等方面切实可行,可节约大量的人力与资金成本,提高诊断效率,使得大规模回顾性基于CT图像的自动腰椎骨密度测量成为现实。


本研究的目的是利用AI定量CT辅助诊断系统基于CT图像自动评估腰椎骨量情况(骨量正常、低骨量、骨质疏松),并与定量CT进行比较,探讨其在腰椎骨量分类中的价值。


资料与方法

一、一般资料

选取2022年6—12月于烟台市烟台山医院行胸部低剂量CT(LDCT)联合定量CT检查337例,2023年9—10月于烟台毓璜顶医院行常规剂量CT检查126例、增强CT检查85例受检者纳入本研究,共548例。其中男性319例,女性229例,年龄50~88(61.36±8.41)岁。研究对象包括恶性肿瘤术后复查患者64例,恶性肿瘤术前或保守治疗患者49例,体检及因其他疾病就诊患者435例。纳入标准:受检者年龄≥50岁;胸部LDCT与定量CT同时检查;CT重建图像连续且层厚≤1.25 mm。排除标准:T12~L2椎体存在囊性、硬化性或肿瘤性病变;有椎体手术史;图像存在呼吸伪影、金属伪影;扫描范围未包全L2椎体;椎体存在严重变形或骨折。


本研究为回顾性研究,获得烟台市烟台山医院伦理委员会批准(烟山伦准2023048号),免除受试者签署知情同意书。


二、仪器与方法

(一)CT检查

受检者胸部LDCT扫描使用飞利浦公司两种不同设备:inisive CT power及inisive CT,常规剂量CT平扫采用GE公司的Optima CT660及西门子公司的SOMATOM Definition,增强扫描使用西门子公司的SOMATOM Definition。患者检查时采取仰卧位,双手上举,吸气末屏气扫描,扫描范围需至少包括胸12椎体上缘至腰2椎体下缘;增强扫描选用门脉期图像进行BMD测量;所有CT图像采用肺算法或软组织算法。


(二)AI定量CT辅助诊断系统测量腰椎vBMD

将所有标准DICOM的CT图像导入AI定量CT辅助诊断系统(慧影医疗科技股份有限公司,版本号V2.2.0),系统采用脊椎分割定位模型,定位并分割出用于计算骨密度的椎体(T12、L1、L2),采用形态学方法去除骨皮质,提取中心骨松质感兴趣区域(region of interest,ROI),将该ROI的3D图像输入至骨密度回归模型,得到每块椎骨的骨密度预测结果。多个椎体的骨密度取平均即得到患者的骨密度预测结果(图1)。


图1 AI定量CT辅助诊断系统进行骨量诊断流程示意图


椎体分割算法为图像分割领域算法U-Net。U-Net由左半部分的编码网络和右半部分的解码网络组成,编码模块和解码模块之间通过跳跃连接进行特征融合。编码网络Encoder:由2个3×3×3的卷积层和2×2×2的最大池化层(stride=2)反复组成,共经过4次下采样,每经过1次下采样,通道数翻倍;解码网络Decoder:由1个2×2×2的上采样卷积层和2个3×3×3的卷积层反复构成,共经过4次上采样;网络最后一层通过1个1×1卷积将通道数变成期望的类别数。


骨密度检测采用DenseNet。骨密度检测网络分为特征提取和全连接回归检测头两个部分。该模型的输入是经3D U-net进行脊椎骨分割后的T12、L1、L2椎体松质骨ROI,其体素大小为16×32×32。网络特征提取部分为修改后的DenseNet网络结构,其主干网络结构为Backbone,Backbone具体参数见表1。



骨密度CT影像辅助检测软件骨密度回归检测算法网络的检测头部分采用全连接的形式。对DenseNet输出的1×1×1特征图,通过全连接操作将特征图的通道数调整为512。再经过两层全连接将输出变为1个单元,输出值即为模型预测的骨密度值。


(三)定量CT测量腰椎vBMD

337例胸部低剂量CT图像采用QCT Pro Model 4骨密度测量系统(Mindways software,Inc.)进行腰椎骨密度测量(图2),126例常规剂量CT及85例增强CT图像采用iCare QCT Advance 1.0骨密度分析系统(北京艾凯尔医学仪器有限公司)进行腰椎骨密度测量(图3)。定量CT系统定期用校准体模进行校准。测量时避开腰椎骨皮质和椎体后方中央静脉沟等结构,尽可能多包含骨松质,在每个椎体中间层面半自动勾画ROI测量椎体vBMD(mg/cm 3),并计算其平均值作为腰椎骨量分类的依据。所有定量CT测量分析均由2名接受过定量CT软件使用培训并具有丰富诊断经验的放射科医师进行,参考定量CT诊断标准进行骨量分类,若结果不一致,由高级医师审核评判。


图2 QCT Pro Model 4骨密度测量系统测腰椎体积骨密度示意图。在L1、L2椎体中央骨松质部分勾画感兴趣区域,测量体积骨密度


图3 iCare QCT骨密度分析系统测腰椎体积骨密度示意图。A为放置的感兴趣区;B为患者骨密度值与同龄同性别匹配的健康对照组比较


腰椎骨量分类的定量CT诊断标准为:vBMD>120 mg/cm 3为骨量正常,80 mg/cm 3≤vBMD≤120 mg/cm 3为低骨量,vBMD<80 mg/cm 3为骨质疏松,此标准已证明适用于中国人群11]


三、统计学方法

采用SPSS 22.0统计软件包(IBM公司,美国)进行统计学分析,计量资料以均数±标准差(x¯±s)表示。采用 Kappa一致性检验比较AI定量CT辅助诊断系统和定量CT骨密度测量工具的一致性,当 Kappa<0.2则说明一致性程度较差;0.2~0.4说明一致性程度一般;>0.4~0.6说明一致性程度中等;>0.6~0.8说明一致性程度较强;>0.8~1.0说明一致性程度很强。所有统计检验均采用双侧检验, P<0.05表示差异有统计学意义。


结  果

一、AI定量CT辅助诊断系统与人工定量CT腰椎骨量分类的一致性


以人工定量CT腰椎骨量分类为参考标准,AI定量CT辅助诊断系统对548例受检者进行腰椎骨量判断(表2),532例腰椎骨量分类准确。


AI定量CT辅助诊断系统腰椎骨量分类人工定量CT腰椎骨量分类合计
正常低骨量骨质疏松
正常22970236
低骨量32041208
骨质疏松0599104
合计232216100548
Kappa


0.954
P


<0.001

AI定量CT辅助诊断系统与人工定量CT腰椎骨量分类情况及一致性比较


二、AI定量CT辅助诊断系统诊断腰椎骨量异常的效能


利用定量CT测量腰椎vBMD总共检出骨量异常(低骨量+骨质疏松)316例(174例男性,142例女性),AI定量CT辅助诊断系统检出骨量异常312例(172例男性,140例女性)。通过混淆矩阵( 图4A )计算得出,AI定量CT辅助诊断系统识别骨量异常的敏感度、特异度、阳性预测值、阴性预测值、准确性、F1-score值分别为97.78%、98.71%、99.04%、97.03%、98.18%、0.98。AI定量CT辅助诊断系统诊断骨量异常的受试者工作特征(receiver operating characteristic,ROC)曲线见 图4B ,曲线下面积(area under the curve,AUC)值为0.982。以不同厂家定量CT结果为标准,AI定量CT辅助诊断系统识别骨量异常的敏感度、特异度、阳性预测值、阴性预测值、准确性、F1-score值、AUC值见表3。


图4 受检者人工智能(AI)定量CT辅助诊断系统及定量CT诊断骨量异常混淆矩阵(A);AI定量CT辅助诊断系统诊断骨量异常的受试者工作特征曲线(B)


腰椎骨量分类敏感度(%)特异度(%)阳性预测值(%)阴性预测值(%)准确性(%)F1-score值AUC值
以定量CT一为标准
骨量异常98.5397.3398.5397.3398.100.990.979
骨质疏松97.9698.7796.0099.3898.580.970.984
Kappa一致性Kappa=0.949( P<0.001)
以定量CT 二为标准
骨量异常97.2299.3699.4396.8998.220.980.983
骨质疏松10098.9594.4410099.110.970.995
Kappa一致性Kappa=0.957( P<0.001)

AI定量CT辅助诊断系统与不同厂家定量CT腰椎骨量分类情况统计表

注:定量CT一为iCare QCT Advance 1.0骨密度分析系统;定量CT二为QCT Pro Model 4骨密度测量系统;AUC:曲线下面积


三、AI定量CT辅助诊断系统诊断腰椎骨质疏松的效能


利用定量CT测量腰椎vBMD总共检出骨质疏松100例(38例男性,62例女性),男女骨质疏松发现率分别为:11.9%(38/319)、27.1%(62/229);AI定量CT辅助诊断系统检出骨质疏松104例(38例男性,66例女性),男女骨质疏松发现率分别为:11.9%(38/319)、28.8%(66/229)。通过混淆矩阵( 图5A )计算得出,AI定量CT辅助诊断系统识别骨质疏松的敏感度、特异度、阳性预测值、阴性预测值、准确性、F1-score值分别为99.00%、98.88%、95.19%、99.77%、98.91%、0.97。AI定量CT辅助诊断系统诊断骨质疏松的ROC曲线见 图5B ,AUC值为0.989。以不同厂家定量CT结果为标准,AI定量CT辅助诊断系统识别骨质疏松的敏感度、特异度、阳性预测值、阴性预测值、准确性、F1-score值、AUC值见表3。


图5 受检者AI定量CT辅助诊断系统及定量CT诊断骨质疏松混淆矩阵(A);AI定量CT辅助诊断系统诊断骨质疏松的受试者工作特征曲线(B)


四、AI定量CT辅助诊断系统与定量CT腰椎骨量分类比较


AI定量CT辅助诊断系统进行腰椎骨量分类诊断错误16例,3例骨量正常诊断为低骨量,5例低骨量诊断为骨质疏松,7例低骨量诊断为骨量正常,1例骨质疏松诊断为低骨量。 Kappa一致性检验表明二者对腰椎骨量分类一致性很强( Kappa=0.954, P<0.001)( 表2 )。AI进行腰椎骨量分类的宏观敏感度、特异度、阳性预测值、阴性预测值、准确性、F1-score值分别为97.38%、98.49%、96.77%、98.42%、98.06%、0.97。AI定量CT辅助诊断系统骨量分类结果与不同厂家定量CT分类结果 Kappa一致性,见表3。


讨  论

在本研究中,应用AI定量CT辅助诊断系统对548例受检者CT图像进行机会性评估腰椎骨量分类情况,结果具有较高的准确性,与人工定量CT分类具有显著一致性。大部分骨量分类错误的vBMD在骨量分类的诊断阈值附近,数值差别并不大,这也提示我们当腰椎vBMD在阈值附近时进行骨量分类需慎重,应密切结合临床资料进行综合判断,必要时进行多次重复测量取平均值。尽管影像医师利用定量CT手动测量vBMD时会尽量避开骨皮质、中央静脉沟等结构,但会因测量不充分导致偏差,同时患者松质骨内粗大的骨小梁亦可影响测量结果。本研究中1例骨质疏松患者分类错误受此影响而诊断为低骨量,二者测得腰椎vBMD数值差别较大。另外,本研究在分析诊断结果不一致原因时发现,AI定量CT辅助诊断系统并未自动删除压缩性骨折的椎体vBMD,引起平均vBMD值明显增加而导致椎体骨量诊断错误,因此对于有压缩性骨折患者的椎体vBMD的AI测量结果需进行人工纠正,此部分AI定量CT辅助诊断系统需要进一步优化更新。


双能X线骨密度仪(dualenergy X-ray absorptiometry,DXA)测量腰椎vBMD是诊断骨质疏松症12]的金标准,但腰椎正位片在测量腰椎BMD时ROI包含了椎体及其附件结构,同时易受到腰椎椎体和椎小关节边缘骨质增生、周围软组织或血管壁钙化、肠道内容物等因素的影响,降低了骨量分类的准确性13]。定量CT可以利用CT扫描数据进行vBMD测量。既往研究表明,定量CT在诊断骨质疏松方面比DXA更敏感14-15],其测量结果不受腰椎退变、体重等因素的影响16]。既往诸多文献采用定量CT研究患者骨量情况 2,17-18],本研究亦采用定量CT作为腰椎骨量分类的参考标准。定量CT与AI定量CT辅助诊断系统均是在腰椎骨松质上勾画ROI测量椎体vBMD,更具有参考价值。


对于老年人和肺癌高危人群,胸部LDCT作为一种常规筛查手段用于每年的健康查体6,19],可有效降低肺癌病死率及医疗经济负担,提高患者生存质量20-21]。这部分人群与骨质疏松症高危人群年龄非常接近。Cheng等6]研究表明应用其他情况下获得的胸部LDCT图像可准确测量腰椎vBMD,但男女骨质疏松发现比例均略高于本研究,尤其是男性,这可能与我们收集的资料中年龄为60岁及以下的受检者占比(64.38%,298/548)较多有关。本研究除了包含胸部LDCT图像外,我们亦收集了行常规剂量CT平扫和增强CT患者的图像,以验证AI定量CT辅助诊断系统在不同扫描方式下诊断骨量异常的稳定性。


临床上由于各种原因而进行的胸部和/或腹部CT检查的数量巨大,这些数据可用于机会性筛查腰椎骨质疏松症,并可评估骨质疏松患者的骨折风险22],无须增加额外的成本、时间以及辐射暴露等23]。通过测量腰椎vBMD,早期进行筛查低骨量和骨质疏松人群,是降低骨质疏松性骨折的有效手段,但DXA和定量CT设备尚未在各大医疗机构普及,尤其是县域级基层医院。AI不需要额外设备及体模校准,通过现有的影像数据即可进行骨量诊断,可花费更少的时间,扩展到更多的人群。Löffler等10]研究表明在脊柱常规CT中进行全自动骨质疏松症筛查是可行的,比DXA能更好地识别低骨量的椎体骨折患者。Pan等5]开发的基于深度学习系统在LDCT图像中诊断骨质疏松方面的敏感度、特异度分别为85.71%、99.68%,区分低骨量与正常骨量的敏感度和特异度达到90.37%和98.08%,表明利用LDCT图像自动进行机会性骨质疏松症筛查具有较大的潜力,但Pan等开发的系统的敏感度、特异度均低于本研究采用的AI定量CT辅助诊断系统。Yang等7]以DXA为标准,利用AI正确识别低骨量和骨质疏松的AUC分别为0.831和0.972,表明对低骨量和骨质疏松的机会性筛查具有重要价值。因此,基于CT图像机会性腰椎骨质疏松筛查具有重要的临床意义及社会价值,可能成为未来筛查骨质疏松症经济、安全的方法。


综上所述,本研究表明AI定量CT辅助诊断系统在对腰椎骨量诊断分类中具有较高的准确性、敏感度及特异度,受检者可通过胸部或腹部CT图像进行机会性测量vBMD评估腰椎骨量情况,大大提高骨质疏松的检出率,为临床采取干预措施提供依据,同时可进行智能随访,尤其是对于无骨密度测量仪器的医疗机构,具有重要参考的价值。



参考文献见本刊网站

引用本文:焦自梅, 王曦, 刘钦鹏, 等. 基于CT图像人工智能机会性自动评估腰椎骨量的应用研究[J]. 数字医学与健康, 2024, 2(4): 247-253. DOI: 10.3760/cma.j.cn101909-20231122-00069.

杂志介绍



《数字医学与健康》(CN 10-1909/R,ISSN 2097-3349)是由中国科协主管、中华医学会主办的多学科交叉性学术期刊。本刊已被“中华医学期刊全文数据库”“维普中文期刊资源数据库”“万方数据库”收录。


办刊宗旨:聚焦国内外数字医学和健康领域的最新发展方向,刊载数字医学和健康领域的新理论、新技术、新方法,打造学术与技术的交流与合作平台,助力“健康中国”战略。


报道范围:国内外数字医学和健康领域前沿进展;数字和信息技术在公共卫生、疾病预防、健康管理、精准医疗、辅助决策、药物研发、临床科研、行业治理、医院管理、医学教育、医疗保险、数据管理及安全等领域的应用;医学和健康与现代信息学等相关学科交叉领域的新理论、新技术、新观点等;数字医学和健康领域的国家政策和法规、行业标准和共识、循证指南、伦理要求及产业信息。


主要栏目:述评、专家笔谈、标准与规范、论著、研究方法与报告、综述、产业研究、未来医学、技术介绍与评估、伦理与监管、讲座、文献速览等。


编辑部地址:北京市西城区东河沿街69号405室,邮政编码:100052。


联系电话:010-51322158,Email:dmh@cmaph.org。


更多阅读:

《数字医学与健康》投稿方式及说明

数字医学与健康
聚焦国内外数字医学和健康领域的最新发展方向,刊载数字医学和健康领域的新理论、新技术、新方法,打造学术与技术的交流与合作平台,助力“健康中国”战略。
 最新文章