引用本文
徐陈柯,俞丽芳,龚 云,等. 超声甲状腺影像报告和数据系统在甲状腺结节诊治中的应用及进展[J]. 肿瘤影像学, 2024, 33 (3): 213-219.
基金项目:浙江省医药卫生科技计划项目(2024KY1333)
通信作者:徐 栋 E-mail: xudong@zjcc.org.cn
第一作者简介
徐陈柯,副主任医师,中国医师协会介入医师分会肝胆胰介入学组常委,浙江省医学会超声分会血管学组委员,浙江省数理医学会甲状腺疾病专委会委员,浙江省数理医学会超声专委会甲乳学组委员,浙江省数理医学会精准超声介入与智能诊断分会委员,浙江省数理医学会肿瘤数据智能物理治疗会青委,杭州市医学会介入分会 委员兼秘书长,杭州市医学会超声分会介入学组委员。主持课题3项,参与课题9项,以第一或通信作者身份发表文章论文10篇( SCI收录期刊上发表3篇),国家发明专利一项(第一发明人),实用新型专利20个(第一发明人6个)。从事超声诊断及介入工作20年,具有全面的超声诊断与介入治疗技术,对超声介入微创治疗技术具有独到之处,擅长甲状腺、乳腺、血管、消化、泌尿、男性生殖系统等疾病的诊断,尤其擅长甲状腺结节、肌骨等疾病的超声介入微创治疗。
通信作者简介
徐 栋,医学博士,主任医师,博士研究生导师,中国科学院杭州医学研究所,浙江省肿瘤医院超声医学科主任兼超声介入病区主任及台州分院介入与微创外科医学中心主任,浙江省卫生高层次领军人才,美国MD安德森癌症中心客座教授。现任中国医师协会介入医师分会超声介入专业委员会主任委员,中国抗癌协会肿瘤消融治疗专业委员会副主任委员,中华医学会超声医学分会委员,中国医师协会介入医师分会常务委员,浙江省医学会超声医学分会候任主任委员,浙江省抗癌协会肿瘤消融治疗专业委员会主任委员,浙江省数理医学学会精准超声介入与智能诊断专业委员会主任委员等。
超声甲状腺影像报告和数据系统在甲状腺结节诊治中的应用及进展
徐陈柯1, 2,俞丽芳1,龚 云3,徐 栋4
1.西湖大学医学院附属杭州市第一人民医院超声影像科,浙江 杭州 310006 ;
2.浙江中医药大学第四临床医学院超声影像科,浙江 杭州 310006 ;
3.西湖大学医学院附属杭州市第一人民医院儿科,浙江 杭州 310006 ;
4.浙江省肿瘤医院超声医学科,浙江 杭州 310005
[摘要] 超声因其安全、无创、低价、方便等优点,成为甲状腺结节检测的首选方法,目前国内外有数个版本甲状腺影像报告和数据系统(Thyroid Imaging Reporting and Data System,TI-RADS)用于甲状腺结节恶性风险的分层管理。不同版本TI-RADS对同一甲状腺结节的分类及其是否需要进行细针穿刺活检(fine-needle aspiration biospy,FNAB)的建议存在差异。本文对各TI-RADS版本在甲状腺结节风险分层管理方面的应用、优势与局限性,以及其最新的研究进展进行了述评。
[关键词] 甲状腺结节;超声;甲状腺影像报告和数据系统;细针穿刺活检;风险分层管理
[Abstract] Ultrasound, characterized by its safety, non-invasive, economy, and convenience, is the preferred modality for the evaluation of thyroid nodules. Currently, several versions of the Thyroid Imaging Reporting and Data System (TI-RADS) have been developed for the risk stratification and management of thyroid nodules. Classifications of the same nodule can vary across different TI-RADS versions, leading to discrepancies in the management strategies, particularly regarding the necessity for fine-needle aspiration biopsy (FNAB) for suspected malignant nodules. This article provided a review of the application, advantages, and limitations of various TI-RADS versions in thyroid nodule risk stratification management, as well as the latest research progress.
[Key words] Thyroid nodules; Ultrasound; Thyroid Imaging Reporting and Data System; Fine-needle aspiration biospy; Risk stratification management
甲状腺结节是甲状腺细胞异常增生而形成的肿块,其病因尚不明确,可与遗传、环境和生活方式等相关。甲状腺结节在人群中的发病率非常高,在各种检查方式中,超声检查具有明显的优势。据研究[1-2]报道,19%~68%的普通人群可通过超声检出甲状腺结节,但大部分结节为良性,且疾病发展比较缓慢,常以随访为主,无需治疗。回顾20余年来发表的相关研究并结合临床诊断经验,在超声上显示出某些特征的结节(如实性低回声、纵横比>1、边缘不规则、微钙化及甲状腺外扩展等征象)被广泛认为与甲状腺癌相关[3]。对可疑的恶性甲状腺结节,进一步行超声引导下的细针穿刺活检(fine-needle aspiration biopsy,FNAB)已成为公认的检查方法,并且FNAB具有较高的准确度[4-5]。然而,在临床实践中,不同经验的医师对甲状腺结节超声特征的解读存在较大差异,特异度受限[6-7]。此外,目前国内外已有多种基于不同超声特征来判断甲状腺结节良恶性的甲状腺影像报告和数据系统(Thyroid Imaging Reporting and Data System,TI-RADS)分类标准,对于不同版本TI-RADS的选择及应用,进一步给实际工作带来了诸多困扰。基于各TI-RADS版本提出的处理建议和医疗现况间存在一些不匹配情况,在一定程度上不利于甲状腺结节的进一步诊治。因此,本文结合国内外相关文献资料,对目前存在的TI-RADS版本分别进行简单介绍,并对其在甲状腺结节中的应用及进展作一述评。
1
多个TI-RADS版本概述
1.1 第一版TI-RADS
TI-RADS的概念由Horvath等[8]于2009年首次提出并使用,是对美国放射学会(American College of Radiology,ACR)乳腺影像报告和数据系统(Breast Imaging Reporting and Data System,BI-RADS)的模仿[9]。Horvath等[8]通过对362个甲状腺结节进行回顾性分析,提取出10种超声模式,并与FNAB结果相关联,最终制订了一个TI-RADS分类系统。其类别定义为TI-RADS 1类:正常甲状腺;TI-RADS 2类:良性病变(恶性率0%);TI-RADS 3类:可能为良性结节(恶性率5%);TI-RADS 4类:可疑结节(恶性率5%~80%),进一步分为4a类(恶性率5%~10%)和4b类(恶性率10%~80%);TI-RADS 5类:可能为恶性结节(恶性率>80%);TI-RADS 6类:经活检证实的恶性结节。
该系统的提出促进了对甲状腺结节进行恶性风险分层诊断及管理,但其合理性和准确度一直以来都受到质疑,因为该研究提出对4类和5类结节均需行FNAB,且未定义大小截断值,这一管理措施势必会导致大量微小癌和亚急性甲状腺炎患者接受非必要的穿刺,影响TI-RADS在临床领域中的应用和推广。
1.2 韩国学者Kwak提出的2011版TI-RADS
2011年,Kwak等[10]提出了一种更为简单的TI-RADS。该研究通过对1 658个最大 径≥1 cm的甲状腺结节进行回顾性分析,得出与甲状腺恶性肿瘤明显相关联的5个超声特征:实性、低回声或极低回声、边缘微分叶或不规则、微钙化、纵横比>1。并根据可疑恶性超声特征个数对甲状腺结节进行危险分层,具体类别如下:TI-RADS 3类(无可疑恶性超声特征,恶性率<2%);TI-RADS 4a类(1个可疑恶性超声特征,恶性率2%~10%);TI-RADS 4b类(2个可疑恶性超声特征,恶性率10%~50%);TI-RADS 4c类(3或4个可疑恶性超声特征,恶性率50%~95%);TI-RADS 5类(5个可疑恶性超声特征,恶性率>95%)。这一系统促进了甲状腺结节风险分层逐步走向简洁化和实用化,但仍没摆脱BI-RADS的影响。该指南建议TI-RADS 4类甲状腺结节均需行FNAB,但5个可疑恶性超声特征并未进行分层,在临床实践中,如果对4a类的实性结节均行FNAB是不合理的。
1.3 Russ提出的2013版TI-RADS
2013年,Russ等[11]提取出几个高度可疑恶性超声特征:纵横比>1、边缘不规则、微钙化、极低回声及超声弹性成像为高硬度,并基于上述超声特征建立了一个TI-RADS:正常甲状腺,TI-RADS 1类;良性结节,TI-RADS 2类;高度良性结节可能,TI-RADS 3类;低度可疑恶性结节,TI-RADS 4a类;高度可疑恶性结节(1、2个恶性特征),TI-RADS 4b类;恶性结节(2个以上恶性特征),TI-RADS 5类。并根据以上分类提出了相应的管理指导方针:对于TI-RADS 4b类和5类结节,如果最大径>7 mm,或有甲状腺癌家族史或儿童颈部放射线照射史等危险因素,则行FNAB;对于TI-RADS 4a类或3类结节,如果明显增大(即二维最大径≥2 mm,体积>20%),则建议行FNAB。该版TI-RADS比较简单实用,具有较强的可操作性,并且更为全面地扩大了良性结节的认定范围,在一定程度上减少了对甲状腺结节的过度诊断。
1.4 英国甲状腺协会(British Thyroid Association,BTA)2014版TI-RADS
BTA于2014年制定了甲状腺结节的“U”分类[12];根据超声特点将结节分为U1~U5,U1为正常甲状腺,U2为良性结节,U3结节性质不确定,U4考虑为可疑恶性,U5考虑为恶性结节,U3、U4、U5结节则需要根据其临床表现考虑是否行FNAB。该指南并未考虑结节的大小,同样会造成对甲状腺微小癌的过度诊治。此外,该指南属于以声像图特征为基础的描述性定性分类管理,并不包括所有不同类型的结节。
1.5 美国甲状腺协会(American Thyroid Association,ATA)2015版TI-RADS
ATA于2016年颁布了2015版TI-RADS,该版TI-RADS根据超声特征将甲状腺结节分为5类,同时制订了相应的管理策略[2]。5种类型分别为:高度可疑、中度可疑、低度可疑、极低度可疑和良性,其恶性率分别为70%~90%、10%~20%、5%~10%、<3%和<1%。其中高度可疑结节≥1.0 cm、中度可疑结节≥1.0 cm、低度可疑结节≥1.5 cm均建议行FNAB;而极低度可疑恶性结节(即恶性风险小于3%)≥2.5 cm才考虑行FNAB或随访;良性结节则完全不建议行FNAB。ATA在这版指南中明确指出了不同类型结节需要FNAB的最大径最小值,同时对于1 cm以下的有怀疑的结节也采取更保守的风险管理措施。
1.6 韩国甲状腺放射学会(Korean Society of Thyroid Radiology,KSThR)2016版TI-RADS
KSThR于2016年颁布了新的TI-RADS(记为K TI-RADS)[13],同样分为5个类别:① 无结节,1类;② 良性结节,2类;③ 低度可疑,囊实混合、等回声且无可疑恶性特征,3类;④ 中度可疑,囊实混合、等回声,同时结节伴有任何可疑恶性特征,或者实性低回声结节但没有其他可疑恶性特征,4类;⑤ 高度可疑,实性低回声结节且具有可疑恶性超声特征,5类。该版TI-RADS结合甲状腺结节的不同超声特征,并根据结节的不同大小,对结节行FNAB的大小提出明确建议:2类结节≥2.0 cm,3类结节≥1.5 cm,4类及以上结节则>1.0 cm。K TI-RADS具有较高的灵敏度,且对于活检的决定,观察者之间具有很好的一致性,但特异度较差,许多典型的良性结节可能会被分到4类或5类,从而接受不必要的FNAB。
1.7 ACR 2017版TI-RADS
ACR TI-RADS在2017年发布[14]。与既往分类系统不同的是,ACR TI-RADS使用了标准化评分系统,根据结节形状、边缘、回声、内部结构、强回声5个方面评分,累计评分越高,恶性肿瘤的可能性越大。其中TR1:0分,良性病变;TR2:2分,不怀疑恶性(恶性率小于2%);TR3:3分,轻度怀疑恶性(恶性率<5%);TR4:4~6分,中度怀疑恶性(恶性率5%~20%);TR 5:≥7分,高度怀疑恶性(恶性率>20%)。相应的管理建议为TR1及TR2不需要FNAB;TR3结节≥1.5 cm随访,≥2.5 cm则FNAB;TR4结节≥1.0 cm随访, ≥1.5 cm则行FNAB;TR5结节≥0.5 cm随访,≥1.0 cm则行FNAB。且对结节的随访频次也进行了解释,如果结节显著增大,即二维最大径增加了20% 和 2 mm,或者体积增加50%,或ACR TI-RADS分类的水平在随诊期间增加,均需在随访的间隔时间段内增加随诊次数。ACR TI-RADS具有较高的灵敏度,且观察者间就结节是否活检具有较好的一致性。
尽管ACR TI-RADS被证实为具有较好的总体性能,但不同观察者对结节的评估仍存在较大主观差异。随着人工智能(artificial intelligence, AI)在医疗领域的发展及应用,大大提高了诊断甲状腺结节的准确度和速度,同时也弥补了观察者间的主观差异[15]。有研究[16]利用AI对ACR TI-RADS进行修订,形成了AI TI-RADS。AI TI-RADS对当前的词汇和评分结构进行了优化,研究结果显示,AI TI-RADS的应用在保持较高灵敏度的同时也增加了特异度,降低了非必要FNAB。
1.8 EU TI-RADS 2017版TI-RADS
2017年,欧洲甲状腺协会(European Thyroid Association,ETA)发布了EU TI-RADS,该协会根据甲状腺结节不同的超声特征亦对结节进行不同的风险分层管理[17]。EU TI-RADS同样为5分类。① Ⅰ类:没有结节;② Ⅱ类:良性;③ Ⅲ 类:椭圆形、平滑边缘、等/高回声、无高风险特征,低风险(恶性率2%~4%);④ Ⅳ类:椭圆形、边缘平滑、轻度低回声、无高风险特征,中度风险(恶性率6%~17%);⑤ Ⅴ类:任何高危特征(非椭圆形、边缘不规则、微钙化、明显低回声),高风险(恶性率26%~87%)。同时,该TI-RADS对结节的FNAB亦提出明确建议:Ⅰ、Ⅱ类结节无需行FNAB;Ⅲ类结节大于2 cm时行FNAB;Ⅳ类结节大于1.5 cm时行FNAB;Ⅴ类结节大于1 cm时行FNAB;若V类结节小于1 cm可考虑行FNAB或随访观察。EU TI-RADS版本是法国版分类系统[12]基础上的修正版本。
1.9 2020版C TI-RADS
Zhou等[7]在2020年发布了(Chinese TI-RADS,C TI-RADS),对2 141个甲状腺结节进行分析,结节的恶性特征包括:① 极低回声;② 实性;③ 微钙化;④ 边缘模糊;⑤ 边缘不规则或甲状腺外侵犯;⑥ 垂直位。结节良性特征包括:彗星尾伪像[18]。然后依次对以上特征进行计数打分,特别地设置了减分项,除每个恶性特征加1分外,良性特征则减1分;最后归为6分类:① 正常甲状腺,无分值:1类;② -1分,良性:2类;③ 0分,良性可能(恶性率<2%):3类;④ 1分,低度可疑恶性(恶性率2%~10%):4A类;2分,中度可疑恶性(恶性率10%~50%):4B类;3、4分,高度可疑(恶性率50%~90%):4C类;⑤ 5分,高度可疑恶性(恶性率>90%):5类;⑥ 经活检证实恶性:6类。其中C TI-RADS 4A类结节>15 mm时建议行FNAB,如果为多灶性4A类结节,或紧邻甲状腺被膜、气管、喉返神经,且结节最大径>10 mm时可考虑行FNAB;而C TI-RADS 4B类、4C类及5类结节最大径>10 mm时,建议行FNAB;如果结节紧邻甲状腺被膜、气管、喉返神经,或为多灶性类结节,最大径>5 mm时可考虑行FNAB。目前,C TI-RADS作为一个新的危险分层系统,其应用价值仍有待在临床推广和应用。
1.10 结合超声造影(contrast-enhanced ultrasound,CEUS)下的TI-RADS分类
CEUS能够对宏观和微观的血管化模式进行分析[19]。近年来,CEUS在甲状腺相关疾病中的应用越来越广泛,且研究[20-21]已证实对甲状腺恶性肿瘤的具有较好的诊断效能。Ruan等[22]构建了一个简单而实用的CEUS TI-RADS,该系统对甲状腺结节二维超声和CEUS相关特征赋予相应分值,并根据最终分值对结节分层管理。CEUS TI-RADS:① 0分,良性:TR1;②1分,不怀疑恶性(恶性率<3%):TR2;③2分,轻度怀疑恶性(恶性率6%~7%):TR3;④ 3~5分,中度怀疑恶性(恶性率17%~59%):TR4,其中4A为3分(恶性率14%~17%),4B为4分(恶性率30%~38%), 4C为5分(恶性率54%~73%);⑤ 6~10分,高度怀疑恶性(恶性率92%~99%):TR5。对FNAB也建议了具体穿刺大小:TR3≥2.5 cm、TR4≥1.5 cm、TR5 ≥ 1.0 cm,均建议行FNAB。该研究构建的CEUS TI-RADS在内部及外部验证中均表现出较高的诊断效能和较低的非必要FNAB率,从而为临床准确制订治疗方案及预后评估提供了参考依据。然而,该系统在临床应用前仍需要进行前瞻性的多中心研究验证。
2
TI-RADS分类系统的临床应用
2.1 各个不同版本TI-RADS的共同特点
随着TI-RADS在临床实践中应用越来越广泛,其带来不可否认的临床益处[23]。尽管不同版本的TI-RADS的风险分层管理不尽相同,但有一个基本的相通点:3类及以下结节恶性可能性很小,而对3类及以上结节的管理差异较大。对结节的大小的关注也逐渐被纳入一些TI-RADS版本中,并给出了行FNAB时结节大小的截断值,对于风险管理有了一个明确的界限[24]。这在一定程度上减少了对微小甲状腺癌的过度处理。此外,中国的C TI-RADS还对部分结节的位置作了特殊风险管理规定(如果结节紧邻甲状腺被膜、气管、喉返神经,或为多灶性类结节,最大径>5 mm时可考虑行FNAB)[25]。
2.2 各个不同版本TI-RADS的比较
同时,关于不同版本TI-RADS的诊断价值,以及各个版本间的优缺点比较也在越来越多的研究[26-29]中提出。已有相关研究[30-31]比较了两个或多个TI-RADS对甲状腺结节的诊断能力(例如,每个风险类别的实际恶性可能性、FNAB的必要性或延迟性),结果显示,不同版本TI-RADS的诊断性能存在显著差异。然而,在得出结论前我们需要考虑以下几点:首先,不同版本的TI-RADS版本各分类恶性肿瘤概率不同,其实质是对恶性风险的估计而非实际测量。事实上,TI-RADS中包含的任何建议都未得到大规模前瞻性验证研究的数据支持,主要为对研究数据的回顾性分析,而不同研究者之间的研究成果往往差异很大。因此,风险估计被报告的范围通常相当广泛,而且在不同的TI-RADS之间差异很大。其次,这些评估背后的证据主要来自于对甲状腺乳头状癌(papillary carcinoma of the thyroid,PTC)患者的研究。此外,在大多数TI-RADS中,FNAB的可行性基于结节超声所显示的特征及其大小,不同TI-RADS版本中对决定行FNAB的结节大小截断值并不相同。如上所述,这些不同版本TI-RADS都是基于不同国家部分专家的意见,因此具有较大的可变性。因此,我们在选择应用TI-RADS时,需充分了解其应用条件并能作出充分解释,筛选出需要临床干预或重视的结节,为临床提供可靠的依据,从而减少过度的诊断和治疗[32]。
2.3 不同版本TI-RADS比较时的思考
旨在评估这些TI-RADS性能的研究也值得讨论,几乎所有研究都以FNAB诊断为金标准,“非肿瘤或者良性”和“恶性或者可疑恶性”分别代表真阴性和真阳性[33]。这种方法引入了一个主要的选择偏倚,其有效地排除了具有不确定性的细胞学检查报告的结节。虽然FNAB可以准确诊断大多数PTC,但对于甲状腺滤泡癌(folicullar carcinoma of the thyroid,FTC)或甲状腺髓样癌(medullary carcinoma of the thyroid,MTC)并非如此。FTC在细胞学上与滤泡性腺瘤难以区分,而MTC在FNAB上被误诊的患者高达50%[34-35]。
此外,在解释细胞学检查结果时,必须考虑假阴性和假阳性结果。少数评估TI-RADS对手术组织学诊断性能的研究,只对存在明显选择偏倚的患者进行回顾性分析,因为符合手术条件的患者很可能有更高的恶性风险[36]。最后,从统计学角度来看,阳性和阴性预测值取决于入组样本中疾病发生的频率。因此,不同版本TI-RADS诊断性能的明显差异实际上可能源于所研究的病例在实际癌症发病率方面的显著差异[37]。
3
总结与展望
不同版本TI-RADS的引入以及持续性改进的终极目标均是将超声的诊断性能不断提高到接近甚至达到FNAB的水平。然而近年来随着高分辨率超声的应用,甲状腺结节的检出率显著提高,而行非必要FNAB的病例数量也随之增加,导致过度诊断。这一结果提示,各TI-RADS指导甲状腺结节行FNAB指征中,需在高灵敏度和特异度与低非必要FNAB率之间寻找一个平衡点。
在不久的将来,我们期待联合目前使用中的各个TI-RADS版本,尤其是最新的AI TI-RADS,取其精华,为甲状腺超声风险分层系统建立一个新的TI-RADS,使之成为诊断甲状腺恶性肿瘤的首要工具。
[参考文献]
编辑:徐虹
审核:倪明