【文献快递】当代SRS平台的基准测试:技术发展是否提高了治疗计划的质量?

文摘   健康   2025-01-05 05:00   上海  

Practical Radiation Oncology》杂志 20239-10月刊刊载[ Sep-Oct;13(5):e451-e459.]英国伦敦Queen Square Radiosurgery Centre, National Hospital for Neurology and Neurosurgery, 的Ian Paddick, Judith Mott , James Bedford ,等撰写的《当代SRS平台的基准测试:技术发展是否提高了治疗计划的质量?Benchmarking Tests of Contemporary SRS Platforms: Have Technological Developments Resulted in Improved Treatment Plan Quality?》(doi: 10.1016/j.prro.2023.05.005. )。

目的:

可以通过一系列装置进行立体定向放射外科治疗照射,每一个装置都是近年来发展起来的。我们试图评估当代立体定向放射外科平台的性能差异,并将其与先前基准研究的早期平台迭代进行比较。

有几种相互竞争的技术用于立体定向放射外科(SRS)的治疗计划和交付,了解它们的相对性能是很重要的。2016年,英国基准研究包括24个中心,每个中心计划6个不同的SRS计划,由英国国家卫生服务(NHS)发起,由放射治疗试验和质量保证小组进行。这是同类研究中规模最大的一项,对英国国民健康服务体系委托的提供颅内治疗的中心的能力和实践作出有价值的大致印象。

放射治疗设备的技术发展值得注意,特别是在对适形性、剂量梯度和空间精度(the demands of conformity, dose gradient, and spatial accuracy are highest,)要求最高的SRS领域。六年过去了,新技术和治疗方法提出了一个问题:“技术进步是否导致了治疗计划的相应改进?”因此,本文描述了一项基准研究,旨在评估当代设备的能力。

方法和材料:

以下平台被选为2022年的“最先进”平台:伽玛刀Icon (GK),射波刀S7型 (CK), Brainlab Elements (Elekta VersaHD和Varian TrueBeam), Varian Edge with HyperArc (HA)和ZAP-X。2016年的一项研究使用了六个基准案例。为了反映每个患者治疗的转移瘤数目的增加,增加了14个靶区的病例。在7例患者中,28个靶区的体积范围为0.02至7.2 cc。研究人员向参与研究的中心发送每位患者的图像和轮廓,并要求他们尽其所能进行计划。虽然允许在地方实践中有一些变化(例如,边缘外扩),但要求各小组为每个靶标处方特定剂量,并就有风险的器官耐受剂量达成一致。比较的参数包括覆盖率、选择性、Paddick适形性指数、梯度指数(GI)、R50%、效率指数、危及器官的剂量、计划和治疗时间。

平台

以下平台被选为2022年的“最先进”平台:伽玛刀Icon (GK)与lightning逆向计划(瑞典Elekta Instruments), 射波刀(CK) S7与M6多叶准直器(MLC) (Accuray), Brainlab Elements (Brainlab,德国)与Elekta Versa HD (EE)和Varian TrueBeam (EV) (Varian Medical Systems), Varian Edge与Hyper- Arc (HA)和ZAP-X (Zap Surgical)结合。采用多中心研究,包括6个中心,每个中心在其所代表的平台上都有相当多的经验。其中三个中心参与了最初的基准研究。表E1详细说明了为研究选择的治疗平台。由于每个治疗计划系统(TPS)中提取计划参数的可用工具的局限性,特殊程序确保在不同平台之间尽可能统一地收集指标(附录E1)。

患者病例和计划目标

与以往研究相同的6例患者计划(2例多发性转移,4例良性靶标)被使用。总结了适应证、处方剂量和治疗计划说明。病人的病史在别处有描述。为了反映SRS对每个患者治疗的转移瘤数目增加的演变,增加了一个有14个靶区的患者作为第7例。

病例1:3个脑转移瘤。计划靶体积PTV 1和2的处方剂量:24 Gy (GK、CK和ZAP-X), 21 Gy (c臂直线加速器[LINACs]);PTV3(脑干):18 Gy (GK、CK和ZAP-X), 15 Gy (c臂LINACs)。

病例2:7个脑转移瘤。PTV1的处方剂量:20 Gy (GK、CK和ZAP-X), 18 Gy (C臂LINACs);PTV2-4: 22 Gy (GK、CK和ZAP-X), 21 Gy (C臂LINACs);PTV5-7: 24 Gy (GK、CK和ZAP-X), 21 Gy (C臂LINACs)。

病例3:小的管内前庭神经鞘瘤。保持听力对病人保住飞行员的工作至关重要。处方剂量:12 Gy。目标为耳蜗平均剂量≤4 Gy。

病例4:前庭神经鞘瘤。没有可用的听力。处方剂量:12 Gy。报告脑干最大剂量- D0.030 cc。

病例5:颅底脑膜瘤。处方剂量:14 Gy。报告脑干最大剂量- D0.030 cc.

病例6:垂体腺瘤(分泌性)。处方剂量25Gy。报告交叉处最大剂量- D0.030 cc. 病例7:患有HER-2乳腺癌的50岁女性。头痛后形成的脑磁共振成像显示14个小病灶,符合转移瘤。PTV1-14的处方剂量:24 Gy (GK、CK和ZAP-X), 21 Gy (c臂LINACs)。

这些测试案例被选择来代表广泛的颅内目标,包括那些邻近或在危及器官(OARs)内的靶标。在7例患者中,28个靶区的体积范围为0.02至7.2 cc。

向参与中心发送数字成像和医学放射治疗通信(DICOMRT)文件,其中包含每个治疗方案的图像、靶标轮廓和潜在的OARs。他们被要求利用有经验的工作人员(定义为至少有2年相关平台经验)尽其所能计划每次治疗。

为了便于治疗方案的比较,为每个靶区指定了剂量。按照常规做法,C臂LINACs增加了1毫米的转移边缘外扩,但没有良性疾病的切缘。如果增加一个边缘外扩,为减少额外的毒性,就减少处方剂量。对OAR的耐受剂量是事先商定的。中心被告知不要修改任何结构,但如果他们愿意,他们可以增加额外的体积来优化、保护等等。

对于转移性靶区,要求使用者在处方剂量下达到≥99%的PTV覆盖率。对于良性靶区,这一比例降至≥95%(理想情况下为97%)。次要计划目标包括选择性、梯度和OAR受照剂量。

用于比较的参数包括覆盖率、选择性、Paddick适形性指数(PCI)、梯度指数(GI)、 R50%、效率指数(EI)、整体EI、OARs剂量、估计计划时间和估计治疗时长。计算公式见附录E2。

EI是一种相对较新的指标,用于量化计划质量,包括多发性转移。它将目标内的适形性、梯度和平均剂量组合成一个单一的值,该值表示计划的积分剂量(能量)中有多少被有效地用于照射靶标。

计算多个转移瘤病例的体积平均数据,并根据其体积加权每个单个靶标的贡献。这降低了小转移灶与同一患者较大病灶相比的重要性。

Kruskal-Wallis测试显示PCI、GI、EI、计划和治疗时间在不同平台之间存在显著差异。如果得到证实,则使用Mann- Whitney U测试将每个平台的结果与GK的结果进行比较。选择P值<0.05表示显著性。

由于该研究涉及使用历史和匿名图像和轮廓勾画,因此不需要伦理委员会的批准。

结果:

所有靶区的平均覆盖率从98.2% (Brainlab/Elekta)到99.7% (HA-6X)不等。Paddick适形性指数为0.722 (ZAP-X) 到 0.894 (CK)。GI的平均值从3.52 (GK)(代表最陡的剂量梯度)5.08 (HA-10X)。GI与射束能量呈一定的趋势,能量较低的平台(GK, 1.25 MeV;ZAP-X, 3MV)有最低值,最高能量的平台(HA-10X)有最高值。平均R50%值为4.48 (GK)至5.98 (HA-10X)。C臂直线加速器的治疗时间最短。

1显示了覆盖范围、选择性、PCI、GI和R50%,所有病变的平均值。由于小靶点难以达到良好的一致性和脱落性,因此也为转移病例提供了体积平均数据,以减少来自较小的、可能不太重要的临床靶区的潜在偏倚。

靶标覆盖率

所有平台的转移病灶覆盖率均达到≥98%,良性病灶覆盖率均达到≥95%(图E1)。

选择性

选择性在图E1中以图形形式表示。由于处方等剂量体积的桥接,2对近端病变无法计算(病例7、PTV和5、9和10)的选择性,因此将其从所有平台的分析中删除。

Paddick适形性指数

良性病变的平均PCI在EV中最高(0.891),在转移性病变中CK最高(0.896)(表1)。计划转移时ZAP-X最低(0.700)。GK的PCI在平均值和成交量加权平均值之间的增幅最大,这反映出与较大的靶标相比,GK计划的较小靶标的适形性相对较低。CK和HA的显著高于GK的,而ZAP的显著低于GK的。

梯度指数

良性病变的梯度指数平均值为2.74 (ZAP-X),代表最陡的剂量梯度,至4.18 (EE)。对于转移瘤,GK的GI最低,为3.66,HA-10X最高,为5.27 (P<0.001)。体积平均法降低了所有平台对于最小转移灶GI值(CK和HA-10X;表1)

R50%

R50%值(图1)代表了适形性和梯度的组合,良性病变的最小平均值为3.12 (ZAP-X)。GK的R50%最低(4.74),HA-10X的R50%最高(6.19;P = 0.027)。

效率指数

对于良性靶标,GK和ZAP-X的EI值最高,CK其次,C臂LINACS值最高,但差异无统计学意义。对于转移瘤病例,GK和CK的整体EI较高,病例1的ZAP-X评分最低,病例2和7的HA- 10X评分最低(图2)。

危及器官(OAR)

良性病变的OAR剂量如图E3所示。在病例3中,所有平台的平均耳蜗剂量为4 Gy。在最初的2016年基准研究中,大多数CLINACs未能满足这一限制。病例4和病例5的最大脑干剂量(D0.03 cc)在所有平台上大致相似。垂体计划的最小交叉受照最大剂量(D0.03 cc)为EV (2.6 Gy),最高的是HA- 10x计划(6.5 Gy),这可能是HA计划固定光束几何形状的结果。然而,EE溶液具有相似的交叉剂量和最低的适形性,可能是因为使用了5毫米MLC叶片,结合复合形状和接近OAR

2016年的研究相比

对于参与2016年和2022年基准研究的3个中心,CK显示PCI (P<0.001), GI降低11% (P = 0.070),而EV显示PCI增加16% (P <0.001), GI降低8% (P =0.374)。GK计划质量的变化变化更大,一些PCI值下降(图3)。

计划和照射交付时间

4显示了跨平台的每个案例的自我报告计划和估计交付时间。CK、EE和EV的治疗时间包括分次内成像的。

讨论:

在放射治疗平台的技术能力被推向极限的SRS领域,比较研究非常有用。然而,偏倚和不良的研究设计导致了不一致的结果,并导致了对此类研究效用的质疑。2016年的研究由放射治疗试验和质量保证小组协调,包括24个治疗平台,比之前发表的任何基准研究都要多。所有的中心都有动力在现实的时间框架内尽可能地制定最高质量的计划,这为英国SRS交付的实践和能力创造了一个有价值的大致印象。计划质量的差异大得惊人,但部分原因是所使用设备的年代不同以及当地实践的广泛差异。目前的研究选择了6种现代设备,并使用经验丰富的治疗计划团队来创造一个“公平的竞争环境”。可以对计划质量度量进行以下观察。

梯度指数

GI与射束能量呈一定的趋势,能量较低的平台(GK, 1.25 MeV;ZAP-X, 3mv)有最低值,而最高能量(HA-10X)的平台有最高值。在同一平台中,HA-6X的平均GI值为4.63,而10X的平均GI值为5.27。这一发现与其他研究结果一致,并且反映了较低能量时散射半影的减少。准直、源轴距离(SAD)和处方等剂量水平也可能在靶外剂量梯度的差异中起作用。GK和ZAP-XSAD分别为40和45 cm,与其他平台相比,其准直更接近患者,减少了几何半影(reducing the geometric beam penumbra.)。较低的处方等剂量(即靶内较大的不均匀性)也是GK和Zap- X治疗的典型特点。与基于CLINAC的平台的100 cm相比,CK的SAD为80 cm,但通常也提供较低处方等剂量的治疗,因此GI为中等。

PCI与梯度

PCI和GI之间的权衡可能是照射交付方法的一个功能。Elements使用动态适形弧线(DCAs)单个等中心治疗多发性转移瘤,而使用积调强拉弧治疗(VMAT)治疗单个病变。由于转移瘤通常是球形的,通常远离危及器官(OAR)DCA可以快速照射,简单的剂量测定和较低的监测单位(MU)。与VMAT方法相比,DCA提供的使高剂量在靶标周围保持一致的机会较少,但可能产生高的剂量衰减。这反映在EV是唯一的C臂LINACs计划,其GIs不显著高于GK。所有病变的PCI和GI之间的平衡如图1D所示,其中可以看出,基于VMATHA方法比基于DCABrainLab Elements具有更高的适形性,但代价是更高的GI。Elements和HA中心都将VMAT用于良性目标,通常情况下平台之间的差异较小,除了3,0.06 cc听神经靶区,其中5mm MLC叶片宽度可能会降低EE方法的计划质量。

效率指数(Efficiency index)

总体而言,GK和ZAP-XEI最高,CK处理的平均指数也高于CLINACs。这可能是由于平均较高的内剂量和更陡的梯度an average higher internal dose and steeper gradient)(GK和ZAP-X)或高选择性 high selectivity )(CK)共同作用的结果。有趣的是,尽管良性标的ZAP-X总体得分最高,但在病例1中,它的得分是所有设备中最低的。这可能是因为在制定治疗计划、平衡适形性、剂量下降和总体治疗时间时所做的决定This is possibly because of decisions made when treatment planning, balancing conformity, dose fall-off,and overall treatment time.)

计划时间

报告的计划时间从为GK计划4的10分钟到为CK计划7的4小时不等。比良性病例所有中心平均花费更长时间计划多发性转移病例。GK的总计划时间最短为120 min, CK的总计划时间最长为960 min (P = 0.001)。基于Linacs的高度自动化C臂解决方案的划时间大致相似。计划时间是自我报告的,反映了用户偏好的一些因素。即使使用相同的划系统,中心之间的方法差异也可以看出,EE中心在每个计划上花费的时间少于EV中心。这可能部分是由于EE中心使用了自动化程度更高、计算速度更快的新版TPS,但也可能反映出,一旦实现了可接受的计划,单个计划人员花了多少时间来探索各种方案,以提高计划质量

治疗时

CLINACs平台和特殊平台之间的总治疗时有显著差异。差异在多发脑转移病例中最为明显(1、2和7),与GK/CK/ZAP-X的多个等中心照射方法相比,在基于Linac的平台上使用单个等中心治疗多个转移的能力减少了照射时间。在任何个体病例中,最大的差异是14个转移瘤的计划(病例7),GK治疗需要204分钟,而HA-10X治疗需要12.1分钟。7例C臂Linac平台的HA-10X最短总照射68分钟,EV最长照射210分钟,差异主要是由于14转移计划使用3个独立的等中心,以及选择较低剂量率的扁平(2400 MU/min vs 600 MU/min)。然而,尽管EE使用扁平的无过滤器束进行治疗,但EE与EV的治疗时间差异很小。所有基于Linac的方法的计时都包括初始锥形束计算机断层扫描,但Elements计时还包括使用ExacTrac在每个治疗床角度进行的分次内成像。

专业平台的照射交付时间要高得多,从CK的579分钟到GK的695分钟不等。后者取决于Co- 60源的年龄,在本研究中这些被归一化为3.0 Gy/min的参考剂量率。对于基于罩的治疗,治疗时间是在假设治疗没有暂停以考虑患者移动的情况下计算的。GK、CK和ZAP-X对多个转移病例(病例1,2,7)使用多个等中心。三个基于Linac的平台对3个转移(病例1)和7个转移(病例2)计划使用单个等中心设置,而EE选择使用单独的等中心治疗病例1脑干转移。这是他们首选的临床解决方案,以尽量减少脑干转移的任何设置错误(因为对于单个等中心多转移计划,设置错误随着离轴距离的增加而增加)两种元素平台均使用3个等中心治疗14例转移病例。元素可以创建一个治疗所有14个转移瘤的单一等中心计划,但两个中心的临床实践似乎是一致的,因为与其他中心和/或彼此接近的转移瘤簇分开治疗,以最小化与等中心的靶距离,并提供更多机会最小化非常接近的靶对之间的潜在桥接剂量。用额外的等中心治疗也可以减少对正常大脑的总剂量。在14个转移计划的情况下,两个Elements中心合并3个等中心的正常脑总V12 Gy为19.6 cc,而HA- 6x为25.8 cc, HA- 10X为26.3 cc,尽管以增加治疗时为代价。

CLINACs相比,专用平台对复杂形状良性病变的治疗时也更长。这些时并不意味着标或限制相反,我们的目标是显示每个平台在计划和交付时间之间的总体平衡These times are not meant to be targets or limits; rather, the aim is to show the general balance per platform between planning and delivery times)

计划的改进

3通过比较参加2016年基准测试的三个中心的个别计划指标,说明了计划质量的改进。CK和EV计划都有显著的改进,这可能归功于它们各自新的划系统。GK中心的变化更加多变,在某些情况下,新的GK计划的适形性明显较差。这可能是由于使用了Lightning逆向计划算法,该算法虽然速度极快,但在某些情况下,生成的计划不如专家手动处理计划Changes are more variable for the GK center, and in some cases the new GK plans have notably inferior conformity. This may be explained by the use of the Lightning inverse planning algorithm, which, although extremely fast, can, in some circumstances, produce plans that are inferior to an expert manual treatment planner.)。然而,应该指出的是,该平台具有最高的原始计划质量However, it should be noted that this platform had the  highest original plan quality)。总体而言,自2016年最初的基准测试以来,平台之间的计划质量差异似乎一直在缩小。

局限性

在专用和CLINAC平台之间规划不同的转移性靶点(根据处方剂量和应用的边际),尽管在所有设备之间的直接性能比较中存在困难,但可以更密切地比较这些设备通常提供的实际治疗。

标上添加边缘外扩可以有效地平滑其轮廓并增加其体积。对于小的转移瘤,这种体积的增加可能是数倍,并且可以增加对有外扩与无外扩计划的比较的偏见,特别是对于那些倾向于随体积变化的指标。

对于良性靶标,没有边缘外扩,所有平台都使用相同的处方剂量,覆盖范围、选择性和适形性的变化更窄,而梯度似乎仍然依赖于束能量,Co-60和3MV能量和更短的SAD/更近的准直shorter SAD/closer collimation )具有比6和10X更陡的梯度。R50%值在不同平台之间也表现出较大的差异。

处方等剂量的变化决定靶内的最大剂量,但也影响靶外的梯度,但尚未进行评估。临床研究表明,很少有证据表明内部最大剂量有临床效果,而经分析的梯度已知会影响症状性放射性坏死的风险(Clinical studies have shown little evidence that the internal maximum dose has a clinical effect,  whereas the gradient, which was analyzed, is known to affect the risk of symptomatic radionecrosis)

一般采用局部TPS值,由于靶体积和剂量-体积计算方法不同,可能导致偏差。这些不确定性可能达到5%至10%,在评估平台之间的微小差异时应牢记,但它们不太可能改变本研究的总体趋势和结论。不同划系统的剂量计算点间距也不同,GK使用0.5 mm, ZAP-XCK和c臂LINACs使用1.0 mm。通常,较细的剂量计算网格将导致计算的质量参数略差。此外,Zap TPS计算的体积最接近0.01 cc,而所有其他TPS计算的体积最接近0.001 cc,这在评估1.0 cc病变的PCI时可能会引入高达1%的舍入误差,对于0.1 cc的标可能会引入高达10%的误差。本研究中存在小至0.02 cc的PTV体积,因此TPS计算的较小标指标应谨慎看待。由于计划的良性目标数量较少,该组的任何参数都不可能达到统计学意义。此外,大量可以探索的关系需要限制,所以我们选择将所有平台与伽玛刀进行比较,这通常被视为SRS的“黄金标准”。ZAP-X系统仍处于起步阶段,因此找一个有2年以上经验的中心是不可能的。我们咨询了Zap外科的一名工作人员,以制定尽可能接近临床中心预期的计划。我们提供了来自1个国家的有限数的中心的数据。获得的结果可能不能反映其他地区的病例组合或临床实践。然而,我们的研究使用了一系列转移性和良性病例,而一些计划研究仅依赖于单个病例或恶性或良性病例。所有的计划比较研究都呈现出治疗质量的不完整图景;然而,它们可以为当前和未来的实践提供有用的信息。本研究未考虑照射准确性或所见差异的临床意义。然而,它的目的是给出一个使用最新治疗平台的当代临床实践的图,使用可比较和一致的参数进行评估。

结论:

与早期的研究相比,较新的设备似乎提供了较高质量的治疗。射波刀和直线加速器平台似乎具有较高的适形性,而低能量平台产生更陡峭的剂量梯度。

2016年全国SRS基准研究得到了重复和扩展,每个主要的当代SRS平台都有代表性的中心。我们的研究结果表明,由于TPS和硬件的技术改进,CK和C臂LINACS的计划质量得到了显着改善。与2016年最初的基准研究相比,这减少了不同平台之间的多变性。

ICON伽玛刀
专业化介绍关于立体定向头部放射外科治疗的国内外专业信息和相关知识,有志于帮助专业同行和病患更好了解相关医学知识信息。以利于规范化精准治疗颅脑疾病。
 最新文章