我们将每天分享国际上生物、医学等方向的最新科研成果,把世界上最新的科技发展带给读者,如果喜欢我们,请点一个关注吧
抗β-淀粉样蛋白单克隆抗体在阿尔茨海默病中的效果评估:一项强调靶点结合与临床意义的系统综述和荟萃分析
尽管大多数针对阿尔茨海默病中Aβ(β淀粉样蛋白)的单克隆抗体未能证明其有效性,但最新的抗体显示出了具有统计学意义的临床效果。我们进行了一项系统综述和荟萃分析,以评估抗Aβ抗体在散发性阿尔茨海默病(AD)中的疗效、靶点结合情况以及安全性,纳入了截至2023年11月28日发表的所有III期随机对照试验(RCTs)。作为一类药物,抗体在临床量表CDR-SB(临床痴呆评定量表-总和盒)和ADAS-Cog(阿尔茨海默病评估量表-认知部分)上使病情恶化得到轻微程度的减轻,并在PET(正电子发射断层扫描)上大幅度减少了淀粉样蛋白。PET上淀粉样蛋白的减少与CDR-SB和ADAS-Cog评分的降低呈中度相关。然而,抗体分别大幅度和中度增加了ARIA-E(淀粉样蛋白相关影像异常-脑水肿)和ARIA-H(淀粉样蛋白相关影像异常-脑出血)的风险。在按个体药物进行的亚组分析中,Donanemab和Lecanemab带来了最大的益处。在按结合亲和力进行的亚组分析中,不与单体结合的抗体与最佳效果相关。尽管在临床指标上取得了具有统计学意义的改善,但在研究期间,抗体的作用低于具有临床意义变化的阈值。然而,最新的抗体明显干扰了阿尔茨海默病潜在的病理生理过程,因此其益处可能随时间累积,从而在后续几年内产生更大的临床效果。PROSPERO注册号:CRD42022381334。
淀粉样蛋白假说认为,大脑中β淀粉样蛋白(Aβ)的病理沉积会驱动tau蛋白病理、神经退行性病变,并最终导致阿尔茨海默病(AD)的认知功能下降[1,2]。在过去几十年里,基于淀粉样蛋白假说,人们开发出了旨在减少Aβ产生(如β-分泌酶和γ-分泌酶抑制剂)或增加其清除(如主动和被动免疫)的药物。在所有抗Aβ方法中,使用针对Aβ的单克隆抗体(mAbs)进行被动免疫已成为最有前景的策略,因为其具有机制选择性和良好的耐受性[3]。尽管绝大多数抗Aβ mAbs(如Bapineuzumab、Solanezumab、Crenezumab和Gantenerumab)未能证明其有效性,但包括Aducanumab、Lecanemab和Donanemab在内的新型mAbs在多项临床指标上显示出了具有统计学意义的益处,并因此获得了美国食品药品监督管理局(FDA)的批准。然而,这些抗体的效果幅度较小[4-6],从而引发了对其临床意义的争议[7,8]。对于Aducanumab,由于一项试验的结果未能在另一项设计相似的试验中得到重复,因此引发了更多担忧[9]。
不同mAbs之间的效果差异、同一mAb在不同试验中的效果不一致,以及关于具有统计学显著性效果的临床重要性的争议,都揭示了目前对于抗Aβ mAbs在AD中疗效的不确定性。我们进行了一项系统综述和荟萃分析,旨在综合并批判性地评估关于抗Aβ mAbs作为一类药物以及作为个体药物在散发性AD中的疗效、靶点结合情况以及安全性的所有现有证据。我们还额外调查了淀粉样蛋白减少的程度是否与临床疗效相关。此外,Aβ可以以单体、寡聚体、原纤维、纤维和斑块等多种形式存在,每种mAb都会与其中特定的组合结合。一些证据表明,Aβ单体可能在AD中发挥保护作用[10],因此,与单体结合的mAbs可能导致不太理想的临床结果。因此,我们测试了与单体结合强度是否与临床结果相关。
方法
本系统综述和荟萃分析的方案已在PROSPERO注册(注册号:CRD42022381334)。我们根据系统综述和荟萃分析的首选报告项目(PRISMA)声明(表S1)[11]报告我们的方法和结果。
数据来源
我们检索了从建库至2023年11月28日的MEDLINE、Embase和Cochrane中央对照试验注册库(CENTRAL)。我们使用了相关的自由文本和受控词汇术语,没有语言和出版状态限制。详细的检索策略见表S2。我们还检索了临床试验注册库,包括ClinicalTrials.gov、欧盟药品监管机构临床试验数据库(EudraCT)和世界卫生组织国际临床试验注册平台。最后,我们手动搜索了阿尔茨海默病临床试验(CTAD)、阿尔茨海默病与帕金森病(AD/PD)以及阿尔茨海默病协会国际(AAIC)会议的记录,以及检索到的文章和相关综述的参考文献。
研究选择
我们综合了针对任何Aβ形式(不论给药方案)的mAbs在散发性AD成人中的III期随机对照试验(RCTs)结果。我们选择III期RCTs是因为与早期(I、II期)RCTs相比,它们采用了更严格且大体一致的设计,以及可比的mAb剂量和治疗持续时间,从而能够合成更同质的数据。病例报告、病例系列、观察性研究、单臂试验、非人类研究以及关于常染色体显性AD的研究被排除在外。
从电子数据库和灰色文献来源中检索到的记录被导入到参考管理软件中。去重后,将剩余记录导出到在线软件(Covidence;Veritas Health Innovation Ltd,澳大利亚墨尔本)中进行筛选。两名审稿人(KA,AM)独立在标题和摘要层面筛选所有记录,并随后评估潜在符合资格研究的全文,记录排除原因。任何分歧均通过两名审稿人之间的共识解决。最终纳入的研究集被包括在系统综述中(本研究的定性部分),而只有提供了mAb与安慰剂比较数值结果的研究才被纳入荟萃分析(本研究的定量部分)。
数据提取
两名审稿人(KA,AM)使用预先设计的提取表,独立提取符合条件研究中的研究特征、参与者的人口统计学和基线特征以及预先指定的结果数据;任何差异均由一名高级审稿人(DK)裁定。我们的主要结果是临床痴呆评定量表-总和盒(CDR-SB)。次要结果包括阿尔茨海默病评估量表-认知部分(ADAS-Cog)、简易精神状态检查(MMSE)和阿尔茨海默病合作研究-日常生活活动(ADCS-ADL)。其他次要结果包括淀粉样蛋白PET和脑脊液(CSF)生物标志物p181-tau、Aβ42和Aβ40。由于各试验中研究/报告的血液生物标志物类型存在很大异质性,因此未提取血液生物标志物数据。安全性结果包括伴有水肿或渗出的淀粉样蛋白相关影像异常(ARIA-E)、伴有脑微出血或脑表面铁沉积的ARIA(ARIA-H)以及全因死亡率。
偏倚风险和证据确定性
使用修订后的Cochrane协作网偏倚风险工具(RoB 2.0)[12]对纳入研究的CDR-SB进行质量评估。如果所有单个领域均表明偏倚风险低,则总体偏倚风险视为低;如果至少有一个领域表明偏倚风险高,则总体偏倚风险视为高;其他情况下则视为存在一些关注点。此外,我们使用推荐意见、评估、发展和评价(GRADE)框架来评估CDR-SB效应估计值的证据确定性[13]。最后,我们通过漏斗图直观地以及通过Egger’s检验[14]正式地探索了CDR-SB的小研究效应。
数据合成与分析
对于连续数据,我们计算了Hedges’g(标准化均值差(SMDs)的标准度量)以及95%置信区间(CIs)。使用这种标准化指标可以合并可能在不同研究中略有不同的测量/量表所得出的效应量。例如,合并不同版本的ADAS-Cog(例如,11-14项);以及使用不同示踪剂(PiB、florbetaben、florbetapir或flutemetamol)和定量技术(SUVr和centiloids)的淀粉样蛋白PET扫描结果的合并。采用随机效应模型进行荟萃分析。为了计算研究间异质性(tau-squared,t²),我们使用了限制最大似然(REML)估计法。为了计算合并效应周围的置信区间,我们使用了Knapp-Hartung调整法。对于二分类结果,我们计算了风险比(RRs)以及95%置信区间,并使用Mantel-Haenszel方法进行荟萃分析。对于所有荟萃分析,使用I²统计量评估研究间的统计异质性,I²值超过50%表示存在实质性异质性。对于连续结果的统计学显著结果,我们使用Kraemer和Kupfer的方法计算需治疗人数(NNT),该方法直接根据曲线下面积(AUC)从SMD计算NNT。
考虑到个体单克隆抗体(mAbs)不同剂量的效果可能存在差异(同一mAb的不同剂量可能对Aβ形式具有不同的结合亲和力,因此作用机制也不同),我们没有在单一试验内合并不同剂量,而是将它们作为单独的分析单元处理。为了确定mAbs作为一类的总体效果,我们结合了所有不同药物和剂量对于任何给定结果的荟萃分析。然后,为了检查个体mAbs的效果,我们按个体mAbs进行了亚组分析。此外,由于Aβ单体可能在阿尔茨海默病(AD)中发挥神经保护作用,我们根据mAbs对Aβ单体的相对结合亲和力进行了亚组分析。为了评估mAbs诱导的Aβ减少的临床相关性,我们计算了淀粉样蛋白PET变化的SMDs与临床结果CDR-SOB、ADAS-Cog和ADCS-ADL的SMDs之间的Pearson’s r相关系数。同样,为了评估CSF p181-tau减少的临床相关性,我们计算了CSF p181-tau的SMDs与CDR-SOB、ADAS-Cog和ADCS-ADL的SMDs之间的Pearson’s r。最后,为了检查已显示出一些临床益处的mAbs的合并效果,我们进行了一项敏感性分析,仅包括获得FDA批准的Aducanumab、Lecanemab和Donanemab。
使用R版本3.6.3(R Core Team,维也纳,奥地利)以及统计包“esc”、“dmetar”、“meta”、“metafor”和RevMan 5.4(北欧Cochrane中心,哥本哈根,丹麦)进行荟萃分析。本手稿已根据NIH规定获得出版许可。
结果
我们的文献搜索共确定了5425条记录。经过去重和筛选后,38条记录描述了19项研究,这些研究被纳入系统综述。其中,18项研究共纳入了21122名参与者,设计为双盲、平行组、安慰剂对照试验,并被纳入我们研究的定量部分,即荟萃分析(图1)。在系统综述包含的19项研究中,四项评估了Bapineuzumab,四项评估了Solanezumab,三项评估了Gantenerumab,两项评估了Crenezumab,两项评估了Aducanumab,一项评估了Donanemab,一项评估了Lecanemab。
系统综述中包含但未纳入荟萃分析的一项试验比较了Donanemab和Aducanumab,且没有设置安慰剂组。一项试验未评估任何临床结果,仅纳入生物标志物合成的荟萃分析中。值得注意的是,本系统综述和荟萃分析中包含的八项试验由于中期分析显示无效或评估同一mAb的其他研究观察到缺乏临床疗效而提前终止。研究和患者基线特征见表1。
偏倚风险评估的详细信息总结在表S3中。总体而言,九项研究偏倚风险较低,一项研究偏倚风险较高,七项研究被认为存在一定程度的偏倚风险。缺失的结果数据是导致存在一定程度偏倚风险的最常见领域。一项试验未评估任何临床结果,因此未纳入偏倚风险评估。
主要结果
与安慰剂相比,mAbs减轻了CDR-SB的恶化[SMD=−0.06(95% CI,−0.10至−0.01,I²=57%)](图2a)。尽管这一差异具有统计学显著性,但效应量非常小(<0.2),对应的NNT为30。合并效应量对应的CDR-SB评分变化远小于文献中目前定义的临床有意义变化(表2)。
主要结果的荟萃分析中Egger’s检验具有统计学显著性(p=0.03)。然而,我们不担心发表偏倚,因为对漏斗图(图S1)的检查显示,不对称性是由漏斗左侧的Lecanemab和Donanemab的效应量驱动的。Lecanemab和Donanemab在我们的分析中是已知的异常值,产生了迄今为止最稳健的临床效果(见按药物的亚组分析),并且预计会导致漏斗不对称。此外,已知漏斗图不对称性有时可能偶然发生。根据GRADE评估,证据质量为中等,主要因偏倚风险而降级(表S4)。
次要结果
与安慰剂相比,mAbs减轻了ADAS-Cog[SMD=−0.08(95% CI,−0.11至−0.05,I²=0%)](图2b)、ADCS-ADL[SMD=0.09(95% CI,0.03至0.14,I²=61%)](图S2b)和MMSE[SMD=0.05(95% CI,0.02至0.08,I²=0%)](图S2a)的恶化。这些改善的效应量非常小(<0.2),对应的NNT分别为22、20和35。ADAS-Cog、ADCS-ADL、MMSE的合并效应量对应的评分变化低于临床有意义变化的阈值(表2)。
与安慰剂相比,mAbs显著减少了PET上的淀粉样蛋白[SMD=−1.13(95% CI,−1.68至−0.58,I²=99%)](图3a),这一减少的效应量非常大(>0.8)。单克隆抗体还减少了CSF p181-tau[SMD=−0.44(95% CI,−0.60至−0.28,I²=51%)](图S3),效应量为中等(~0.5)。抗体增加了CSF Aβ42[SMD=1.12(95% CI,0.64至1.61,I²=91%)](图S4)和Aβ40[SMD=0.7(95% CI,0.15至1.26,I²=90%)](图S5),效应量分别为非常大和中等到非常大。
关于ARIA,与安慰剂相比,mAbs显著增加了ARIA-E[RR=7.86(95% CI,5.18至11.94,I²=82%)](图4a)和ARIA-H[RR=1.76(95% CI,1.45至2.15,I²=81%)]的风险
图1. 研究选择流程图。
按药物划分的亚组分析
按单种药物的亚组分析结果见图2-4及补充材料(S2-S6)。
在单种药物中,Donanemab对主要临床结局CDR-SB的改善效果最大[标准化平均差SMD=−0.26(95%置信区间,−0.36至−0.16)],其效应量范围属于小到中等(0.2-0.5)(图2a)。尽管具有统计学显著性,但这种改善在CDR-SB量表上对应0.70分,小于被视为该量表上具有临床意义变化的阈值1分(表2)。对于其他临床结局,Donanemab对简易智能状态检查量表(MMSE)的改善效应量非常小(0.11),对阿尔茨海默病评估量表-认知分量表(ADAS-Cog)的改善效应量属于非常小到小(0.15),对阿尔茨海默病合作研究-日常生活活动量表(ADCS-ADL)的改善效应量属于小(0.18)(图2b,S2)。Donanemab带来的所有改善在药物与安慰剂之间的分数差异均低于临床重要变化的阈值(表2)。
Lecanemab对主要临床结局CDR-SB的恶化有较小的改善效应[SMD=−0.19(95%置信区间,−0.29至−0.10)](图2a)。Lecanemab还对其他临床结局的恶化有改善作用,包括ADAS-Cog的改善效应量属于小(~0.2),ADCS-ADL的改善效应量属于小到中等(0.25)(图2b,S2b)。Lecanemab带来的所有改善在药物与安慰剂之间的分数差异均低于临床重要变化的阈值(表2)。
Aducanumab仅对ADAS-Cog和ADCS-ADL临床结局的恶化有非常小的改善效应(<0.2)(图2b,S2b)。Solanezumab对ADAS-Cog和MMSE的恶化有非常小的改善效应(<0.2)(图2b,S2a)。同样,Gantenerumab对ADAS-Cog的恶化有非常小的改善效应(<0.2)(图2b)。这些单种药物对临床指标的改善也均低于临床重要变化的阈值(表2)。
对于生物标志物结局,Aducanumab、Lecanemab和Donanemab对淀粉样蛋白正电子发射断层扫描(PET)的减少有非常大的效应量(>0.8)(图2a)。Aducanumab和Lecanemab对脑脊液(CSF)p181-tau的减少有大的效应量(0.8)。Gantenerumab使CSF p181-tau减少的效应量属于中等到大(0.6),而Bapineuzumab的效应量属于小到中等(0.3)(图S3)。此外,对于其他CSF淀粉样蛋白生物标志物,Lecanemab、Aducanumab和Crenezumab均使Aβ42增加的效应量非常大(图S4),而仅有Crenezumab使Aβ40增加的效应量也非常大(图S5)。
关于ARIA(淀粉样蛋白相关影像异常),Aducanumab、Lecanemab、Donanemab、Gantenerumab和Bapineuzumab均使ARIA-E(ARIA-脑水肿/渗出)的发生率增加,且效应量非常大(相对风险RR>2)(图4a)。Bapineuzumab、Aducanumab和Donanemab使ARIA-H(ARIA-脑出血)的发生率增加的效应量非常大(RR>2),而Lecanemab和Gantenerumab的效应量属于中等(RR 1.2-2)(图4b)。与安慰剂相比,Solanezumab和Crenezumab未增加任何ARIA-E或ARIA-H的风险。最后,与安慰剂相比,任何药物均未增加全因死亡的风险(图S6)。
表1. 研究及患者基线特征。
图2. (a)临床痴呆评定量表-方框总和(CDR-SB)和(b)阿尔茨海默病评估量表-认知分量表(ADAS-Cog)的森林图,含按单药划分的亚组分析的荟萃分析。
表2. 临床结局效应量解释、需治疗人数及临床意义。
根据与Aβ单体的结合亲和力进行的亚组分析
根据与Aβ单体的结合亲和力,单克隆抗体(mAbs)可分为以下三个亚组之一:不结合、弱结合和强结合。不与单体结合的mAbs亚组包括优先与原纤维(Lecanemab)、纤维(Aducanumab)或Aβ斑块本身(Donanemab)结合的药物[4,21]。
与单体呈弱结合的mAbs亚组包括Gantenerumab,它除了与单体有一定结合外,还与寡聚体和纤维有亲和力[4,21]。与单体呈强结合的亚组包括仅与单体结合(Solanezumab)或与单体以及所有其他Aβ形式结合的mAbs(Bapineuzumab、Crenezumab)[21]。
按结合亲和力划分的亚组分析的森林图见图S7-S13。与安慰剂相比,不与单体结合的抗体在CDR-SB上的恶化程度有所减轻,但效应量非常小[标准化平均差(SMD)=−0.14(95%置信区间(CI),−0.24至−0.04,I²=56%)]。相反,与单体呈弱结合或强结合的抗体在CDR-SB上未产生任何显著影响(图S7a)。
与安慰剂相比,不与单体结合的抗体在ADAS-Cog上的恶化程度也有所减轻,但效应量非常小[SMD=−0.13(95% CI,−0.18至−0.09,I²=0%)],其次是与单体呈弱结合的mAbs具有较小的有益效应[SMD=−0.10(95% CI,−0.17至−0.03,I²=0%)],再次是与单体呈强结合的mAbs具有更小(边缘性)的有益效应[SMD=−0.04(95% CI,−0.08至−0.01,I²=0%)](图S7b)。
对于ADCS-ADL,不与单体结合的mAbs亚组与安慰剂相比有有利差异[SMD=0.17(95% CI,0.10至0.24,I²=17%)],效应量略小(~0.2),但与单体呈弱结合或强结合的mAbs则无此差异(图S8b)。三个亚组均未对MMSE评分产生统计学上的显著影响(图S8a)。
在生物标志物结果方面,与安慰剂相比,不与单体结合的mAbs在PET上显著减少了淀粉样蛋白沉积,效应量非常大(>0.8)[SMD=−2.30(95% CI,−2.97至−1.63,I²=97%)],其次是与单体呈强结合的mAbs引起的减少幅度明显较小,效应量为小到中等(0.2–0.5)[SMD=−0.28(95% CI,−0.43至−0.13,I²=16%)](图S9a)。
此外,与安慰剂相比,不与单体结合的mAbs使CSF p181-tau的减少幅度达到大效应量[SMD=−0.81(95% CI,−1.08至−0.55,I²=0%)],其次是与单体呈弱结合的mAbs引起的减少幅度较小,但效应量仍为中等到大[SMD=−0.57(95% CI,−0.85至−0.29,I²=0%)],再次是与单体呈强结合的mAbs引起的减少幅度更小,效应量为小到中等[SMD=−0.26(95% CI,−0.41至−0.10,I²=0%)](图S9b)。
与安慰剂相比,不与单体结合的抗体使CSF Aβ42的增加幅度达到非常大效应量[SMD=1.27(95% CI,0.77至1.77,I²=61%)],与与单体呈强结合的mAbs[SMD=1.43(95% CI,0.58至2.29,I²=93%)]相似,而与单体呈弱结合的mAbs则无此效应[SMD=0.33(95% CI,−0.36至1.02,I²=83%)](图S10)。最后,与单体呈强结合的抗体是唯一改变(增加)CSF Aβ40的亚组[SMD=1.01(95% CI,0.46至1.56,I²=84%)],且效应量非常大(图S11)。
在与单体不结合的mAbs中观察到ARIA-E的发生率最高[相对风险(RR)=9.61(95% CI,5.52至16.72,I²=30%)],其次是与单体呈强结合[RR=8.37(95% CI,3.66至19.16,I²=58%)]和弱结合[RR=6.15(95% CI,1.59至23.75,I²=92%)]的mAbs(图S12a)。对于ARIA-H,与安慰剂相比,不与单体结合的mAbs风险最高[RR=2.29(95% CI,1.94至2.71,I²=0%)],其次是与单体呈弱结合[RR=1.65(95% CI,1.26至2.15,I²=18%)]和强结合[RR=1.55(95% CI,1.05至2.28,I²=76%)]的mAbs(图S12b)。在所有亚组中,mAbs与安慰剂的死亡风险相似(图S13)。
图3.(a)按单种药物进行亚组分析的淀粉样蛋白PET森林图。(b)淀粉样蛋白PET效应值与CDR-SB之间的相关图。(c)基于Aβ单体结合亲和力的亚组分析中,淀粉样蛋白PET与CDR-SB之间的相关性。(d)淀粉样蛋白PET效应值与ADAS-Cog之间的相关图。(e)基于Aβ单体结合亲和力的亚组分析中,淀粉样蛋白PET与ADAS-Cog之间的相关性。
图4. (a)伴水肿/渗出的淀粉样蛋白相关影像学异常(ARIA-E)和(b)伴微出血或脑表面铁沉积症(ARIA-H)的森林图,均按单种药物进行亚组分析。
Aβ和p181-tau减少与临床指标改善的相关性
PET显示的淀粉样蛋白减少与CDR-SB(标准化均数差[SMDs]之间的相关性,r=+0.59,p=0.006)和ADAS-Cog(r=+0.70,p<0.001)的减少呈中度相关(图3b,3d)。值得注意的是,这些相关性主要由对Aβ单体无结合亲和力的单克隆抗体(mAbs)所驱动(图3c,e)。
同样,脑脊液(CSF)中p181-tau的减少与ADAS-Cog的减少呈中度相关(r=+0.59,p=0.022),与ADCS-ADL的减少呈强相关(r=−0.79,p=0.035)。这些相关性也主要由对Aβ单体无结合亲和力的mAbs所驱动。
FDA批准mAbs的敏感性分析
FDA批准的mAbs(Aducanumab、Lecanemab、Donanemab)联合使用可减轻CDR-SB[SMD=−0.14(95%置信区间[CI],−0.24至−0.04,I²=56%)](图S14a)和ADAS-Cog[SMD=−0.13(95% CI,−0.18至−0.09,I²=0%)](图S14b)的恶化。尽管这些益处大于所有mAbs联合使用的益处(分别为0.14 vs 0.06和0.13 vs 0.08),但效应量仍然很小(<0.2)。此外,FDA批准的mAbs对ADCS-ADL有益[SMD=0.17(95% CI,0.10至0.24,I²=17%)](图S14c),效应量在小范围内(0.17),大于所有mAbs联合使用产生的非常小效应(0.09)。仅在Aducanumab和Donanemab研究中评估了简易智能状态检查量表(MMSE),其合并效应在统计学上无显著性[SMD=0.06(95% CI,−0.03至0.14,I²=6%)](图S14d);相反,所有mAbs联合使用的合并效应在MMSE上显示出统计学上显著的益处,尽管效应量非常小(0.05)(图S2a)。
对于淀粉样蛋白PET,三种FDA批准的mAbs可显著减少淀粉样蛋白[SMD=−2.30(95% CI,−2.97至−1.63,I²=97%)](图S15a),效应量大于所有mAbs联合产生的效应量(2.30 vs 1.13)。此外,仅Aducanumab和Lecanemab研究评估了CSF p181-tau和Aβ42,联合使用导致SMD=−0.81(95% CI,−1.08至−0.55,I²=0%)(图S15b)的减少和SMD=1.27(95% CI,0.77至1.77,I²=61%)(图S15c)的增加;这些变化的效应量大于所有mAbs联合使用产生的效应量(分别为0.81 vs 0.44和1.27 vs 1.12)。
值得注意的是,FDA批准的mAbs显著增加了ARIA-E[相对风险(RR)=10.36(95% CI,8.12至13.21),I²=0%](图S16a)和ARIA-H[RR=2.29(95% CI,1.94至2.71),I²=0%](图16b)的风险,RR大于所有mAbs联合分析中的RR(分别为10.36 vs 7.86和2.29 vs 1.76)。三种抗体联合使用的死亡率风险与安慰剂无差异(图S17)。
讨论
在本系统综述和荟萃分析中,我们综合了关于抗Aβ mAbs在散发性阿尔茨海默病(AD)中的疗效、靶点结合和安全性的所有III期随机对照试验(RCTs)数据。总体而言,我们发现抗Aβ mAbs作为一类药物,在临床指标CDR-SB、ADAS-Cog和ADCS-ADL上产生了统计学上显著但效应量非常小的益处。此外,mAbs还通过PET测量显著减少了淀粉样蛋白负荷,这种减少与CDR-SB和ADAS-Cog的益处呈中度相关。而且,CSF p181-tau的减少具有中度效应量,与ADAS-Cog的益处呈中度相关,与ADCS-ADL的益处呈强相关。然而,mAbs也显著增加了ARIA-E的发生率(效应量非常大)和ARIA-H的发生率(效应量中度)。
在单种mAbs方面,与安慰剂相比,Donanemab和Lecanemab,其次是Aducanumab,在临床和生物标志物结果方面产生了最大的益处差异。然而,根据既往文献[32],这些统计学上显著的益处低于临床有意义变化的阈值。
为了解释为什么大多数针对淀粉样蛋白的mAbs临床试验历史上未能获得阳性临床结果,许多研究人员假设,这可能是因为试验纳入了处于疾病进展阶段的AD患者,在这些患者中,淀粉样蛋白清除可能无益。例如,从2014年到2016年,前六项关于mAbs的III期试验(Solanezumab的EXPEDITION 1和2;Bapineuzumab的301、302、3000、3001研究)在轻度至中度AD患者中进行,结果药物与安慰剂之间无显著差异[24,25]。从那时到2021-2022年,大量关于各种mAbs的临床试验(Solanezumab的EXPEDITION 3;Gantenerumab的Scarlet RoAD;Crenezumab的CREAD 1和2;Aducanumab的EMERGE和ENGAGE)[5,22,26,27]纳入了处于疾病早期阶段(前驱期和/或轻度AD)的患者。除了Aducanumab产生了统计学上显著但临床上存在疑问的结果[5]外,大多数研究均被认为完全呈阴性。考虑到从2014年到2022年的所有这些研究,我们之前通过荟萃回归分析表明,疾病阶段与mAbs产生的结果无相关性[33]。自那时以来,已经进行了更多纳入前驱期和/或轻度AD患者的试验(Solanezumab的A4、Lecanemab的CLARITY AD、Gantenerumab的GRADUATE I和II、Donanemab的TRAILBLAZER 2)[4,6,23],结果显示,在疾病早期阶段开始使用mAbs治疗并未带来更好的结果。例如,尽管Lecanemab和Donanemab试验是在前驱期至轻度AD患者中进行,且获得了统计学上显著的益处[4,6],但仅在前驱期AD患者中进行的Solanezumab 2023研究却呈阴性[23]。
越来越多的证据表明,淀粉样蛋白斑块减少的程度是临床结果的更好预测指标。在本研究中,我们显示,PET测量的淀粉样蛋白减少与CDR-SB和ADAS-Cog的改善相关。尽管淀粉样蛋白减少可能是决定mAbs疗效的主要因素之一,但我们假设可能还有其他因素决定对mAbs的反应。我们假设,与Aβ单体的结合程度在抗体反应中起作用,单体结合程度更高会导致结果更差,因为单体可能在大脑中发挥着保护性的生理作用[10]。因此,我们根据与单体的结合亲和力强度对所有结果进行了亚组分析,并发现以下结果:不与单体结合(而优先与原纤维、纤维或斑块结合)的mAbs在多个临床和生物标志物结果上一致地产生了统计学上显著的益处,且程度大于与单体弱结合或强结合的mAbs。尽管亚组分析的结果并不意味着因果关系,但我们的发现支持了这样一种观点:在AD中,保留单体Aβ池的同时靶向原纤维、纤维和斑块可能是有益的。
总体而言,我们更新并扩展了早期荟萃分析的结果[33,34],通过对11个不同结果进行荟萃分析得出了新的结论,这些结果共同评估了对认知、功能能力、淀粉样蛋白和tau生物标志物、ARIA风险和死亡率的影响。此外,我们还显示了生物标志物和临床结果改善之间的相关性。重要的是,除了按单种mAbs进行亚组分析外,我们还基于mAbs对Aβ单体的结合亲和力进行了新颖的亚组分析。此分析的结果可能为不同mAbs效应的差异提供了解释,并可为未来AD中抗Aβ mAbs的开发提供信息。
然而,我们的研究也存在一些局限性。对多个生物标志物结果的荟萃分析显示出较大的统计异质性。在某些情况下,如淀粉样蛋白PET荟萃分析,异质性归因于单克隆抗体(mAb)的真实效应差异。更具体地说,一些单克隆抗体能有效清除脑内淀粉样蛋白,而另一些则不能,因此导致了高度异质性的效应,这也解释了统计异质性的原因。相比之下,脑脊液(CSF)中Aβ42和Aβ40荟萃分析的异质性可能部分源于单克隆抗体的真实差异,但也可能源于淀粉样蛋白测定分析试验缺乏验证和公认的统一截止值,这可能导致即使是相同药物在相同剂量下也会产生异质性的结果。另一个局限性是,纳入试验中的生物标志物结果是在研究队列的子群体中评估的,因此,我们在研究层面计算生物标志物与临床效果之间的相关性时,假设这些子群体能够代表研究临床结果的整个队列。
我们的研究结果证实,单克隆抗体作为一类药物,以及一些单个的单克隆抗体,能够显著降低淀粉样蛋白负荷;然而,这种效应伴随着统计上显著的临床改善,但这些改善的效果最多只是小到中等程度,这引发了对这些效应临床意义的质疑。最近有人提出,在临床试验中,临床痴呆评定量表(CDR-SB)评分变化1分、阿尔茨海默病评估量表-认知部分(ADAS-Cog,11项或13项)评分变化2分、以及简易智能状态检查量表(MMSE)评分在12个月内变化2分,可被视为具有统计学意义的结果达到临床意义的最低变化值[32]。在分别进行了19.5个月(Aducanumab)和18个月(Lecanemab、Donanemab)的临床试验后,Aducanumab、Lecanemab和Donanemab各自在临床指标上的评分变化均低于这些基准值。在我们的荟萃分析中,我们将所有具有统计学意义的合并效应量转换回原始临床量表上的评分变化,并发现没有任何一种药物或单克隆抗体亚组达到上述具有临床意义的改变阈值(表2)。因此,基于这些截止值,单克隆抗体并未产生具有临床意义的效果,因此其在临床实践中的应用仍然存疑。然而,我们分析中淀粉样蛋白减少与临床改善之间的相关性支持了淀粉样蛋白是阿尔茨海默病(AD)合理靶点的观点。此外,由于单克隆抗体可明显干扰AD的潜在病理生理过程,其益处可能随时间累积,且在随后几年中临床效果更大[35]。可能需要更长时间的临床试验和/或随访来探究这种可能性。我们发现,在保留Aβ单体的同时靶向原纤维、纤维和斑块的单克隆抗体与更好的临床结果相关,这可能为未来药物开发聚焦于具有此类靶点的单克隆抗体提供了方向。
结论
我们的系统综述和荟萃分析表明,单克隆抗体能够显著降低脑内淀粉样蛋白负荷,并在临床指标上诱导出具有统计学意义的益处,但在研究期间这些益处的临床重要性尚存疑问。观察到的淀粉样蛋白减少与临床指标上有益效果之间的中度相关性表明,这是病理生理上相关靶点的参与。最后,我们发现,对单体无亲和力的单克隆抗体与临床和生物标志物益处之间的相关性更强。