吐
露
心
声
血清蛋白生物标志物检测,因其含量低、血清成分复杂,而极具挑战性。科学家们不惧挑战,有什么解决问题的新思路?癌症患者血清样本蛋白质生物标志物检测,怎样转换为适配体检测?机器学习、适配体与CRISPR-Cas系统,怎样实现简单、经济、智能和高通量的癌症筛查诊断呢?大家随小编一起,来看看今天的文章吧~
临床无创或微创体液活检,如血液、尿液生物标志物检测,因其操作简单、易解读等优点,已成为早期癌症早筛的首选。以往的研究主要集中于核酸标志物检测,如ctDNA及miRNA,但这些检测往往需要大量的新鲜血液样本及额外的运输和储存条件。此外,虽然核酸检测具有优异的灵敏度和检测准确性,但在大量样本检测中,其专业依赖性较强。血清蛋白生物标志物比核酸更稳定,其检测不需要提取、纯化等过程,然而,大多数报道的蛋白质生物标志物对复杂的生物环境敏感,且在血清中的浓度很低。
血清蛋白生物标志物检测,因血清成分复杂,蛋白标志物含量低,而极具挑战。中科院杭州医学研究所谭蔚泓院士团队,在“Proteome Fishing for CRISPR/Cas12a-Based Orthogonal Multiplex Aptamer Sensing”一文中报道了一种从血清中捕获蛋白质组的方法。该法将血清样本与Fe3O4@SiO2磁性纳米颗粒(MNPs)孵育形成蛋白冠,蛋白冠结合特异性适配体后,洗脱适配体,并加入CRISPR-Cas12a反应系统,激活其反式切割活性,释放荧光信号。作者以临床非小细胞肺癌(NSCLC)血清样本为实例,构建了基于CRISPR/Cas12a的正交多重生物传感平台(COMPASS),将蛋白生物标志物检测转换为适配体检测。COMPASS平台规避了多重血清蛋白放大问题,且避免了血清中适配体的降解。这种新型COMPASS检测平台为简单、经济、智能和高通量的大规模癌症筛查诊断平台的开发指明了方向。
作者首先将血清样本与MNPs孵育形成MNP−PC,然后与9种适配体(特异性识别不同的癌症相关蛋白质生物标志物)混合物孵育形成MNP−PCA,接下来,洗脱适配体,并将其分为9等份,分别加入9种CRISPR/Cas12a系统中,包括Cas12a、报告探针(5’-6-FAM-TTATT-BHQ1−3’)和特异性识别适配体的crRNA。作者还构建了一个基于全连接神经网络(FCNN)算法的机器学习模型,进行适配体优化。
作者将MNP−PC捕获的健康对照组(H)和NSCLC的蛋白和适配体洗脱后,使用Qubit蛋白检测试剂盒进行定量。结果表明NSCLC组和健康组之间的蛋白量有明显差异。根据MNP−PC的蛋白定量结果(NSCLC vs 健康对照),计算得ROC-AUC值为87.50%(图2a),结果表明MNP−PC在一定程度上可以区分NSCLC和健康对照。作者使用Qubit ssDNA检测试剂盒对MNP−PCA中洗脱下来的适配体进行定量,NSCLC和健康对照结果差异更为明显,计算得ROC-AUC值为97.14%(图2a)。NSCLC血清MNP−PCA的洗脱蛋白和洗脱适配体含量均高于健康对照。
通过蛋白质或适配体进行诊断分类的准确性不足以满足NSCLC诊断需求,因此,作者引入了CRISPR/Cas12a系统,并设计了9种不同的crRNA,用于识别相应的9种适配体,以实现MNP−PCA的一锅法检测(图2b)。该一锅法CRISPR/Cas12a检测系统中包含Cas12a蛋白、报告探针(FQ-DNA)、9种适配体和9种相应的crRNA。30份血清样本荧光信号统计学分析结果显示,NSCLC与健康对照组之间存在显著差异(图2b),AUC值为91.67%。
区别于上述混合洗脱适配体及9种crRNA的一锅法,作者通过将从每个MNP−PC上洗脱下来的适配体混合物分成9等份,然后分别添加到9种不同的CRISPR/Cas12系统中(每种对应单一的crRNAs),证实了单个适配体的多重检测可以显著提高样本检测的准确性和特异性(图3a,b)。作者还评估了非杂交适配体的串扰信号。如图3d,e所示,靶适配体都呈现最高的荧光信号,而非靶适配体只显示了背景信号。
为了定量分析所选的适配体是否能精确区分NSCLC和健康对照,作者分析了9个适配体(NION)的荧光信号。热图结果显示,NSCLC中的蛋白质生物标志物水平高于健康对照组(图4a)。此外,在PCA中可以观察到两个清晰点簇,这表明来自MNP−PCA的适配体谱可以区分NSCLC和健康对照(图4b)。作者还建立了一个基于全连接神经网络(FCNN)算法(训练数据/测试数据=6:4)的机器学习模型来计算ROC-AUC。诊断分类分析结果为ROC-AUC=98.81%,表明该法在区分NSCLC与健康对照组方面表现良好(图4c)。
作者进一步评估了9个适配体在区分NSCLC与健康对照中的贡献值,如图4d,结果显示,9种适配体贡献高低排序为:NSE > AFP > VEGF165 > HE4 > PSA > HER2 > MUC1 > CEA > proGRP。最后3个适配体在区分NSCLC和健康对照方面的贡献非常低。
图4. NION适配体组检测分析
作者随后比较了前6个适配体的不同组合的F1评分(图4e),并综合平衡成本和检测准确性,进一步评估了9种适配体中的5种组合(FION)和4种组合(FOON)的性能(图5)。FION中,作者综合评价了FION-α适配体组合(NSE, AFP, VEGF165, HE4, HER2)和FION-β适配体组合(NSE, AFP, VEGF165, HE4, PSA)的性能。FOON则包含了排名前4的适配体,即NSE、AFP、VEGF165和HE4。虽然FOON适配体组合的ROC-AUC性能(99.40%)略低于FION适配体组合(99.60%),但二者的准确性、精密度、敏感性、特异性和F1评分相同。综合经济因素,FOON适配体组是可行、准确且经济的适配体组合。
图5. 适配体组的比较和优化
作者使用排序前四的适配体(NSE、AFP、VEGF165和HE4)对MNP−PCA的形成进行探究(图6)。作者评估了适配体与MNP−PC孵育的两种方式(图6):单适配体MNP−PC(SAM),即4种适配体分别单独与MNP−PC在4个不同管中孵育,洗脱后的适配体进行COPASS检测;四适配体混合MNP−PC(FAMM),即4种相同浓度适配体混合后与MNP−PC孵育,洗脱后适配体混合物四等分,分别进行COMPASS检测。结果显示(图6a),SAM法检测(6个健康对照和6个NSCLC血清样本),虽然在区分NSCLC血清样本与健康对照方面的良好表现(图6b−d),但单个适配体(仅HE4除外)对NSCLC诊断的准确性和效率较低,且对样本数非常敏感。因此,从准确性和效率的角度来看,SAM法并不是一个很好的选择。在FAMM法检测(图6e)中(50个健康对照和60个NSCLC血清样本),如图6f−i,虽然小提琴图显示出显著性差异,但健康对照组和NSCLC组之间的边界模糊。此外,FAMM(n=110)的ROC-AUC为96.28%,低于FOON适配体组(n=112, 99.40%)。FAMM的准确性、F1评分等也低于FOON适配体组。FOON适配体组的多样性可能会减少适配体的非特异性结合,并增加健康对照和NSCLC之间的区别。总的来说,虽然FAMM与FOON适配体组相比成本更低,但FOON适配体组更准确,实验工作量更少。因此,作者最终选用FOON适配体组开发智能NSCLC诊断(SND)试剂盒。
图6. SAM和FAMM评估
作者通过FCNN算法进行了样本的ROC-AUC(n=96)计算。如图7b、c所示,FOON外部检验,ROC-AUC为95.41%,准确率89.58%,与NION相同。作者总结了基于FOON和NION适配体组的COPASS整体性能,证实了COMPASS-FOON在癌症诊断中,尤其是在血液样本癌症筛查方面的巨大潜力。此外,考虑到未来自动化和集成的样本处理、分析和报告等在基于血液样本的大人群癌症筛查中的重要性,作者提议开发一种COPASS试剂盒和一种基于COMPASS的应用程序(app)。该试剂盒命名为智能NSCLC诊断试剂盒(SND试剂盒),试剂盒包括MNP、缓冲液和适配体(MUC1、proGRP、PSA、HE4、AFP、NSE、HER2、VEGF165和CEA)(图7d)。为了便于数据分析和报告,作者进一步开发了一个SND应用程序(https://github.com/asukamayintao/aptamer)。
图7. COMPASS-FOON外部验证和集成高通量分析应用程序初探
参考文献:
[1] Li S, Jin B, Ma Y, Yang X, Fan J, Xie Y, Xu C, Dai X, Wang M, Liu Q, Fu
T, Liu Y, Tan W. Proteome Fishing for CRISPR/Cas12a-Based Orthogonal
Multiplex Aptamer Sensing. J Am Chem Soc. 2024 Jul
24;146(29):19874-19885. doi: 10.1021/jacs.4c03061. Epub 2024 Jul 15.
PMID: 39007743.