供稿:刘亚君,武汉大学
校稿:曾黎,武汉大学
推送:曾黎,武汉大学
今天给大家分享的文献发表在Advanced Science上,标题为Efficient Metabolic Fingerprinting of Follicular Fluid Encodes Ovarian Reserve and Fertility,通讯作者是上海交通大学生物医学工程学院的钱昆教授、能源与机械工程学院的纪冬梅教授和安徽医科大学的曹云霞教授。
卵巢储备(ovarian reserve,OR)反映了生育能力,这在女性保健中至关重要。OR的精确编码在确定适当的治疗方法方面至关重要,目前临床上的分析方法依赖于包括生化分析和超声成像在内的多种试验的组合。这些方法是基于选定的蛋白质生物标志物或物理测量,不能作为多功能平台,从特定的生物液体获取信息。因此,在编码OR和生育力方面,提供全面代谢信息的单一测试将是理想的,以参与针对妇女保健的各种临床应用。
在选择生物标志物时,不同于核酸和蛋白质,代谢物作为途径的终产物,允许真实的表征生物学和病理学过程。OR和生育力的大多数生物标志物是激素,其通过依赖于垂体或卵巢卵泡的反馈提供间接评价。与之相比,卵泡分泌的卵泡液(follicular fluid,FF)与OR、卵母细胞发育能力和胚胎存活率的变化直接相关。因此,考虑到代谢途径末端代谢物的功能,新的FF代谢生物标志物组合有望编码OR和生育力。迄今为止,使用代谢生物标志物对FF进行的可用分析对于编码OR和生育力仍是初步的,仅涉及小队列和单一功能。因此,需要在明确的队列中构建具有多功能的新代谢生物标志物组合,以提高诊断准确性和预测性能,作为下一代工具。
使用色谱法的常规MS技术需要对样品进行预处理和富集,以克服生物流体的高复杂性和低丰度代谢物,这阻碍了其广泛应用。激光解吸/电离(LDI)MS通过在微阵列芯片上使用限定的基质材料来选择性地捕获代谢物,使得能够以最少的样品预处理和高灵敏度有效地分析生物流体。迄今为止,基于用于代谢指纹的LDI MS的方案已被用于检测广泛的生物流体。尽管如此,尚未开发使用LDI MS进行FF代谢指纹图谱(metabolic fingerprinting of FF,MFFF)分析的方案。因此,在本文中,研究者使用粒子辅助激光解吸/电离质谱(PALDIMS)对卵泡进行MFFF分析,以编码OR和生育力。
研究者开发了PALDI-MS方法,通过利用特定的颗粒,快速,灵敏,可重复地记录MFFF(图1)。
图1 PALDI-MS的表征
关于研究人群的样本量,经过一系列筛选,最终有对照组(即卵巢储备正常组,nOR)203例,病例组(即卵巢储备功能减退组,dOR)141例可用于数据分析(图2a)。并且基于PALDI-MS构建了FF代谢数据库,用于编码OR和生育力(图2b)。通过比较主成分分析(PCA)和t分布随机近邻嵌入(t-SNE),OR样本的MFFF显示dOR和nOR样本之间的粗略分离(图2e),这意味着需要引入高级机器学习算法来区分dOR和nOR。
图2 使用MFFF表征OR和生育力
作为初步研究,作者进行了功效分析(5/5,dOR/nOR),以确定允许执行机器学习的最小样本量。共入组了275例受试者(111/164,dOR/nOR),并将其随机分配至发现队列进行10倍交叉验证(图3a),发现队列中的年龄匹配,dOR组和nOR组之间无显著差异。用剩余的69例受试者(30/39,dOR/nOR)构建独立验证队列。随后,使用四种算法(岭回归[RR],神经网络[NN],支持向量机[SVM]和随机森林[RF])进行dOR诊断的模型构建。根据AUC、准确度(Acc)、灵敏度(Sen)、精密度(Pre)和F1评分(F1,Sen和Pre的调和平均值)(图3b)进行模型性能分析。所有四种算法均达到AUC ≥ 0.79,表明MFFF对dOR的诊断潜力。重要的是,RR的AUC为0.905,95%置信区间(CI)为0.870-0.940,显著优于其他算法。
图3 通过MFFF的机器学习编码OR和生育力
结果在独立验证队列中一致重复,AUC为0.929(图3c),还进行了置换检验,得到p < 0.0002,证明了RR模型在dOR诊断中的有效性,而没有过度拟合。此外,生成了样本水平图,以描述区分dOR样本和nOR样本的预测概率(图3d)。发现队列(AUC为0.905)和独立验证队列(AUC为0.929)中RR算法的上述结果证明了使用MFFF进行dOR诊断的机器学习的诊断能力。
为了进一步研究MFFF对生育能力的预测能力,根据生育信息将接受IVF的dOR受试者分为HQO组和HQE组。排除无卵母细胞信息的受试者后,共有139例受试者(123/16,HQO组/无卵母细胞组,80/43,HQE组/无胚胎组)(图3e)。散点图分析显示,HQO组和无卵母细胞组之间的平均概率存在统计学显著差异(p < 0.05,图3f)。同时,FSH水平显示出统计学显著差异,而AFC水平显示无显著差异。此外,对于HQE的预测,HQE组表现出比没有胚胎的组更低的概率(图3g),证明了MFFF对胚胎质量的预测能力。相比之下,FSH和AFC均显示HQE组和无胚胎组之间无显著差异。因此,本文构建了一个强大的多功能平台,用于使用MFFF的机器学习进行dOR诊断和生育力预测,从而为临床应用提供了编码OR和生育力的有效工具。
通过特征选择开发了一个代谢生物标志物小组,并识别了相关的代谢途径,用于编码OR和生育能力的临床应用。具体而言,通过在发现队列中设置RR等级评分的各种阈值来优化RR模型的AUC(图4a)。从具有优化的AUC的MFFF中选择了121个m/z特征,从中选择7个m/z特征作为有希望的候选者,用于使用平均强度(mean intensity,MNI)> 3000和p < 0.05的标准进行生物标志物鉴定。所选7个m/z特征的无监督聚类分析显示dOR和nOR之间存在明显的强度水平(图4b),证明了这些特征用于dOR诊断的能力。
图4 生物标志物组合构建及相关通路分析
接着研究者还进行了与构建的生物标志物组相关的代谢途径分析。筛选了与OR和生育力相关的四种途径,途径影响丙酮酸代谢、淀粉和蔗糖代谢、糖酵解/糖异生和柠檬酸循环(图4g)。随后,从所选m/z特征中鉴定乳酸(LA)、琥珀酸(SA)、葡糖酸(PA)、Glc和果糖6-磷酸/葡萄糖6-磷酸(F6 P/G6 P)作为生物标志物组。与nOR组相比,dOR组中LA、Glc和F6 P/G6 P过表达,而SA和PA下调表达(图4c)。构建的生物标志物组显示出良好的诊断性能(图4d),为了进一步评估用于预测生育力的生物标志物组,计算了由生物标志物组训练的机器学习模型用于区分HQO和HQE的概率。发现HQO组和无卵母细胞组之间的概率存在显著差异(图4e)。HQE和无胚胎组的概率也表现出显著差异(图4f)。因此,研究者验证了构建的生物标志物组作为编码OR(AUC为0.849)和生育力(p < 0.05,用于确定HQO和HQE)的指标。
综上所述,研究者通过PALDI-MS实现了具有快速、高灵敏度和理想的再现性的高效MFFF。此外,应用MFFF的机器学习来诊断dOR,AUC为0.929,并通过单一PALDI-MS测试识别高质量卵母细胞/胚胎。随后,构建了一个生物标志物组,其显示dOR诊断和高质量卵母细胞/胚胎的有效测定的AUC为0.849。本文工作将为妇女的医疗保健提供一个强大的检测工具,包括但不限于OR和生育力。
文章编号:469
原文链接:
https://doi.org/10.1002/advs.202302023
原文引用:
Jiao Wu, Chunmei Liang, Xin Wang, Yida Huang, Wanshan Liu, Ruimin Wang, Jing Cao, Xun Su, Tao Yin, Xiaolei Wang, Zhikang Zhang, Lingchao Shen, Danyang Li, Weiwei Zou, Ji Wu, Lihua Qiu, Wen Di, Yunxia Cao*, Dongmei Ji*, and Kun Qian*. Efficient Metabolic Fingerprinting of Follicular Fluid Encodes Ovarian Reserve and Fertility.Adv. Sci., 2023, 10, 2302023.