北京时间2024年10月25日17时,美国杜克大学Jason Locasale团队(杜克大学的刘时昱博士为第一作者,北卡罗来纳州立大学的刘晓静博士为第二作者),在《自然—代谢》期刊上发表了一篇题为“Quantitation of metabolic activity from isotope tracing data using automated methodology”的通讯文章,介绍了他们开发的全新代谢流分析自动化流程。
该研究不仅提出了一款更高效、应用场景更广泛的MFA软件,还首次将机器学习中常用的基于模拟数据的基准测试引入代谢流分析。研究揭示了现有MFA流程在分析复杂代谢网络时,存在精度和稳健性不足的问题,并针对此设计了一套改进流程,大幅提升了MFA方法的可靠性和适用性,从而为解决各类代谢相关的科研问题提供了有力支持。
细胞中的多种生命活动依赖于新陈代谢中紧密关联的生化反应,而对这些反应的精确测量能够显著加深我们对细胞功能的理解,并为众多疾病的治疗和药物开发提供宝贵的支持。随着质谱和核磁共振技术的迅速发展,基于稳定同位素标记实验的代谢流分析(Metabolic Flux Analysis, MFA)因其高效、精确且不干扰正常生化过程的优势,正引起越来越多的关注。典型的MFA方法类似于机器学习的训练步骤,利用同位素标记数据来优化代谢网络中的流量分布,寻求最符合实验数据的最优解。然而,现有的MFA方法普遍缺乏机器学习研究中常见的系统性评估和基准测试,特别是在算法收敛性、精度以及结果稳健性方面的挑战尚未得到充分解决,限制了该方法在代谢研究中的广泛应用。
目前的MFA软件在处理大规模、复杂网络时效率不高,尤其是线粒体与细胞质之间的物质转运流,在众多研究中被反复提及,却缺乏专门的代谢流模型。本研究开发的新软件不仅运行速度比现有工具更快,还能处理更复杂的代谢网络,特别是包含线粒体代谢的网络,这为研究复杂代谢途径奠定了坚实的基础。
现有的MFA流程缺乏统一的基准测试体系。研究团队采用机器学习中的模拟数据策略,通过人为设定的代谢流量生成准确的同位素标记数据,再根据这些模拟数据计算出MFA流程的结果,并与已知流量进行对比,以评估结果的准确度。基准测试发现,在代谢网络较大且同位素标记数据覆盖率不高的情况下,现有MFA流程可能会产生虽然损失函数较低但结果精度和稳健性较差的情况,表明复杂情况下损失函数无法充分反映真实代谢流量的差异。
为解决这一问题,研究团队对MFA方法进行了深入研究。研究团队从理论上证明,在放宽一定条件下,几乎总是能够通过梯度下降法找到符合同位素标记数据的全局最优解。而导致最终精度偏低的主要原因在于梯度过低,导致算法提前停止,表现为大多数解的损失值较低但精度不高。对此,研究团队提出了一种选取若干损失较小的解并将其平均作为最终解的新方法。基准测试结果表明,该新方法显著提升了结果的精度和稳健性。
图 1. 新代谢流分析方法的建立与验证
利用这一改进流程,研究团队发现了线粒体与细胞质之间部分反向转运流在癌细胞中显著升高,暗示其在癌细胞生成和分化中可能具有的重要作用,为未来的深入研究提供了基础。值得注意的是,在使用传统流程分析时,这些流在不同组织中的差异性显著降低,甚至接近无显著差异。这进一步证明了这一新方法的必要性,及其在揭示代谢细微变化中的重要作用。
相关论文信息:
https://www.nature.com/articles/s42255-024-01144-2
编辑 | 余 荷
欲知更多内容,敬请围观小柯机器人频道: