每一坨平平无奇的粑粑,里面都是一座浩瀚的城市。这里熙熙攘攘,生命涌动。
数以亿计的微生物居民在这座隐秘的都市工作、生活。它们从城市里获取养分,以蛋白质为载体,记录着宿主的代谢轨迹、疾病线索和免疫波动。城市居民的每一次活动,都是生命深处的细微脉动,最终构成一场精妙的共生交响。
探索这座微观宇宙的复杂性,远比破解人类自身的蛋白质组要艰巨得多,挑战在于其丰富的多样性与结构的层次性。
今天,新的工具正为这片领域注入新生力量——metaExpertPro,一个精确解析粪便微生物蛋白组的计算工作流程,正以惊人的精准与效率,解读这些微生物的低语与呐喊。与传统方法相比,metaExpertPro在肽段和蛋白质群的识别、定量及低丰度检测方面表现更佳,同时运行速度更快,尤其适用于大规模、高通量的宏蛋白组学研究。
metaExpertPro不仅能精准识别数十万条肽段和上万种蛋白质,还能高效处理不同质谱平台的数据,大幅提升蛋白质鉴定的深度与广度。通过精确的分类注释与定量分析,metaExpertPro可揭示微生物与宿主间的复杂互动,助力研究者从粪便这一无创样本中获取更多关于健康与疾病的重要线索。
在人类梦寐以求的无创体检愿景中,粪便这一不曾被赋予浪漫色彩的存在,正层层勾勒更加清晰的人体奥秘。
9月13日,西湖大学医学院、生命科学学院郭天南团队及郑钜圣团队,联合中山大学陈裕明团队,在Molecular & Cellular Proteomics 联合发表了题为 metaExpertPro: A Computational Workflow for Metaproteomics Spectral Library Construction and Data-Independent Acquisition Mass Spectrometry Data Analysis 的文章。
文章介绍了一个名为metaExpertPro的计算工作流程,用于高效分析宏蛋白质组学DIA-MS数据,可提升数据分析的深度和准确性。
- 提纲挈领 -
图文摘要
metaExpertPro工作流程和性能测试
● 所有 DDA-MS 原始数据的 pepXML 和 pin 文件进行合并,使用 PeptideProphet 进行 PSM 验证,确保较低的 FDR。
第二阶段 DIA-NN 用于肽段和蛋白质定量
第三阶段 分类群与功能注释
第四阶段 生成多层次定量矩阵
● 最终生成包括人类肽、微生物肽、人类蛋白、微生物蛋白、COG、KO、COG 类别、KO 类别和分类群在内的九个层次的定量矩阵。
metaExpertPro整合了多个高性能工具,通过严谨的过滤标准提供全面的蛋白质组学分析。
以下为文章详细研究结果:
在62个人类粪便样本的宏蛋白组学分析工作中,metaExpertPro 展现了出色的鉴定深度和高重现性。
人类粪便样本的收集、制备、MS采集和metaExpertPro数据分析
基于DDA-MS的谱图库中,使用timsTOF Pro质谱仪时,metaExpertPro 共鉴定到220,365个肽段和58,952个protein groups;而在Orbitrap Exploris 480质谱仪上,共鉴定到189,808个肽段和51,269个protein groups。metaExpertPro在两台质谱仪上的平均谱图鉴定率分别为32.2%和29.3%,展示了其在不同仪器上的高效鉴定能力。
与MetaLab、MetaProteomeAnalyzer (MPA)、ProteoStorm等基于DDA-MS的数据分析工具相比,metaExpertPro表现出更高的肽段和蛋白质群识别能力。
与基于DIA-MS的分析工具glaDIAtor相比,metaExpertPro 在肽段和蛋白质群定量方面的表现更佳,识别的肽段和蛋白质群数量分别是glaDIAtor的2倍和6倍,且能更好地检测低丰度肽段和蛋白质。
研究人员总结了metaExpertPro与glaDIAtor和MetaLab在蛋白质组鉴定中的基准测试结果。通过对HeLa细胞和微生物群落混合物的数据进行分析,metaExpertPro 展现出较低的真实错误发现率(factual FDR)和更高的蛋白鉴定能力。
即使在扩大样本量和增加未匹配蛋白序列的情况下,metaExpertPro 仍能保持较低的真实FDR(<6%),而其他软件在增加数据库规模时真实FDR明显升高。
通过使用两组人工细菌群落数据,研究人员评估了metaExpertPro在属和物种水平上的分类学准确性。结果表明,在属(genus)水平上,metaExpertPro的准确性较高,尤其是在过滤至少5个肽段的情况下;尽管在物种(species)水平上的准确性相对较低,但该工具仍能够为宏蛋白组学的多样性和生物量评估提供可靠的结果。
在血脂异常(DLP)患者的宏蛋白组分析中,metaExpertPro 揭示了与脂质代谢相关的微生物功能变化,并发现了微生物与宿主蛋白之间的潜在相互作用。
具体来说,DLP患者的肠道微生物在能量生产、脂质代谢等功能上增强,而氨基酸运输和某些细胞功能则减少。
尽管metaExpertPro在提高识别率、减少计算资源消耗方面有显著进展,但宏蛋白质组学分析仍然面临对数据库的高依赖性、低效的肽段鉴定率、较低的分类群鉴定分辨率,以及大量的计算资源需求等问题。此外,控制 FDR 依然是一项挑战,尤其在处理高度相似的谱图时。
研究者指出,未来的研究需要开发更高效的算法以降低错误发现率,并整合宏基因组学数据来提高物种分类的准确性。此外,由于样本量的限制,在高脂血症患者中未能发现多重假设检验下显著的微生物群或宿主蛋白与疾病相关的功能或分类学变化,未来的研究应使用更大规模的样本来验证结果。
西湖欧米是一家专注于AI赋能的微观世界数据公司,致力于多组学精准医学的转化落地,目前专注于基于蛋白质谱技术的疾病生物标记物IVD试剂盒的开发。
联 系 我 们
service@westlakeomics.com
扫描下方二维码
点击阅读原文获取论文原文。