大家好,本周分享一篇2023年1月发表在Briefings in Bioinformatics(IF:9.5)的文章,题目为“Lipid network and moiety analysis for revealing enzymatic dysregulation and mechanistic alterations from lipidomics data”。该研究的通讯作者为Josch Konstantin Pauling教授,慕尼黑工业大学生命科学学院实验生物信息学系主任。
脂质在生物体细胞中起着重要作用。它们不仅对能量的长期储存至关重要,而且还可以影响膜蛋白的活性,以及信号传导和炎症过程。因此,表征脂质组的变化并了解它们的调控可以在分子水平上充分了解疾病。为了更深入地了解疾病机制,有必要提出脂质变化的功能解释以及与其他组学的联系。由于获得的脂质组学数据以及脂质代谢背后的调节机制的复杂性,专用的计算工具对于揭示这些关联非常重要。这种相互作用可以通过生物网络进行研究。在代谢水平上,这些网络描述了由酶催化的代谢物之间的反应。代谢网络通常使用动态建模或基于约束的建模进行研究。分析生物网络的另一种方法是通过网络富集。对于脂质网络,BioPAN软件可生成脂质网络并识别活性反应链。然而,它仅在脂质和物质水平上起作用,并且仅识别线性反应链。作者之前开发了脂质网络探测器(LINEX),结合了脂质类别和脂肪酸代谢,为计算分析和脂质组学数据解释提供了全面的网络。然而,一个限制是,超出默认值的脂质类别反应必须由用户输入,这需要有关脂质代谢的知识储备。与从头网络富集相比,通路富集可识别显著改变的代谢通路。到目前为止,还没有可用的方法,将脂质酶的多特异性置于解释脂质组学变化的中心。在这里,作者提出LINEX2,一个重新设计和扩展的框架,它解决了基于脂质网络方法的缺点。脂质反应基于数据库信息,这提供了与其他组学的关联。此外,作者开发了一种脂质网络富集算法,该算法结合了多特异性酶链接。该方法能够从脂质组学数据中生成机理假设。作者成功地将该方法应用于基因敲除研究的脂质组学数据,并揭示了肥胖人群脂肪组织中脂质代谢的潜在失调机制。这有助于更好地将脂质组学转化为临床应用,并提高我们对脂质代谢在疾病机制中作用的理解。
脂质组学实验的工作流程可分为五个步骤:取样、样品制备、数据采集、数据处理和数据解释。LINEX2的目标是对脂质组学数据进行生物学解释。LINEX2构建数据特异性脂质代谢网络。为了获得这些网络,作者开发了一种网络扩展算法(图1,紫色框),其中脂质类水平的代谢反应和脂肪酸反应扩展到脂质分子水平。脂质组学数据用作LINEX2的输入。该网络还用作脂质亚结构、组成和脂质链分析的基础。考虑酶多特异性的脂质网络富集算法可用于生成酶失调的假设。
Fig. 1 | Lipidomics data are used as an input to LINEX2
为了全面概述脂质代谢,作者从Rhea和Reactome数据库中整理了脂质反应(图2A)。产生了来自两个数据库的3000多个注释反应(图2A)。反应中反应最多的前三种生物是智人(HSA)、挪威鼠(RNO)和小白鼠(MMU)(图2B)。经过数据库处理,LPC是参与大多数反应的脂质类别,其次是DG(图2C)。为了使免费提供的LINEX2软件保持更新状态,用户可以在线对新的脂质类别和脂质代谢反应做出补充。通过这种方式,LINEX2可以进行更新,以增强对脂质组中研究较少的部分反应的解释。
Fig. 2 | Number of lipid-reactions parsed from Reactome and Rhea databases
在脂质代谢网络中,另一个挑战来自相关酶的多特异性。在LINEX2网络中,两种脂质物种之间的每条连接都对应于一个酶促反应,因此一个酶可以对应于多个连接。该方法旨在明确考虑酶的多特异性。因此,需要一个超级网络,不仅在脂质之间建立连接,而且在反应之间建立连接。图3A显示了富集分析的工作流程。作为富集的原理证明,作者选择了Thangapandi等人的数据进行验证。在这项研究中,作者比较了非酒精性脂肪性肝病(NAFLD)条件下肝特异性缺乏MBOAT7(KO)小鼠与野生型(WT)小鼠的肝脏脂质组学。MBOAT7催化脂肪酰基-CoA + LPI→PI + CoA的脂类反应,对花生四烯酸(20:4,AA)具有特异性偏好。图3B显示了算法优化过程中的分数进展。得分为25的临时平台期表明需要全局近似方法,例如模拟退火。在图3C中,显示了最佳子网,它仅由PI、LPI和一类反应组成。当研究每个基因型的LPI→PI反应的分布时(图3D),没有观察到一个方向的强烈分布偏移。然而,在这两种情况下,都可以观察到1和-1周围的另外两个峰值,其中KO的峰值略微偏向更高的绝对值。图3E中表示完整脂质组学数据的主成分分析(PCA)。图3F显示了仅基于富集子网中存在的脂质分子数据的PCA图。在所有脂质数据的PCA中,PC2解释了总方差的23%。然而,图3F中基因型差异几乎解释了86%的大部分差异。这意味着子网中的脂质(图3C)几乎完全代表了MBOAT7敲除的影响。Fig. 3 | Description of network enrichment workflow
作者为了进一步验证LINEX2对脂质相关疾病脂质代谢变化的解释,选择了AdipoAtlas数据,这是一组瘦和肥胖人群脂肪组织的可参考脂质组数据。作者使用了网络富集算法,得出了如图4A所示的子网。该子网包含三个反应,它们都代表溶血磷脂之间的酰基转移酶反应。研究这三类反应在所有可能的物种反应中的反应比率显示肥胖和瘦体重之间的分布相等(图4C)。然而,考虑到子网中存在的物质反应,揭示了各组之间在反应比率方面的差异(图4D)。这些反应由磷脂酶A2组IVC(PLA2G4C)和天冬酰胺酶(ASPG)催化,它们都具有脂肪酶和酰基转移酶活性。子网中酰基转移酶反应的普遍性表明FA在具有磷酸胆碱和磷酸乙醇胺头基的脂质(PC,PE)及其各自的溶血磷脂(LPC,LPE)之间转移。LPC/LPE与PC/PE的比值会影响膜曲率。这一特性很重要,因为肥胖时脂肪细胞会扩增。该比率的变化也与膜完整性和流动性的改变有关。作者通过Lipid Ontology(LION)富集分析证实了这一点,其中作者使用富集子网的脂质作为目标列表(图4B)。分析得出了膜曲率和其他与膜相关的结果。Fig. 4 | LINEX2 application on the AdipoAtlas data
尽管甘油磷脂成分的变化是脂肪细胞扩增的指征,但中性脂质的合成和积累是肥胖的主要标志。这也反映在AdipoAtlas脂质组的网络表示中(图5)。它显示出肥胖样本的TG和DG水平升高,甘油磷脂总体水平降低。含有多不饱和FA的中性脂质具有特别高的差异倍数变化。
Fig. 5 | Lipidomics data from the AdipoAtlas visualized with LINEX2
在这项工作中,作者提出了一种生成和分析脂质代谢网络的方法。使用来自常见代谢数据库的脂质类反应,计算了数据特异性脂质网络。此外,开发了一种网络富集算法,从脂质组学数据中提出酶失调的假设。LINEX2能够将酶活性与脂质组学数据联系起来,为脂质组学与蛋白质组学数据的知识驱动整合奠定了基础。脂质组学研究人员无需成为生物信息学专家,即可对脂质组学数据进行复杂的分析。此外,LINEX2网络可以成为进一步方法学发展的基础,通过从脂质数据推断代谢调控,有助于提高脂质组学实验的生物学可解释性。编辑:王杰
责任编辑:王丹
文章引用:https://doi.org/10.1093/bib/bbac572
文章信息:Tim D Rose, Nikolai Köhler, Lisa Falk, Lucie Klischat, Olga E Lazareva, Josch K Pauling, Lipid network and moiety analysis for revealing enzymatic dysregulation and mechanistic alterations from lipidomics data, Briefings in Bioinformatics, Volume 24, Issue 1, January 2023.
中国农业科学院油料作物研究所油料品质化学与营养创新团队脂质分析实验室致力于突破脂质组分析所面临的生物基质复杂、脂质及其代谢产物种类繁多且结构复杂、定性和定量分析困难等共性关键技术瓶颈,建立高效,高通量的脂质组分析平台,并将该平台广泛应用于:(1)不同生物种质资源中脂质组成;(2)应用于食品安全与质量控制;(3)脂质的生物功能与营养学评价;(4)开发新的功能脂质。