NBT| 解锁人类蛋白质相互作用网络,探究疾病突变的全新视界

文摘   2024-10-25 20:53   新加坡  

引言:精准医学的交响曲

      近年来,精准医学的兴起为破解遗传变异与疾病的关联点燃了新的希望,尤其是通过全基因组/全外显子组测序(WGS/WES)在全球范围内掀起的数据浪潮。然而,尽管有了海量的基因数据,传统的统计分析方法仍面临挑战,因为它们需要庞大的样本才能识别出可靠的疾病风险变异或药物靶点。而最关键的功能性解读——即突变如何改变蛋白质相互作用网络,进而导致疾病——仍然是个难题。

    这项由康奈尔大学的余海源教授与凯斯西储大学的程飞雄教授实验室联合完成的研究,发表在Nature Biotechnology上,以新一代深度学习框架PIONEER为核心,为疾病突变的功能性解读提供了一个全面的“互动图谱”。论文题为“A structurally informed human protein–protein interactome reveals proteome-wide perturbations caused by disease mutations”,其中PIONEER系统不仅优于现有方法,还通过实验验证了其预测精确性,为蛋白质-蛋白质相互作用(PPI)网络的全面解读带来突破。

PIONEER系统的诞生:蛋白质相互作用的“解码器”

      PIONEER系统(Protein–protein InteractiOn iNtErfacE pRediction)采用深度学习技术,预测了人类及七种常见模式生物的所有已知蛋白质相互作用界面,形成了结构化的相互作用图谱。该系统整合了共晶体结构和同源模型,生成了包含282,095个跨物种的蛋白质相互作用,覆盖了16,232种人类蛋白质的146,138个实验验证的相互作用。

PIONEER的混合深度学习架构

       为了解决约91%的蛋白质相互作用缺乏可靠结构信息的问题,PIONEER管线针对所有无结构信息的相互作用生成了特定的蛋白质相互作用界面预测。团队构建了多样化的数据集,尤其关注同一蛋白质通过不同界面与多个伙伴相互作用的实例,以提升预测精度,并确保数据集之间无同源相互作用,从而保障模型的鲁棒性与广泛适用性。

单蛋白与伙伴特定特征的融合

   PIONEER结合单蛋白特征与伙伴特定特征,通过生物物理、进化、结构和序列信息来深入描述蛋白质界面。单蛋白特征包含进化保守性和结构属性,而伙伴特定特征则包括氨基酸序列的协同进化、蛋白质对接等。这种结合确保了蛋白质在不同生物功能间的界面差异得以呈现。

四种模型架构最大化信息利用

    PIONEER通过结构-结构、结构-序列、序列-结构和序列-序列模型,分别对应不同的蛋白质结构信息状况,确保每个交互都能利用最完整的信息,避免了偏差导致的过拟合,从而提升了界面预测的精准性。

混合架构中的图卷积与递归神经网络

   对于已有结构的蛋白质,PIONEER使用了图卷积网络(GCN)和双向递归神经网络(RNN)的混合架构,将结构信息与序列信息有效结合;对于无高质量结构的蛋白质,系统则仅依靠RNN来提取序列信息。通过这种独特架构,每个残基的预测都能整合蛋白质本身及其伙伴的信息,实现了精确的界面预测。

多层级结构化互动图谱的构建

     通过PIONEER,研究团队得以从原子分辨率的角度观察疾病相关突变在蛋白质相互作用网络中的影响。这项“多层级”互动图谱揭示了突变如何改变相互作用界面,进一步揭示这些变化在癌症预后和药物响应方面的重要性。团队构建了一个交互式的动态网络数据库(https://pioneer.yulab.org),允许研究人员基于PIONEER框架进行按需界面预测,同时提供了软件包供科学界使用。

解码癌症:oncoPPIs与预后、药物反应的关联

      PIONEER的亮点之一是识别了586个被称为oncoPPIs的显著蛋白质相互作用,这些相互作用中富集了PIONEER预测的界面体细胞突变,且通过对33种癌症类型的11,000个全外显子组的分析,证实了这些突变与患者生存和药物反应存在显著关联。具体来说,这些oncoPPIs不仅影响癌细胞的生长和侵袭能力,还可能影响现有药物的治疗效果。

技术突破:PIONEER优于AlphaFold等现有方法

     近年来,随着AlphaFold等人工智能预测方法的崛起,蛋白质结构的预测取得了突破,但现有方法如AlphaFold-Multimer和FoldDock的预测覆盖率较低,无法有效解决涉及数十万PPIs的互动网络。PIONEER则利用现有的实验数据和同源建模,结合深度学习的精准预测,打破了这一局限,达成了更高的覆盖率和预测精度,使其成为目前最全面的蛋白质相互作用界面预测系统。

展望:精准医学的未来

      PIONEER的创新性不仅在于其预测精度,更在于其对突变功能性影响的解析能力。该系统使得科研人员可以更精确地追踪疾病突变在蛋白质相互作用网络中的扰动,从而为精准医学提供了重要的支持。正如余海源教授所言,PIONEER为基因组学和蛋白质组学领域带来了新工具,将帮助科学家们更高效地开展疾病靶点的研究,并有望加速个体化治疗的发展。

    总而言之,这项研究不仅填补了蛋白质相互作用领域的空白,也为精准医学的未来铺平了道路。

文字写作:kit
责任编辑:er不er
文章编号:263
论文链接:https://www.nature.com/articles/s41587-024-02428-4

胡纯一实验室 Hu lab
新国大胡纯一实验室Hu Lab (2023~)的官方公众账号。实验室宗旨是文体艺术不分家,科研科普两开花。加油加油!欢迎访问www.chunyihulab.org获取更多信息。
 最新文章