引言:精准医学的交响曲
近年来,精准医学的兴起为破解遗传变异与疾病的关联点燃了新的希望,尤其是通过全基因组/全外显子组测序(WGS/WES)在全球范围内掀起的数据浪潮。然而,尽管有了海量的基因数据,传统的统计分析方法仍面临挑战,因为它们需要庞大的样本才能识别出可靠的疾病风险变异或药物靶点。而最关键的功能性解读——即突变如何改变蛋白质相互作用网络,进而导致疾病——仍然是个难题。
这项由康奈尔大学的余海源教授与凯斯西储大学的程飞雄教授实验室联合完成的研究,发表在Nature Biotechnology上,以新一代深度学习框架PIONEER为核心,为疾病突变的功能性解读提供了一个全面的“互动图谱”。论文题为“A structurally informed human protein–protein interactome reveals proteome-wide perturbations caused by disease mutations”,其中PIONEER系统不仅优于现有方法,还通过实验验证了其预测精确性,为蛋白质-蛋白质相互作用(PPI)网络的全面解读带来突破。
PIONEER系统的诞生:蛋白质相互作用的“解码器”
PIONEER系统(Protein–protein InteractiOn iNtErfacE pRediction)采用深度学习技术,预测了人类及七种常见模式生物的所有已知蛋白质相互作用界面,形成了结构化的相互作用图谱。该系统整合了共晶体结构和同源模型,生成了包含282,095个跨物种的蛋白质相互作用,覆盖了16,232种人类蛋白质的146,138个实验验证的相互作用。
PIONEER的混合深度学习架构
单蛋白与伙伴特定特征的融合
四种模型架构最大化信息利用
混合架构中的图卷积与递归神经网络
多层级结构化互动图谱的构建
通过PIONEER,研究团队得以从原子分辨率的角度观察疾病相关突变在蛋白质相互作用网络中的影响。这项“多层级”互动图谱揭示了突变如何改变相互作用界面,进一步揭示这些变化在癌症预后和药物响应方面的重要性。团队构建了一个交互式的动态网络数据库(https://pioneer.yulab.org),允许研究人员基于PIONEER框架进行按需界面预测,同时提供了软件包供科学界使用。
解码癌症:oncoPPIs与预后、药物反应的关联
PIONEER的亮点之一是识别了586个被称为oncoPPIs的显著蛋白质相互作用,这些相互作用中富集了PIONEER预测的界面体细胞突变,且通过对33种癌症类型的11,000个全外显子组的分析,证实了这些突变与患者生存和药物反应存在显著关联。具体来说,这些oncoPPIs不仅影响癌细胞的生长和侵袭能力,还可能影响现有药物的治疗效果。
技术突破:PIONEER优于AlphaFold等现有方法
近年来,随着AlphaFold等人工智能预测方法的崛起,蛋白质结构的预测取得了突破,但现有方法如AlphaFold-Multimer和FoldDock的预测覆盖率较低,无法有效解决涉及数十万PPIs的互动网络。PIONEER则利用现有的实验数据和同源建模,结合深度学习的精准预测,打破了这一局限,达成了更高的覆盖率和预测精度,使其成为目前最全面的蛋白质相互作用界面预测系统。
展望:精准医学的未来
PIONEER的创新性不仅在于其预测精度,更在于其对突变功能性影响的解析能力。该系统使得科研人员可以更精确地追踪疾病突变在蛋白质相互作用网络中的扰动,从而为精准医学提供了重要的支持。正如余海源教授所言,PIONEER为基因组学和蛋白质组学领域带来了新工具,将帮助科学家们更高效地开展疾病靶点的研究,并有望加速个体化治疗的发展。
总而言之,这项研究不仅填补了蛋白质相互作用领域的空白,也为精准医学的未来铺平了道路。