今天为大家介绍的是来自中南大学湘雅药学院曹东升教授团队和香港浸会大学吕爱平教授团队近期在Chemical Science发表的利用贝叶斯框架融合多种高水平生物表征预测新颖靶标的文章《Predicting novel targets with Bayesian machine learning by integrating multiple biological signatures》。
导读
候选分子的靶标识别是药物开发过程中至关重要的一步,涉及先导化合物的发现、药物的再利用以及潜在的脱靶效应或药物副作用的解释。因此,提高靶点预测的精度具有重要意义。然而,目前的靶点预测方法主要依赖于基于配体的化学相似性原理(或仅仅整合几种常见的表型数据),无法捕捉更多基于配体高水平特征相似性的新化合物-靶点关系。此外,目前的靶点预测机器学习方法具有较高的不可解释性。
针对这一挑战,作者提出了融合多种生物表征策略(FMBS),引入了可轻松添加新表型数据且具有较高可解释性的贝叶斯框架整合了跨越药物开发的全过程信息:从小分子(A,化学)与其相关蛋白受体(B,靶点)之间的相互作用,到被激活的生物通路(C,网络)和由此产生的可观察到的表型变化(D,细胞),最终延伸到临床层面(E,临床)的25 种可预测的高水平生物表征。捕捉到了传统化学描述符未能识别的新靶点,从而通过骨架跃迁提高了靶点预测的准确性。作者系统比较了它与常见靶点预测方法的准确度最后通过具体案例分析了其应用潜力。结果表明,该方法能有效地确定有前景的候选靶点,从而加快药物机制探索。
方法与结果
作者首先收集到688个靶点,1150个化合物并评估了25个高水平表征之间的相关性,结果显示表征之间的相关性均较低,进而作者基于25种表征对1150个药物组成的660675个药物对计算相似性,然后将共享药物对和非共享药物对的比例作为先验知识利用贝叶斯框架整合计算得到似然值。之后将似然值作为靶点投票策略的权重。
为验证方法的准确性,作者首先进行了留一法和外部验证,并且与常见靶点预测方法进行了比较(Table 1)证明了该方法具有较好的准确性。进而文章又通过具体案例分析证明了该方法在药物重定向领域等的应用潜力。
结论
总之,该研究介绍了一种新颖的靶标预测方法。与传统的通用描述符(如化学描述符由于难以捕捉骨架变化,往往会形成靶标预测的盲点)相比,FMBS全面整合了25种高水平生物表征,识别了更多新颖的化合物与靶标的关系。此外,常用的生物表征只能用于极小的化学空间,导致基于表型的靶点预测模型适应性较弱,而该方法所采用的特征描述是可预测的,因此可以预测任何给定分子的靶标。同时作者也提出了该研究的局限性:即使该方法理论上可适用于所有分子,但准确性可能会因预测表征的可靠性等因素而有所不同。最后,作者指出由于不同的表征对任务的贡献不同,未来研究人员可根据专家经验选择强相关的表征以节省计算资源。
投稿人:魏 筱
责任编辑:许燕红