DRUGAI
今天给大家介绍的是来自中国科学院上海营养与健康研究所的李虹团队在国际生物信息学期刊《Bioinformatics》上的工作,题目为“Dual-view jointly learning improves personalized drug synergy prediction”。文章提出JointSyn算法,采用联合表征获取药物组合的全局图信息,并通过双视图捕获协同作用相关特征。评估结果表明,JointSyn在多项基准上的预测准确性和稳健性优于现有方法,证明了其在药物协同预测中的实用性。微调后的JointSyn,在少量实验数据条件下提高了预测新药物组合和癌症样本的泛化能力,为个性化组合疗法的开发提供了有力支持。
研究背景
组合药物疗法广泛用于癌症治疗,相比单一疗法,组合药物能提高疗效、减少副作用并降低耐药性。然而,由于癌症的异质性,不同患者对相同组合的反应可能大相径庭,个性化选择药物组合成为一大挑战。随着高通量药物筛选和多种药物组合数据的积累,计算模型逐渐用于预测药物协同效应。然而,现有方法往往独立建模每种药物,未能充分利用药物间的关联信息。多药物联合表征表示学习已被证明可有效预测药物间相互作用。基于此,文章提出JointSyn算法,利用双视图联合学习根据药物和细胞特征来预测药物组合的协同作用。
研究方法
JointSyn的核心在于通过联合表征获取药物组合的全局图信息,并构建两个视图来捕获协同作用相关特征(图1B):
视图1(drugCombination-cell):将两种药物的分子图连接成药物组合图,并通过GAT(图注意网络)获取联合表征,再与细胞系的基因表达谱结合,以提取药物组合的全局图信息。
视图2(drug1-cell & drug2-cell):通过MLP整合单药的分子指纹与细胞系基因表达谱,得到每种药物在细胞系中的嵌入,并组合两种药物的嵌入表示。
图1. JointSyn概述
JointSyn最后通过MLP对双视图的嵌入进行融合,预测连续的协同分数或分类协同效果。仅使用视图1或视图2的模型分别称为JointSyn-Graph和JointSyn-Fingerprint。
研究结果
JointSyn 改进了药物协同预测性能
在O'Neil数据集的回归和分类任务上,JointSyn在所有评估指标中均优于现有深度学习和机器学习方法。在NCI-ALMANAC数据集上的测试也展示了类似的性能提升(图2A、B)。
图2. 使用 O’Neil 基准数据集评估 JointSyn 性能
JointSyn的双视图捕获不同方面并获得更好的性能
tSNE可视化表明,双视图模型比单视图更好地区分协同与拮抗三元组,验证了JointSyn的双视图学习对药物协同预测的有效性(图3A、B、C)。
图3. 评估JointSyn的双视图
微调的JointSyn改进对未见数据的药物协同预测
通过PairOut、CellOut和DrugOut等分层分割场景评估,与随机分割相比,分层数据显著降低了所有模型的性能,但JointSyn依然在绝大多数指标上保持最佳表现(图4A)。对于新的细胞系,当添加21%药物组合数据时,其余组合的协同作用可高效预测(图4C)。
图4. 模型在未见数据中性能表现
微调的JointSyn提高了独立数据集的药物协同预测
NCI-ALMANAC 和 O’Neil数据集仅共享 14 种药物、9 种细胞系和 221 个三元组(药物 1-药物 2-细胞系)(图 5A)。对于重叠的三元组,两个数据集中的协同分数相关性仅为0.32(图5B)。NCI-ALMANAC与O'Neil数据集的直接跨数据集预测困难,但通过微调,JointSyn在新数据集上的预测性能显著提升。对于给定的药物列表,当 O'Neil 数据集每个细胞系的 28%药物组合添加到微调的 JointSyn 中时,可以很好地预测剩余三元组的协同得分(图 5D)。
图5. 跨数据集预测的难点和模型性能
JointSyn生成了泛癌的协同药物组合估计图谱
基于CCLE的996个细胞系和703种药物组合,JointSyn生成了泛癌协同药物组合的预测图谱(图 6A),并通过层次聚类分析从预测的药物协同矩阵中将肿瘤分为 4 个簇(C1~C4),将药物组合分为 5 个簇(D1~D5)。发现了不同肿瘤类型间的协同作用模式,如血液肿瘤与实体瘤之间的显著差异。
CCLE数据集中肺癌细胞系数量最多。文章以肺癌为例来说明癌症样本之间的异质性,选择了108个协同比例大于5%的药物组合在188 种肺癌细胞系中协同评分作为肺癌的协同药物组合估计图谱(图6B)。根据这些选定药物组合的协同评分,将样本分为三个簇(Lung_C1~Lung_C3)。肺癌的两种主要类型非小细胞肺癌(NSCLC)和小细胞肺癌(SCLC)在协同评分的分布上表现出明显的差异。Lung_C1主要由SCLC组成,几乎没有协同药物组合。Lung_C3主要由NSCLC组成,多种药物组合具有协同作用。这与之前的许多研究一致,即SCLC具有高度耐药性且预后较差。一些药物组合对特定的NSCLC细胞系具有协同作用,因此文章进一步探讨药物协同作用的差异是否与某些体细胞突变有关。EGFR是 NSCLC中频繁突变的驱动基因,根据JointSyn的预测,其抑制剂erlotinib与其他一些药物的组合具有协同作用,并且与EGFR突变相关(图6C)。
图6. 泛癌的协同药物组合估计图谱
总结
文章提出了新颖的深度学习模型JointSyn,通过双视图联合学习高效预测药物协同作用。在O'Neil和NCI-ALMANAC等基准数据集上的实验结果表明,JointSyn的性能优于现有方法。双视图嵌入成功捕获了与协同作用相关的低维特征。此外,JointSyn的微调能力提升了其在未见数据和独立数据集上的预测效果。最后,使用JointSyn生成了泛癌的协同药物组合估计图谱,并探讨了不同肿瘤间的差异模式,为个性化药物组合疗法的开发提供了有力支持。
参考资料
Xueliang Li, Bihan Shen, Fangyoumin Feng, Kunshi Li, Zhixuan Tang, Liangxiao Ma, Hong Li, Dual-view jointly learning improves personalized drug synergy prediction, Bioinformatics, 2024;, btae604, https://doi.org/10.1093/bioinformatics/btae604