在药物发现领域,发现满足多种标准(例如靶蛋白结合亲合力、药代动力学和膜渗透性等)的化合物是一项极具挑战性的任务,原因在于化学空间的庞大和复杂性。以往多使用不同奖励函数的线性组合来解决多目标优化问题。然而,线性组合方法通过将多目标优化转化为单目标任务进行求解,这种方法存在两个问题:1)目标权重设定问题:每个目标的权重设置会影响最终结果,不同目标的尺度和权重的平衡难以合理确定。2)目标冲突问题:由于不同目标之间可能存在冲突,简单的线性组合难以有效处理多目标之间的权衡。针对这些问题,东京工业大学Masakazu Sekijima研究小组开发了一种基于深度学习技术的可扩展多目标分子生成模型Mothra,该模型集成了循环神经网络(RNN)和基于 Pareto 优化的多目标蒙特卡洛树搜索,以生成可以满足多个重要评价函数的化合物。该项工作近期发表在计算化学领域著名期刊Journal of Chemical Information and Modeling上[1]。RNN模块是Mothra分子生成系统的核心组成部分,通过两层256维的门控循环单元(GRU)和嵌入层结构,学习SMILES表示的语法规则和分子化学特性。RNN模块基于从ZINC数据库中随机挑选的约25万个配体分子进行监督学习,生成化学上合理且多样化的分子。在Mothra工作流程中,RNN作为默认策略与多目标蒙特卡洛树搜索协作,补全分子结构,探索化学空间,生成满足多目标优化需求的分子,为药物设计提供了强大的生成能力。Pareto前沿是多目标优化中的一个重要概念,用于描述多个目标之间的权衡关系。在优化过程中,不同目标往往存在冲突,即在优化一个目标的同时可能会损害其他目标的性能。Pareto前沿定义了一组无法在某个目标上进一步优化且不损害其他目标的解。在多目标优化中可以计算并利用超体积来评估Pareto前沿的质量(图-1)。将超体积中每个点投影到 Pareto 前沿上,投影距离反映了点在性能上的不足,对与Pareto前沿距离较远的点施加惩罚,从而降低这些点在优化中的优先级。通过这种机制,Mothra 优化算法能够优先选择与 Pareto 前沿更接近的点进行进一步扩展。
图-1 二维奖励空间中的超体积。Z为参考点,通常是一个比当前所有目标值更差的点,用于定义目标空间的边界;黑色十字点为贡献扩展超体积的Pareto前沿点;红色十字点为虽然属于Pareto前沿,但不贡献超体积扩展的点;参考点Z与Pareto 前沿点之间的紫色区域为超体积。
Mothra的工作流程如图-2所示,主要涵盖了四个步骤:1)选择:Mothra 的搜索树从仅包含根节点的初始状态开始,根节点对应 SMILES 字符串的起始标记,代表分子生成的初始状态。搜索树的每个节点对应一个 SMILES 字符如化学元素或结构。通过树策略结合 Pareto 前沿的计算,从根节点选择一个叶节点作为当前扩展的目标。从根节点到叶节点的路径形成当前分子 SMILES 表示的一部分。2)扩展:在选中的叶节点上添加一个子节点,相当于向当前 SMILES 字符串末尾增加一个字符。逐步生成更长的 SMILES 字符串,推进分子构建。3)模拟:使用预训练的 RNN 模型补全 SMILES 字符串以生成完整的分子并检查生成的 SMILES 是否表示有效分子。根据目标函数如结合能、毒性等计算多维奖励向量,将奖励向量与当前 Pareto 前沿比较,判断是否为Pareto最优解。4)反向传播:将奖励向量沿着搜索路径反馈到搜索树的父节点,利用反馈信息更新树结构,指导后续的节点选择和分子生成。
图-2 Mothra工作流程。
Mothra设置了对接评分、药物相似性(QED)和毒性概率三个目标函数来评估生成分子的性能,此外可合成性(SAscore)被用作生成分子的过滤标准。由于 Mothra 在运行过程中会生成大量分子,并需要对每个生成分子进行分子对接,为节省计算资源和时间,提高整体运行效率,使用AutoDock Vina进行对接并将穷尽度搜索“Exhaustiveness”设为1,以快速得到分子与蛋白结合的大致结果;使用机器学习模型eToxPred预测毒性概率。为验证Mothra多目标分子生成的性能,作者以DDR1激酶(PDB ID: 3ZOS)为靶点进行了测试。结果表明(图-3),生成分子在三个目标函数上的分布均呈现单峰分布且两侧有较宽的基底,说明Mothra 能够进行广泛的化学空间搜索,生成大量具有多样性和性能平衡的分子。
图-3 针对DDR1激酶(PDBID: 3ZOS)生成化合物的每个指标产生的分子数量。
同时作者对 Mothra 在多目标优化过程中生成分子的 Pareto 前沿分布及优化动态进行了分析(图-4)。图-4a的三维点云分布显示了生成分子在 Docking Score、QED 和毒性概率三项指标上的表现,图b-d为其在二维平面的投影。随着时间推移,生成分子的点云逐渐靠近目标空间的Pareto前沿,即后期生成的分子性能逐步优于早期分子,甚至部分分子性能超越了 ChEMBL 数据库中的已知配体。这些结果验证了 Mothra 在多目标分子生成与优化中的高效性和灵活性。
图-4 靶向DDR1激酶分子生成过程中Pareto前沿散点图。b-d分别为对接评分与QED、QED与毒性概率、毒性概率与对接评分的相关性。绿色十字表示ChEMBL数据库中与靶蛋白结合的已知分子。不同颜色的点表示不同时间步长下所产生的分子。
【小结】
Mothra作为一个分子生成模型,不依赖于现有的化合物库,且生成的分子能够覆盖广泛的化学空间,这有助于发现新的药物候选分子。不同于传统的多目标优化方法,Mothra采用了一种创新的策略来处理药物发现中的复杂性,在结合亲合力、药物相似性和毒性概率等多个维度上达到了良好的优化平衡。基于该模型的灵活性和适应性,Mothra允许用户根据自己的研究目标定义新的评估函数。此外,尽管Mothra是基于深度学习的模型,但其生成的分子结构和背后的推理过程却通常是可解释的,研究人员可以通过分析模型的生成过程和结构特征对模型做出调整或优化。虽然Mothra多目标优化的思路值得肯定和学习,但是该模型也存在一些潜在的问题:1)随着目标函数数量的增加,优化过程中需要同时考虑的因素变多,搜索难度提升,如果 Pareto 前沿分子数量过多,优化可能难以有效推进。2)使用 AutoDock Vina进行结合亲合力评分,尽管计算效率较高,但评分精度可能不足以准确反映分子实际的结合能力。3)RNN 模型在 SMILES 表达的语法学习上有效,但缺乏对分子全局结构的深刻理解,可能限制生成分子的复杂性。因此,虽然Mothra为多目标分子优化领域提供了新的思路和工具,但是该模型中的分子生成模块和分子性能评价模块均仍有一定的改进和优化空间。参考文献:
[1] Suzuki T, Ma D, Yasuo N, Sekijima M. Mothra:
Multiobjective de novo Molecular Generation Using Monte Carlo Tree Search. J
Chem Inf Model. 2024 Oct 14;64(19):7291-7302.