建立在超大规模虚拟化合物库上的虚拟筛选是药物研发者探索浩瀚如星海般类药空间(约1060个分子)的重要手段之一,近年来化合物数据库规模的爆炸式增长,似乎极大地提高了人们发现新药物结构的成功率。然而,此前的研究表明,在超大规模的虚拟筛选结果中,假阳性化合物越发集中在排名靠前的分子里,降低最终的筛选成功率。加州大学旧金山分校的Shoichet小组长期以来对这一问题保持了高度的关注并开展了广泛的探索。他们提出虚筛排名靠前的假阳性结果主要可分为两类,一是常规的对接失败(normal docking failures,图1C),二是由于异常结构表征而诱使打分异常偏高(cheating artifacts,图1A、D)。近期,该小组通过探索多种正交方法对排名靠前的分子进行重新评估,从而主动筛除其中因异常结构表征导致的假阳性结果,并在回顾性和前瞻性研究中证明了这一方法的有效性。该工作发表在美国化学会出版的Journal of Medicinal Chemistry期刊上(J Med Chem 2024, 67(18), 16796–16806)【1】。
图1:AmpC β-内酰胺酶靶点虚拟筛选打分分布及部分已验证结构
首先,为设计并建立起用于发现虚拟筛选中假阳性分子的交叉验证方法,作者需要一个已经得到实验验证出数百个假阳性化合物的大型虚拟筛选数据库,因而优先选取针对AmpC β-内酰胺酶靶点的一个体系用于回溯性研究。这一体系使用DOCK打分函数对接筛选了17.1亿个分子,其中超过1400个化合物得到了实验测试【2】,可用于交叉验证方法的检验。图2:AmpC靶点已验证化合物的标准化DOCK3.8和FACTS溶剂化能分布
在这一体系上,作者将这些分子标准化的DOCK3.8和FACTS(fast analytical continuum treatment of solvation)溶剂化能进行了对比,得到一个双峰正态分布(图2A)。按照两个分布均值的3σ范围对上述分子进行聚类后,有268个分子由于异常的去溶剂化能而落在范围之外,其中262个化合物在实验测试中没有活性,仅有6个分子产生了酶抑制活性,最优达到9.7μM。换言之,基于溶剂化能异常的验证方法,可以筛除超过22%的假阳性分子,并仅损失了3.8%的配体,还未涉及抑制活性最佳的配体分子(图2D)。作者将该方案应用在σ2和D4受体的筛选体系上,分别筛除了22%和28%的无活性分子,同时仅损失了4个和3个配体。这些回溯性研究结果表明,该方法可以在全体化合物内区分配体和非配体,同时尽可能降低假阴性结果。根据前期研究结果,在AmpC靶点上得到实验测试的1440个分子中,假阳性结果包含了前述的两种情况,分别是由于异常结构表征(Br、S等较高周期元素及氰基的过高原子电荷等)导致的对接打分偏高及常规对接失败(图1C、D),其中前者往往排名最为靠前。因此,作者分析了9个靶点上被交叉验证筛除分子的对接排名情况,发现其中6个靶点被筛除的分子明显富集于排名靠前的区间,说明该方法在排除筛选结果前列的假阳性分子方面效果更佳。图3:前瞻性实验中经交叉验证筛除优选的8个化合物剂量关系曲线
作者进一步开展了前瞻性的测试,对上述在AmpC靶点的虚拟筛选上排名靠前且未经实验测试的128个全新分子进行了合成与测试,其虚筛排名在1~415之间。经过上述溶剂化能的交叉验证筛选,其中39个分子(排名1~407)被标记为假阳性,经过实验验证符合预期,而余下通过筛选的89个化合物中有51个(57%)在200μM的最高浓度下表现出明显的酶抑制活性,其中虚筛排名靠前的8个配体可以得到良好的剂量关系曲线(图3)。
图4:MM/GBSA和AB-FEP对AmpC靶点初筛命中分子的重打分及筛选结果
这一基于溶剂化能的交叉验证本质上是通过排除异常值来实现的,而以往更直接、更常用的验证方法是采用理论上更接近第一性原理、计算精度更高的方法重新计算优选化合物的亲合性,并设置合理的能量阈值来排除弱或无亲合性的假阳性分子。因此,作者对前述前瞻性测试中的128个分子分别采用MM/GBMV和AB-FEP重新计算了与AmpC靶点的结合自由能(图4A、C)。尽管实验测得这些化合物的最高抑制活性仅在微摩尔级别,但两种重打分方法得到的结合自由能均远高于其,故而设置合适的能量阈值来区分配体与假阳性分子成为关键。其中,MM/GBMV法的表现并不理想,当以-100 kcal/mol作为阈值时,能够筛除的假阳性化合物不足1/4,若想达到前述方法的筛除水平(约50%),则会排除近一半的活性配体。相比之下,若以实验亲合性筛选的阈值200μM对AB-FEP法的结果进行划分,就能将基于异常溶剂化能标记的39个假阳性结果中的30个进行筛除,若进一步提高阈值到1μM,则可以筛除37个。小编评论:
该项工作是Shoichet小组对于在大规模虚拟筛选中如何减少假阳性结果的又一次探索。在前期研究中,他们提出了通过改变挑选虚拟筛选结果的方式来降低进入到下一评估阶段的假阳性分子比例的方案,即不是直接按照打分排名优选前若干个分子,而是在靠前的不同排名区间中等量地挑选分子【3】。不难看出,此前提出的挑选分子策略,并非主动地筛除排名靠前的假阳性结果,而是借助概率分布的差异来降低假阳性结果的出现概率。本次报道的一系列交叉验证方法,则能够主动出击,对虚筛结果中排名靠前的化合物进行筛查,有效地形成互补。不过,相比于此前提出的通用型策略不受所使用的筛选方法限制,此次设计的基于溶剂化能的交叉验证,一定程度上或依赖于筛选阶段所使用的打分函数,而AB-FEP、MM/GBMV方法需要在亲合性阈值设置合理的前提下才有可能满足需求,但同时计算资源开支相对更高。总体来说,该小组在此研究课题上的系列工作值得大家关注。参考文献
【1】 Yujin Wu*, Fangyu Liu, Isabella Glenn, Karla
Fonseca-Valencia, Lu Paris, Yuyue Xiong, Steven V. Jerome, Charles L. Brooks
III, and Brian K. Shoichet*, Identifying Artifacts from Large Library Docking. J.
Med. Chem., 2024, 67(18), 16796–16806. https://doi.org/10.1021/acs.jmedchem.4c01632.
【2】 Fangyu Liu*, Olivier Mailhot, Isabella
S. Glenn, Seth F. Vigneron, Violla Bassim, Xinyu Xu, Karla Fonseca-Valencia, Matthew
S. Smith, Dmytro S. Radchenko, James
S. Fraser, Yurii S. Moroz, John J. Irwin, Brian
K. Shoichet*, The impact of Library Size and Scale of Testing on Virtual
Screening. bioRxiv, 2024. https://doi.org/10.1101/2024.07.08.602536
【3】 Jiankun Lyu*, John J. Irwin, and Brian K.
Shoichet*, Modeling the expansion of virtual screening libraries. Nat. Chem.
Bio., 2023, 19(6), 712-718. https://doi.org/10.1038/s41589-022-01234-w