对一个分子是否类药的理解影响着药物化学家对分子结构的设计,近年来科学家发现有越来越多的药物分子在逼近里宾斯基五规则(RO5)的边界,甚至有越来越多的新药跳出了RO5的范围,这对药物化学家提出了新的难题:RO5之外,应该依据什么设计安全有效的药物?英科智能和俄罗斯的研究人员Ivanenkov等人通过收集和分析1910-2018年间的专利分子和上市药物数据,并提出了评估药物分子的复杂度和(发展历史上)新颖程度的经验指标MCE-18,来揭示药物设计发展历史的变化趋势,指出在高通量筛选(HTS)危机时期之后的当前药企面临的挑战、造成研发困境的主导因素和值得改进之处。他们的研究结果作为综述于2019年发表在JMC杂志上,题为“Are We Opening the Door to a New Era of Medicinal Chemistry or Being Collapsed to a Chemical Singularity?”
——研究方法——
* 研究数据的获取和处理。作者分析的对象是来自最成功的23家药企(如赛诺菲、辉瑞、默克、阿斯利康等)的三个分子数据集。第一个数据集是这些公司申请的专利文件中的分子结构(24232个独特结构),每个分子结构用专利年份标记,涵盖了从1950年到2018年间的记录;第二个是这些公司已经上市的药物分子(1370个独特结构),每个分子用批准/注册/上市的年份进行标记。为了比较不同药物开发阶段的情况,作者又收集了从先导化合物,到临床一二三期,以及最终成功上市的药物(这部分与第二个数据集相同),作为第三个分子数据集(~30000个先导化合物,1678、1847和464个临床一二三期化合物,1370个上市药物),同样被标记上对应的年份。这些数据集都进行了统一的清洗和筛选,并且为了减少骨架相似的分子重复出现,作者根据拓扑结构进行了聚类,并在每一类中挑选多样性打分靠前(5%或10%)的分子作为最终的分析对象。* MCE-18。作者为了能够用一个比较鲁棒的指标来区分新旧的类药化合物,提出了MCE-18指标,但他们的主要目标并不是使用这个指标执行分类任务(当然其预测能力经过了检验),而是借此观察药物分子发展的变化。他们从一些分子拓扑结构的特征构造出MCE-18指标,以此反映分子三维复杂程度(数值越高,对应着越复杂的分子结构)。其中AR标记有无芳香(杂)环的存在(取0或1),NAR标记有无脂肪(杂)环的存在(取0或1),CHIRAL标记有无手性中心的存在(取0或1),SPIRO标记有无螺环点的存在(取0或1),sp3是sp3杂化的碳原子比例(取0-1),Cyc是环上的碳原子是sp3杂化的比例(取0-1),Acyc是链上的碳原子是sp3杂化的比例(取0-1),Q1是归一化的quadratic index,描述骨架分支的复杂程度。作者预期MCE-18相比常用的Fsp3指标(sp3碳的比例)更能够描述分子的细致复杂结构,能够用于评估类药分子的新颖性,帮助研究人员主动设计更新颖的、有更可靠的知识产权保护的分子结构。从不同时期专利中的独特化合物数量变化来看(图1),从1998年(RO5被提出之后)到2004年间新颖化合物的数量快速上升,之后则是一个显著地下降,到了2015和2016期间,专利中的新颖化合物的数量已经下降到接近上世纪末的程度。而与之形成鲜明对比的,是MCE-18指标在整个研究的时间内都保持着上升的趋势。具体到热门研究靶标的上市药物(图2):过去的三十年中激酶抑制剂上市药物的数量在不断增加,而靶向蛋白酶和GPCR的药物则在过去的13年内出现了明显的数量减少。类似地,MCE-18在整个时间段内都在一直增加。作者认为这预示着一个“化学奇点”的到来:在本世纪初,高通量筛选刚开始起步,而供应商手上还有大量的没有被测试过的分子结构,就像是被环绕在黑洞周围的“化学质量”。经过了高通量筛选方法20年的蓬勃发展,很多化合物库的存量被几近耗尽,库中的很多骨架被认为是没有吸引力和潜力有限而被移出类药化合物空间,这团“化学质量”如今已经明显地变少了,而我们正在逼近一个包含了巨大“化学质量”的“化学奇点”,其中包含的类药化合物有更加复杂的结构而且跟已有的结构明显地不同(从MCE-18来看),可能会打破我们对于类药分子已有的认知。不过目前这个点还处在视界之内,只有很少化合物能够逃离被观察到。作者认为虽然从新颖化合物的数量来看似乎现状不容乐观,但是我们正在接近一个胜利的转折点,在此之前很多药物发展中的传统概念需要被重新思考。图1 专利分子数量和MCE-18随时间的变化
图2 靶向三类热门靶标的药物分子数量随时间的变化
另外,作者对上市药物进行了聚类分析(图3),从药物分子服从RO5+规则(RO5的基础上加入PSA<140 Å2)的角度对药物分子进行了划分,结果发现过去7年中上市的新药有超过65%都是打破了RO5+规则的,作者认为下一代药物会有逐渐偏离里宾斯基提出的规则的趋势。——药物分子发生了怎样的演变?——
图4 专利分子各特征的雷达图变化
* 对于专利分子而言(图4),SPIRO、Q1、电拓扑状态指数和分子量这几个特征都随时间有明显增长(平均增长因子分别为1.36、1.09、1.08和1.07)。虽然SPIRO增加的幅度最大,但是没有明显的时间变化规律,后期的增长主要是因为投入了较多的精力用于合成天然产物中更为常见的环结构,前几个阶段增长的趋势不明显(在这个意义上作者认为他们提出的MCE-18是一个更加综合和更有意义的指标)。而水溶性logSw从上世纪末开始已经降低到-4.8并维持至今,逼近药物分子统计上允许的最低值。
* 上市药物分子的MCE-18、分子量、Q1、极性表面积和电拓扑状态指数都在随时间增长(图5),其中MCE-18和Q1的平均增长因子更高(均为1.06),而亲脂性没有表现出与上市时间有明显的相关性。总体来说,后出现的化合物有更大、更极性、三维复杂度更高的特点。
图6 不同药物研发阶段的分子的变化情况
* MCE-18在整个药物研发过程中呈现持续地下降(图6),从临床前研究的57.3到上市药物的45.98(此处的上市药物MCE-18值比2012-2018时段的上市药物MCE-18值低的原因是此处的上市药物包含了新旧药物分子,而数量较多的旧分子结构,拉低了平均的MCE-18),分子量、AR、NAR、Q1, 水溶性和电拓扑状态指数也有类似的情况。——MCE-18合理吗?——
* 从自组织映射的聚类结果来看,药物分子随时间的演变轨迹与MCE-18的分布情况是相似的。从7a、b图也能看出新药有更加复杂的结构,更加接近中高数值的MCE-18的区域。
图7 上市药物分子的SOM映射结果。
(a) 所有时期的上市药物分子分布;(b) MCE-18在不同区域的分布;(c)1910-1979年间上市的药物分子分布;(d)2011-2018年间上市的药物分子分布
* 临床前研究的化合物比较平均地分布在全图中,而上市药物则比较均匀地分布在临床前化合物密集分布的几个区域(图8b),并且旧药物分子倾向于分布在MCE-18值较低的区域(图8d),而过去8年(2011-2018)中上市的药物则倾向于分布在中等MCE-18值的区域(图8e)。
(a)临床前研究的化合物的分布;(b)经过或者正在经历临床研究的化合物分布;(c)MCE-18的分布;(d)1910-1987年间上市的药物分子分布;(e)2011-2018年间上市的药物分子分布* 药企在过去推出的强效药的专利很多会在不久的将来失效,据估计在2018年就减少了将近一千亿美元的销售额,药企即将失去了他们的主要收入来源,不得不将成本转移到内部结构调整,特别是研发部分的裁员上,这影响了新药的开发速度。* 美国的医疗改革和欧洲政府的紧缩政策同样影响了药企的利润,更多的来自政府机构对上市药物的更加严格的监管显著增加了药企将药物推向市场需要耗费的时间和金钱,间接地影响了对研发部分的投入。* 企业研发中HTS快速筛选发现新药的研发模式在逐渐过时,但药企由于对短期经济效益的追求和过分的实用主义,往往将自己局限在结构简单、易合成的分子结构中,尽量避开了那些需要相当研发投入和工艺提升的复杂反应,作者认为当前大药企的核心问题是创新文化的残缺。 * 因此,作者认为企业需要以不同形式与学术圈建立更多的联系和合作,吸纳更多有创造力的药化专家加入到企业药物研发的领域中。
Ivanenkov, Yan A., Bogdan A. Zagribelnyy, and Vladimir A. Aladinskiy. "Are We Opening the Door to a New Era of Medicinal Chemistry or Being Collapsed to a Chemical Singularity? Perspective." Journal of medicinal chemistry 62.22 (2019): 10026-10043.DOI: 10.1021/acs.jmedchem.9b00004