MCE 中国作为大赛的独家协办方,为大赛提供包含 1800 万个化合物的数据资源以及约 1000 个实体化合物分子。
经过高通量测试,上海药物所发现 223 个分子具有活性,并经过多轮测试,最终选出 5 个最具有特异性的潜力分子。伴随着“药筛+AI”的强强联手,赛事不仅展示了前沿科技的应用,也彰显了AI在药物研发过程中的巨大潜力和重要价值。
图 1. 药理活性分子从设计到知识交流和传递的开发过程[1]。
基于 AI 筛选的优势:
1. AI 算法可以筛选庞大的生物数据库,以前所未有的速度和高精度识别潜在的药物靶点。
AI 辅助药物研发成功案例
AI 在药物发现中的潜力已经在很多案例中得到证明。例如,Gupta,R. 等人 2021 年报道了基于已知癌症相关化合物和相应的生物活性的大型数据集训练了 DL (深度学习) 算法,结果获得了具有癌症治疗潜力的新型化合物,证明了 AI 在发现新型候选药物的能力[2]。
MEK 也是治疗癌症的潜在靶点,但是该靶点的有效抑制剂的开发一直具有挑战性,Zhu,J 等人在 2021 年报道了通过训练 ML (机器学习) 算法,识别出这种蛋白质的新型抑制剂[3]。另一个例子是通过使用 ML 算法发现 β-分泌酶 (BACE1) 的新型抑制剂,BACE1 是一种参与阿尔兹海默症的蛋白[4]。在 COVID-19 大流行期间,AI 的潜力显得尤为突出,AI 算法被用于分析潜在的大型化合物数据集,并确定了最有可能对抗该病毒的化合物[5][6][7][8][9][10]。
本次 AI 大赛获得一等奖的团队为上科大的 GeminiMol 团队,构象空间是他们的一大亮点,该模型能够识别 2D 结构不相似,但 3D 构象相似的潜在活性分子,有助于发现具有新颖结构的先导化合物。该模型基于分子间构象空间相似性对比学习来进行训练,能够表征药物小分子的构象空间特征,全面反映与分子结构相关的分子属性、潜在药效性质等,进而在包括基于配体的虚拟筛选、靶标鉴定、分子属性预测等多种药物发现任务上表现出均衡的优良性能。
图 2. GeminiMol 模型架构图[11]。
去年,Insilico Medicine 公司基于 AI 生成的抗纤维化药物,名为 INS018_055,是首个进入临床II期实验的化合物。
此外,MCE 拥有已知活性库、类药多样库、特色片段库及药物筛选、先导化合物优化技术平台为全球科研客户及新药研发客户提供—站式药物发现及研究服务。
未来,平台将紧跟全球研发前沿,持续丰富专业资源与科研工具,提升视觉形象与用户体验,链接全球产业链资源,推进产业提质增效。在系统化、专业化、精益化的战略引领下,平台致力于打造适合科学研究领域的一站式药物发现及研究服务平台,构建开放、公益的化合物信息共享平台,为科学研究提供各种化合物与试剂,为科研工作者和学术界提供一个创新、高效、协作的平台,为新药研发提供智能化解决方案,更好推动科学发展和知识共享。
产品推荐 |
DNA 编码化合物库(DNA Encoded compound Library,DEL)技术作为新颖、强大的苗头化合物发现引擎,可快速从几千万至数十亿分子中,遴选出结构新颖、具有潜在成药性的化合物,大大缩短药物研究周期,降低研发成本。在 DEL 库中,每一个分子砌块(Building Block)都由一段已知唯一的 DNA 序列进行标记,通过 DNA 兼容反应和组合化学模式,历经数个循环即可获得上亿 DEL 分子。数十亿化合物可以混合在一管中筛选,最终通过高通量测序技术,解码 DEL 分子的专属 DNA 标签,快速获得针对靶点的苗头化合物信息。 |
50K Diversity Library (HY-L901) 由 50,000 种类药化合物组成。本多样性库具备新颖性、类药性,结构多样性等特点,库中化合物可重复供应,是新药研发的有力工具,可以广泛地应用于高通量筛选 (HTS) 和高内涵筛选 (HCS)。 |
5K Scaffold Library(HY-L902) 由 5,000 种类药化合物组成,每种化合物代表一种结构骨架,最大程度保证了库的结构多样性。库中的化合物均经过 MedChem & PAINS filters 筛选,剔除了不合适的化学结构,避免“目标错误”。本库化合物数量少但结构足够多样,是药物筛选的有力工具。 |
3D Diverse Fragment Library (HY-L903) 由 5,196 个非平面片段分子组成 (平均 Fsp3 值为 0.58),超过 4,700 个片段至少包含一个手性中心。本库设计的关键元素是 3D 结构、多样性、生物反应性等,有效提高了片段潜在生物活性,为基于片段的药物发现提供了更高的片段命中概率。 |
Drug Fragment Library (HY-L904) MCE Drug Fragment Library 由 1,000 个药物片段组成。这些药物片段来自 2,946 个 FDA 已批准的药物分子,同一药物的不同片段可以出现在其他药物中,这些片段和 PK/PD 性质存在一定的相关性,基于片段的筛选可以为后续优化结构预留出足够的化学空间,该化合物库是 FBDD(基于片段的药物设计)药物筛选的必备工具。 |
Natural Product-like Library (HY-L905) MCE Natural Product-like Compound Library 由 5,000 个来自类药库的类天然产物化合物组成,库中每个分子含有天然产物关键骨架(42 个)或者和天然产物的谷本相似系数大于 0.6,且Natural-likeness scoring > -2,该化合物库同时具备类药性和新颖性,库中化合物可重复供应,是新药研发的有力工具,可以广泛地应用于高通量筛选 (HTS) 和高内涵筛选 (HCS)。 |