科研助攻 | "药筛+AI"：AI 算法如何加速药物发现？

企业 2024-09-19 11:23 上海

Big news！Hey, buddy! 首届上海国际计算生物学创新大赛圆满结束。是的，没错！正是当前火热的“药物筛选 + AI”的主题。什么？不晓得？快快快！拉上你身边信息略有闭塞的小伙伴，一起来看下AI 技术为药物筛选带来了哪些新进步？

2024 年 9 月 9 日，首届上海国际计算生物学创新大赛•药物筛选 AI 算法“凌越”挑战赛正式落下帷幕。86 支来自国内外的顶尖计算生物参赛团队运用人工智能 (AI) 算法，在这场智慧与实力的比拼中各显神通。

MCE 中国作为大赛的独家协办方，为大赛提供包含 1800 万个化合物的数据资源以及约 1000 个实体化合物分子。

经过高通量测试，上海药物所发现 223 个分子具有活性，并经过多轮测试，最终选出 5 个最具有特异性的潜力分子。伴随着“药筛+AI”的强强联手，赛事不仅展示了前沿科技的应用，也彰显了AI在药物研发过程中的巨大潜力和重要价值。

基于 AI 的筛选技术，有哪些优势？

众所周知，传统的药物发现之旅是艰难的，大多数的药物需要 10-15 年才能进入临床，花费数百万甚至数十亿美元的成本，最终，大多数候选药物会由于安全或者疗效问题而失败。

随着 AI 时代的到来，越来越多的事实证明，AI 是药物发现过程中的强大工具，为长期存在的挑战提供了创新的解决方案。

图 1. 药理活性分子从设计到知识交流和传递的开发过程^[1]。

基于 AI 筛选的优势：

1. AI 算法可以筛选庞大的生物数据库，以前所未有的速度和高精度识别潜在的药物靶点。

2. 通过分析从基因组到临床的所有数据，AI 工具可以精确定位在疾病进展中起关键作用的分子和生物途经，为研究人员提供关于潜在治疗干预措施的宝贵见解。

3. 同时基于 AI 筛选技术对大型的化合物库数据进行快速的筛选，以识别最有可能与靶标结合的化合物，这个过程曾经耗时且成本高昂，现在可以在短时间内完成，大大加快了药物发现的步伐。

4. 此外，AI 驱动的预测模型可以帮助研究人员更准确的评估候选药物的有效性和安全性，从而指导优先对哪些化合物进行进一步的优化和测试。

基于 AI 的药物发现，如何应用？

AI 辅助药物研发成功案例

AI 在药物发现中的潜力已经在很多案例中得到证明。例如，Gupta,R. 等人 2021 年报道了基于已知癌症相关化合物和相应的生物活性的大型数据集训练了 DL (深度学习) 算法，结果获得了具有癌症治疗潜力的新型化合物，证明了 AI 在发现新型候选药物的能力[2]。

MEK 也是治疗癌症的潜在靶点，但是该靶点的有效抑制剂的开发一直具有挑战性，Zhu,J 等人在 2021 年报道了通过训练 ML (机器学习) 算法，识别出这种蛋白质的新型抑制剂[3]。另一个例子是通过使用 ML 算法发现 β-分泌酶 (BACE1) 的新型抑制剂，BACE1 是一种参与阿尔兹海默症的蛋白[4]。在 COVID-19 大流行期间，AI 的潜力显得尤为突出，AI 算法被用于分析潜在的大型化合物数据集，并确定了最有可能对抗该病毒的化合物[5][6][7][8][9][10]。

本次 AI 大赛获得一等奖的团队为上科大的 GeminiMol 团队，构象空间是他们的一大亮点，该模型能够识别 2D 结构不相似，但 3D 构象相似的潜在活性分子，有助于发现具有新颖结构的先导化合物。该模型基于分子间构象空间相似性对比学习来进行训练，能够表征药物小分子的构象空间特征，全面反映与分子结构相关的分子属性、潜在药效性质等，进而在包括基于配体的虚拟筛选、靶标鉴定、分子属性预测等多种药物发现任务上表现出均衡的优良性能。

近日，该模型相关论文“Conformational Space Profiling Enhances Generic Molecular Representation for AI-powered Ligand-based Drug Discovery”已发布于国际期刊 Advanced Science 杂志。

图 2. GeminiMol 模型架构图^[11]。

AI 制药，未来会怎么样？

去年，Insilico Medicine 公司基于 AI 生成的抗纤维化药物，名为 INS018_055，是首个进入临床II期实验的化合物。

今年 3 月，Insilico 在 Nature Biotechnology 上详细报道了从采用大型语言模型 (LLM) 生成到临床试验的整个过程。

2023 年，美国食品和药品管理局 (FDA) 发布了 AI 在药物发现中使用的相关指南，该报告强调了潜在的关键应用领域，同时也考虑到了降低风险以及对这一技术更明确的指导方针。在更清晰的指导下，研究人员能够更好的应用这项技术。

另一个确保 AI 最佳实践的条件是建立对模型的信任，在最近的 Front Line Genomics 网络研讨会上，Richard Lewis (Novartis 计算机辅助药物设计数据科学总监) 讨论了模型构建的社会学考虑因素以及 AI 在药物发现中的地位。如果研究人员对这项技术有更好的理解和信任，那么 AI 应该能够在此过程中更有效地使用。

尽管截止 2024 年，尚未有 AI 生成的药物获批上市，科学家仍在努力推动AI在药物发现中的应用。

MCE：一站式药筛平台

MCE 一站式药筛平台聚焦于药物发现早期，积极拥抱 AI 带来的巨大机遇和挑战，将越来越多的 AI 技术应用到各个业务模块。化合物库方面，除了通过 AI 算法生成 MegaUni 1,000 万虚拟类药多样库，还将 AI 算法应用到各种类型的 Mini 化合物库的构建，帮助客户更高效地获得符合自己需求的化合物库。虚拟筛选方面，将 AI 主动学习和分子对接相结合，以支持更大规模的虚拟筛选。

此外，MCE 拥有已知活性库、类药多样库、特色片段库及药物筛选、先导化合物优化技术平台为全球科研客户及新药研发客户提供—站式药物发现及研究服务。

图 3. MCE一站式药筛平台简介。

未来，平台将紧跟全球研发前沿，持续丰富专业资源与科研工具，提升视觉形象与用户体验，链接全球产业链资源，推进产业提质增效。在系统化、专业化、精益化的战略引领下，平台致力于打造适合科学研究领域的一站式药物发现及研究服务平台，构建开放、公益的化合物信息共享平台，为科学研究提供各种化合物与试剂，为科研工作者和学术界提供一个创新、高效、协作的平台，为新药研发提供智能化解决方案，更好推动科学发展和知识共享。

产品推荐

DNA 编码化合物库合成与筛选

DNA 编码化合物库（DNA Encoded compound Library，DEL）技术作为新颖、强大的苗头化合物发现引擎，可快速从几千万至数十亿分子中，遴选出结构新颖、具有潜在成药性的化合物，大大缩短药物研究周期，降低研发成本。在 DEL 库中，每一个分子砌块（Building Block）都由一段已知唯一的 DNA 序列进行标记，通过 DNA 兼容反应和组合化学模式，历经数个循环即可获得上亿 DEL 分子。数十亿化合物可以混合在一管中筛选，最终通过高通量测序技术，解码 DEL 分子的专属 DNA 标签，快速获得针对靶点的苗头化合物信息。

50K Diversity Library (HY-L901)

由 50,000 种类药化合物组成。本多样性库具备新颖性、类药性，结构多样性等特点，库中化合物可重复供应，是新药研发的有力工具，可以广泛地应用于高通量筛选 (HTS) 和高内涵筛选 (HCS)。

5K Scaffold Library(HY-L902)

由 5,000 种类药化合物组成，每种化合物代表一种结构骨架，最大程度保证了库的结构多样性。库中的化合物均经过 MedChem & PAINS filters 筛选，剔除了不合适的化学结构，避免“目标错误”。本库化合物数量少但结构足够多样，是药物筛选的有力工具。

3D Diverse Fragment Library (HY-L903)

由 5,196 个非平面片段分子组成 (平均 Fsp3 值为 0.58)，超过 4,700 个片段至少包含一个手性中心。本库设计的关键元素是 3D 结构、多样性、生物反应性等，有效提高了片段潜在生物活性，为基于片段的药物发现提供了更高的片段命中概率。

Drug Fragment Library (HY-L904)

MCE Drug Fragment Library 由 1,000 个药物片段组成。这些药物片段来自 2,946 个 FDA 已批准的药物分子，同一药物的不同片段可以出现在其他药物中，这些片段和 PK/PD 性质存在一定的相关性，基于片段的筛选可以为后续优化结构预留出足够的化学空间，该化合物库是 FBDD（基于片段的药物设计）药物筛选的必备工具。

Natural Product-like Library (HY-L905)

MCE Natural Product-like Compound Library 由 5,000 个来自类药库的类天然产物化合物组成，库中每个分子含有天然产物关键骨架（42 个）或者和天然产物的谷本相似系数大于 0.6，且Natural-likeness scoring > -2，该化合物库同时具备类药性和新颖性，库中化合物可重复供应，是新药研发的有力工具，可以广泛地应用于高通量筛选 (HTS) 和高内涵筛选 (HCS)。

[1] Blanco-González, et al. The Role of AI in Drug Discovery: Challenges, Opportunities, and Strategies. Pharmaceuticals 2023, 16,891.

[2] Gupta, R.; et al. Artificial intelligence to deep learning: Machine intelligence approach for drug discovery. Mol. Divers. 2021, 25, 1315–1360.

[3] Zhu, J.; et al. Prediction of drug efficacy from transcriptional profiles with deep learning. Nat. Biotechnol. 2021, 39, 1444–1452.

[4] Dhamodharan, G.; et al. Machine learning models for predicting the activity of AChE and BACE1 dual inhibitors for the treatment of Alzheimer’s disease. Mol. Divers. 2022, 26, 1501–1517.

[5] Lv, H.; et al. Application of artificial intelligenceand machine learning for COVID-19 drug discovery and vaccine design. Brief. Bioinform. 2021, 22, bbab320.

[6] Monteleone, S.; et al. Fighting COVID-19 with Artificial Intelligence. In Methods in Molecular Biology; Humana Press Inc.: Totowa, NJ, USA, 2022; Volume 2390, pp. 103–112.

[7] Zhou, Y.; et al. Artificial intelligence in COVID-19 drug repurposing. Lancet Digit. Health 2020, 2, e667–e676.

[8] Verma, N.; et al. Predicting potential SARS-CoV-2 drugs-in depth drug database screening using deep neural network framework ssnet, classical virtual screening and docking. Int. J. Mol. Sci. 2021, 22, 1392.

[9] Bung, N.; et al. De novo design of new chemical entities for SARS-CoV-2 using artificial intelligence.Future Med. Chem. 2021, 13, 575–585.

[10] Floresta, G.; et al. Artificial Intelligence Technologies for COVID-19 De Novo Drug Design. Int. J. Mol. Sci. 2022, 23, 3261.

[11] Wang L, et al. Conformational Space Profiling Enhances Generic Molecular Representation for AI-Powered Ligand-Based Drug Discovery. Adv Sci (Weinh). 2024 Aug 29:e2403998.

◆ 科研助攻 | 案例分享！MCE 的客户如何做药筛？

◆ 科研助攻 | "肽肽风"？如何基于 DEL 环肽库进行筛选？(案例分享)

◆ 科研助攻 | 不容小觑！靶点药物筛选知多少？

◆ 赛事落幕 | 2023 上海国际计算生物学创新大赛圆满收官：MCE 在 "药筛+AI" 领域展现非凡助力

MCE 抑制剂

最新文章

干货分享 | 放射性核素 RDC？"干掉" 肿瘤的同时会不会杀死我？

科研助攻 | 小片段，大能量? 一文搞懂什么是基于片段的药物开发!

直播预告 | AI 与药筛：CADD 和 AIDD 如何 "破局" 药物研发？

癌细胞竟 "偷走" 免疫细胞线粒体？免疫细胞: 不慌, 能 "充电"！

暖冬感恩 | 邀您参加 2024 年满意度有奖调查 & 感恩回馈活动

科研助攻 | 分子动力学模拟：药物设计的超能力！

有投必奖 | 大家都用 MCE 产品做了啥? (肿瘤与癌症)

直播预告 | 同位素标记物: 示踪剂与定量内标品的探索

MCE 暖冬季 | 钜惠进行中！染料、siRNA 65 折，享 1.5 倍牌价积分~ 更多专属折扣，速戳！

干货分享 | 药物游离态 or 盐型，实验如何选？

科研助攻 | 蛋白降解：AUTOTAC、第一代、第二代 AUTAC? 你分清了吗？

直播预告 | MCE 全球云讲堂 & 经典主题直播: 炎症反应 or 细胞焦亡研究？一键预约都要看！

展会预告 | MCE 中国 11 月展会预告: 冬日盛展, 暖心启航~

细胞迁移 VS 侵袭大不同！想要划痕和 Transwell 实验的实操？包会的！

干货分享 | In Vivo 同型对照抗体—对照实验的秘密武器

科研助攻 | "隐形杀手"-- 血脂异常：有哪些干预靶点？

一作论坛 | Cell 新突破！一种可把染色体 "打包 Copy" 的新型基因编辑工具

牢记基本功! 实验室的各类培养液 & 缓冲液怎么配??? (配方分享)

科研助攻 | 全面解读 (下)：白介素家族大盘点！

干货分享 | PKH 26：如何进行体外细胞的标记和追踪？

首发速领 | 入冬啦！MCE 限定台历，精美来袭，速来免费领取！

双十一狂欢盛典 | 重组蛋白、化合物库、生化试剂、试剂盒、多肽、酶、染料等多款明星产品，限时秒杀大放价，惊喜低至四折！

新突破 | 治愈自身免疫性疾病？序贯免疫疗法：免疫系统也能 "开机重启"！

干货分享 | 3D 生物打印：器官可以打印出来？！

科研助攻｜全面了解肿瘤标志物—基质金属蛋白酶家族 (MMPs)

有投必奖 | 大家都用 MCE 产品做了啥? (炎症与免疫)

直播预告 | 治疗性药物递送技术的进阶之路

全面解读 (上)：白介素家族大盘点！如何塑造我们的身体反应？

干货分享 | 条件性基因敲除动物模型：你必须了解的 "Cre-LoxP 系统"

MCE 萌家园 | 积分商城焕新盛启，科研好物尽在掌握~

直播预告 | 开讲啦！天然产物化合物在药物筛选中的应用

展会预告 | MCE 中国：金秋十月，月末展会，重磅来袭！

前沿进展 | 拯救消失的记忆：阿尔兹海默症何时能治愈？

干货分享 | 细胞铺板有哪些被忽略的小妙招？

Q&A 汇总 | 细胞凋亡手册免费领啦！实验总抓狂？一册在手不迷茫~

直播预告 | 国自然热点：巨噬细胞极化的研究思路

10 月秒杀 | 十月金秋特惠，多肽惊喜秒杀

2024 诺奖公布 | 三大奖项揭晓: 人工智能 “霸占” 半边天？microRNA 揭示生命调控新维度？堪称神仙打架！

干货分享 | 助溶剂大比拼：小小动物实验，拿下！

直播预告 | 携手共探：寡核苷酸的固相合成奥秘之旅

展会预告 | MCE 中国十月展会预告金秋十月收获满满

MCE 开学季 | 小红书晒萌家好运刮刮卡 & 产品使用体验，好运与你不期而遇

科研助攻 | 脂质≈脂肪？NO！一文了解脂质

结果公布 | MCE 第三届细胞摄影大赛圆满落幕，一起来欣赏科研美图