【TiPLab Innovation Day 2024 | 专题回顾】AI辅助药物发现

文摘   其他   2024-08-19 07:00   上海  

AI辅助药物发现专题

AI在药物发现中的应用不仅局限于小分子,而是拓展到大分子领域,包括在大分子的结构预测、功能预测和候选药物产生。目前,我们看到了许多将AI技术用于药物研发的案例,其加速了药物研发的进程并且降低了药物研发的成本。


TiPLab聚焦这些AI辅助药物发现相关的前沿技术,在Innovation day当天为大家带来了4篇相关的前沿文献,并从专利视角探讨了针对AI辅助药物发现的特殊专利问题以及专利保护略。

使用通用蛋白质语言模型实现人源抗体的高效进化(Peter S. Kim团队,Nature Biotechnology,2024)

我们首先分享了来自斯坦福大学的Peter S. Kim团队开发的一种使用通用蛋白质语言模型优化蛋白的方法。研究人员使用6种基于大规模蛋白质序列数据库训练的掩码语言模型,即ESM-1b模型和组成ESM-1v的5种模型,预测给定的抗体可变区序列上在进化上可行的点突变。这一过程无需目标抗原、结合特异性或蛋白结构等信息。之后,选择经6种模型一致推荐的突变(9-15个)进行第一轮实验,筛选其中亲和力较高的点突变,并在第二轮实验中测试其可能的组合(1-11个),筛选得到其中亲和力较高的突变组合。


该方法只需结合少量实验筛选,即可实现抗体亲和力的大幅提升。对于每种已知抗体,只结合两轮实验,筛选约20种突变体,即成功使4种成熟抗体的亲和力提升到最多7倍,使3种未成熟抗体的亲和力提升了最多160倍。此外,该方法还表现出在其他非抗体蛋白进化中的应用潜力。

接下来,我们从较为宏观的角度分析了AI辅助药物研发、尤其是蛋白设计这个领域寻求专利保护时可能遇到的问题。受技术特点影响,本领域中合作或委托开发的商业模式较为常见。在这种商业模式中,往往会涉及双方的数据交换和基于数据反馈的模型/产品更新,知识产权的归属可能天然地会出现不明确的问题。因此我们建议,为避免后续商业化过程中产生不必要的纠纷,在合作或委托进行AI药物研发时,双方需提前约定研发过程不同阶段的产出以及对于具体产出的归属

利用RFdiffusion从头设计全新抗体(David Baker团队,BioRxiv,2024)

接下来,我们聚焦到使用生成式AI从头设计全新抗体的研究,是近期David Baker团队的又一突破性研究成果。随着其他领域AI模型研究的不断深入,蛋白质设计领域的开发者在至下而上的理论基础上,融合了近年来发展迅速的图像生成工具——扩散模型,逐步实现了蛋白质从头设计的理论。Baker团队构建了一个基于RoseTTAFold的扩散模型——RFdiffusion,其同时具备高度多样化的输出、快速响应反馈信息并调节设计目标和清晰的3D建模能力


RFdiffusion综合了RoseTTAFold2的抗体结构预测和Diffusion的图像生成能力,实现了抗体的从头设计。其从待合成分子整体的性能出发,给出所需的结构特性,让AI进行计算,通过大量模拟蛋白质片段组装,最终寻找到最符合功能预期的产物。不仅可以设计出先前技术完全达不到蛋白结构,其产物还具有极强的功能性。

之后我们分析了此类通用型AI的专利保护策略。结合在AI辅助药物设计的过程中容易发生侵权行为的场景,可以考虑的专利保护视角包括:软件或模型本身的保护、软件或模型的训练方法以及其输出的具体产品的保护对于软件或模型本身来说,单纯的软件或模型特征通常被认为是抽象的概念不能直接进行专利保护。

比如,在中国,如果想对软件或者模型进行保护,一般需要再限定除软件/模型以外的技术特征,这些技术特征通常对应的是不同的应用场景,通过拓展各种应用场景以寻求尽可能宽泛的保护。


比如,对于蛋白质设计的AI来说,可以限定的应用场景包括预测蛋白质结构/结合域的模型、设计氨基酸序列的模型以及生成蛋白质分子的模型。例如,针对RFdiffusion,可以尝试保护以diffusion为特点的算法整体架在蛋白质序列生成中的应用。

使用自然语言模型实现锌指酶设计(Philip M.Kim & Marcus B. Noyes团队,Nature Biotechnology,2023)

研究人员根据锌指酶的结构特点和其与DNA结合的原理,处理了ZF蛋白与DNA相互作用的数据,并设计了基于transformer机器学习模型(也就是与ChatGPT类似的模型),使得模型可以生成出能够与特定DNA序列结合的工程化锌指蛋白序列


在训练数据上,该团队筛选了10个库,每一个库代表一个完全随机的序列和一个独特的指与指之间的接触机制,以此建立起了包括具有以下两个维度的数据集:不同的ZF之间的界面的数据以及某种特定的接触界面下完全随机的序列

在训练模型上,针对锌指酶设计这一特定的应用场景,根据单个指与DNA之间的相互作用、两个指之间的关系以及最终的序列预测设计了基于transformer的训练模型。ZFDesign技术能够设计出靶向人类基因组中DNA片段的ZF蛋白,这为基因疗法的广泛应用提供了新的可能性


基于建模计算设计新型Cas9 PAM结构域(David Bikard团队,Computational Biology,2023)

该方法基于半监督的受限波尔兹曼机(RBM),同时结合了实验数据、蛋白质序列的自然变异以及基于物理学的预测,提供了一种可靠的方法,在改变蛋白质序列的同时保持其功能。首先在训练数据上,该团队使用了无需监督的受限波尔兹曼机(RBM)进行训练,但是为了提高精度,该团队使用了标记数据监督输出,使其成为半监督学习的RBM。

在模型上,该团队使用了更接近物理规则的采样方法,Langevin Dynamics进行采样。提高了模型的预测精度。结果表明,在对Cas9 PAM作用结构域的序列进行了20%以上的修改后,仍能保持其功能。这在药物开发和各种工业应用中创造有价值的蛋白质变体具有潜在的应用前景

针对具体应用场景的AI辅助药物设计,除了能够通过专利保护其具体产品(例如某种锌指酶、某种Cas酶),还可以对具体的应用场景进行专利保护。我们可以尝试使用具体应用场景的实际技术特点结合宽泛的模型进行专利保护。


具体来说,以锌指酶设计为例,前述方案的应用场景为锌指酶设计,其技术方案的所有改进均基于“不同的指“以及”指与指不同的界面“这两个概念。因此其保护方式可以从数据的角度进行,也可以从模型的角度进行。从数据角度的话,可以尝试保护包含“不同的指”和”指与指之间的界面“的数据结构用于锌指酶模型的训练;从模型角度的话,其可以尝试保护一种模型,其含有“不同的指“相关的训练模块和”指与指之间的界面“相关的训练模块。这两种保护方式均无需限定具体的训练模型类型

TiPLab观点总结:AI辅助药物发现专题

对于AI辅助药物研发,我们主要分享了目前新出现的AI辅助药物设计的应用形式,考虑到AI药物研发的特殊性并结合AI辅助药物设计的商业模式,讨论了本领域参与者需要注意的特有专利问题以及专利保护策略。


首先,围绕知识产权归属问题,对于以委托/合作开发为主要商业模式的AI药物研发,由于AI本身通常会涉及甲方乙方的数据交换和基于数据反馈的模型/产品更新,因此知识产权的归属天然地会出现不明确的问题。因此TiPLab建议,在委托或接受委托进行AI药物研发时,双方需明确研发过程中的产出以及对于具体产出的归属


其次,在AI辅助药物研发中,对于算法,会涉及到可专利客体的这一特殊问题。对此TiPLab建议,可以结合中美欧对于可专利客体不同的审查尺度,在撰写算法相关专利时需充分体现算法的技术特征或者算法的应用场景


另外,对于AI辅助药物设计的专利保护策略,针对平台性质的通用型模型,可采用“广泛的应用场景+某一算法改进”为基础寻求最大的保护范围,通过拓展算法改进的应用场景,获得通用模型的保护,例如通用的算法。针对具体应用的特定模型,可采用“具体的应用场景改进+宽泛算法”为基础寻求最大的保护范围,通过引入具体应用场景所涉及的技术特征,寻求不限制模型类型的算法保护,例如针对具体的某一类酶的训练模型。



TIPLAB INNOVATION DAY 2024
往期精彩回顾
第二届TiPLab Innovation Day回顾|20240726|上海张江
【TiPLab Innovation Day 2024|专题回顾】靶向蛋白降解剂

* 以上文字仅为促进讨论与交流,不构成法律意见或咨询建议。

© 作为一家专业服务公司,TiPLab坚持原创的系统的研究,注重系统性知识积累与专业影响力。欢迎读者个人分享转发,各专业平台媒体如需转载请联系TiPLab获得授权。

 TiPLab提供基于研究的核心知识产权服务

FTO:技术商业化实施的侵权风险防范

TiPLab通过对细分技术领域内核心技术和重要专利的长期研究,结合自身在数据检索和分析方面的专长,致力于帮助客户深入了解、积极应对潜在的专利侵权风险。


Due Diligence:商业活动中的知识产权尽职调查

在企业许可交易、融资、并购、上市等过程中,TiPLab帮助企业和投资方了解目标技术/产品的专利保护强度及产品商业化过程中潜在的专利侵权风险,从而为商业谈判和决策提供支持依据。


Strategic Patenting:全球范围内高价值专利资产的创设

TiPLab熟知全球主要国家和地区的法律实践和细分领域内的前沿技术进展情况,通过前瞻性的专利布局策略,帮助客户通过创设有价值的专利资产而获取、保持和巩固独特的竞争优势。

TiPLab
TiPLab是国内领先的专业知识产权服务机构,聚焦于生命科学前沿技术领域。我们的核心工作就是帮助行业内的技术驱动企业及投资机构,进行:全球范围内高价值的专利资产申请与布局;技术实施的侵权风险管控;及商业活动中的知识产权尽职调查。
 最新文章