ICML 2024 | 知识感知的强化学习优化的蛋白质定向进化方法

创业 2024-10-30 08:22 北京

定向进化是蛋白质优化的基石，是利用自然突变过程来增强蛋白质功能。现有的机器学习辅助定向进化(MLDE)方法通常依赖于数据驱动的策略，经常忽略生化领域的深刻领域知识。
在本文中，我们为 MLDE 引入了一种新的知识感知强化语言模型 (KnowRLM)。构建氨基酸知识图(AAKG)来表示氨基酸之间复杂的生化关系。我们进一步提出了一种基于蛋白质语言模型 (PLM) 的策略网络，该网络通过使用动态滑动窗口机制在 AAKG 上优先随机游走迭代地对突变体进行采样。对新的突变体进行主动采样，以微调适应度预测器作为奖励模型，为知识感知策略提供反馈。最后，我们以主动学习方法优化整个系统，该方法模拟实践中的生物设置。
KnowRLM 的优势在于它能够利用来自知识图谱的上下文氨基酸信息，从而从蛋白质序列的统计模式和氨基酸的生化特性中获得优势。大量实验表明，与现有方法相比，KnowRLM 在更有效地识别高适应度突变体方面的优越性能。

论文题目：
Knowledge-aware Reinforced Language Models for Protein Directed Evolution
论文链接：
https://openreview.net/forum?id=MikandLqtW
代码链接：
https://github.com/HICAI-ZJU/KnowRLM

一、方法

首先，我们根据氨基酸的性质构建了氨基酸的知识图，捕获了氨基酸之间复杂和相互关联的关系。在此基础上，我们提出了一种知识感知策略，通过AAKG上的优先随机游走来预测突变位点和类型。最后，奖励模型（即突变体的适应度预测器）提供了对 KAP 的反馈。我们以主动学习的方式优化 KnowRLM，识别的突变体由预言机注释并用于微调适应度预测器。现有的知识源要么不包含氨基酸级别的信息，要么缺乏结构化关系。为了填补这一空白，我们构建了一个以氨基酸为中心的知识图谱（AAKG）。

具体来说，基于 AAontology，我们确定了每个氨基酸的各种属性来构建 AAKG，包括两个级别：实例和类，分别为黄色和红色。在类级别，我们描述了氨基酸类。为了伪造氨基内酸连接，我们选择在类级别对属性进行建模。在实例级，20个氨基酸被实例化为氨基酸类的实体，而氨基酸的各种物理化学性质，如极性和体积，被实例化为属性类的实体。不同的氨基酸实体可以通过属性实体建立间接关系。实体通过 rdf :type 分配给它们各自的类，用红色虚线箭头表示。此外，如蓝色箭头所示，我们通过对象属性建立实体间关系，表示与氨基酸性质相关的特定数值。图 1 说明了 AAKG 的构建过程。

知识感知策略旨在对适应度最高的最优突变体进行采样，这是通过使用 PLM 和 AAKG 预测突变位点和突变氨基酸类型来实现的，如图 2 所示。在突变位点预测模块，给定一个类似于 EvoPlay 的野生型蛋白质序列，在每个时间步 t，我们进行单点突变。我们首先使用 PLM 和多层感知 (MLP) 来预测 n 个候选位点最可能的突变位点。在氨基酸类型预测模块，在确定突变位点后，我们考虑适当的氨基酸突变体。氨基酸突变的过程被概念化为在AAKG上从一个氨基酸节点导航到另一个氨基酸节点，为了将PLM中的统计规律与AAKG中的理化性质对齐，我们利用PLM中的位置敏感氨基酸嵌入作为AAKG中的节点嵌入。

识别氨基酸的突变类型是通过在AAKG中从一个氨基酸节点导航到另一个氨基酸节点来实现的。传统的能够寻路随机游走算法忽略了先验知识信息。因此，我们引入了一种优先随机游走策略。为了测量从一个节点到相邻节点的转移概率，我们使用两个节点之间的嵌入之间的余弦相似度。我们的策略是在AAKG指定的氨基酸的邻域中找到新的替换。

在突变过程的背景下，倾向于对具有相似性质的氨基酸进行突变，这可能导致收敛到局部最优。为了抵消这一点并鼓励 RL 探索，我们在优先随机游走策略中引入了动态滑动窗口机制，如图 3 所示。该算法作为优先随机游走的细微补充，便于更广泛地研究蛋白质空间。初始窗口位于 (b) 中，节点 V 是最初的氨基酸。当突变导致适应度增加时，窗口会滑动到原点，如 (a) 所示，从而能够探索具有相似属性的氨基酸。然而，如果连续的突变不能增加适应度，窗口将从原点滑动，如 (c) 所示。这允许策略网络探索具有不同属性的氨基酸，从而增强发现全局最优解的潜力。

策略优化过程涉及迭代地调整策略网络参数以最大化累积奖励。值得注意的是，奖励函数由适应度预测器实现，该预测器提供了对突变体适应度的伪评估。这个过程在将模型的输出与有向进化任务的特定目标对齐中起着至关重要的作用，确保每个连续迭代产生一个更符合所需特征的蛋白质序列。奖励函数（即适应度预测器 F）在主动学习框架内进行了微调。这种方法通过策略网络迭代地对蛋白质序列进行采样，然后通过预言机注释这些样本的适应度。每一轮采样和注释都有助于用于训练适应度预测器的累积数据集。因此，它的特点是采样、注释和训练的连续循环，允许模型逐步细化其预测能力。

二、实验

我们的研究使用了两个广泛认可的公共数据集 GB1和 PhoQ，以评估所提出的 KnowRLM 方法的有效性。GB1 数据集代表了蛋白质 G 的域 B1，这是众多生物过程的关键组成部分。它包括一个包含149,361个注释突变体的综合阵列，来源于一个可能的160,000个组合，集中在四个关键的突变位点:V39、D40、G41和V54。与 GB1 互补，PhoQ 数据集专注于不同的蛋白质，在四个突变位点具有 160,000 个潜在突变体中的 140,517 个带注释的数据点：A284、V285、S288 和 T289。该数据集中的适应度值表明各种 PhoQ 突变体的磷酸酶或激酶活性。

本研究对 MLDE 方法的评估采用多方面的方法来确保对模型性能进行全面评估。归一化折扣累积增益 (NDCG)由于其在排名相关问题中的相关性而成为主要指标，NDCG 评估突变体的预测和实际适应度值之间的相关性。除了 NDCG 之外，评估模型的有效性涉及分析组合集的均值和最大适应度值，其中包括采样过程生成的样本和预测阶段识别的排名靠前的突变体。

这些指标共同提供了对模型能力的全面看法，不仅包括它能够识别最高适应度突变体（最大值），还包括考虑的整个突变体集的整体适应度水平（平均值）。我们对我们的方法相对于五种复杂的基线方法进行了广泛的比较分析，包括 MLDE、ftMLDE、CLADE、CLADE2.0和 EvoPlay。

作者：王钰皓
来源：公众号【ZJUKG】

llustration From IconScout By IconScout Store

-The End-

扫码观看！

本周上新！

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区（www.techbeat.net）。社区上线500+期talk视频，3000+篇技术干货文章，方向覆盖CV/NLP/ML/Robotis等；每月定期举办顶会及其他线上交流活动，不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台，希望为AI人才打造更专业的服务和体验，加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章，并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向，对用户启发更大的文章，做原创性内容奖励

投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信（yellowsubbj）投稿，沟通投稿详情；还可以关注“将门创投”公众号，后台回复“投稿”二字，获得投稿说明。

关于我“门”

▼

将门是一家以专注于数智核心科技领域的新型创投机构，也是北京市标杆型孵化器。公司致力于通过连接技术与商业，发掘和培育具有全球影响力的科技创新企业，推动企业创新发展与产业升级。

将门成立于2015年底，创始团队由微软创投在中国的创始团队原班人马构建而成，曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业，不仅想获得投资，还希望获得一系列持续性、有价值的投后服务，欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角，把文章分享到朋友圈

点击“阅读原文”按钮，查看社区原文

http://mp.weixin.qq.com/s?__biz=MzAxMzc2NDAxOQ==&mid=2650514910&idx=2&sn=81421593ce43c955326d3130c45b31ab

将门创投

将门是一家以专注于数智核心科技领域的新型创投机构，也是北京市标杆型孵化器，由前微软创投在中国的创始团队于2015年底创立。公司致力于通过连接技术与商业，发掘和培育具有全球影响力的科技创新企业，推动企业创新发展与产业升级。

最新文章

Talk预告｜澳门大学田春霖：小参数大作为，揭秘非对称LoRA架构的高效性能

NeurIPS 2024 | 解锁大模型知识记忆编辑的新路径

ECCV 2024 | 南洋理工人体动作生成新范式：统一多模态的动作生成大模型

NeurIPS 2024 | 类脑智能与黎曼图学习：黎曼脉冲神经元初探

Talk预告｜UT-Austin樊志文：端到端从多视角图片解析3D与全景3D生成

NeurIPS 2024 | 让大语言模型使用代码解决图分析推理任务

Talk预告｜中国科学院大学教授高林：高真实感三维建模与生成研究进展

活动报名 | 探秘自主机器人领域：19 位青年报告嘉宾集结，ARTS 2024研讨会震撼来袭！

MoA：混合稀疏注意力加速长文本生成，实现最高8倍吞吐率提升

Talk预告｜香港科技大学叶汉荣：X-VILA - 大语言模型的跨模态对齐

ECCV 2024 | 利用函数映射优化图像对应关系：零样本推理的新方法

Talk预告｜北京大学余旺博：探索视频扩散模型在3D生成和重建中的应用

EMNLP 2024 | 解锁Apple Intelligence：用AppBench一键评测你的手机智能

NeurIPS 2024 | 自监督湍流分析，减少99%标注数据需求

HazyDet：利用深度线索的雾天无人机目标检测开源基准

将门月报 | 文远知行正式登陆纳斯达克、智谱与中国三星宣布战略合作、帷幄与永旺在印尼达成紧密合作......

Talk预告｜香港中文大学汪福运：Rectified Diffusion - 一般扩散模型的ODE轨迹修正

ICML 2024 | 知识感知的强化学习优化的蛋白质定向进化方法

Talk预告｜西安电子科技大学曾泽群：CLIP是否有能力做零样本的图像描述生成？

NeurIPS 2024 | MoGU：用于增强模型安全性并保持其可用性的框架

将门创投早期项目「文远知行」正式在纳斯达克挂牌上市

NeurIPS 2024 | AdaptiveDiffusion - 为每个prompt量身定制的扩散加速方案

ECCV 2024 | 推动纯视觉自动驾驶落地，单目三维检测实时泛化

Talk预告｜南开大学李政：视觉语言模型CLIP的提示学习方法研究

贝联珠贯完成Pre-A轮数千万元融资，将门创投领投

Talk预告｜香港中文大学邵昊：LMDrive - 大语言模型加持的闭环端到端自动驾驶框架

NeurIPS 2024 | VFIMamba：基于状态空间模型的视频插帧新SOTA

业内首个突破十亿参数的时序大模型，引领预测性能新高峰!

活动报名 | 将门横琴科技创新日暨人工智能加速器开业仪式

EMNLP 2024 | 从特征解耦角度重新审视单义神经元及其在对齐算法中的作用

图少样本学习综述：从元学习到预训练和提示学习

Talk预告｜香港科技大学高深远：构建通用可泛化的自动驾驶世界模型

NeurIPS 2024 | 结构信息原理指导的高效智能体探索

Talk预告｜香港中文大学王鸿儒：工具学习 - 杂谈 apple intelligence 和 o1 的异同

ICML 2024 | 论扩散模型采样轨迹的规律性及快速采样算法

ECCV 2024 | 研究残差及跳跃连接的可解释性，层相关性传播LRP在ResNet网络中的适配

北大对齐团队独家解读：OpenAI o1开启「后训练」时代强化学习新范式

Talk预告｜香港科技大学黄华健：高写实三维数字化时代下的在线同时定位和建图

CoRL 2024 | InstructNav：通用指令导航大模型系统

Talk预告｜普渡大学倪瑞祺：基于物理信息机器学习的运动规划

ICLR 2024 | BioBridge：通过知识图谱桥接生物医学基础模型

将门月报 | 格灵深瞳携手北京铁路局、文远知行与Uber达成战略合作、帷幄与华为云建立战略合作伙伴关系......

清华、北大等发布Self-Play强化学习最新综述

ECCV 2024 | 代码开源&方法简单，探索基于相机RAW图像的High-level视觉任务：RAW-Adapter

ICML 2024 | 从拓扑视角出发，10行代码提升类别不平衡图节点分类

Talk预告｜慕尼黑工业大学翟光耀：SG-Bot - 基于场景图生成式模型的机械臂操作和物体重排

300篇文献！大模型走向物理世界：TeleAI发布大模型驱动的具身智能综述

Talk预告｜北京航空航天大学阮受炜：探索视觉感知的3D视角鲁棒性

ECCV 2024 | EchoScene：通过场景图扩散生成3D室内场景

一张图搞定3D视效！深度解读北大、港中文、腾讯等联合开源项目ViewCrafter

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉