为什么需要 UniIF?
分子逆折叠的核心挑战在于设计能够准确预测分子结构的算法。然而,传统方法往往针对小分子或大分子分别开发模型,导致研究成本高且重复工作严重。UniIF 的使命是通过统一框架,解决以下问题:
- 单位差异:大分子以氨基酸或核苷酸为单位,而小分子以原子为单位。
- 几何特征提取:如何统一处理分子的三维结构特性。
- 系统规模:在大分子系统中,长程依赖关系难以建模。
UniIF 的创新之处
数据层面的统一: UniIF 引入了基于“块图(Block Graph)”的数据表示方法,将分子中的原子、氨基酸和核苷酸视为统一的“块”,实现了多类型分子的高效处理。
模型层面的统一: 使用几何块注意力网络(Geometric Block Attention Network)捕捉所有分子间的三维相互作用,包括全局虚拟块和长程依赖模块。
多任务表现优越: 在蛋白质设计、RNA 设计和材料设计的综合评测中,UniIF 均超越了当前最先进的方法,展示了其强大的适应性。
研究亮点
该研究已被 NeurIPS 2024 接收,为分子逆折叠提供了一种通用、精准的解决方案。 实验显示 UniIF 的综合性能优于现有方法,尤其在 RNA 和蛋白质的设计任务中表现卓越。