RNA,作为生命活动的中心分子之一,其功能远不止于转录 DNA 信息。近年来,RNA 的结构多样性及其在生物学过程中的关键作用越来越受到关注,研究表明 RNA 构象动力学在剪接、包装、细胞激活和响应环境刺激等过程中发挥着重要作用。RNA 构象的多样性赋予了 RNA 丰富的功能,是当前生命科学研究的热点之一。深入理解 RNA 构象对于揭示生命活动的分子机制、开发新型治疗药物以及推动合成生物学的发展都具有重要意义。
2024 年 12 月 18 日,美国国家癌症研究所的 Yun-Xing Wang 教授在 Nature在线发表了两篇题为「The conformational space of RNase P RNA in solution」(图 1)和「Determining structures of RNA conformers using AFM and deep neural networks」(图 2)的研究论文。
图 1 相关研究(图源:[1])
图 2 相关研究(图源:[2])
RNA 不仅是遗传信息的载体,还是生物催化和基因表达调控的核心分子之一,其功能与复杂的三维构象密切相关。已有研究表明,RNA 分子在溶液中可以表现出远超静态晶体结构的动态行为,这种动态特性在基因剪接、细胞内转运以及应激响应中扮演重要角色。然而,传统的结构生物学方法如 X 射线晶体学和冷冻电镜主要捕捉 RNA 的静态结构,难以解析其动态构象。
RNase P RNA 是研究 RNA 动态行为的理想模型。作为所有生命界中唯一的转作用 RNA 酶,它主要负责处理前体 tRNA(pre-tRNA)的 5′ 端,同时具备广泛的底物特异性,可以加工多种 RNA 底物。这种双重特性表明,RNase P RNA 可能在高度保守的催化核心和灵活的外围结构域之间实现功能的平衡。然而,其动态行为如何影响催化功能,以及如何通过直接实验手段揭示其动态特性,仍是未解之谜。为此,研究人员设计了一种新方法,将溶液原子力显微镜(atomic force microscopy, AFM)与深度学习算法 HORNET 结合,首次实现了 RNA 单分子动态构象的三维可视化。这种方法的创新性在于能够捕捉 RNA 分子在生理条件下的真实动态特性。
首先,研究团者通过体外转录技术获得了完整长度的 RNase P RNA,并在非变性条件下对其进行了纯化,以确保 RNA 分子的正确折叠,为后续分析提供了可靠的基础。接下来,研究者使用原子力显微镜(AFM)对 RNase P RNA 分子进行了单分子成像(图 3)。在溶液条件下,AFM 被用于采集 RNA 分子的高分辨率图像,分辨率达到了 10–15 Å。为了确保每个图像记录一个独立的 RNA 分子,研究者特意避免了分子间的重叠和聚集现象,这对于分析每个分子单独的构象变化至关重要。
图 3 溶液中单个 Gst-RNase P RNA 分子的 AFM 图像(图源:[1])
然后,研究团队运用深度学习算法 HORNET 对 AFM 图像数据进行了处理,并成功重建了 158 个独立分子的三维结构(图 4)。此外,研究结合了小角 X 射线散射(SAXS)技术和主成分分析(PCA),对重建的三维结构数据进行了分类和动态分析,从而提取出 RNA 分子在不同条件下的主要构象类型和动态特性。在构象动态分析中,研究团队根据分子的半径和构象紧凑程度,将 RNase P RNA 分子分为三类:C1(紧凑型)、C2(中间型)和 C3(扩展型)。通过 PCA,研究提取了构象变化的主要动态方向和振幅,进一步分析了 RNA 分子在不同条件下的运动模式。同时,为了探索 RNA 序列与其动态特性之间的关系,研究团队计算了 RNA 序列的保守性(sequence conservation score, SCS)与三维构象稳定性(3D conformation conservation score , 3DCS)之间的相关性分析,揭示了 RNA 序列在维持构象稳定性和动态行为中的重要作用,尤其是在确保 RNA 功能的关键区域(图 5)。
图 4 RNase P RNA 分子多种构象的拓扑结构(图源:[1])
图 5 序列保守性与构象动力学的相关性(图源:[1])
在第二篇文章中,研究人员对 HORNET(Holistic RNA structure determination method using atomic force microscopy, unsupervised machine learning and deep neural networks)方法进行了详细的阐述。HORNET 是一种结合原子力显微镜(AFM)图像、无监督机器学习和深度神经网络的技术,用于解析单个 RNA 分子在溶液中的三维结构。这种方法特别适用于研究大型、结构异质和柔性的 RNA 分子,这些分子的功能多样性和动态性使得传统的结构解析方法(如核磁共振、晶体学和冷冻电镜)难以应用。
图 6 HORNET 工作流(图源:[2])
研究者使用 Bacillus stearothermophilus 的 RPR(RNase P RNA)作为示例,展示了如何通过原子力显微镜(AFM)图像结合动态拟合方法,确定 RNA 分子的三维结构。研究者首先生成了初始模拟数据(BM0),并对 AFM 图像加入不同程度的高斯噪声(5% 至 50%),然后使用经典的 Langevin 粗粒度分子动力学进行动态拟合。通过这种方法,可以有效地在 AFM 伪势能的限制下进行广泛的构象空间采样,得到多种异质性 RNA 构象(图 7)。虽然图像分辨率约为 12 Å,但 RNA 的结构特点使得 AFM 成为研究异质性 RNA 结构和动力学的理想工具。此外,研究还展示了通过 AFM 拓扑图谱进行的动态拟合能够准确地估算 RNA 的三维拓扑结构,其准确性随噪声的增加而降低,但仍能有效反映真实结构。
图 7 RNA 结构的 AFM 图像(图源:[2])
紧接着,研究者使用无监督机器学习(UML)方法分析了 BM0 轨迹模型的 r.m.s.d. 值,发现虽然许多模型的能量与真实结构(PBD ID: 3DHS)相似,但它们的构象与真实结构存在显著差异,说明仅凭能量统计不足以准确识别最接近真实结构的模型。为此,研究引入了结合三类信息的 UML(unsupervised machine learning)方法:包括与化学、二级和三级结构相关的能量、CCAFM 评分以及 AFM 拓扑约束的能量成本(图 8)。通过初步的能量筛选、主成分分析(PCA)和聚类算法,UML 能够筛选出能量最低且 CCAFM 评分最高的模型,从而迭代选择出与真实结构最接近的子群体。结果表明,使用 UML 方法,经过动态拟合的模型在不同噪声水平下的 r.m.s.d. 值均保持在约 5 Å 左右,证明了该方法的有效性,并且在不同 RNA 和起始构象下都表现出了优异的准确性,最低 r.m.s.d. 可达到约 3.5 Å。
图 8 UML 基准测试(图源:[2])
RNA 结构预测面临的主要挑战是分子异质性和缺乏结构-序列相关性。为了解决这个问题,研究团队提出了一种基于深度神经网络(novel deep neural network, DNN)的方法,通过结合 RNA 结构模型的能量信息、AFM 拓扑图(CCAFM)和拓扑约束,估算 RNA 结构模型的准确性。DNN 能够在真实结构未知的情况下进行准确度估算,解决了 RNA 结构预测中的难题。为训练 DNN,研究者创建了包含 350 万个 RPR 催化域模型的 psDatabase,覆盖广泛的构象空间,并通过将 80% 的数据用于训练,20% 用于验证,成功训练出了高准确度的模型。为了验证 DNN 的效果,研究者使用了三种不同的验证方法:①使用相同的 AFM 拓扑图,但不同初始构象下的 RNA 结构;②使用来自更小 RNA(如 cobalamin-sensing riboswitch)的数据进行盲测;③使用 SAXS 衍生模型验证。验证结果均表明 DNN 能够有效估算结构准确性。
最后,研究者通过 HORNET 方法分析 HIV-1 RRE RNA 的构象异质性(图 9)。RRE RNA 在 HIV-1 病毒的核出口过程中起着关键作用,帮助病毒选择其 RNA 进行出口。然而,尽管已有基于 SAXS 数据的 RRE 分子包络图,但其高分辨率结构仍未确定。研究者认为 RRE 具有构象异质性,这使得 X 射线晶体学和冷冻电子显微镜等技术难以应用。
为了进一步探讨 RRE 的结构,研究者使用 HORNET 分析了通过 AFM 观察到的五种不同 RRE 构象,验证了其灵活性和异质性。结果表明,RRE 折叠成多种类似 A 形状的构象,且其两个已知的 Rev 结合位点相互面对,位点之间的距离变化在 45–70 Å 之间,展示了 RRE 的构象波动性。特别是在 III-V 域,显示出较大的构象波动,这一区域与抗病毒出口机制相关。基于这些发现,研究者设计了一类新型的分支肽,模仿 Rev 二聚体,通过赖氨酸连接的两个富含精氨酸的基序,保持高度灵活性,能够适应不同的位点距离和角度,并特异性结合 RRE。实验表明,这些分支肽能够与 RRE 高亲和力结合,即便在大量 Rev 或非特异性 RNA 的存在下,且形成的复合物表现出较小的迁移速度,表明其结构更紧凑、更稳定。最终,研究通过这些实验结果解决了 RRE 拓扑结构的长期争议,并解释了 HIV-1 如何识别 RRE RNA。
图 9 RRE RNA 构象的拓扑结构(图源:[2])
参考资料:
Yun-Tzai L et al. The conformational space of RNase P RNA in solution. Nature. 2024 Dec 18. Maximilia D et al. Determining structures of RNA conformers using AFM and deep neural networks. Nature. 2024 Dec 18