引言
本文档概述了使用PDB数据库中的实验结构与RoseTTAFoldNA预测模型进行蛋白质与核酸(DNA和RNA)对接的测试过程与结果。测试目的在于评估RoseTTAFoldNA模型在精确模拟蛋白质与核酸间相互作用的能力,并将预测结果与实际实验数据进行对比。
对接程序
对接程序
🔹使用工具:RoseTTAFoldNA预测模型。
🔹方法:采用计算对接方法,将选定的蛋白质链与相应的核酸序列进行对接。针对不同类型的核酸进行测试,评估模型对相互作用特异性和准确性的识别能力。
评估指标
🔹RMSD(均方根偏差):用于量化分子结构间差异的指标,广泛应用于蛋白质结构预测、分子对接及其他分子建模领域。RMSD测量两个分子结构间对应原子的平均距离偏差。RMSD值越低,表明结构间差异越小,相似度越高。
🔹IDDT(InteractiveDomain - Domain Teamwork) : 评估蛋白质与核酸结构预测质量的指标,反映结构的局部精确度。IDDT分数范围为0到1,分数越高,预测结构与实验确定结构的相似度越高。此指标适用于评价单个蛋白质结构及蛋白质复合体或多域结构的预测质量。
结果
1
蛋白质-DNA对接
对标的PDB数据链接:https://www.rcsb.org/structure/3Q05
3Q05蛋白链:
SSSVPSQKTYQGSYGFRLGFLHSGTAKSVTCTYSPALNKMFVQLAKTVPVQLYVDSTPPPGTRVRAMAIYKQSQHMTEVVRRCPHHERSSDSDGLAPPQHLIRVEGNLRAEYLDDPNTFRHSVVVPYEPPEVGSDYTTIYFKFMCNSSCMGGMNRRPILVIITLEDSSGNLLGRDSFEVRVCACPGRDRRTEEENLRKKTMDGEYFTLQIRGRERFEQFRERNEALELKDAQAT
核酸(DNA)A链
TGAGACATGCCCAGACATGCCCGTTT
核酸(DNA)B链
ACGGGCATGTCTGGGCATGTCTCAAA
2
蛋白质-RNA对接
对标的PDB数据链接:https://www.rcsb.org/structure/4O26
4O26蛋白链:
GSGFLYGGRGMHGFCLNRKRRTAAGPRRLQGQDLVRLVFFEGLPYLNGQERKPKKLPLRYFNMVPVFGRLLQRHRKCRYSSVLHRMCPVVELSRAAQGELSSLIPQHCAPHRVYLFVRECLTAVVPEELWGSDHNRLQFFSRVRGFLKSGKFERISVAELMWKIKVMDCDWLKLRRTAGRFPPSELAYRTRILSQFLTWLLDGFVVGLVRACFYATESVGQKNAIRFYRQEVWSKLQDLAFRRHIAKGEMEELSPAQ
核酸(RNA)链:
GGAACGCCGCGGUCAGCUCGGCUGCUGCGAAGAGUUCGUCUCUGUUGUUCC
讨论
对接测试不仅揭示了RoseTTAFoldNA预测模型与实验结构之间的差异,而且高亮了其在特定情景下对比AF3模型的显著优势。RoseTTAFoldNA在处理蛋白质-核酸相互作用的预测中表现出色,尤其在预测核酸与蛋白质之间的结合模式时,其精度和灵敏度通常超过了AF3模型。这一优势可能源于RoseTTAFoldNA在训练阶段使用了更广泛的蛋白质-核酸交互数据集,以及其算法在处理核酸相关结构时的特定优化。
此外,RoseTTAFoldNA在预测那些在AF3训练集中较少出现的稀有或复杂的蛋白质-核酸交互模式上,也显示了更高的灵活性和准确性。这表明,RoseTTAFoldNA的方法论在维持算法的泛化能力方面是成功的,能够有效识别和模拟多样的生物分子交互动态。
结论
综上所述,RoseTTAFoldNA模型在蛋白质与核酸对接的预测任务中显示了显著的竞争力,特别是与AF3模型相比,其在处理核酸复合物的预测方面具有明显的优势。这些成果验证了RoseTTAFoldNA在生物分子建模领域的应用潜力,特别是在精确预测蛋白质与核酸相互作用的结构细节方面。
RoseTTAFoldNA模型主要用于预测蛋白质与核酸之间的相互作用,并能够处理多种类型的核酸。以下是一些核酸类型,其中RoseTTAFoldNA可以发挥作用:
1. DNA(脱氧核糖核酸):RoseTTAFoldNA能够预测蛋白质与DNA分子之间的结合模式,这对于理解基因调控、DNA修复和复制等生物学过程至关重要。
2. RNA(核糖核酸):模型同样适用于预测蛋白质与各种RNA形式(如mRNA、tRNA、rRNA等)之间的交互作用。这有助于研究蛋白质如何影响RNA的加工、转录后修饰和功能。
3. 复合核酸结构:包括RNA-DNA杂交链等。这些结构在许多生物学过程中起着关键作用,如逆转录病毒的复制和某些基因编辑机制。
4. 非编码RNA(ncRNA):这类RNA不编码蛋白质,但在基因表达调控中扮演着重要角色。RoseTTAFoldNA可以帮助研究者探索蛋白质与这些功能性RNA之间的复杂相互作用。
RoseTTAFoldNA的强大之处在于其能够应用于多种核酸类型,进而为生物学研究提供深入的结构洞察,这是理解生物分子机制和开发新疗法的关键。此外,随着模型的进一步改进和数据的积累,预计其在预测精度和适用范围上将持续提升。
❖合肥科晶生物技术有限公司是一家以AI与生物技术融合为核心的行业领军企业,汇聚生物技术和AI领域的高端人才,经验丰富的资深研发团队,能够为您提供全方位的专业知识、独特见解和技术支撑。
❖我们倾力打造百库精筛虚拟引擎,已储备数十种物种的蛋白质数字化文库,研究者只需送研究蛋白的CDS序列或者氨基酸序列,即可进行数字化互作蛋白筛选,只需5-10天即可交付!已储备常用物种数据库如下列表:
福利来袭!
科晶生物论文出图
免费蛋白互作分析等您来领!
0551-64669001
扫码添加客服,即可领取!