文献分享:HSQC 谱图模拟与匹配在分子鉴定中的应用

学术   2024-09-23 11:19   中国香港  

概述

本研究由阿斯利康公司的Martin Priessner等科学家发表于《Journal of Chemical Information and Modeling》上,深入探讨了异核单量子相干(HSQC)核磁光谱模拟与匹配方法在分子鉴定中的应用。研究团队旨在通过提高化合物的鉴定精度和数据库搜索效率,推动化学信息学领域的发展。

研究首先介绍了HSQC技术的重要性,该技术通过连接氢谱和碳谱的化学位移,提供了一种分子结构的独特指纹。然而,由于实验中的各种限制,如峰值重叠、样品纯度等问题,使得从HSQC数据中准确鉴定分子结构成为一个挑战。

为了应对这一挑战,研究团队评估了四种不同的HSQC模拟技术:ACD/Labs(ACD)、MestReNova(MNova)、基于密度泛函理论(DFT)的高斯NMR计算,以及基于图的机器学习(ML)模型。他们特别为DFT和ML技术开发了一种重建逻辑,以结合氢谱和碳谱生成HSQC光谱。

研究中还实施了三种峰匹配策略和三种填充策略,以解决不同光谱间峰值数量的差异问题。通过这些策略的组合,研究团队能够显著提高分子结构鉴定的准确性,并成功地从大量数据库中快速检索出正确的分子结构。

总体而言,这项研究不仅为HSQC光谱分析提供了新的视角和工具,而且为化学家和材料科学家在分子结构鉴定和数据库搜索方面提供了宝贵的资源,有望极大地提高相关领域的工作效率和准确性。
ACD/Labs软件在HSQC谱图预测上的优势

在这项研究的背景下,ACD/Labs(ACD)软件显示出了其在分子结构鉴定方面的显著优势。在所比较的四种模拟技术中,ACD 技术以最高的准确度脱颖而出,在测试的848个分子中,有455个分子的峰值数量被准确识别。相比之下,MNova 在此任务中的表现略逊一筹,正确识别的分子数量为仅有354个。而基于 DFT 计算和 ML 预测的光谱重建技术,其表现则介于这两款商业软件之间,分别正确识别了379个和378个分子的峰值数量。

图 S1. ACD、MNova、DFT 和 ML 技术的HSQC峰值重建性能比较。条形图展示了每种方法的峰值计数差异(Δ0、Δ1、Δ2 和 Δ3)的分布。在这里,“偏差窗口”指的是与正确峰值数量的可接受偏差范围;例如,Δ0 要求完全匹配,而 Δ3 允许最多偏差三个峰值。ACD 显示出最高的准确性,而 MNova 的准确性表现最低。


图 3:实验数据与各种模拟方法(ACD、MNova、DFT 和 ML)的峰值数量不匹配,以直方图形式绘制,箱形图表示真实数据(GT)与模拟光谱之间的峰值数量差异。每个子图的内嵌文本提供了总差异、正确分配、平均误差和标准偏差。


图 4:使用平均绝对误差(MAE)评估模拟技术。(a) 比较标准化的MAE,(b) 匹配的1H NMR化学位移的平均MAE的热图,(c) 匹配的13CNMR化学位移的平均MAE的热图。 


如需了解该文章的更多信息,请查看原文。

文献来源:J. Chem. Inf. Model. 2024, 64, 3180−3191

https://doi.org/10.1021/acs.jcim.3c01735



ACDLabs
核磁结构定性,质谱结构定性,色谱分析方法开发,理化性质预测,药物分子设计。
 最新文章