这周起,我们将介绍《Chem》期刊中2022-2023年度与密度泛函理论(DFT)、分子动力学模拟(MD)、机器学习、深度学习以及神经网络相关的文章,搜索方式就是在《Chem》主页搜索框搜索“Machine Learning;Deep Learning;Neural Network;Transfer learning;DFT;Molecular dynamic simulation”等关键词,时间跨度选择2022-2023年。根据搜索结果,我们筛去了以前本公众号报道过的相关文章,选取了其中的十篇被引率量靠前的文章进行报告,以供大家学习和参考。这一期是6~10。 1.Chem:数据科学使一类新的手性磷酸催化剂的发展成为可能 BINOL类手性磷酸(CPAs)的广泛成功,促使了多种高分子量且具有空间位阻的衍生物的开发。在此,研究者提出了一种替代性、简约的手性磷酸骨架,其仅包含一个点手性。利用数据科学技术选择了多样化的催化剂训练集,并以8-氨基喹啉的转移氢化反应作为基准。通过单变量分类算法和多变量线性回归分析,研究者解析出实现高选择性所需的关键催化剂特征,进而构建了一个简单的催化剂模型,可预测数据集外催化剂的选择性。该工作流程成功推广至一个具备更高选择性的催化剂,其对映体选择性(er)高达95:5,优于之前报道的肽类和BINOL类催化剂。随后,这些技术成功应用于另外两种转化反应。总体而言,这些例子展示了将理性设计与数据科学(从头算)相结合的强大效力,为催化剂开发中的反应活性探索提供了高效途径。参考文献:Liles, J. P., Rouget-Virbel, C., Wahlman, J. L., Rahimoff, R., Crawford, J. M., Medlin, A., ... & Sigman, M. S. (2023). Data science enables the development of a new class of chiral phosphoric acid catalysts. Chem, 9(6), 1518-1537.原文链接:https://www.cell.com/chem/fulltext/S2451-9294(23)00112-2 2. Chem:用DFT预测磺胺中间体E/Z选择性来指导酰胺的直接对映选择性α-胺化 手性胺类化合物是一类极其重要的化合物,始终需要高效的合成方法。在此,研究者报道了一种前所未有的制备手性 α-氨基酰胺的方法,该方法使用廉价且丰富的起始材料。研究者的策略基于手性纯亚磺酰胺对酰胺的直接氨化,涉及一个关键的亚砜鎓中间体的[2,3]-σ迁移重排。研究者进一步展示了如何通过量子化学计算预测该氨基-烯醇氧-亚砜鎓物种的关键E/Z选择性,从而获得深入的选择性见解。参考文献:Feng, M., Fernandes, A. J., Meyrelles, R., & Maulide, N. (2023). Direct enantioselective α-amination of amides guided by DFT prediction of E/Z selectivity in a sulfonium intermediate. Chem, 9(6), 1538-1548.原文链接:https://www.cell.com/chem/fulltext/S2451-9294(23)00121-3 3. Chem:利用计算工程材料加速锂基电池的设计 满足可再生能源市场需求,推动了高能量密度、温度自适应、可持续、安全且具成本效益的电池工程设计。识别实现这一目标的关键参数,需要将技术进步与电池的基本组件(包括正极、负极和电解质)相连接,并对其进行准确的特性表征。数据驱动的电池设计通过对基础材料性质和现象的多尺度研究,进一步推动整体技术改进。这包括计算模拟、机器学习和经济学分析。本文选取了锂离子、锂金属、锂硫和无负极锂电池材料,以有利于电池应用的特性调控。首先,本文提出了一种材料选择和性质调控的基础计算方法,将精确的原子模拟、机器学习和数据驱动技术相结合。随后,该方法在加速锂基电池正极、负极和电解质设计中的应用进行了探讨。除了扩展到通用电池性能指标和全固态电池的发展,本文最终对如何通过实施所述方法改进未来研究提出了建议。参考文献:Maiti, S., Curnan, M. T., Maiti, K., Choung, S., & Han, J. W. (2023). Accelerating Li-based battery design by computationally engineering materials. Chem, 9(12), 3415-3460.原文链接:https://www.cell.com/chem/abstract/S2451-9294(23)00462-X 4. Chem:基于二级结构约束的基于注意力扩散模型的新生蛋白生成设计 研究者提出了两种生成式深度学习模型,可基于二级结构设计目标预测氨基酸序列和3D蛋白质结构,分别依据整体结构含量或每个残基的结构。这些模型对不完美输入具有鲁棒性,并具备去 novo 设计能力,能够发现天然机制或系统中尚未发现的新蛋白序列。基于残基级别的二级结构设计模型通常能生成更高准确性且更具多样性的序列。这些结果表明,在已知蛋白之外的庞大氨基酸序列中,存在未探索的蛋白设计和功能开发的潜力。研究者的模型基于注意力机制的扩散模型,使用实验已知的3D蛋白结构数据集进行训练,能够广泛应用于各类生物和工程系统的条件生成设计。未来的研究可包括进一步的条件约束,探索生成蛋白的其他功能属性,以实现结构目标之外的多种应用。参考文献:Ni, B., Kaplan, D. L., & Buehler, M. J. (2023). Generative design of de novo proteins based on secondary-structure constraints using an attention-based diffusion model. Chem, 9(7), 1828-1849.原文链接:https://www.cell.com/chem/fulltext/S2451-9294(23)00139-0 5. Chem:计算如何加速电催化剂的发现 电化学能量转换作为一种可持续的方式,通过将小分子转化为更高价值的产物,已成为缓解能源短缺和环境污染的最有前景的方法之一。然而,该技术的实际应用受到低成本、高活性和高耐久性电催化剂发展的限制。在过去的几十年里,电催化剂的发现取得了巨大进展,计算方法在其中发挥了不可替代的作用。受此启发,研究者在本综述中介绍和讨论了“计算如何加速电催化剂的发现”,并从提供洞见和指导原则的角度进行分析。首先,通过一些典型的实例,总结了旨在识别活性位点和理解反应机制及活性起源的理论研究进展。随后,重点介绍了优异电催化剂的设计原则和筛选策略。最后,对该领域的未来前景进行了展望。参考文献:Ling, C., Cui, Y., Lu, S., Bai, X., & Wang, J. (2022). How computations accelerate electrocatalyst discovery. Chem, 8(6), 1575-1610.原文链接:https://www.sciencedirect.com/science/article/pii/S2451929422001528