刁莹,出生在大兴安岭林海深处的加格达奇区——一片外人很少听说的“飞地”。这个来自偏远山区的女孩,会一路走过清华大学、美国麻省理工学院、斯坦福大学,直到成为美国伊利诺伊大学贝克曼研究所的一名教授,在化工专业、制药专业、柔性电子研究、高分子自组装研究等不同专业间丝滑转场,把自己的名字写在国际顶尖学术期刊上。今日,她以通讯作者身份发《Nature》!
人工智能引导的闭环实验已成为一种有前途的目标函数优化方法,但这种传统的黑箱方法在发现新化学知识方面的巨大潜力仍未得到充分开发。
鉴于此,伊利诺伊大学厄巴纳-香槟分校NicholasE.Jackson、刁莹、CharlesM.Schroeder、MartinD.Burke、AlánAspuru-Guzik联合报告了闭环实验与基于物理的特征选择和监督学习的集成,称为闭环转移(CLT),以在优化目标函数的同时产生化学见解。CLT用于研究决定用于各种有机电子应用的光收集供体-受体分子溶液光稳定性的因素,并显示了包括三重态流形高能区域的重要性在内的基本见解。这是在自动模块化合成和仅约1.5%的理论化学空间的实验表征后实现的。使用多个实验测试集增强了这种基于物理的光稳定性模型,并通过调整溶剂的三重激发态能量以突破闭环光稳定性优化过程中观察到的平台期来验证。CLT在其他材料系统中的进一步应用支持了该策略在增强闭环策略方面的普遍性。从广义上讲,这些发现表明,将可解释的监督学习模型和基于物理的特征与闭环发现过程相结合可以快速提供基本的化学见解。相关研究成果以题为“Closed-loop transfer enables artificial intelligence to yield chemical knowledge”发表在最新一期《Nature》上。从最初的假设形成到实验验证以及随后的发现驱动的进步,每个阶段都在指导闭环过程中发挥着关键作用。结果强调了三重态流形的高能区域在确定分子光稳定性方面的重要性,这一发现经过实验验证并用于进一步完善发现过程。图1说明了CLT过程中使用的三阶段方法,描述了假设生成、测试和发现的迭代和相互关联的性质。该过程的闭环性质,其中ML和BO不断获得实验数据以完善假设。这种迭代循环对于有效探索广阔的化学空间和识别分子特性的关键决定因素至关重要。该过程的闭环性质,其中ML和BO不断获得实验数据以完善假设。这种迭代循环对于有效探索广阔的化学空间和识别分子特性的关键决定因素至关重要。在初始阶段,该研究利用BO来导航DBA分子定义的化学空间。这一过程的驱动力是强调多样性,以避免偏见并确保广泛的探索。自动合成和表征在为闭环过程的每次迭代生成数据方面发挥着至关重要的作用。第一阶段的主要目标是通过迭代完善有助于光捕获分子的关键特性的光稳定性来优化光稳定性。ML衍生假设的出现标志着第一阶段的高潮。通过DFT计算和支持向量回归(SVR)模型的结合,该研究确定高能TDOS是光稳定性的关键决定因素。这一发现挑战了对最低三重态能量(T1)的传统关注,并为更高三重态在分子降解中的作用引入了新的视角。图2展示了研究中探索的化学空间,重点关注光捕获应用中使用的供体-桥-受体(DBA)分子。特征空间的主成分分析(PCA)投影,突出显示了基于供体和桥块特征的化学空间的组织。化学空间包括3个供体、7个pi桥和100个受体块,从而产生2200个可能的DBA分子。化学空间的多样性对于CLT过程至关重要,因为它确保了对潜在分子结构的广泛探索。构建块的模块化允许在闭环框架内进行系统变化和优化。图3提供了第三轮优化的快照,显示了根据BO建议选择用于合成的分子。它还详细介绍了自动合成中使用的反应条件以及表征光物理性质以评估光稳定性的过程。图4强调了机器学习在生成将分子特征与光稳定性相关联的可解释模型中的作用。第二阶段的重点是验证第一阶段产生的假设。该研究构建了一个独立的分子测试集,根据预测的光稳定性进行选择,以通过实验验证TDOS和光稳定性之间的相关性。结果证实了这一假设,显示预测的高绩效者和低绩效者之间的光稳定性存在统计学上的显着差异。这一阶段还探索了光降解的潜在机制,提出溶剂的T1态与DBA分子的TDOS的共振促进了Dexter能量转移,从而导致光降解。该研究通过实验验证这一机制的能力强调了CLT方法在生成可操作的化学知识方面的有效性。在最后阶段,研究应用经过验证的假设来指导进一步的发现工作。通过在不同溶剂中测试具有不同 TDOS 的分子,该研究展示了溶剂的选择如何影响光稳定性。这一阶段还探索了使用三线态猝灭剂来进一步增强光稳定性,为改善初始化学空间之外的分子性能提供了途径。第三阶段的结果凸显了 CLT 方法的潜力,不仅可以优化分子特性,还可以产生新的分子设计策略。该研究最后强调 CLT 在化学研究的其他领域具有更广泛的适用性,特别是在传统实验方法可能不太有效的低数据领域。本文报道的闭环实验,通过使用基于物理的特征的可解释的机器学习模型进行了增强,阐明了有关分子光稳定性的基本化学知识,同时针对高功能分子目标进行了优化。人机交互、人工智能引导的活动产生了本文的假设(30个分子),其显着效率归功于人工智能引导的探索和利用的平衡与可解释的基于物理的建模的结合。CLT被证明广泛适用于其他前沿应用和研究领域,特别是难以先验预测的低数据状态和多维分子特性。有理由相信,CLT将成为在假设驱动的发现研究中利用BO优势的手册,并通过基于物理的见解得到加强。