在材料科学中,发现能够产生具有明确光学特性的纳米材料的配方既昂贵又耗时。本文提出了一个机器学习驱动的高通量微流控平台的两步框架,以快速生产具有所需吸收光谱的银纳米颗粒。该算法框架结合了基于高斯过程的贝叶斯优化(BO)和深度神经网络(DNN),能够在采样120个条件后向目标光谱收敛。一旦数据集足够大,可以在目标光谱区域以足够的精度训练DNN, DNN就可以用于预测反应合成可获得的调色板。在保持可解释性的同时,所提出的框架有效地优化了纳米材料的合成,并可以提取化学成分与光学性质之间关系的基本知识,例如每种反应物对吸收光谱形状和振幅的作用。在本文中的两步机器学习框架,它可以驱动HTE平台从筛选过程的最开始(稀疏数据集)到更精细的筛选状态(大型数据集),以预定的光学性质为目标,并且在没有任何模型复杂性的先验知识的情况下,提取有关化学过程如何影响合成材料光学性质的知识。由于种子颗粒的成核和溶液中已有种子的生长之间存在固有的非线性竞争,因此湿化学纳米颗粒的合成非常难以调整。因此,选择银纳米颗粒(AgNP)合成来证明该框架的效率。AgNP的合成使用基于液滴的微流控平台进行,该平台有五个输入变量,如图1所示。图1:两步优化算法框架(蓝色框)由第一个HTE循环(运行2-5次)组成,其中BO(蓝色点)对参数空间进行采样以训练DNN,第二个循环(运行6-8次)允许DNN(橙色点)对参数空间进行采样以验证其回归函数。在基于液滴的微流控平台上对BO和DNN提出的条件进行了测试。测量每个液滴的吸光度光谱,并通过损失函数与目标光谱进行比较,然后将完全分辨的吸光度光谱提供给DNN。由于表面等离子体共振,AgNPs在UV-Vis范围内具有特征的光学指纹,这取决于它们的大小和形状分布。在本研究中,选择50 nm长边,10 nm高的三角形纳米棱镜作为光学目标,利用离散偶极子散射(DDSCAT)进行等离子体共振模拟计算。传统的贝叶斯优化(BO)通常被选择用于驱动HTE循环,因为它能够有效地探索参数空间和目标特定材料属性,即使是在稀疏数据启动时也是如此。然而,BO并不能提供对反应过程的一般见解。此外,它的性能取决于模型超参数的初始选择和损耗的定义——通常是一个单值输出参数,被测材料的性能被降低。为了从数据中提取知识,其他研究使用神经网络来训练回归模型,并从固定数据集进行逆设计。虽然神经网络甚至可以从全光谱中学习复杂函数,但它有许多超参数,并且需要大量的训练数据集,这使得它难以集成到具有有限初始数据和昂贵评估的机器驱动的实验环路中,并且在采样的早期阶段使用来探索参数空间效率低下。所提出的两步框架(图1)将BO的优化资产与深度神经网络(DNN)的回归能力相结合。在第一步中,在使用拉丁HyperCube (LH)采样进行了15个条件的第一次实验运行之后,使用具有局部惩罚(LP)的批处理模式BO启动优化过程。以高斯过程(GP)为代理模型的BO算法用于探索参数空间,其中边界最初由实验者设置,并找到导致目标光谱的化学条件。损失函数的定义同时考虑了吸光度谱的形状和强度。每次运行时,BO算法根据决策策略(获取函数)确定的最小化损失(开发)和最小化不确定性(探索)之间的平衡,选择下一批15个条件进行测试。同时,使用由BO采样生成的实验数据训练离线深度神经网络。在第二步中,从第六次运行开始,当BO继续提出具有相同超参数的另外15个条件并向DNN提供目标光谱周围的更多数据时,DNN用于在参数空间网格上为所有过程变量生成模拟光谱。通过这种方式,DNN能够通过对网格中的预测值进行排序来建议15个最小化损失函数的条件。深度神经网络架构和网格优化在“方法”中进行了描述。在HTE平台上对DNN和BO建议的条件进行了测试。在随后的运行中,只使用BO采样产生的实验数据来训练DNN,这可以直接比较BO和DNN的性能。当目标光谱被BO或DNN优化,并且DNN回归足够精确和稳定,可以提取化学合成的知识时,ml驱动的HTE循环停止。框架的详细数据流见补充图1。在此,我们首先证明了所提出的两步算法框架有效地优化了纳米材料的合成,以获得所需的等离子体共振。通过合成的AgNPs的TEM成像实验验证了优化的性能。接下来,通过提取BO和DNN回归函数,我们展示了优化过程是如何被人类解释的。最后,一旦建立了深度神经网络回归函数的稳定性和准确性,我们就可以使用深度神经网络来提取纳米粒子的化学成分和光谱特性之间的关系。优化性能为了评估框架的优化性能,跟踪了连续实验运行中损失的演变。每次运行由15个化学条件组成。在每种情况下,记录20个液滴副本的光谱并用于更新算法,并计算20个副本的中位数损失以处理异常值。由于中值损失用于更新BO,我们将导致运行的所有条件中中值损失最低的条件定义为最佳性能。在图2a中,我们报告了每个副本获得的损失值,以及最佳性能条件下副本的统计分布。在框架的第一步,BO最佳表现条件的中位数损失在第一次运行中迅速下降,然后从第4次运行开始达到平稳。图2:a RS(绿色)、BO(蓝色)和DNN(橙色)给出的条件下损失的演变:每个点代表一个液滴。对于每次运行,损耗最小的条件被确定为最佳性能。箱形图显示了运行中所有液滴样品的损耗值分布,灰色区域表示在停止HTE循环之前达到的最小损耗值。表现最佳的BO (b)和DNN (c)的吸光度光谱,以及溶液中三角形棱镜的尺寸分布表明,所选择的损失函数允许光谱向目标光谱收敛,棱镜向65 nm的三角形边缘收敛。吸光度光谱的颜色表示性能最好的液滴的颜色。透射电镜图像显示纳米棱镜的中值边缘尺寸在样品中发现。比例尺对应于50 nm。
由BO建议的最佳条件聚集在参数空间的边界处(Qseed越低,越高),这表明在参数空间边界之外可能会发现更好的构型。传统上,主动学习活动固定了参数空间的边界,这需要事先具备化学合成方面的专业知识。在我们的研究中,当我们探索一个从未探索过的参数空间时,我们面临着一个实验活动的现实,参数空间扩展的灵活性对于更接近目标光谱是必不可少的。如果建议的条件过于接近连续两次运行的设定边界,则该框架能够扩展参数空间。这种情况发生在运行4和5中。因此,从第6次运行开始,流量限制放宽到设备允许的最大值。没有对扩展参数空间进行初步筛选。基于BO的网格优化和基于dnn的网格优化都是利用它们在初始参数空间上的知识开始探索扩展空间。这种扩展允许进一步减少BO采样获得的最佳性能条件的中位数损失。从运行6开始引入DNN采样。有趣的是,DNN在第8次运行中获得的最佳表现条件的中位数损失明显低于BO(见图2a)。为了证明我们的两步方法的合理性,当让DNN使用网格搜索而不是使用BO采样条件对空间进行采样时,查看了DNN的优化性能。从运行1的同一组初始条件开始,我们表明DNN不能像BO那样快速地找到更低的损失条件(详见补充讨论2)。此外,我们通过将BO方法的性能与随机抽样(RS)进行比较(见图2a),在框架的第一步中证明了BO方法的非平凡性:可以在第2次运行中观察到RS的性能优于BO。但是在第3次运行中,BO表现优于RS,并且明显开始向较低的损耗值收敛,而RS仍然选择高损耗值。通过BO和DNN最优吸光度光谱向目标光谱收敛,进一步验证了优化结果。对于BO样品(图2b),主吸光度峰快速移动达到目标值(645 nm),而600 nm以下的吸光度强度下降。测量光谱向目标光谱的演化验证了本研究中使用的损失函数定义的有效性。图2c报告了每次运行时DNN最佳表现的测量光谱,以及DNN在采样前预测的光谱。虽然运行6中的预测光谱由于在刚刚进入的区域中训练不足而具有噪声,但即使DNN仍在采样条件的位置进行外推,在后续运行中光谱预测也趋于平滑。表现最好的样品用TEM成像(见“TEM成像和分析”)。主要合成了两种形状的纳米颗粒:纳米球和三角形纳米棱镜,这两种形状的纳米颗粒在尺寸上具有很大的不均匀性。三角形的百分比在不同的运行中保持在30%左右。此外,三角形纳米棱镜边缘长度(图2b, c)和纳米球直径(见补充图3)都随着运行而增加,BO和DNN的性能都达到最佳。吸收光谱随位移的变化与合成的三角形纳米棱镜的尺寸分布向所需三角形边缘长度的变化有关。由BO(图2b)和DNN(图2c)合成的三角形AgNPs的尺寸分布随着运行而变窄,三角形边缘向65nm收敛,比产生目标光谱的模拟纳米颗粒尺寸大30%。这种变化可以用三角形棱镜厚度的增加来解释:使用TEM测量,棱镜厚度估计在13nm左右。实际上,吸收峰的位置是由棱镜边缘长度与其厚度的纵横比决定的。值得注意的是,本研究中开发的方法使用了全光学吸收光谱。在先前的研究中,优化过程仅使用吸光度光谱的某些属性,如峰波长、半峰全宽度(FWHM)和峰强度。虽然使用有限的光谱特征对于快速优化问题是一个很好的选择,但在回归问题的情况下,它会减少用于训练DNN的光谱信息。由于AgNP的形状和大小的不均匀性导致了吸光度峰的叠加,因此整个光谱包含了纳米颗粒的完整尺寸和形状分布的信息。虽然将光谱一维还原为单个损耗值可以使BO保持高效,但DNN可以使用全光谱分辨率来获得高效优化并允许DNN准确预测AgNP颜色。这种全光谱方法还有两个额外的优点。首先,它不需要DNN架构适应检测到的特征数量,如果特征数量在筛选参数空间期间发生变化。其次,由于损失函数不需要适应吸光度目标,因此在优化过程中可以使框架对光谱目标的变化具有鲁棒性。(未完,下一篇继续探讨……)
参考文献:
Flow Chemistry: A Sustainable Voyage Through the Chemical Universe en Route to Smart Manufacturing
Amanda A. Volk1, Zachary S. Campbell1, Malek Y.S. Ibrahim1, Jeffrey A. Bennett1, and Milad Abolhasani1 View Affiliations Vol. 13:45-72 (Volume publication date June 2022) https://doi.org/10.1146/annurev-chembioeng-092120-024449First published as a Review in Advance on March 08, 2022
关注我吧,才有力气持续更新……
码字离不开大家的支持和鼓励,同时有误之处还请不吝赐教。