第一作者:郭华章、鹿雨豪、雷振东、鲍红
通讯作者:王亮、刘政、汤碧珺、关存太
通讯单位:上海大学、南洋理工大学
论文链接:https://www.nature.com/articles/s41467-024-49172-6
2023年10月,诺贝尔化学奖颁给了三位科学家,以表彰他们在“量子点的发现和合成”方面做出的杰出贡献。近年来,碳量子点(CQDs)的研究被广泛关注。然而,面对众多合成参数,确定优异性能碳量子点的最佳合成条件一直存在挑战。基于此,上海大学王亮研究员团队联合新加坡南洋理工大学刘政教授团队、关存太教授团队近日在人工智能引领诺奖级量子点材料性能取得重要进展。相关成果以“Machine learning-guided realization of full-color high-quantum-yield
carbon quantum dots”发表在国际知名期刊《Nature Communications》(影响因子为16.6)。本研究提出了一种创新的多目标优化策略,借助机器学习(ML)人工智能算法来指导碳量子点的合成过程。通过闭环方法从有限且稀疏的数据中学习,大幅缩短研究周期,超越了传统的试错方法。此外,该方法还揭示了合成参数与目标属性之间的复杂联系,并统一目标函数以优化多个期望属性,如全色光致发光(PL)波长和高PL量子产率(PLQY)。仅通过63次实验,就实现了全色荧光碳量子点的合成,其高PLQY超过60%。该研究代表了ML引导碳量子点合成的重要进展,为开发具有多个期望属性的新材料奠定了基础。
近几十年来,发光材料因其在发光二极管、生命医学和太阳能电池等领域的多功能光电应用而受到了广泛的关注。其中,碳量子点由于低成本、环境友好性、尺寸可调性和优异的光学性能等特性,已成为一种很有前景的替代传统发光材料。最近的研究表明,碳量子点的性质不仅由其化学构成决定,同时也受到其合成过程的影响。例如,碳量子点在不同的反应温度和反应时间下,可能会表现出截然不同的发光特性。这种现象使得碳量子点的制备变得复杂,因为常用的水热法等合成技术涉及众多参数,如温度、反应时长、溶剂选择以及催化剂的使用,这些因素共同构成了一个广阔而繁复的优化空间。为了获得特定性能的碳量子点,研究人员必须在实验室中进行无数次的试验。这个过程既耗时又劳力,而且往往只能得到次优的结果。
在探索碳量子点的合成过程中,研究人员一直面临着如何优化这些材料性能的挑战。随着机器学习技术的进步,我们找到了一条新路。机器学习,作为一种先进的人工智能技术,已经证明了自己在解析材料描述符与所需属性之间复杂关系上的价值,尤其是在处理高维和复杂的搜索空间时。然而,目前的研究大多数只关注于材料的单一目标性能,这在实际材料设计中是不足够的。例如,荧光碳量子点的光学特性包括两个关键的性能指标——光致发光波长和量子产率,它们共同决定了材料的光学性能。此外,以往的研究即使聚焦于单一特性,也需要大量的实验或计算数据(通常不少于500组),才能达到预期的目标。面对如此庞大的搜索空间和多重目标属性,寻找最优的合成条件变得异常艰难。这就迫切需要我们开发出一种高效的优化策略,这种策略不仅能够利用机器学习模型,而且能在解决多个期望特性方面发挥同步作用。
本研究提出了一种新的多目标优化(MOO)策略来优化指导合成多目标的碳量子点,仅在20次迭代实现了具有全色荧光且高荧光量子产率(PLQY)的碳量子点,并进一步揭示了合成参数和双重目标属性之间的构效关系。
主要创新点如下:
(1)首次利用机器学习的MOO策略实现了碳量子点的多目标合成优化:PL波长覆盖410-645 nm(即全色),且全部7个颜色的PLQY超过60%。
(2)该模型基于23个初始数据,通过复杂的闭环系统,仅经过20次迭代就完成了所需性质的优化(每次序列执行两个最优推荐条件),累计涉及63个实验。
图1 ML指导合成具有优越光学性质碳量子点的流程示意图合成参数对碳量子点的目标性能有显著影响。然而,同时调整各种参数来优化多个期望属性是极其复杂的。为了解决这一问题,本研究采用机器学习(ML)的多目标优化(MOO)策略引导合成碳量子点(总体流程如图1所示),该策略主要包括数据库构建、多目标优化制定、MOO推荐和实验验证四个关键部分。为了建立初始训练数据集,本研究在前期实验中收集了23个在不同随机选择参数下合成的碳量子点样本,并用实验验证其荧光(PL)波长和荧光量子产率(PLQY)。具体而言,主要采用2,7-二羟基萘和不同催化剂(硫酸、醋酸、乙二胺和尿素)在不同的溶剂(包括去离子水、乙醇、N,N-二甲基甲酰胺、甲苯和甲酰胺)中反应制备碳量子点。探究的8个合成反应参数包括:前驱体质量(Mp)、催化剂类型(C)、催化剂的体积/质量(Vc)、溶液类型(S)、溶液体积(Vs)、斜坡速率(Rr)、反应温度(T)和反应时间(t)。为了实现双重目标,MOO策略基于ML模型的预测结果。由于高维搜索空间和有限的实验数据,建立能够很好地推广到未见数据上的模型具有挑战性。为了解决这一问题,本研究采用了基于梯度增强决策树的模型(XGBoost),在给定的数据集上分别拟合了两个通过最优超参数优化的回归模型,一个用于预测PL波长,另一个用于预测PLQY。然后,这些模型被用于预测所有未探索的候选合成条件。候选条件的搜索空间由8个合成参数的所有可能值的笛卡尔积定义,从而得到约2000万个可能的组合。利用MOO评价策略和预测结果,对未探索的候选合成条件进行了进一步排序。最终,通过实验和表征验证了在前两个推荐合成条件下制备的碳量子点的PL波长和PLQY值,并将其结果加入到训练数据集中,用于MOO设计循环的下一次迭代。迭代设计循环继续进行,直到目标实现,即当所有七种颜色实现的PLQY超过50%时。图2 基于ML的MOO策略指导下的全色荧光碳量子点合成评价。(a) MOO的统一目标效用与设计迭代。(b)在新的合成实验条件下探索的颜色。(c)预测目标属性与实际目标属性之间的均方差。(d) 8个合成参数与2个目标属性之间相关性的协方差矩阵。(e)整个探索空间的二维t分布随机邻居嵌入图,包括未探索(圆形点)、训练(星形点)和探索(方形点)条件。为了评估ML的MOO策略在碳量子点的合成过程的有效性,我们采用了一系列指标来确定我们的方法是否不仅满足其双重目标,而且在整个迭代过程中提高了预测精度。统一的目标函数衡量了这两个期望的目标通过实验实现的程度,因此可以作为本研究所提出的方法在指导碳量子点合成方面的有效性的定量指标。MOO策略将目标效用值提高了39.27%,达到75.44,表明所有7种颜色的最大PLQY都超过了50%(如图2a)。如图2b所示,MOO策略系统地探索每种颜色的合成条件,解决那些尚未达到设计的PLQY阈值的条件。在每5次迭代中,单一碳量子点的颜色显示了其最大PLQY的增强。最初,黄色的PLQY激增到65%,然后在接下来的5次迭代中,紫色的最大PLQY从44%显著上升到71%。这一趋势继续在青色和绿色中体现,其中最大的PLQY分别升级到94%和83%。经过20次迭代,所有颜色的峰值PLQY均超过了60%。一些碳量子点的颜色接近70% (包括紫色、蓝色和红色),而另一些甚至接近100% (包括青色、绿色和橙色)。由于MOO策略基于ML预测对候选合成条件进行排序,评价ML模型的性能是至关重要的。我们采用均方误差(MSE)作为评价度量,它是基于ML模型预测的PL波长和PLQY与实验确定的值计算的。如图2c所示,PLQY的MSE在短短4次迭代中就从0.45大幅下降到约0.15,并随着迭代的进行,最终稳定在0.1左右。同时,PL波长的MSE始终保持在较低的水平,低于0.1。这表明ML模型在增强的数据中不断学习后,对PL波长和PLQY的准确性持续提高。这不仅证明了MOO策略在优化多个期望属性方面的有效性,还在改进ML模型方面取得了显著进展。为了揭示合成参数与目标性质之间的相关性,进一步计算了协方差矩阵。如图2d所示,8个合成参数之间的相关性普遍较低,说明每个参数为碳量子点合成条件的优化提供了独特和互补的信息。除了反应时间和温度外,PL波长和PLQY都是由不同的合成参数决定的。这再次证明,在高维搜索空间下,如果没有合适的ML集成方法,合成参数和多目标属性之间的复杂相互作用很难展开。为了可视化MOO策略如何仅使用63个数据样本在广阔的搜索空间(~2000万)中导航,我们使用t分布随机邻域嵌入(t-SNE)将其投影到一个新的简化嵌入空间,将初始训练、探索和未探索的空间压缩为二维空间。如图2e所示,通过颜色识别不同的聚类模式具有挑战性,进一步强调了ML驱动的方法在解析数据中隐藏的复杂性方面的关键作用。ML模型的有效性依赖于训练数据的质量。本研究开发的ML模型受益于随机和稀疏分布的训练数据,这反过来鼓励模型进一步推广到搜索空间中以前未见的区域,并有效地指导在这个复杂多目标优化条件下最优合成条件的搜索。图3 全色荧光碳量子点的光学性质。(a)碳量子点的归一化PL光谱。(b)碳量子点在365 nm紫外光照射下的照片。(c)碳量子点的HOMO和LUMO能级的依赖关系。借助机器学习的多目标优化策略,我们快速确定了合成高PLQY全色碳量子点的最优条件。在本研究中,我们从众多碳量子点中筛选出10种光学性能最好的样本,进行了深入的光谱和结构分析。结果表明,这些全色碳量子点涵盖了从紫色到红色的广泛颜色范围(如图3a-b所示),其归一化PL光谱中,PL峰从410 nm的紫色碳量子点延伸到645 nm的红色碳量子点,而且它们的PLQY普遍高于60%。为了深入了解这些碳量子点的性质,我们计算了它们的带隙能量,发现其从紫色3.02 eV逐渐降低至红色1.91 eV。此外,我们还利用紫外光电子能谱测量了碳量子点的最高占据分子轨道(HOMO)能级和最低未占分子轨道(LUMO)能级。如图3c所示,HOMO能级呈现出波浪般的起伏,缺乏明显的规律性。这一发现进一步证实了机器学习的MOO策略在预测和优化方面的强大能力,仅通过40组实验,它就能从庞大而复杂的搜索空间中精准筛选出这些高质量的碳量子点。图4 全色荧光碳量子点的形态表征及合成参数与光学性质的关系分析。(a)全色荧光CQDs的横向尺寸和颜色(插图:PL波长与全色荧光碳量子点横向尺寸的关系)。(b-c)HRTEM图像和紫色、蓝色、青色、绿色、黄色、橙色和红色碳量子点的傅里叶变换模式。(d)PL波长(左)/PLQY(右)和7个碳量子点合成参数的箱线图。为了揭示合成的碳量子点所展现的可调谐光学效应的机理,我们对它们进行了XRD、FT-IR、XPS和TEM等一系列的表征,以全面研究了它们的形态和结构特征。从透射电镜图像发现这些碳量子点呈现出均匀且单分散的纳米点。10种全色碳量子点的平均尺寸分别为1.85 nm、1.95 nm、2.0 nm、2.09
nm、2.13 nm、2.15 nm、2.19 nm、2.24 nm、2.27
nm和2.30 nm,这与它们的相应PL波长保持一致,进一步证明了碳量子点的量子尺寸效应(如图4a)。进一步地,高分辨率透射电镜图像观察到具有良好分辨率晶格条纹的碳量子点的高结晶性结构(图4b-c),且其晶面间距为0.21
nm,对应于(100)石墨平面,进一步证实了XRD数据。这些分析数据表明,合成的碳量子点具有类石墨烯的高结晶度特性,从而产生了其优越的荧光性能。为了深入探索搜索空间,本研究有效地运用机器学习方法,对63个样品进行系统分析。我们采用盒形图来揭示合成参数和合成的碳量子点光学性质之间的复杂相互作用。如图4d所示,在高温、长反应时间和低极性溶剂的存在下,碳量子点的PL波长具有红移趋势。这一现象与先前的研究结果相吻合,说明这些合成参数可以促进前驱体分子融合和成核生长,进而形成更大粒径且PL波长长的碳量子点。进一步地,我们对现有文献进行了全面梳理,发现前驱体和催化剂,通常包括电子供体和接受,对于形成长波长碳量子点具有重要作用。与传统的观念相反,本研究在机器学习的指导下,成功合成了以2,7-二羟基萘为前驱体,催化剂乙二胺为供电子,从而得到了长波长红色碳量子点。这一突破性发现挑战了传统观念,并为长波长碳量子点的设计提供了全新的视角。在探讨碳量子点的光学性质时,我们特别关注了PLQY这一关键指标。本研究中,催化剂乙二胺具有更强供电基团,显著增强了碳量子点的PLQY,这与我们研究团队之前的观察结果一致。值得注意的是,在高PLQY情况下,我们观察到PLQY与反应温度、反应时间和溶剂极性之间存在显著的正相关性,这一发现尚未在现有文献中得到阐述。除了已讨论的合成参数,其他因素如斜坡速率、前驱体的用量和溶剂体积,同样在碳量子点的性质塑造中扮演着重要角色。综合来看,碳量子点的发射颜色和PLQY受到众多因素之间复杂非线性相互作用的影响。值得注意的是,传统方法在调整碳量子点特性时,往往伴随着PL波长的红移,同时PLQY却有所下降,这无疑限制了碳量子点的应用范围。然而,借助机器学习的智能辅助合成,我们成功地将全色碳量子点的PLQY提升到了60%以上,这一成果不仅凸显了机器学习引导的合成策略的独特优势,也证实了机器学习方法在高维搜索空间中精准导航合成参数与目标特性之间错综复杂关系的巨大潜力。这一突破性进展,不仅为碳量子点的研究开辟了新的视角,也为未来的合成策略提供了全新的思考方向。本研究成功地开发并实现了基于机器学习的多目标优化策略,用于合成高PLQY的全色碳量子点。这种策略通过利用有限和稀疏的数据,揭示了合成参数和目标特性之间的构效关系,特别是PL波长和PLQY。同时,通过统一目标函数,优化了多种期望的特性,包括全色荧光和高PLQY。经过仅63次机器学习引导实验,本研究成功制备出了从蓝光到红光的可调全色荧光碳量子点,其所有颜色的PLQY显著超过60%。这些碳量子点的粒径与其相应的PL波长之间存在线性关系,这揭示了碳量子点固有的量子尺寸效应。与其他材料合成中的机器学习应用不同,本研究的方法在相对较少的实验中,成功优化了多种特性。这种能力不仅节省了时间和资源,而且为材料合成的早期探索提供了新的可能性,与传统的试验误差方法相比,显示出较大的飞跃和广阔的应用前景。郭华章,博士毕业于上海大学(导师:王亮研究员),现为上海大学博士后(合作导师:吴明红院士)。研究方向为碳纳米功能材料的可控制备及其应用研究,在Nature Communications、Advanced Functional Materials、Materials Today等期刊发表论文12余篇。鹿雨豪,新加坡南洋理工大学博士(导师:关存太教授),研究方向为人工智能驱动的材料科学研究。在Nature Communications、Materials Today、ACS Nano等期刊发表论文6篇。雷振东,新加坡南洋理工大学研究员、博士生导师。研究方向为功能性纳米材料的合成与应用。聚焦于纳米材料的结构设计、合成、表征及应用方面。已发表SCI一区论文14篇,累计影响因子320.389,SCI他引1171次,包括3篇Nature Communications,1篇Chem,3篇Advanced Materials,3篇Advanced Energy Materials等,其中第一作者论文12篇,2篇入选ESI高被引论文。鲍红,上海大学硕士研究生,研究方向为二维纳米材料的合成设计及其在光催化中的应用,在Nature Communications和Carbon期刊发表论文2篇。关存太,新加坡南洋理工大学教授、博士生导师。新加坡工程院院士(Academy of Engineering Singapore)、美国国家发明家科学院院士(National Academy of Inventors USA)、国际电气电子工程师学会会士(IEEE Fellow)、美国医学与生物工程学会会士(AIMBE Felow)。研究方向为非植入式脑机接口、神经工程和人工智能。他长期专注于脑机接口的算法研究和系统研究,及其在医疗领域的应用。已发表超过400篇期刊和会议论文(引用超过27,000次)。拥有超过25项国际授权专利和申请,共有15项专利和技术完成产业化,技术转让给多家公司。因脑机接口研究的贡献而获得国际脑机接口年度研究奖一等奖、萨勒曼国王残障研究国际大奖、南洋研究奖、新加坡杰出工程成就奖等。现任新加坡南洋理工大学校长讲席教授、南洋理工大学人工智能研究院院长、新加坡康复研究院联席院长、先进智能研究院联席院长、和脑计算研究中心主任。汤碧珺,新加坡南洋理工大学特聘研究员,研究方向为新型二维材料的制备与应用,人工智能驱动的材料科学研究。在Nature, Nature Materials, Nature Electronics, Nature Synthesis等顶级学术期刊发表学术论文30余篇,其中以第一/共一/通讯作者身份在Nature Electronics, Nature Communications, Advanced Materials,Materials Today,Advanced Functional Materials,JACS,ACS Nano等发表SCI论文10篇,总影响因子达200。所获奖项包括:福布斯亚洲30岁以下精英榜,南洋理工大学校长博士后研究基金,国家优秀自费留学生奖学金,南洋理工大学理工科女性发展基金等。刘政,新加坡南洋理工大学教授、博士生导师。研究方向为二维材料的合成与应用。近年的工作主要集中在二维过渡金属硫化物等材料的合成与光电器件和催化应用。已发表了350多篇论文,其中包括Nature和Science系列期刊50余篇,引用超过60000次,h-index为123,高引论文60多篇,连续五年入选科睿唯安全球高被引科学家。所获奖项包括:亚太经合组织科学创新、研究和教育奖(ASPIRE奖),新加坡青年科学家奖,ICON-2DMAT青年科学家,Asia’s Rising Scientists,ACS Nano Rising Star Lecture, Nano Research Young Star Editors,南洋研究奖等。现任新加坡南洋理工大学校长讲席教授及新加坡材料研究学会讲席教授。王亮,上海大学研究员,博士生导师,师从中国工程院院士吴明红教授。研究方向一直从事碳纳米功能材料的绿色可控制备与应用相关研究工作,近年来在Science Advance、Nature Communications、Advanced Materials、Advanced Functional Materials、Materials Today、Angewandte Chemie International Edition和ACS Nano等期刊上发表SCI论文100余篇,其中热点论文4篇,ESI高倍引论文18篇,封面论文8篇,论文他引次数超过8500次,h-index为50。先后主持国家自然科学基金面上项目、国家自然科学基金青年项目、上海市浦江人才计划、上海市青年科技英才扬帆计划、中国博士后基金、上海市博士后基金等多项基金。2022年入选上海市东方学者。课题组主页https://www.x-mol.com/groups/wangliang