日本东北大学李昊等:如何应对热电材料人工智能领域的大数据挑战

2025-01-05 18:01   日本  

人工智能的发展正在改变材料科学领域。然而,大规模材料数据集中存在错误数据以及利用机器学习预测与温度相关的性质时出现过拟合等挑战

近日,日本东北大学李昊副教授等人Science China Materials发表研究论文,以热电材料为例,提出了一个处理和克服材料科学中的人工智能大数据挑战的示例。

本文要点
1) 首先采取一系列合理的方法删除问题数据,从Starrydata2数据库中获得包括7295种成分在不同温度下的92,291个数据。
2) 然后,提出了一种基于成分的交叉验证方法避免过拟合,进而使用梯度提升决策树方法构建了机器学习模型,并获得了显著的R2
3) 最后,使用该模型对Materials Project数据库中的材料进行评估,Ge2Te5As2Ge3(Te3As)2表现出较高的zT值。
4) 理论计算得到n型和pGe2Te5As2的最大zT值分别为1.982.12, n型和pGe3(Te3As)2的最大zT值分别为0.580.74,表明它们是有潜力的热电材料。
Figure 1. Workflow for the thorough preprocessing of the data from the Starrydata2 repository.
Figure 2. Illustration of how the dataset was split up based on composition using a 10-fold cross-validation.
Figure 3. Identification of outliers or problematic data using ML models and statistical analysis of the finally determined dataset. Performance of the ML model based on (a) 108,116 data points from 8541 different compositions and (b) 92,291 data points from 7295 compositions, using 10-fold cross validations. (c, d) Bar charts showing (c) the zT values and (d) the top 20 elements that appear most frequently in our dataset.
Figure 4. Calculated band structures. Electronic band structures for (a) Ge2Te5As2 and (b) Ge3(Te3As)2, showing the band energy levels along high symmetry paths in the Brillouin zone. The band energies are calculated at the PBE + SOC level of theory with the band gap shifted to the values obtained at the HSE06 + SOC level of theory. The Fermi energy is set to zero. The valence bands are shown in blue and the conduction bands in orange and plotted using the sumo code.
Figure 5. Calculated TE transport properties. Calculated (a, e) S, (b, f) σ, (c, g) κe, and (d, h) zT values for n- and p-type Ge2Te5As2 and Ge3(Te3As)2.

文章信息




Xue Jia, Alex Aziz, Yusuke Hashimoto, Hao LiDealing with the big data challenges in AI for thermoelectric materials. Sci. China Mater. (2024).

https://doi.org/10.1007/s40843-023-2777-2


击左下角“阅读原文”,阅读以上文章PDF原文

【扩展阅读】

SCMs文章合辑|热电材料

SCMs|热电Bi0.5Sb1.5Te3中扩散屏蔽层材料的筛选

SCMs|纳米结构和能带工程提高Bi-Sb-Te合金的热电性能

SCMs|通过键共价性增加策略获得高性能Cu3SbSe4基热电材料

SCMs|Q掺杂SnTe-GeTe合金(Q = Bi, Sb和Ag)中的晶格调制和电子能带优化

SCMs|TiFe1.1-xNixSb的结构和热电性能随Ni填充量的演变

SCMs|Cu1.8S基合金的热电性能和电稳定性增强:熵工程和Cu空位工程

SCMs|熵工程提高(GeTe)x(AgSb0.5Bi0.5Te2)1−x的热电性能和显微硬度

点击阅读全文,了解更多



数字催化+数字电池
Digital Catalysis Platform (DigCat) 数字催化平台及Dynamic Database of Solid-State Electrolyte (DDSE) 固态电池电解质平台 ,由日本东北大学李昊教授领衔开发
 最新文章