神经网络势函数天梯,eqV2再次登顶

学术   2024-11-08 15:34   天津  

AMatbench Discovery
An evaluation framework for machine learning crystal stability prediction

Matbench Discovery 是一个用于评估机器学习 (ML) 模型在预测固态热力学稳定性方面表现的预测(如能力/受力)交互式排行榜。这个项目测试了多种模型,涵盖了多种方法,如图神经网络 (GNN) 的原子间势等。

eqV2 S DeNS是equiformerV2基于DeNS降噪的最新算法,在Matbench Discovery榜单中限定训练MPtraj集排中第一。基于OMat24最新数据集,的eqV2 M在不限定训练集的排名中也位于第一。这是该榜单今年第三次易主,此前分别是MatterSim,ORB。

榜单中的模型参数量(model params)也是重要参考,虽然MACE,CHGNET排名稍后,但是这些网络的模型参数较小,可以在单精度卡RTX4090上实现训练。而排名靠前的eqV2,MatterSim模型参数量巨大,大力出奇迹,只能在双精度大显存显卡上实现训练,比如A100 80GB版本等。

Matbench Discovery与WBM(Wide Bandgap Materials) 原本是测试CHGNET和MAGNET用的测试数据集 。https://chgnet.lbl.gov/,现在以及发展成评估机器学习势函数精度的标准材料数据了。

WBM(Wide Bandgap Materials)数据集是一个旨在测试和研究稳定晶体材料预测模型性能的大型数据集合。该数据集于2021年发布,通过基于化学相似性的元素替换生成了257,487个独特的晶体结构。

    • 数据集通过在Materials Project (MP)源结构上进行单元素替换生成。替换元素的选择基于从无机晶体结构数据库 (ICSD) 中挖掘的化学相似性矩阵。

    • 数据集共进行了5轮替换,每轮都将生成的结构进行弛豫并识别那些位于凸包上的结构(代表稳定结构),最终约10%(约20,000个)被确认是稳定的。

    • 初始结构曾通过Google Drive提供,一部分链接由Halle大学托管(现已失效)。数据集可通过Materials Cloud获取,其中包括加载数据的Python脚本和说明文件。


    总结来说,神经网络势函数发展极为迅速,算力和算法是两个大关键,在诸多神经网络势函数算法中,基于等变图神经网络的算法已经优势明显,比如(MACE,eqV2等),算力方面具有大显存的80GB A100 已经是比必不可少的计算工具了。

    为此庚子计算推出A100 80GB显卡计算机器。单卡/双卡/四卡/八卡配置都有。购买A100机器软件都会配置好DeePMD-kit3,MACE,fair-chem(eqV2, Gemnet-OC)等环境。

    A100机器详情请咨询:

    庚子服务器联系方式(微信):

    理论计算科学
    致力于理论计算化学与材料科研学术内容知识的分享。
     最新文章