日本东北大李昊领衔开发:AI催化实验室前端升级版(DigCat 3.0)发布!

2024-09-13 13:36   日本  
摘要
数字催化平台DigCat是由日本东北大学李昊教授团队领衔,与全球范围内十余科研团队共同打造的融合大数据与人工智能的催化材料研究平台。平台汇聚了超过40万条电、热、光催化材料的实验性能数据和超过30万个催化材料结构。DigCat为用户提供强大的动态数据可视化、精准文献追溯以及智能问答助手,更有催化微观动力学理论建模,基于催化数据与知识库的AI聊天机器人、机器学习力场训练和回归模型建立等前沿功能。这是全球首个数字催化平台及全电催化实验数据库2024年9月1日,DigCat已更新至高度智能化的3.0版本
平台链接地址:https://www.digcat.org/
全文速览
基于“大数据平台+人工智能方法+精准理论建模”的研究方法是未来开发新型催化材料的主流趋势。由“大数据平台+人工智能方法+精准理论建模”构成的人工智能实验室前端为催化剂合成和性能表征提供了更有价值的尝试方案,对于节省开发成本、加快发现新型性能优异且成本低廉的催化剂具有重要意义。
内容简介
数字催化平台DigCat是由日本东北大学李昊团队领衔,与全球范围内十余科研团队共同打造的融合大数据与人工智能的催化材料研究平台。平台汇聚了超过40万条电、热、光催化材料的实验性能数据和超过30万个催化材料结构。DigCat为用户提供强大的动态数据可视化、精准文献追溯以及智能问答助手,更有催化微观动力学理论建模,基于催化数据与知识库的AI聊天机器人、机器学习力场训练和回归模型建立等前沿功能。这是目前全球首个数字催化平台及全电催化实验数据库。
截至2024年9月12日,数字平台包含超过40万个实验数据点和超过33万个理论结构,全面涵盖各种材料类型,共120余种催化反应、共超过200个性能指标的数据。主要包括氧还原反应、析氧反应、析氢反应、合成氨、二氧化碳还原,双氧水合成、臭氧合成、氢、氨氧化反应、氮气、氨气氧化反应、电催化加氢、环氧烯烃合成、尿素合成、甲醇乙醇重整制氢与各类有机催化反应等,同时涵盖多种材料,包括过渡金属及其合金,金属氧化物,氮化物,碳化物,硫化物,磷化物,贵金属,单原子催化剂、二维材料、钙钛矿等。除了贵金属和其他经典催化材料外,截至2024年9月10日,DigCat数据库对于各类M-N-C电催化剂的实验文献数据收录最为全面,其中包括单原子、多原子金属团簇掺杂的缺陷石墨烯,单原子分子片段催化剂,共价有机框架材料(COF)、金属有机框架材料(MOF)以及金属掺杂的石墨相氮化碳(g-C3N4)等新型非贵金属电催化剂体系。
动态数据可视化
用户只需选择反应类型和材料类型,平台即可默认显示以年份为横坐标的性能数据。通过修改横、纵坐标类型或输入感兴趣的元素,用户可以轻松实现数据的动态可视化。平台还提供数据分类分析功能,例如按测试pH值对实验数据进行分类,并显示不同pH条件下的性能图表。针对特定条件,平台也提供了限定反应条件的滑动条,帮助用户快速筛选数据。对于热点研究领域如海水电解、磁性催化、介导合成氨、介导环氧化等,平台支持一键筛选相关文献。
精准文献追溯,理论结构以及智能问答助手
筛选后的文献可进一步使用平台的扩展功能,如原文追溯与AI问答。用户只需将鼠标悬停在数据点上,即可查看催化剂ID和DOI,并通过对话框跳转至原文链接。此外,用户还可以在线查看经过实验验证的理论结构,下载相关计算文件或实验数据,用于建立或验证理论或机器学习模型。针对特定结构或文献,AI问答功能可帮助用户快速获取制备原料、方法、工艺、性能分析等详细信息,通过输入文献ID即可快速获得答案。
DigCat大量数据统计结果分析还为实验标准化和可靠性分析提供了有力支持。通过对比大量文献中同一常见对比样品的性能,用户可以轻松识别实验数据中的噪点,并排查可能的原因。这不仅帮助规范实验操作和数据处理流程,还能确保获取更可靠、可重复的实验数据。
实验噪点分析
通过将规范化的文献数据与大语言模型相结合,DigCat新推出了AI催化聊天科学家功能。相比原始版本与基于pdf文字知识库的聊天机器人,结合DigCat格式化数据知识库的聊天机器人DigCat-GPT在回答催化领域专业问题时,能够提供更具体、更详细且更具指导意义的解答。此外,DigCat还整合了更多材料数据库作为材料源,包括穆斯堡尔谱数据库、固态无机与有机电解质数据库、热电材料数据库。通过大语言模型将这些材料的基础结构与特性与文献中的需求进行匹配,显著扩展了AI催化科学家预测催化剂的潜在材料范围。
除了基于数据和大语言模型的预测,DigCat平台还提供了最先进的理论建模工具和机器学习模型训练模块,以提升催化剂材料预测的可靠性。通过pH-电场耦合的微观动力学建模功能,用户可以选择所需的反应类型和模型,并输入线性标度关系、电场响应参数、零点能、熵和溶剂化校正、电极电势等必要计算参数,从而获得精准的催化反应活性火山图,为实验研究提供更可靠的理论支持。
AI催化科学家
理论火山模型
此外,DigCat平台的理论建模功能还包括了构建机器学习力场势所需的大量催化相关稳定结构模型和过渡态结构模型。用户只需输入材料类型、元素类型及是否包含能量、力或压强等信息,即可快速下载相关基础结构,用于机器学习力场训练,从而为加速理论建模中的DFT计算提供坚实的数据基础。

机器学习力场

DigCat开发团队汇聚了来自全球多所学术机构的研究人员。目前DigCat 3.0处于公测阶段,用户注册后请(用edu或认证机构的邮箱)联系李昊教授(邮箱地址:li.hao.b8@tohoku.ac.jp;邮件内请提供账户名称及用户的姓名和单位信息,及希望使用的相关功能)进行权限审核及授予,方可使用里面的服务。感谢您对DigCat的支持与关注,欢迎联系交流,帮助开发人员不断改进和提升DigCat的服务。
作者课题组介绍
日本东北大学材料科学高等研究所 Hao Li Lab团队:
数字平台负责人:
李昊,副教授,日本东北大学 (Tohoku University) 材料科学高等研究所 (WPI-AIMR),作为课题组PI从事材料设计与计算、人工智能 (机器学习和数据科学) 开发研究。已发表论文200余篇,包含Nature Catalysis、Nature Sustainability、Nature Communications、JACS、PNAS、EES、德国应化、Advanced Materials、ACS Catalysis等领域权威杂志。
张頔日本东北大学特聘助理教授,2021年博士毕业于上海交通大学,主要研究方向为材料计算理论与人工智能方法开发,电催化过程理论建模与预测,先进氢能源材料设计与开发。目前以第一作者在Nature Communications、JACS、Advanced Materials等国际知名期刊发表论文。
合作单位:


数字催化+数字电池
Digital Catalysis Platform (DigCat) 数字催化平台及Dynamic Database of Solid-State Electrolyte (DDSE) 固态电池电解质平台 ,由日本东北大学李昊教授领衔开发