华东师范大学化学大模型ChemGPT-2.0版本发布

学术   2024-11-11 17:15   北京  
ChemGPT 2.0 link:https://chemgpt.lrcwtech.com

11月11日,在华东师范大学化学学科建设与学科交叉发展论坛上,正式发布了化学领域的大模型ChemGPT 2.0和以具身智能机器人化学家-华24为核心的自动化化学合成平台。此次发布标志着化学研究与人工智能技术深度融合的新纪元。

何晓介绍,ChemGPT 1.0具有三大亮点:第一,高质量化学对话数据集的构建。ChemGPT 1.0整合了超过39万条高质量对话数据,包括734种化学性质问答类数据、11679种科学类(含化学)问答类数据和658种化学类问答类数据以及超过一万条百科词条,转化成了超过207万条问题数据集。基于对化学领域专业知识的广泛收集和深入理解,构建的数据集为全面、准确地完成化学知识问答提供了强大支撑。第二,化合物逆合成数据库的创建。针对化合物逆合成的难题,团队通过数据拼接、叠加、加权和合成方式筛选,构建了一个全新的逆合成数据库。该数据库规模宏大,提高了模型的鲁棒性和反应性,且具有高质量的标注数据,提升了模型的准确性和可靠性。通过更好的数据平衡,显著提高了模型对各类反应的预测能力。在 USPTO-50K测试任务中,经过新数据集训练的大模型ChemGPT达到了74.4%预测精度,位列第一。第三,对话模型和逆合成模型的创新改进。ChemGPT 1.0的对话模型和逆合成模型分别基于ChatGLM模型和LLaMA模型。通过全量微调以及在A800 GPU集群上两个月的训练,性能显著提升。此外,通过多模型多模块融合技术的实施,使得ChemGPT 1.0无需安装任何插件,就能支持化学专业知识、化学逆合成、生物医药以及通用领域的知识问答。此外,ChemGPT 1.0还支持自动上网查资料,帮助模型返回高质量的实时回答并具备绘画功能。https://www.ecnu.edu.cn/info/1094/65125.htm

学术之友
\x26quot;学术之友\x26quot;旨在建立一个综合的学术交流平台。主要内容包括:分享科研资讯,总结学术干货,发布科研招聘等。让我们携起手来共同学习,一起进步!
 最新文章