近日,地震科学国际数据中心发布QuakeGPT地震科普大模型。该模型基于阿里通义千问开源大模型构建,成为首个专注于地震科学研究和应用领域的语言大模型。这标志着语言大模型在地震行业的成功应用,以及大模型技术在辅助地震科研和提升公众理解方面的创新尝试。
《中国震例》系列丛书由地震出版社出版,是地震研究和预测预报的重要科学资料。地震科学国际数据中心团队历时半年时间,从全书和地震知识库提取了近3万个问答对,构建了“谛听”地震知识问答数据集,覆盖了自1966年以来中国大陆5级以上震例知识。团队基于Qwen-14B-Chat模型进行微调与对齐,确保充分吸收地震知识问答数据集。同时,团队全面评估模型性能,推动其强化学习与奖励机制。此外,团队拓展了QuakeGPT模型的语义理解和意图识别能力,为用户提供更精准、高效的服务。
团队通过与“谛听”系列地震学中小规模AI模型能力的对接,成功打造基于“谛听盒子”的边缘端推理与阿里云端API调度的行业智能体应用新模式。目前,QuakeGPT已选为地震科普数字人小Q的基础问答模型,并启动了地震数字人“QuakeMan”项目。作为地震行业首个数字人,“他”具备垂直领域的语言大模型文字问答能力,支持中文语音识别、合成和三维形象互动,结合边缘端任务执行能力,“他”可助力用户高效完成数据库查询、第三方软件调用、数据统计分析等任务。
目前,QuakeMan开放地震科普功能,通过生动的表现形式,有效提高了公众对地震知识的参与度和接受度。据中国科学技术部近二十年科普统计数据,地震科普人才中专职人员占比仅约10%,存在人才短缺问题。地震数字人若能提供持续科普服务,覆盖不同人群,将扩大地震科普覆盖面和影响力,进而显著提升防震减灾公益事业的社会价值。
未来,QuakeMan将持续钻研地震领域专业知识,通过优化成为地震领域的可靠助手。同时,在阿里生态技术的支持下,不断丰富自己的语言、动作和表情,以更直观、生动的方式与公众互动,提升科普教育的趣味性和实效性。QuakeMan也将积极与其他硬件设施结合,走进地震科学研究机构和科普场馆,成为地震科学领域的AI得力助手。