首个多模态地理科学大模型「坤元」

学术   2024-09-21 10:00   北京  

ScienceAI 设为星标

第一时间掌握

新鲜的 AI for Science 资讯


编辑 | 芫荽

9月19日,中国科学院地理科学与资源研究所联合中国科学院青藏高原研究所、中国科学院自动化研究所等单位研发的多模态地理科学大模型「坤元」(Sigma Geography)正式发布。

「坤元」首席科学家、中国科学院地理科学与资源研究所研究员苏奋振介绍,该模型是专注于地理科学的专业语言大模型,具备处理地理科学相关问题的专业能力,目前完成了地理学全谱系高质量语料库构建、地理科学语言大模型构建、地理科学研究智导平台研发等工作。

「坤元」具备「懂地理」「精配图」「知人心」「智生图」等特点,实现了地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图绘制等功能。

「懂地理」

研发团队建立了涵盖4大类、16小类的地理全学科语料库,提供320亿词元供大模型自监督学习,并制作了4万余条高质量地理学指令进行模型微调。相比通用语言大模型,「坤元」更熟悉地理学的语言模式、专业术语和领域知识,在地理学基准测试集上的准确性提升了31.3%。

「精配图」

该团队自主研发了面向多层次地图信息的多模态检索技术、支持地理认知与图形表达的知识推理技术。这些技术使得「坤元」能够在解答地理学提问的同时,可以根据生成的文字答案检索不同地理要素,并匹配地理景观照片、专题地图或示意图表呈现给提问者。

「知人心」

研究人员提出了基于「认知启航-应用智导-前沿研析」框架的用户画像精准判别与响应技术,保证「坤元」能够充分考虑地理知识爱好者、地理学专业学生以及科研人员的地理科学知识体系认知和表达差异,以图文共现的方式给出适配用户知识结构的地理学专业问题解答。

「智生图」

基于「坤元」开发的科研助手,可以根据用户指令完成概念理解、数据获取、信息分析、制图综合等流程,最终生成用户需要的专业地理图表。

「『坤元』目前主要支持科研用户,未来将逐步面向公众开放。」苏奋振表示,「坤元」将赋能地理科学研究、加速重大地理科学发现。

未来,研发团队将推进地图大模型及地理推理机研发,有望让地理科学语言大模型读懂地图;将打造地理科研协作大平台,以期让每个科研团队都可以拥有专属的地理大模型,能够与数百万科学家通过共享数据、模型、研究思路等方式协同工作。

来源:中国科学院地理科学与资源研究所

人工智能 × [ 生物 神经科学 数学 物理 化学 材料 ]

「ScienceAI」关注人工智能与其他前沿技术及基础科学的交叉研究与融合发展

欢迎注标星,并点击右下角点赞在看

点击读原文,加入专业从业者社区,以获得更多交流合作机会及服务。

ScienceAI
机器之心旗下媒体,关注人工智能与其他前沿技术、基础学科的交叉研究与融合发展。
 最新文章