院士 | 周成虎:大模型推动地理科学迈向地理智能

学术   2024-12-09 07:51   广东  

来源:中国测绘学会(2024年11月27日)

中国科学院院士周成虎




相比通用语言大模型,“坤元”更熟悉地理学的语言模式、专业术语和领域知识,在地理学基准测试集上的准确性提升了31.3%。


未来“坤元”计划打造出一个地理科研协作大平台,每个科学家和科研团队都能够拥有专属的地理大模型,每个科研人员都可以通过平台共享数据、模型或者寻求跨学科合作,通过这样的方式来与数百万科学家一起协同工作。


大模型本质上还是一个生成式人工智能,所以大模型采集的数据、形成的分析结果到底是对还是错,最终还需要通过人来判断,确保大模型生成及分析结果的准确性与可靠性。





“坤”指大地;“元”指起始,也指神经元。“坤元”寓意为大地的神经元系统,我国科学家以“坤元”命名了全球首个地理科学大模型。

日前,由中国科学院地理科学与资源研究所联合中国科学院青藏高原研究所、中国科学院自动化研究所研发的“坤元”大模型发布,旨在拓宽普通大众的地理视野,增强地理科技工作者的智力,加速重大地理科学发现。

“今天‘坤元’作为地理科学大模型的起步,也希望能够在此基础上集聚全球地理信息,融汇全域的地理空间知识,构建能够服务人类可持续发展等复杂问题求解的新科技体系,进而促进新的地理科学发展,推动地理科学迈向地理智能。”“坤元”大模型科学顾问、中国科学院院士周成虎向《瞭望》新闻周刊记者介绍。






“坤元”大模型更懂地理


《瞭望》:研发“坤元”大模型的契机是什么?


周成虎:今天我们正迎来新一轮的科技革命和产业变革,以生成式人工智能为核心的现代人工智能技术正在重塑我们的社会,人工智能正成为科学研究的新工具。


地理科学包含了自然、人文、社会、经济等多个学科领域,是一个高度综合性的学科。大模型可以把不同时期地理知识统一在一个时空框架下,为解决全球气候变化、可持续发展问题提供新的科技手段。这是我们研发“坤元”地理科学大模型的初衷。


早在三年前我们就一直在思考,地理科学涉及太多知识,它的大模型应该怎么做。我们从做知识图谱到知识库的管理然后开始做大模型,这是个慢慢演变的过程。为什么我们能做?


第一,中国科学院地理科学与资源研究所是全球最大的地理科学研究所,拥有丰富的科研积累和人才团队;


第二,中国科学院拥有众多各类研究所,有数学、自动化等学科的科研力量,通过多个学科研究者的联合和协同,例如把计算机、信息科学和地理学的人组合在一起,能实现科学与技术的提升;


第三,我们有强大的计算能力,中国科学院有做国产智能芯片的企业,有算力的支撑。


相比于通用大模型,“坤元”更聚焦于地理科学领域,它已学习了300万篇地理科学领域的相关科技文献、98部经典教材、88部经典著作、34部标准规范,还有1万张专题地图、10万份专业图表和5万条专业问答。“坤元”构建了涵盖全谱系地理科学知识的语料库,增强了其在处理地理相关任务时的专业性和精确性。这种专门化的模型在特定领域应用上有很大的优势,也能满足更精细化的需求。


《瞭望》:“坤元”大模型的应用优势体现在哪些方面?


周成虎:“坤元”是一个以地理科学语言和地理科学思维为支撑的科学大模型,具备“懂地理”“精配图”“知人心”“智生图”等特点,实现了地理专业问题解答、地理学文献智能分析、地理数据资源查询、地理数据挖掘分析、专题地图绘制等功能。


在“懂地理”方面,研发团队建立了涵盖4大类、16小类的地理全学科语料库,提供320亿词元供大模型自监督学习,并制作了4万余条高质量地理学指令进行模型微调。相比通用语言大模型,“坤元”更熟悉地理学的语言模式、专业术语和领域知识,在地理学基准测试集上的准确性提升了31.3%。


在“精配图”方面,团队自主研发了面向多层次地图信息的多模态检索技术、支持地理认知与图形表达的知识推理技术。这些技术使得“坤元”能够在解答地理学提问的同时,根据生成的文字答案检索不同地理要素,并匹配地理景观照片、专题地图或示意图表呈现给提问者。


在“知人心”方面,团队创新提出了基于“认知启航—应用智导—前沿研析”框架的用户画像精准判别与响应技术,保证“坤元”能够充分考虑地理知识爱好者、地理学专业学生以及科研人员等不同人群地理科学知识储备的差异情况,以图文共现的方式给出适配用户知识结构的地理学专业问题解答。


在“智生图”方面,团队基于“坤元”开发的科研助手,可以根据用户指令完成概念理解、数据获取、信息分析、制图等流程,最终生成用户需要的专业地理图表。






推动地理科学向地理智能迈进


《瞭望》:目前“坤元”大模型已经发挥了哪些作用?


周成虎:“坤元”拥有相当于千万个博士的庞大知识储量,它意味着原来在发表论文时一个人的工作会得到千万个博士的帮助。现在我们已经使用“坤元”来完成研究的辅助工作,例如文献的辅助阅读工作、撰写综述以及辅助撰写论文等。文献辅助阅读方面,做一项具有创新性的研究,会需要很多前沿研究支持,以前检索、阅读一段时间内的文献经常会存在漏网之鱼,这个过程也非常辛苦,“坤元”有助于解决这些问题。它还能从上百万篇文献中凝练出需要的内容,写成一段综述文字供参考。论文辅助撰写方面,它可以根据我们给出的论文框架、数据、图表等辅助论文的撰写。


在“坤元”大模型支持下,我们已经开展了一系列研究试验,已在高水平期刊发表学术论文十余篇。


《瞭望》:如何利用大模型推动地理科学向地理智能迈进?


周成虎:地理科学大模型驱动地理科学研究范式变革,目标是将地理科学研究从各个研究组、各个课题或各个区域的小作坊模式转变为平台科研模式,将“坤元”打造成为地理科学领域研究者之间的重要协作工具。


“坤元”大模型研制分三个阶段:第一个阶段是发布“坤元”地理科学语言大模型,它了解地理学概念与知识体系,支持知识问答和文献归纳,实现文配图、文生图,成为一名合格的“地理学家”。第二个阶段是训练地理识图大模型,或者叫地图大模型,能够进行通用、专题地图的学习和认知,具备空间分析和归纳能力,既可以解释地图,也可以生成地图,成为一名“地图学家”。第三个阶段是将基于大模型打造一系列地理专业智能体,能够提供综合性地理问题智能解决方案,可以创造地理分析的方法,成为一名“地理智能科学家”。


未来“坤元”计划打造出一个地理科研协作大平台,每个科学家和科研团队都能够拥有专属的地理大模型,每个科研人员都可以通过平台共享数据、模型或者寻求跨学科合作,通过这样的方式来与数百万科学家一起协同工作。


中国科学院地理科学与资源研究所承担的中国科学院基础与交叉前沿科研先导专项(B类)“数据—模型驱动地理智能系统与典型场景应用研究”专项启动及实施方案专家论证会已于4月召开,旨在推动地理信息系统向地理智能系统跨越革新,抢占国际地理智能制高点。“坤元”的研发正是在该专项的支持下,按照既定的研究框架有序推进。


多模态地理科学大模型“坤元”的运行机房(2024年9月19日摄) 李鑫摄/本刊






加速大模型落地应用


《瞭望》:如何平衡“坤元”大模型不断增强的能力与地理信息安全的关系?


周成虎:“坤元”大模型的训练、使用要遵照我国关于地理信息安全的所有法律条文。我们在研发过程中也特别注重知识产权和地理信息安全,确保我们所使用的训练语料不存在侵权和涉密问题。目前阶段“坤元”主要支撑科研任务,能够支撑科研就意味着“坤元”能很快走向支撑行业或者业务工作。在这个阶段,我们会与相关业务部门进行合作,遵照我国相关法律法规,确保地理信息安全。


此外,需要注意的是,大模型本质上还是一个生成式人工智能,所以大模型采集的数据、形成的分析结果到底是对还是错,最终还需要通过人来判断,确保大模型生成及分析结果的准确性与可靠性。


《瞭望》:你是遥感应用方面的专家,在遥感大模型建设方面,你有哪些建议?


周成虎:当前,人类对遥感数据的获取能力超越了以往任何一个历史时期。对地观测技术的进步和高分辨率对地观测卫星的密集发射,代表着我国已构建了自主全球观测系统,进入了遥感大数据时代,而海量的遥感大数据也给遥感应用带来了新挑战。


2022年8月,中国科学院空天信息创新研究院发布了“空天·灵眸”大模型,这是首个面向跨模态遥感数据的生成式预训练大模型,旨在构建一个通用的多模态多任务模型,为遥感领域多行业应用提供一套通用便捷、性能优良的解决方案,填补了跨模态生成式预训练模型在遥感专业领域的空白。


今天语言大模型已经超越了常规的自然语言理解,特别是ChatGPT的出现让人工智能应用进入了普惠时代。那么,遥感大模型是不是也可以将遥感应用带入普惠时代?这就需要学术界和工业界共同联手研究、攻克遥感大模型的底层技术。


我们的遥感大模型不仅要关注地物分类与信息提取,还要关注地理系统参数的定量反演。在遥感应用中,无论是提取、分类还是地学参数反演,都需要非常多的专业模型。如何将专业模型嵌入大模型中?这也是今天遥感大模型面临的挑战和难点。我认为,一是要在现有学习的基础上将多语义结合起来,将遥感的地学知识和模型组合起来;二是将多样化的地学任务适配器建起来,争取让每一个任务都有自己的适配器,或者开拓成千上万个应用软件,在这个大模型基础上把每一项任务都做得像专家水平。


未来,要抓住时代机遇拓展遥感大模型,有了大数据、大模型,进一步推动中国遥感应用的变革,加速向地理智能时代迈进。


中国科学院院士朱永官带领一群“土壤高级玩家”,一同创作出了本部集科学性、趣味性和前瞻性于一体的科普著作——《鲜活的土壤》,以科研者的视角和深入浅出的笔触,向大众讲述了土壤的本质、功能、土壤污染问题以及由此带来的粮食安全问题等人们关心和感兴趣的话题。

书中不仅涵盖了土壤的形成、分类、功能等基础内容,还深入探讨了土壤与生态环境、人类健康、文明演变进程等方面的紧密联系。用丰富的科研数据与成果揭示了土壤作为农业生产之基、生态系统之本的不可替代作用,更强调了在当前全球环境变化与资源约束加剧的背景下,科学合理地利用土地资源,对于维护国家粮食安全、促进生态平衡、实现经济社会可持续发展乃至推动人与自然和谐共生的战略价值。


识别图中二维码即可购买本书

《土壤盐渍化的诊断、评估、减缓与适应技术指南》由联合国粮农组织 / 国际原子能机构粮食和农业核技术联合中心水土管理和作物营养科专家穆罕默德·扎曼、李恒所著。著者长期致力于改善土壤、水资源与肥料管理的生产实践,为促进国际社会农业积极适应气候变化做出了贡献。



该书回顾了全球土壤盐渍化的历史和治理成败经验,旨在制定盐度和钠化度的评估技术规程,完善盐渍化土壤的缓解和适应措施,创新和推进核技术和同位素技术等的应用,为可持续地利用盐碱地提供可行性方案。该书具有先进性、指导性和实用性,能够切实解决生物盐碱农业所遇到的实际问题。该书可为进行景观和农田土壤盐渍化评估和诊断,利用核技术和同位素技术制定边际土壤可持续利用战略的技术研究人员、一线管理人员提供参考和借鉴。


康绍忠院士序|《土壤盐渍化的诊断、评估、减缓与适应技术指南》出版发行


张佳宝院士序|《土壤盐渍化的诊断、评估、减缓与适应技术指南》出版发行


新书推荐 |《土壤盐渍化的诊断、评估、减缓与适应技术指南》出版发行


Rainer Horn 博士,德国基尔大学教授,世界著名土壤物理学家。现任中-欧土地和土壤合作专家组委员,曾任世界土壤联合会(IUSS)主席,IUSS土壤物理委员会、土壤技术委员会以及第三工作组主席、土壤耕作研究组织主席、德国土壤学会主席等土壤学术组织重要职位。Horn教授在不饱和土壤力学理论创新和应用、土壤物理多尺度过程、土壤力学与水力学、物理化学和生物学等多学科交叉研究等方面取得巨大成就,并成功应用于指导固废处理、地质工程安全以及电缆地下埋藏等社会经济多方面。发表100余篇期刊论文,数十部土壤学专著以及数百篇技术报告,荣获美国土壤学会、美国农学会会士,罗马尼亚、波兰、德国土壤学会以及国际土壤耕作研究组织等学术团体先后授予Horn教授荣誉会员称号。


该书由赵英博士和张斌博士组织,邀请了诸多从事土壤物理研究的中青年工作者共同翻译。他们花费很大精力把该教材引进国内,可使更多的科研人员系统了解土壤物理学,对推动我国土壤物理学的发展意义重大。


邵明安院士序|《土壤物理学精要——过程、功能、结构和力学导论》


《土壤物理学精要——过程、功能、结构和力学导论》出版—赵其国院士序


新书 |《土壤物理学精要——过程、功能、结构和力学导论》





近期文章推荐 

世界土壤日,苏科社携手“土壤高级玩家"力献《鲜活的土壤》


欢迎相聚云南大理,探讨土壤退化修复改良与污染防治新技术


借地而生:写给地球人的土壤生命史


重磅引进:日本生态学会奖励奖、农学进步奖、河合隼雄学艺奖——《大地5亿年:土壤和生命的跃迁史》出版


朱永官:皮之不存,毛将焉附?—《鲜活的土壤》序言


The Innovation Life | 种养循环提高资源利用率,实现环境可持续发展


“山上”换“山下”优化耕地布局


第三次全国土壤普查共采集样点287.2万个 2025年开展成果编制


东北地理所在东北风蚀区土壤质量评价方面取得进展


文章荐读-Soil Biology and Biochemistry-红树林湿地土壤有机质组分特性综述:对碳储存的影响





      




  精选土壤好书,长按识别二维码了解



由于微信修改了推送规则,请大家将土壤家加为星标,或每次看完后点击页面下端的“在看”,这样可以第一时间收到推文!合作、转载、入群,请加13926117407微信号(或发邮件至149996384@qq.com)

             

土壤观察
分享土壤科研成果、传播土壤科普知识、宣传土壤管理政策
 最新文章