进入信息时代以来, 数据总量呈爆炸式增长, 数据的类型、结构、维度也更加复杂多样, 远远超出了传统数据库的管理和处理能力,逐渐向“大数据”方向转变。大数据是用于描述超出常规处理能力的数据集术语, 其内涵不仅包含海量的数据本身, 也包含对这些数据集的存储、处理与分析方法。当前, 大数据已经成为国家信息主权的体现, 并已在人类社会发展中发挥重要作用。
科学大数据主要由大型实验设施、监测设备、传感器和计算机模拟产生, 具有不可重复、多维和高度不确定等特性, 即对于一般自然与物理客观过程的观测很难重复; 由于观测对象和采样方法本身的时空属性以及观测传感器的多样化, 数据具有时空多维性; 由于采用的直接或间接观测方式、采样手段和记录技术, 导致系统观测误差及数据记录误差的存在。地球大数据作为科学大数据的重要组成部分, 近年来呈现飞速发展的态势: 随着遥感、导航、通讯等技术的发展, 对地观测手段和仪器越来越多, 对地观测的空间越来越大, 光谱分辨率越来越高, 科学数据的传输速度和存储容量也相应增加。同时, 由社会公众收集的与地理相关的社 会经济数据也成为地球大数据的重要组成部分。
数字地球利用数字技术和方法对地球数据进行组织、分析、管理、挖掘及可视化, 在地球科学研究中发挥重要作用。早期, 数字地球强调“把地球装进计算机”, 以数字化技术推动地球科学发展。近年来, 随着大数据概念的不断深入,数字地球进入“地球大数据”时代。作为一种数据驱动范式, 地球大数据正在成为认识地球的“新钥匙”和加速地球科学研究发展的“新引擎”, 为联合国可持续发展目标(Sustainable Development Goals, SDGs) 的实现和全球发展倡议的实施提供科学支撑。
2020年, 联合国发布《数字合作路线图》, 专门就数字技术对人类社会的治理、经济、安全、权力与合作进行了分析和发展规划。数字技术和可持续发展问题的协同研究, 以及利用数字技术服务可持续发展支撑国家和世界宏观战略发展目标这一系列重要问题亟待探索和解决。地球大数据在推动SDGs实现中还需加强理论、方法、技术的深入研究。面向未来, 应深入开展以下研究。
(1) 建立面向人地系统的大数据感知理论和方法。厘清自然-社会-经济系统可持续发展的关键观测指标因子, 研究地球环境和人类社会两大系统的多时空观测方法, 发展海量异构可持续发展指标数据的汇聚与泛数字化技术, 构建地球大数据感知人与环境系统交互演化的科学理论和方法体系。
(2) 发展可持续发展大数据智能建模与处理技术。开展自然-社会-经济一体化的可持续发展大数据多维建模和标准化技术研究, 结合深度学习、人工智能等前沿技术, 建立不同时空尺度的标准化监测体系, 实现可持续发展指标的精准监测。
(3) 研究可持续发展数字治理方法。开展大数据驱动的自 然-社会-经济耦合的可持续性情景模拟研究, 尤其对不同指标内在联系、地理相关性、动态变化规律等方面深入研究, 并建立可持续发展指标预测模型, 实现对各种情景下可持续发展状况的动态分析及仿真。
(4) 搭建全球性的数字地球科学平台。建立全球可持续发展数据的“数算一体”超融合系统架构, 研究集数据、计算、 服务于一体的可持续发展大数据共享及云服务新模式, 建立新一代数字地球平台, 为实现数据、知识、决策三位一体的可持续发展多维度决策提供信息支撑。
(5) 推广地球大数据促进SDGs成果。面向SDGs监测的本土化问题, 尤其是发展中国家, 努力将我国的应用示范成果推动成为普适性的SDGs官方应用示范典型案例, 建设面向服务于SDGs评估和实现的开放型高端智库, 为我国和国际SDGs的实现提供科学支持。
引用本文
郭华东,梁栋.2024.地球大数据缘起和进展.科学通报 69卷, 1期: 58 - 67