物理机制+神经网络=Nature！教你NeuralGCM正刊气象大模型！（含代码）

文摘 2024-12-14 13:45 北京

神经网络与物理机制的结合——NeuralGCM

在天气和气候模拟的研究中，传统的通用环流模型（General Circulation Models, GCMs）是基于物理规律的模拟工具，长期以来一直是预报和研究地球系统的重要支柱。然而传统的物理模型计算总是比较慢的。

近期的Nature正刊，引入了神经网络与物理机制的结合——NeuralGCM。这种方法将机器学习组件与可微分的大气动力核心整合，实现了端到端的在线训练，能够在1到15天的天气预报中与最先进的物理和机器学习方法相媲美，同时以数十倍的计算效率完成数年乃至数十年的气候模拟。

这次我们来推理一下NeuralGCM大模型看看效果！

环境

首先安装dinosaur，neuralgcm，jax等库

最好还要有GPU环境，加快推理计算

! pip install -q -U neuralgcm dinosaur-dycore gcsfs

然后导入必要的库

import gcsfs
import jax
import numpy as np
import pickle
import xarray

from dinosaur import horizontal_interpolation
from dinosaur import spherical_harmonic
from dinosaur import xarray_utils
import neuralgcm

gcs = gcsfs.GCSFileSystem(token='anon')

加载模型

然后我们就要加载预训练好的模型

Pre-trained model checkpoints from the NeuralGCM paper areavailable for download on Google Cloud Storage:

Deterministic models:

gs://gresearch/neuralgcm/04_30_2024/neural_gcm_dynamic_forcing_deterministic_0_7_deg.pkl
gs://gresearch/neuralgcm/04_30_2024/neural_gcm_dynamic_forcing_deterministic_1_4_deg.pkl
gs://gresearch/neuralgcm/04_30_2024/neural_gcm_dynamic_forcing_deterministic_2_8_deg.pkl

根据上述描述，我们可以加载0.7°，1.4°和2.8°模型，这里我们选择中间的模型

model_name = 'neural_gcm_dynamic_forcing_deterministic_1_4_deg.pkl'  #@param ['neural_gcm_dynamic_forcing_deterministic_0_7_deg.pkl', 'neural_gcm_dynamic_forcing_deterministic_1_4_deg.pkl', 'neural_gcm_dynamic_forcing_deterministic_2_8_deg.pkl', 'neural_gcm_dynamic_forcing_stochastic_1_4_deg.pkl'] {type: "string"}

with gcs.open(f'gs://gresearch/neuralgcm/04_30_2024/{model_name}', 'rb') as f:
  ckpt = pickle.load(f)

model = neuralgcm.PressureLevelModel.from_checkpoint(ckpt)

加载ERA5驱动数据

然后我们就可以下载驱动数据进行训练了，这里我们直接使用推荐的zarr数据，就不用自己下载了

era5_path = 'gs://gcp-public-data-arco-era5/ar/full_37-1h-0p25deg-chunk-1.zarr-v3'
full_era5 = xarray.open_zarr(gcs.get_mapper(era5_path), chunks=None)

demo_start_time = '2020-02-14'
demo_end_time = '2020-02-18'
data_inner_steps = 24  # process every 24th hour

sliced_era5 = (
    full_era5
    [model.input_variables + model.forcing_variables]
    .pipe(
        xarray_utils.selective_temporal_shift,
        variables=model.forcing_variables,
        time_shift='24 hours',
    )
    .sel(time=slice(demo_start_time, demo_end_time, data_inner_steps))
    .compute()
)

然后把ERA5的驱动改为NeuralGCM适应的驱动分辨率1.4°

era5_grid = spherical_harmonic.Grid(
    latitude_nodes=full_era5.sizes['latitude'],
    longitude_nodes=full_era5.sizes['longitude'],
    latitude_spacing=xarray_utils.infer_latitude_spacing(full_era5.latitude),
    longitude_offset=xarray_utils.infer_longitude_offset(full_era5.longitude),
)
regridder = horizontal_interpolation.ConservativeRegridder(
    era5_grid, model.data_coords.horizontal, skipna=True
)
eval_era5 = xarray_utils.regrid(sliced_era5, regridder)
eval_era5 = xarray_utils.fill_nan_with_nearest(eval_era5)

模型推理

''然后就可以预测了：

inner_steps = 24  # save model outputs once every 24 hours
outer_steps = 4 * 24 // inner_steps  # total of 4 days
timedelta = np.timedelta64(1, 'h') * inner_steps
times = (np.arange(outer_steps) * inner_steps)  # time axis in hours

# initialize model state
inputs = model.inputs_from_xarray(eval_era5.isel(time=0))
input_forcings = model.forcings_from_xarray(eval_era5.isel(time=0))
rng_key = jax.random.key(42)  # optional for deterministic models
initial_state = model.encode(inputs, input_forcings, rng_key)

# use persistence for forcing variables (SST and sea ice cover)
all_forcings = model.forcings_from_xarray(eval_era5.head(time=1))

# make forecast
final_state, predictions = model.unroll(
    initial_state,
    all_forcings,
    steps=outer_steps,
    timedelta=timedelta,
    start_with_input=True,
)
predictions_ds = model.data_to_xarray(predictions, times=times)

最后predictions_ds就是我们的推理结果

这里有所有高空层的变量和结果：

以比湿为例，可以可视化预测和模型结果

# Visualize ERA5 vs NeuralGCM trajectories
combined_ds.specific_humidity.sel(level=850).plot(
    x='longitude', y='latitude', row='time', col='model', robust=True, aspect=2, size=2
);

最后模型如果代码错误，似乎有几个小bug，要改一下NeuralGCM库中的transforms.py和api.py相应报错处就行了，应该是Google开发人员的一些小错误，自行更正就行了。

地学万事屋

分享先进Matlab、R、Python、GEE地学应用，以及分享制图攻略。

最新文章

重磅！智能遥感新质生产力：目测一大波地学人的饭碗要碎了...

搞科研，原来“模仿”才是最快发论文的方法？

打破记录！“真心建议”各位地学研究生读一下《Nature》这篇文章...

无敌了！python中国地图绘制模板，含九段线，南海诸岛，还不收藏的都是神人了

还不会分析地理数据的空间变化规律？教你可解释的地理加权集成学习方法GWRBoost

物理机制+神经网络=Nature！教你NeuralGCM正刊气象大模型！（含代码）

说句实话，研究生搞科研，哪有什么真正的创新点…

OpenAI重磅更新：发布目前最强推理模型ChatGPT-o1（内含测评和体验方式）

太强了！如何用ChatGPT结合Python处理地学数据

登顶Nature，准备起飞！KAN-UNet又杀疯了（有代码）

裁员了，很严重，大家做好准备吧！

地理学如何进行洪水分析？

全网首发！SWOT水资源卫星数据处理方法（含代码）

我现在每天用GPT帮我进行数据分析...

顶刊技巧！3D绘图！

能发顶刊！可解释机器学习地质灾害分析（附代码）

奉劝各位，失业了就不要再去找工作了

现在还用KAN网络的也是神人了...

绘制地理空间矢量场

诚征男友！98年妹纸，北大本科，人大硕士，部委公务员，偶尔被夸好看，江浙沪独女

半价用ChatGPT，我上车了！

（待会删）请大家低调浏览，地学代码提速300%的绝密技巧！

完美解决Python地学库安装问题（最新）

又一篇遥感顶刊！这个idea简直“ 杀疯了 ”

现在做地学深度学习不用TorchGeo也是神人了...

为啥本科生都能发顶会，而博士一篇都没有？

很重要！快把Python升级到3.13吧（利好机器学习和地学分析）

很严重，大家做好准备吧.....

新版ERA5下载多线程加速，看这一篇就行了

说句实话，研究生搞科研，哪有什么真正的创新点…

地学中常见的归因分析，就是这么简单！【附代码】

SCI遥感一区TOP，再次刷新顶刊巅峰！

地学科研与论文｜这个新方向杀疯了，抓紧学起来…

的确可以封神了！原来写SCI这么简单

【AI+遥感】今天分享几个能发SCI的创新点！

作为一个穷学生，我是这样玩大模型的！强烈推荐！

频发地学顶刊！这个新方向杀疯了，抓紧搞起来

在地球科学中使用ChatGPT4o效果惊呆了…【建议保存】

为啥本科生都能发顶刊，而博士一篇都没有？

机器学习洪水预测

原来idea都是这么找的，强烈建议科研人入局AI！！

免费学习遥感Workshop还送《黑神话：悟空》？教你土地覆盖变化检测及分类制图！

地理数据缺失？试试空间插值，真的很简单

这个工具可以一键下载全球任意地区高分辨率Google影像

一位外国小哥把整个Transformer都给可视化清楚了，这下彻底理解注意力机制了！

为啥本科生都能发顶刊，而博士一篇都没有？

的确可以封神了！原来GPT数据处理这么简单

栅格数据时空序列分析，看这一篇就够了

轰动地学界｜又一篇地学领域顶刊！这个idea简直“ 杀疯了 ”

日结/天130-260，工作简单0基础可做招3000人！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉