RS DL
论文介绍
题目:SolarCube: An Integrative Benchmark Dataset Harnessing Satellite and In-situ Observations for Large-scale Solar Energy Forecasting
会议:Conference on Neural Information Processing Systems 2024
论文:https://openreview.net/forum?id=WffhOhYvZ0
数据:https://zenodo.org/records/11498739
代码:https://github.com/Ruohan-Li/SolarCube
创新点
SolarCube 数据集:该数据集整合了地球同步卫星图像、基于物理的太阳辐照数据以及地面测量数据,以支持点和区域级别的短期和长期太阳辐照预测。 高分辨率时空数据:SolarCube 提供15分钟时间分辨率的太阳辐照数据,以满足大规模光伏系统管理和特定地点光伏设备规划的需求。 标准化评估指标:提出了一组一致的评估指标,使得对预测模型的评估更具可比性。 Python 工具包支持:提供了Python工具包以便用户生成不同的预测任务数据集。
背景
太阳能作为清洁能源在减缓气候变化中的作用日益凸显,其稳定的供应对电网管理至关重要。然而,太阳辐照受云层和天气变化的影响波动较大,给光伏电力的管理带来挑战,尤其是在调度、储能和备用系统管理方面。因此,精确的太阳辐照预测对于优化电力生产和调度非常重要。现有的预测方法通常依赖于地面观测站点数据,空间覆盖有限,或使用如ERA5的重分析数据,但精度和时间分辨率较低,难以满足区域性、短期预测需求。
为解决这些问题,SolarCube数据集应运而生,整合地球同步卫星观测和地面数据,提供高时空分辨率的太阳辐照数据,支持从局部到大范围区域的预测任务,为光伏电力调度与管理提供了更可靠的数据支持。
数据
1. 数据来源与类型
地球同步卫星影像:从GOES-16和Himawari-8卫星提取了三个光谱波段的数据(0.47 µm、0.86 µm和13.3 µm),这些波段与地表太阳辐照高度相关。GOES-16提供15分钟分辨率影像,而Himawari-8的时间分辨率为10分钟,经过平均处理后也达到了15分钟。 物理模型计算的太阳辐照数据:利用辐射传输模型生成的15分钟分辨率的太阳辐照数据,通过辐射传输参数化模型推导出地表接收到的太阳辐照。模型使用了卫星影像的波段信息,并结合了表面反射率、大气水汽含量等变量。 地面观测数据:从BSRN和SURFRAD网络采集了19个站点的地面辐照测量数据,主要采用辐射计测量,确保了较高的观测精度。这些数据为模型验证提供了实际观测基准。
2. 数据处理与一致性
空间分辨率处理:卫星影像最初为1公里分辨率,最终降采样至5公里。这一分辨率符合太阳辐照的空间同质性需求,同时显著减少了数据体量,便于模型使用。
时间分辨率处理:为了确保时间分辨率一致,Himawari-8的影像数据被平均至15分钟,与GOES-16保持一致。这使得两个卫星的数据在时间维度上具有可比性。
代表性误差消除:地面观测数据为每分钟采样,为匹配卫星影像,数据经过15分钟的窗口平均处理,缓解了点观测与像元数据在代表性上的差异。
3. 辅助数据
太阳天顶角(SZA):SZA反映了太阳高度角,决定了在晴朗条件下的最大可能辐照量。SZA数据与其他数据在时间和空间上保持一致(15分钟和5公里分辨率),用于归一化预测结果,帮助模型更准确地评估不同时间和地理位置的辐照变化。
云层掩膜和土地覆盖:利用来自NOAA和EUMETSAT的云层掩膜数据,将数据分为两种场景——“简单”(云层变化小)和“困难”(云层变化大)。土地覆盖数据来自MODIS,帮助模型在不同地表类型上进行适应性训练和评估。
4. 研究区域与数据分割
研究区域:选取了分布于全球多大洲的19个区域,覆盖北美、南美、亚洲和大洋洲,每个区域的面积为600公里×600公里。
数据分割策略:为了测试模型的地理泛化能力,数据集基于地理区域而非时间进行划分。14个区域用于训练,5个区域用于测试。这种划分方式旨在增强模型在新区域的预测能力。
5. 数据集使用场景与任务
预测任务类型:SolarCube数据集支持两类预测任务:
区域级预测:适用于大范围光伏系统的管理,以600 km × 600 km区域为单位进行预测。
点级预测:基于具体观测站点数据,适合局部光伏系统的管理。
时间范围:数据集支持短期预测(30分钟至6小时)和长期预测(一天或更长),满足不同时间尺度的太阳辐照预测需求。
6. 数据质量与验证
与ERA5的对比验证:在小时尺度上,SolarCube的预测数据与ERA5进行了比较,SolarCube在精度上显著优于ERA5,展示了更高的预测精度。
地面观测验证:基于地面观测站的太阳辐照测量值,确保数据集的物理模型计算数据具有可靠性和实用性。
实验
区域级和点级预测任务的实验结果表明,视频Transformer模型在区域级任务中表现更稳定,而LSTM和Transformer变体则在点级预测任务中有更好表现。实验显示,深度学习模型在处理复杂的时空依赖性时明显优于传统持久性模型。
1.区域级预测
任务描述:使用历史15分钟间隔的卫星图像序列(前3小时,共12帧)预测未来3小时的太阳辐照分布。每个图像覆盖600 km × 600 km区域,分辨率为120×120像素。 候选模型:
ConvLSTM:捕捉时空序列信息的卷积LSTM。 视频Transformer模型:包括轴向注意力(Axial)、视频Swin-Transformer(Video-swin)和分割时空注意力(Divided-st),这些模型基于Earthformer架构,能够有效提取视频序列中的特征。 持久性模型:基线模型,通过计算“晴空指数”预测未来的太阳辐照,假设大气条件在短时间内保持不变。
评估:包括相对均方根误差(rRMSE)、相对均偏误差(rMBD)和预测技能(FS),后者用于与持久性模型比较性能提升。 实验表明,视频Transformer模型在各类场景下表现较为稳定,Divided-st模型在难度较高的测试场景中有较好的表现。在不同地表类型(如湿地、草原等)上,模型的表现有些差异,但总体趋势一致。
2. 点级预测
任务描述:使用历史3小时的光谱数据和SZA数据预测未来3小时或24小时的地面点位太阳辐照,支持短期和长期预测任务。 候选模型:
LSTM及其变体:包括LSTM和带时间序列注意力的LSTM(LSTM-a),擅长时间序列建模。 Transformer和Informer:长序列预测模型,适用于捕捉时间序列中的复杂依赖性。 持久性模型:用于基线比较,假设大气条件与前一天同一时间一致。
评估指标:与区域级任务一致,包括rRMSE、rMBD和FS。 实验结果:深度学习模型优于持久性模型,尤其在长时间预测中表现出色。Transformer和LSTM-a模型在短期和长期预测中的性能最优,能够更好地捕捉云层带来的辐照波动。
3. 预测对比
短期预测:对比不同模型在不同地表类型、天气条件下的表现。视频Swin在时间步长增加时的预测技能(FS)表现出提升,而ConvLSTM在短期内有较高的预测技能,但随着时间增长其性能下降。 长期预测:在长时间预测中,深度学习模型表现明显优于持久性模型。尤其在“困难”场景(即云层动态变化)下,LSTM-a和Transformer模型的精度较高,能够更好地应对长时间的太阳辐照波动。
挑战及数据集潜在应用
提升全天候长时间预测能力:SolarCube结合了红外波段和物理模型支持的太阳辐照数据,可为夜间和长时间跨度的太阳辐照预测提供更高精度的支持。这将为光伏系统的持续电力供应和需求管理提供全天候的数据基础。 增强稀疏观测区域的预测泛化能力:利用卫星和地面观测数据,SolarCube能在地面监测点稀疏的区域提升预测精度。未来可结合物理引导的机器学习模型来进一步提升区域预测的泛化效果,为大范围光伏电力管理提供支持。 实现公平性导向的跨区域预测:SolarCube覆盖了不同地理和气候条件的全球多区域,能够开发适应性更强的公平预测模型,有助于在各地均衡分配太阳能资源,提高能源供应的公正性和有效性。
更多图表分析可见原文
因配置了AI回复功能,除关键词自动回复外,号内信息主要由AI大模型回复。如需资源、投稿、合作等,请直接联系小助手微信(添加请备注:咨询、投稿、合作、加群,加群需备注姓名/昵称,单位和研究方向)。
公众号欢迎优秀作者投稿!可加入优秀论文作者群:欢迎加入AI遥感优秀论文作者群!
问题及讨论可直接在文章下方留言
欢迎关注
分享遥感与深度学习领域的技术、论文、书籍、新鲜事。
欢迎加入遥感与深度学习交流群(点此加入)。