国网冀北电力有限公司杨鹏伟等｜基于相似时段匹配与Transformer网络建模的分布式光伏超短期功率预测方法

文摘 2024-12-30 13:11 北京

来源：《中国电力》2024年第12期

引文：杨鹏伟, 赵丽萍, 陈军法, 等. 基于相似时段匹配与Transformer网络建模的分布式光伏超短期功率预测方法[J]. 中国电力, 2024, 57(12): 60-70.

编者按

近年来，随着“双碳”目标及新型电力系统建设的推进，分布式光伏发电迅速发展，截至2023年6月，装机容量已达19822.8万kW。大规模分布式光伏接入显著改变了配电网的负荷特性，加剧了负荷短时波动，增加了配电网调控难度。同时，分布式光伏出力与负荷特性时间维度上的不匹配引起反向潮流，抬升了配电网末端电压，在部分时段甚至会导致配电变压器反向重过载，威胁配电网安全稳定运行。亟需准确的分布式光伏功率预测为配电网优化调控、促进新能源消纳提供重要的信息支撑，以保障配电网安全稳定运行。然而，太阳辐射强度、云团分布等易发生快速变化的气象因素会导致光伏出力在短时间内产生较大波动，特别是对于单个容量较小的分布式光伏，这使得其超短期预测难度大增。

《中国电力》2024年第12期刊发了杨鹏伟等撰写的《基于相似时段匹配与Transformer网络建模的分布式光伏超短期功率预测方法》一文。文章将短期预测的相似日细分至相似时段，提出了一种功率相似时段匹配方法（temporal analog matching approach，TAMA），无需NWP数据。TAMA整合卫星遥感数据与分布式光伏历史功率数据，从云团分布和出力模式2个方面细致匹配相似时段，提高了所选时段对预测时段的参考意义。此外，针对功率剧烈波动场景，本文引入Transformer模型，评估历史相似时段对待预测时段的重要性，增强了模型在复杂波动情况下的预测精度和鲁棒性。最后，通过算例验证所提方法的优越性。

摘要

由于缺乏气象数据，分布式光伏在天气骤变场景下预测精度不高，提出了一种基于相似时段匹配与Transformer网络建模的分布式光伏超短期功率预测方法。首先，将相似时段概念由日扩展至更灵活的时间段，并提出了一种历史功率与卫星遥感信息融合的匹配策略，旨在无须依赖气象数据的情况下，高效识别出对预测最为关键的相似功率时段。在此基础上，融合Transformer网络的强大时序建模能力，动态解析多源相似时段中的隐藏关联，深入挖掘功率关键特征信息，从而为天气骤变条件下的分布式光伏系统提供更为精确的超短期功率预测。最后，通过实际分布式光伏功率数据验证了所提方法的有效性。

相似时段匹配与Transformer网络的设计

本文所提方法分为相似时段匹配、特征工程和功率预测模型构建3个部分。研究整体路线如图1所示。首先，相似时段匹配根据历史的发电功率和气象数据从分布式光伏场站历史数据中匹配相似时段；随后，特征工程根据功率预测模型的需求构造相似时段的功率数据，称为模型输入；最后，功率预测模型执行预测功能，实现对分布式光伏场站的超短期功率预测。

图1 研究方法整体流程

Fig.1 Flowchart of proposed methodology

1.1 相似时段匹配

本节首先探讨如何规定相似时段匹配周期，即将滑动窗口应用于时段划分工作。随后说明TAMA如何确保搜索时段的相似性并获取待预测时段参考数据。

1.1.1 时间滑动窗口

卫星遥感数据和光伏场站发电数据以时间戳的形式被记录。在超短期功率预测工作中，要求以15 min的时间分辨率预测未来4 h的光伏发电量。本文中功率预测模型每15 min执行一次预测，相应地相似时段匹配机制会使用时间滑动窗口，以当前时刻为t=0时刻，以(t–15)~t时段作为搜索时段，以(t+1)~(t+16)时段作为待预测时段。并随着时间推进，滑动窗口以1个时间戳的步长向后推进。由此每天可以被划分为96个时段。

1.1.2 功率相似时段匹配方法

TAMA方法定义了几个关键时间概念。“待预测日”为预测执行当天；“相似日”为从历史中匹配到相似时段所在日；“待预测时段”为预测启动时刻起的未来4 h，适用于待预测日和相似日；“搜索时段”为预测时刻前的一段历史时间，同样适用于待预测日和相似日；“相似时段”为TAMA从历史数据中匹配得到的与当前时段相似的时段，包括待预测时段和搜索时段。TAMA建立了历史相似天气条件下的待预测时段与预测日待预测时段的联系，使这些数据在功率预测模型中共同传播。

为评估时段的相似性，从天气类型、搜索时段功率序列波动相似性以及待预测时段气象因素相似性3个关键方面入手。

1）天气类型方面，运用K-Means聚类对光伏发电历史功率数据进行分析。根据晴空辐照度模型的推算，全年内同一时段的地表辐照度幅值相近。由于光伏发电量主要受到地表辐照度的影响，因此本文将每个时段的光伏发电功率数据划分为晴天、云蓬、云密3类，以区分不同天气类型。同时也可以最大化每一类别的样本数量，以保证模型在训练时的泛化能力。

天气类型一致是匹配机制里的第1条约束规则，满足约束的时段被称为“相似时段”，将被进一步评估与当日搜索时段的相似性。

2）在搜索时段功率序列波动相似性方面，计算不同日搜索时段内的光伏发电功率曲线的Pearson相关系数v₁、v₂为光伏发电时间序列，该系数可以反映2组曲线在趋势变化方向和陡度上的一致性。

3）在待预测时段天气变化相似性方面，使用空间分辨率为4 km的风云4号气象卫星（FY-4）云覆盖率二级数据，其像素值为0~1，表示云层覆盖面积的百分比。由于云覆盖率数据的均值和方差在整幅图上变化剧烈，且不同区块的失真程度可能不同，本文采用滑动窗口法（步长为1）计算2幅图对应窗口下的结构相似性指标的平均值，称为平均结构相似性指标（mean structure similarity index，MSSIM）。对于2组卫星遥感数据X和Y，2幅图的MSSIM为

式中：x_j、y_j分别为2幅图中由滑动窗口分割得到的第j个画幅（patch）；

I_MSS(x_j,y_j)为x_j、y_j的相似性指标；M为整幅图包含的patch数量。

对于2组卫星遥感数据集合A={X₁,X₂,X₃,⋯,X_N}, B={Y₁,Y₂,Y₃,⋯,Y_N}，N为数据量，MSSIM相似度可表示为

即使搜索时段的数据描述的是过去时间段的天气状况，算法仍能推测光伏场站上空云覆盖的变化，帮助TAMA判断待预测时段的功率变化趋势。TAMA通过以下步骤实现这一点。首先，用K-Means聚类快速筛选出相似时段；然后，基于Pearson相关系数和MSSIM指数的平均值评估这些时段的相似度。最终，从历史数据中选出最相似时段的待预测时段数据及其相似度，提供给功率预测模型。整个机制的执行过程如图2所示。此方法有效弥补了传统相似日方法在应对天气骤变时的不足，提高了功率预测的准确性。

图2 相似时段匹配方法流程

Fig.2 Flowchart of TAMA

1.2 特征工程

为了将TAMA匹配的相似时段数据及其相似度信息有效应用于功率预测，本文通过特征工程构建了相应的方法和特征空间。具体来说，TAMA获取的相似时段数据数量可能不确定，为此，设定了一个规则：期望的相似时段数量为n。当搜索到的相似时段少于n时，使用mask遮盖技术，以极小值（10^–9）填充缺失数据，确保不影响预测结果。若相似时段超过n，则按相似度从高到低排序，选择前n个最相似时段的数据作为参考输入模型。这一过程如图3所示。该方法通过广播机制和相似度排序优化数据集，提升了功率预测模型在实际应用中的鲁棒性。

图3 单个batch下的特征工程数据流程

Fig.3 Data flow process for a single batch

1.3 功率预测模型构建

本文采用Transformer模型执行分布式光伏功率时序预测任务，相比于传统基于循环神经网络（recurrent neural network，RNN）及其变体的时序预测模型，Transformer模型在长程依赖建模、全局信息交互与并行计算方面具有显著优势。比如Transformer模型以注意力机制（Attention）为核心，而注意力机制通过动态地分配不同时刻的注意力权重，使得模型能够专注于与当前时刻相似的时段，支撑了基于相似时段的功率预测任务。Transformer结构模型的简略结构如图4所示。

图4 功率预测模型结构

Fig.4 Transformer based forecasting model structure

1.3.1 注意力机制应用

由相似时段搜索方法可知，搜索时段与相似时段中的待预测时段数据向量之间存在相似性，本文采用注意力机制将不同日的搜索时段数据映射到特征空间，使特征空间中的向量同时包含了待预测日和相似时段搜索时段数据的主要特征。将待预测日的搜索时段数据经线性层变换的向量作为查询向量Q和数值向量V，同时使用相似时段的搜索时段数据经线性层变换的向量作为键向量K输入Attention机制，其中线性层指Linear层线性变换。本文遵循自注意力机制的设置，规定线性层的输入输出维度相等，对于线性层的输入X₁或X₂，其遵循式（3）被线性层映射到特征空间。

此外，线性层通过将数据映射到更高维度的特征空间，以增加数据的表征能力。对于解码器内的线性层，其有助于自注意力机制提取相似日数据的共性特征，保留相似日数据的普遍共性特征；对于融合编码器和解码器特征向量处注意力机制的线性层，其有有助于融合待预测日与相似日数据的时序内在联系，从而提升预测精度。

注意力机制表示为

式中：为键向量的维度。

由此，本文中的注意力计算过程可被描述为

注意力机制计算的结果是一个加权的数值向量集合，其中每个数值向量的权重由查询向量与对应键向量之间的相似度决定。在本文的预测任务中，它使模型在处理序列数据时更加关注相似度高的特征。

1.3.2 Transformer模型构建

本文所构建的Transformer模型以注意力机制为核心，针对TAMA进行了适配。模型主体可分为编码器和解码器2部分，分别如图5和图6所示。

图5 模型编码器结构

Fig.5 Structure of model encoder

图6 模型解码器结构

Fig.6 Structure of model decoder

在编码器阶段，首先在注意力机制前将相应的时间序列向量经过线性层变换为特征向量Q、K和V。其次，设计特征向量X₄=QK^T，且令注意力机制计算后的向量X₃与X₄相加，这是因为内积操作相当于在一个向量空间中进行相似性匹配，通过学习相似性，模型可以更好地理解X₁与X₂之间的关系，对于捕捉时序数据中的模式和周期性变化非常有帮助；另一方面向量X₃与X₄相加可减少信息丢失，使编码器输出更加稳定。

在解码器阶段，以相似时段的待预测时段数据为基础，设计相似时段的待预测时段数据，依据相似度加权平均的结果作为输入向量X₅，随后，引入了2个Attention机制，用于更加精细地关注向量X₅中的不同部分。

其中第1个注意力机制以X₅为Q、K、V输入；而第2个注意力机制则以编码器输出作为Q和K，以第1个注意力机制的输出作为V。如此设计让2次注意力机制信息互补。第1个注意力机制强调了待预测时段自身的重要性，第2个注意力机制则通过整合相似时段的信息，为模型提供了更多关于相似时段的上下文信息。

综上，本文设计的Transformer模型在原基础上改进了向量的输入设计，相比于专注图像分类任务的Transformer，更加适用于基于相似时段的时序预测任务。

实验仿真

2.1 数据集设置

本文使用了河北省某地区969个分布式光伏场站的数据集，涵盖2020年7月—2021年7月、时间分辨率为15 min的发电功率数据，场站地理信息包含经纬度。这些场站分布在100 km边长的正方形区域内，容量为2~610 kW。

卫星遥感数据采用中国气象数据网提供的风云四号A卫星云覆盖率数据，时间分辨率为15~45 min，空间分辨率为4×4 km/像素。为使卫星数据与光伏数据时间戳对应，对缺失的卫星数据进行了线性插值，确保其时间分辨率为15 min。

2.2 光伏功率预测模型参数配置

仿真设置特征工程中目标相似时段数量N=12；所使用的Transformer模型设置了单层的编码器和解码器；模型训练所使用的梯度下降误差函数采用均方根误差（root mean squared error，RMSE）。仿真中，以8∶1∶1的比例设置了训练集、测试集和验证集。

2.3 仿真结果

2.3.1 相似时段匹配方法

本文选用云覆盖率和单一分布式光伏场站发电功率作为TAMA的输入变量。考虑地球公转导致的太阳辐照强度与时长的周期性变化，本文设置从过去80天内的同时间段内匹配相似时段，而非从全部历史数据中匹配。对于匹配方法使用的滑动窗口长度，本文实验不同窗口长度对模型预测精度的影响，最终选定滑动窗口长度为16个时间戳（4 h）。在不同时段分别利用K-Means算法聚类得到不同天气类型功率曲线范围，部分分类结果如图7所示。

图7 各时段发电功率K-Means聚类结果

Fig.7 K-Means clustering results for power generation in different time intervals

选择具有相同天气类型标签的数据进入相似度评价环节，匹配的卫星遥感数据经MSSIM指标评价，功率数据经过Pearson相关系数评价，如图8所示。最终由TAMA输出的综合相似系数和相似时段中待预测时段的功率数据。

图8 相似度评价过程

Fig.8 Process of similarity evaluation

对于相似时段的相似度评价中，由MSSIM指标评价的云遮盖率数据丰富了相似指标，且有助于匹配方法感知光伏场站所处区域即将发生的云遮盖事件。相似匹配方法将卫星遥感数据分多个画幅，并以所有画幅SSIM的平均值作为相似度评价指标，则当光伏场站周边的云覆盖率相似度低，意味着随着云团的移动，光伏发电量的变化趋势将与相似时段存在较大差异，相似时段数据的相似度低，对预测的参考价值小。匹配时段卫星遥感数据的MSSIM和待预测时段光伏发电数据的皮尔逊相关系数对比表明，2组数据的相似度呈现正相关，说明卫星遥感数据和功率序列的相似度存在时延关系，证明了TAMA方法能够感知光伏场站所在地的气象条件变化，如图9所示。

图9 匹配时段的卫星遥感数据MSSIM和待预测时段的功率皮尔逊相关系数

Fig.9 Satellite remote sensing data MSSIM during matching time period and Pearson correlation coefficient during predicted time period

通过图10同时段的云遮盖率和发电功率对比可知，当云遮盖率相似度较高时，在两日的待预测分布式光伏发电功率也会呈现相似的变化趋势。

图10 同时段的云遮盖率和发电功率对比

Fig.10 Comparison of cloud cover and power generation during the same time intervals

综上所述，本文所提出的TAMA可以从光伏发电功率的历史数据中匹配得到与当前时段相似的功率时段。

2.3.2 功率预测模型

首先，本文在试验阶段探究了TAMA滑动窗口长度对预测误差的影响，在Transformer模型超参数不变的情况下，探究TAMA滑动窗口为6~25对验证集RMSE总体误差的影响，结果如图11所示。可见，滑动窗口长度对模型预测精度并无直接影响。总体上看，较短的滑动窗口会降低模型预测的误差，然而这种情况并不绝对。从局部上看，过短滑动窗口可能意味着模型性能更不稳定，即更易受到TAMA匹配结果的质量影响，这也反映出TAMA在滑动窗口较短时鲁棒性较低。本文最终选取局部最优的参数，设定滑动窗口长度为16。

图11 不同滑动窗口长度下的RMSE预测误差

Fig.11 RMSE error under different sliding window length

将所提方法与TAMA+LSTM模型、Transformer模型、LSTM模型进行对比，以证明所提相似时段匹配与Transformer联合建模的优越性。均方根误差RMSE和平均绝对误差MAE如表1和表2所示。

表1 预测模型的RMSE误差对比

Table 1 Comparison of RMSE errors of different forecasting models

表2 预测模型的MAE误差对比

Table 2 Comparison of MAE errors of different forecasting models

功率预测模型编码器以待预测日及相似时段的搜索时段数据作为输入、解码器以相似时段的待预测时段作为输入。以LSTM模型和Transformer模型作为基线。本文所提出的预测模型最终预测效果如图12~14所示。

图12 天气骤变情况下预测结果（大部分为晴天）

Fig.12 Forecasting results under rapid weather changes (mostly clear skies )

图13 天气骤变情况下预测结果（多数时间云蓬）

Fig.13 Forecasting results under rapid weather changes (mostly clear skies with few cloud)

图14 天气骤变情况下预测结果（多数时间云密）

Fig.14 Forecasting results under rapid weather changes (mostly clouded weather)

由图12~14可知，晴天下光伏出力水平高，波动较小。在上午和下午时段不同模型均能预测发电功率的稳定上升和下降趋势，但当正午时段出现波动时，所提方法能更好地捕捉出力变化趋势，相比之下仅依靠LSTM和Transformer模型的预测可能误判正午出现云遮盖事件导致功率下降；云蓬状态下，所提方法对于剧烈的天气状况波动具有更好的预测能力（如图13中14:00—18:00的波动），而仅依靠模型的方法无法根据临近的功率信息感知此类变化；云密状态下，仅依靠模型的方法在上午时段缺功率参考数据，难以判断天气类型，相比之下所提方法能够识别上午时段的天气类型。

综上，无论在何种天气状况下，本文所提的预测方法对于天气状况骤变的事件具备较强的响应能力，在判断天气状况变化的具体时间和变化方向两方面都具有更优秀的能力。

在超短期预测内每个时间戳预测的RMSE误差如图15所示。

图15 不同方法预测精度

Fig.15 Forecasting accuracy for different methods

综上，本文所提方法对天气骤变事件具有较强的感知能力。1）TAMA方法通过逐画幅计算卫星遥感数据相似度并与历史待预测时段数据对比，能够感知光伏场站未来超短期的天气条件变化。2）综合相似度指标的引入及Transformer模型的注意力机制，使模型能从多条历史相似时段数据中动态提取关键序列特征，提升预测精度。

然而，所提方法存在一些局限性。从图14可以看出，在前2个时间戳内的预测效果不如仅依赖模型的方法。这可能是由于所用卫星遥感数据的空间覆盖范围较大，虽然有助于提升TAMA对天气变化的感知能力，但可能导致忽略相近时间的功率相似度，进而影响相近时间戳的预测精度。此外，所提方法的RMSE误差并非随预测时间单调上升，而是先降后增，这是因为在预测模型中加入了相似日的待预测时段数据，缓解了时间序列预测中的误差累积问题。预测精度的变化不仅取决于预测时间的长度，还受到数据时序规律的影响。

结论

本文提出了基于TAMA和基于Transformer的功率预测模型，克服了天气骤变情况下分布式光伏超短期功率预测精度不高的问题。TAMA将相似日概念扩展到相似时间段，通过结合卫星遥感信息和光伏场站历史数据，不依赖NWP数据，增加了预测模型对天气因素瞬时变化的捕捉能力。实验结果表明，本文方法在天气快速变化场景下具有良好的超短期功率预测性能，相较于传统LSTM预测模型更具优越性。本文研究对提升电网稳定性、促进新能源消纳具有重要意义。未来可进一步优化模型结构，实现时间戳级别的相似度评价，提升模型对于相似时段数据的动态捕捉能力，以提高预测精度和鲁棒性。

注：本文内容呈现略有调整，如需要请查看原文。

往期回顾

◀ 《中国电力》2024年第12期抢先看

◀ 国网冀北电力有限公司陈璨等｜基于分层关联性建模的分布式光伏功率超短期概率预测

◀ 山西大学李翰章等｜基于TDE-SO-AWM-GRU的光伏发电功率预测模型

◀ 三峡大学李丹等｜基于高斯混合聚类和改进条件变分自编码的多风电场功率日场景生成方法

◀ 河海大学王蕊等｜基于复杂特征提取和Sinkhorn距离的风光荷多阶段场景树生成方法

◀ “交直流配电系统灵活资源规划运行及动态控制”专题征稿启事

◀ “提升新能源和新型并网主体涉网安全能力关键技术”专题征稿启事

◀ “电-碳协同下分布式能源系统运营关键技术”专题征稿启事

◀ “氢能交通与电力系统耦合下的规划、运行和交易关键技术”专题征稿启事