国网冀北电力有限公司陈璨等｜基于分层关联性建模的分布式光伏功率超短期概率预测

文摘 2024-12-29 11:00 北京

来源：《中国电力》2024年第12期

引文：陈璨, 苏紫诺, 马原, 等. 基于分层关联性建模的分布式光伏功率超短期概率预测[J]. 中国电力, 2024, 57(12): 50-59.

编者按

近年来，随着“碳达峰、碳中和”目标的提出及新型电力系统建设的推进，分布式光伏发展迅猛。据国家能源局统计，截至2023年9月底，全国分布式光伏累计装机容量为225.26 GW，占光伏总装机容量的43.29%。然而，分布式光伏功率受天气等多重不稳定性因素影响，具有显著的随机性和不确定性，大规模分布式光伏接入显著增加了配电网运行控制的难度。在此背景下，分布式光伏功率概率预测通过量化预测偏差的不确定性范围，为分布式光伏的功率预测提供了坚实的不确定性评估基础，对有源配电网运行调控具有重要的指导意义。

《中国电力》2024年第12期刊发了陈璨等撰写的《基于分层关联性建模的分布式光伏功率超短期概率预测》一文。文章提出了一种基于分层关联建模的区域分布式光伏概率预测方法。首先，提出了基于深度一致性的聚类方法，区别于基于相似性的集群划分方法，所提方法根据深度学习模型在各分布式光伏上的性能表现，直接反映分布式光伏特性深度一致性，将集群划分为具有内在高度一致性的子区域集群。然后，在聚类结果的基础上，从分层的角度构建子图和全局图结构体系，以同步建模集群电站子域内和子域间的时空关联关系，实现对各层级间时空关联信息的有效利用。最后，通过对子图所揭示的时空特征序列进行深度挖掘和有效提取，将其作为全局图模型的关键输入变量，以此融合子图与全局图的层次信息，构建了基于分层图网络（hierarchical graph convolutional networks，HGCN）网络分位数回归概率预测模型，从而实现了超短期区域分布式光伏发电的精确概率预测。

摘要

准确的区域分布式光伏功率概率预测可为有源配电网优化运行提供更全面的信息支撑。当缺乏气象测量或预报数据时，对分布式光伏时空相关信息的挖掘利用可以有效提升功率预测精度，然而，现有研究或难以针对性挖掘时空关联信息，或在建模过程中丢失大量有效信息。为此，提出了一种基于分层关联建模的区域分布式光伏功率超短期概率预测方法。首先，采用基于深度一致性的聚类方法对分布式光伏集群进行子区域划分，支撑对子区域内部时空关联的针对性建模；在此基础上，构建分层图结构以同步建模子域内与子域间时空关联关系，有效利用不同层级间关联信息；然后，提出了基于分层图卷积神经网络的概率预测模型，挖掘光伏电站之间的深度时空关联特征，提升区域分布式光伏超短期功率概率预测精度。最后，利用实际分布式光伏功率数据集验证了该方法的有效性。

分层图建模功率预测方法

本文提出的基于分层关联建模的区域分布式光伏功率概率预测模型总体框架如图1所示，包括以下3个步骤，通过挖掘电站之间的深度时空关联和引入概率区间预测，有效提高了预测精度，量化了分布式光伏出力的不确定性。

图1 区域分布式光伏功率超短期概率预测流程

Fig.1 Flowchart of ultra-short-term probabilistic forecasting of regional distributed PV power

1）利用基于深度一致性的分布式光伏集群聚类算法，将集群分布式光伏划分为多个具备内在一致性的子区域集群，以支撑后续精细化建模。

2）根据聚类结果，构建子图与全局图的分层图结构体系，用于支撑同步建模子域内外的关联模式。其中，子图以子域内中的每个站点为图节点，反映各个光伏子区域内部电站间复杂的时空相关关系；全局图以子图为节点，反映各个子区域整体间的关联特性。

3）以子区域光伏电站历史功率序列组成的特征矩阵和表征子图节点相关性的邻接矩阵作为子图网络的输入。通过子图网络提取出的子图输出特征，注入全局图网络的节点中，实现对区域整体时空关联特征的有效建模提取。最终，结合分位数回归网络，实现区域分布式光伏功率的超短期概率预测。

1.1 子区域划分

传统的聚类方法多依赖于欧式距离度量，侧重于电站功率曲线的形态相似度与幅值匹配来进行集群划分，然而这种直观的相似性衡量往往难以深刻揭示集群内部分布式光伏电站功率的一致性与趋同性。针对这一局限性，本文通过分析深度学习模型在各个电站的功率预测性能表现，捕捉和反映电站出力特性的深层一致性模式。主要步骤如下。

1）利用K-means算法，依据分布式光伏经纬度及历史出力特性数据，将N个站点聚类获得K个初始化群簇中心。

2）基于K个簇心的历史功率数据分别训练K个基于长短期记忆（long short term memory，LSTM）的功率预测模型{F¹,⋯,F^K}，而后分别计算K个模型在N个电站功率预测误差，利用深度学习功率预测模型在电站的预测表现，实现深层一致性的表征。模型k对电站n的预测误差e^n,k为

式中：与分别为t时刻模型k对电站n功率预测值与对应实测值；T为预测周期。

3）根据K个模型在电站预测效果更新电站簇类标签为

式中：lⁿ为电站n的簇类标签。

将所有分布式光伏电站标签更新完毕后，以对各簇类电站功率取平均方式，更新簇类中心数据。

4）当达到设定的迭代次数时，完成聚类。否则，重复步骤2）和3）。

考虑到LSTM在功率预测领域应用广泛，本研究在步骤2）将其作为预测模型。尽管理论上其他深度学习模型亦能达成相似效果，但本文尚未进行这些模型与所提深层一致性聚类方法结合的比较分析，未来将继续深化探究。

1.2 分层图建模

在区域分布式光伏功率预测中，分布式光伏电站之间存在复杂的时空相关性，为充分挖掘电站间时空特征信息，根据其关联关系将分布式光伏电站定义为图结构数据。然而经过子区域划分后的区域光伏电站具有层次结构，分布式光伏分层结构不仅包括由分布式光伏电站组成的节点，还包括宏观层面，其节点由划分后的子区域组成，预测区域分布式光伏功率时应考虑分布式光伏系统不同分层结构的相关性，以挖掘电站间的深层时空关联性，进一步提高功率预测精度。

一个子区域内的多个分布式光伏电站和多个子区域都可以表示为一个无向图，一个无向图由一个特征矩阵和一个邻接矩阵组成，可以定义为

式中：X为节点特征矩阵，在本研究中，对于子图而言，每个分布式光伏电站都被视为一个图节点，子区域内所有光伏电站的历史功率数据组成子图的特征矩阵。对于全局图而言，每个子图都被视为一个图节点，提取子图输出的时空特征组成全局图的特征矩阵，具体提取方式见1.3.2和1.3.3节；A为表示节点间关联关系的邻接矩阵，其元素为

式中： σ为阈值，定义为N个节点历史输出功率的相关系数的平均值，对于子图，节点为子区域中的每个分布式光伏电站，对于全局图，节点为每个子图；

c_ij为节点i和j历史出力之间的相关系数，取皮尔逊相关系数的绝对值；A_ij为邻接矩阵中相应位置的值，表征节点之间的连接强度。由此获得表征子区域内电站关联性的子图邻接矩阵

A^S。

在构建子图后，全局图以子图为节点，进而根据子图节点历史出力的关联关系得到全局图的邻接矩阵为A^U。至此，构建了具有层次结构的子图和全局图，如图2所示。

图2 子图和全局图的分层结构示意

Fig.2 Schematic of the hierarchical structure of subgraphs and global graphs.

1.3 基于HGCN的分位数回归概率预测模型

1.3.1 子图GCN建模

如图3所示，子图上的GCN模型是通过2个叠加的GCN模块和1个全连接层实现的。前者通过GCN提取输入数据的时空特征，后者实现对GCN模块输出数据的线性变换。GCN模块由线性层、图卷积层和激活函数3个部分组成。线性层将输入的节点特征映射到高维度空间，以提取深层高维特征，用于挖掘节点深层关联信息；图卷积层对图数据进行深层特征提取，通过聚合节点及其邻居节点的特征信息来更新每个节点的表示，这有助于对输入数据时空关联性的充分挖掘；激活函数选择sigmoid函数，用于归一化图卷积层输出矩阵。GCN模块的实现具体可以表示为

图3 分层图卷积神经网络预测模型结构示意

Fig.3 The structure of the proposed HGCN prediction model

式中：为归一化后的邻接矩阵，为输入的给定历史长度M、特征维度为D的节点特征矩阵（本文D取1），由子区域内所有光伏电站的历史功率数据组成，这二者为子图网络的输入；

f^F^C为线性层网络；f^G^C^o^v表示图卷积操作；

σ为sigmoid函数。对于给定节点输出特征长度O，GCN块的输出矩阵为

然而不同的子图节点数N不相同，无法直接将各子图的输出进行特征组合，以作为全局图的输入特征。2个叠加的GCN模块后的全连接层

f^F^C解决了这一问题，它对

进行线性变换和矩阵转置，提取子图输出的时空特征为

Y^S∈R^1×M，实现子图输出的时空特征形状统一。

综上所述，子图的实现可以表示为

式中：Y^S∈R^1×M为子图的输出。为了实现子图与全局图的交互，本文提出了一个特征组合模块，将各子图输出的时空特征进行融合，并以此作为全局图的输入特征矩阵具体实现方法为

式中：f^C^oⁿ^c^a^t函数用于拼接不同子图输出时空特征。

1.3.2 全局图GCN建模

如图3所示，和子图结构相比，全局图上的GCN模型通过2个叠加的GCN模块实现，全局图上的GCN模块与子图上的GCN模块结构相同，但输入数据不同，即是

A^U∈R^K×K、

而不是A^S∈R^N×N、全局图的实现可以表示为

最后的预测模型是将子图和全局图叠加，组成了端对端模型，即从输入端到输出端仅得到一个结果，全局图的输出为（k为预测的未来步长，本文取16）在某个分位数下最后的输出，的分位数损失值被用来衡量模型的性能。

1.3.3 基于分位数回归的概率预测模型

分位数回归（quantile regression，QR）不需要对预测变量的分布进行假设，直接预测各分位水平下的分位数，已经广泛应用于新能源发电功率预测和负荷预测领域中，并取得了较好的预测效果。在分位数回归中，当模型训练集给定时，QR可以描述为最小化分位数损失函数L，即

式中：m为预测点数；为在分位数q下的功率预测值；y_i为分布式光伏实际功率；II为指示函数（indicator function），根据逻辑值返回0或1。通过选择不同的分位数q可得不同分位数下的功率预测模型，从而得到区间预测结果。

实验结果与分析

2.1 数据来源与分析

本文数据集包含河北某地区 24 个分布式光伏电站，总容量为 147.73 MW，具有从2020 年 7 月 1 日—2021 年 7 月 1 日06:00—18:00的每 15 min的实际发电功率数据。将2020年7月1日—2021年5月24 日作为训练集、2021年5月25日—2021 年 7 月 1 日作为测试集，用于所提方法的验证。预测模型的输入是预测时间前12 h区域分布式光伏电站的功率数据，输出是预测时间后4 h区域分布式光伏电站的光伏功率。

2.2 实验设置

为证明本文所提基于HGCN的光伏功率区间预测模型的有效性，除本文所提方法外，设置了另外4种模型作为对照模型。

方法 1：先用深度一致性聚类方法对光伏电站进行子区域划分，将子区域整体作为图节点，以子区域总出力为节点特征，构建图结构并利用GCN建模预测，获得集群总功率。

方法 2：先用深度一致性聚类方法对光伏电站进行子区域划分，将各子区域分别构建图结构，以子区域内各电站为节点，分别对各子区域进行GCN建模预测，最后累加各子区域出力获得集群总出力。

方法 3：直接以各分布式光伏出力为节点特征，利用GCN 建模预测，获得集群总功率。

方法4：采用常用的基于LSTM的功率时间序列预测模型分别预测各分布式光伏出力，然后累加获得集群总出力，其中LSTM的参数选择基于经验。

方法4仅考虑了电站出力的时间关联性，方法3能够捕捉数据间的时空关联性但未考虑集群划分对挖掘电站间时空关联性的影响，方法1和2虽然确保了区域内部光伏电站间关联性的考量，但却未充分探索各子区域间的潜在关联性。通过本文方法与方法1~4的对比，验证其可以更深层地挖掘光伏电站之间的关联关系，使得本文模型获得了最优的预测性能；通过对比方法1~2与方法3，验证了集群划分的有效性。

2.3 算例分析

2.3.1 评价指标

本文选择采用均方根误差（root mean square error，RMSE）和平均绝对误差（mean absolute error，MAE）作为功率点预测精度评价指标，分别为

式中：E_RMS为均方根误差；E_MA为平均绝对误差；p_t为t时刻实际功率值；为t时刻功率预测值。

本文选择采用预测区间覆盖率（prediction interval coverage probability，PICP）、预测区间归一化平均宽度（prediction interval normalized average width，PINAW）与全面性评价指标（intervals of confidence evaluation，ICE）来衡量所提概率预测模型的可靠性和清晰度。PICP定义为真实值落在预测区间上下界之间的比率，表达式为

式中：τ_i为一个逻辑变量，某点的预测值落在上下区间内则为1，否则为0；U_i、L_i分别为预测上下限。

PINAW定义为预测区间上下界的平均距离，反映了预测区间的准确性，结果越小表示能提供更多的信息和实际价值，其表达式为

ICE为全面性评价指标，结果越小则预测结果越好，其表达式为

2.3.2 聚类方法对比分析

为了验证所提基于深度一致性聚类方法的有效性，将不同聚类方法下的功率预测精度进行了对比。表1为不同聚类方法下的点预测精度，深度一致性聚类+GCN方法的E_MA和E_RMS分别低于K-means聚类+GCN方法0.68%、1.07%；深度一致性聚类+HGCN方法的E_MA和E_RMS分别低于K-means聚类+HGCN方法0.28%、0.70%。这一提升效果归功于所提方法能够直接分析并体现分布式光伏电站出力特性的深层一致性，从而支撑对集群分布式光伏的有效划分与针对性建模，证实了深度一致性聚类方法相比传统聚类手段，在挖掘和利用光伏系统内在规律上更为高效和精确。

表1 不同聚类方法下的点预测精度

Table 1 Forecasting accuracy of different clustering methods

2.3.3 区间预测分析

不同方法下点预测的提前4 h预测曲线对比如图4所示。总体来说，与现有其他方法相比较，本文所提出的方法在模型拟合效能上表现最佳，尤其在模拟日间光伏出力的2个关键阶段：功率爬升期与下降期，本文方法的优势得到了体现，表现为其在捕捉和预测光伏功率变化动态方面的优势。

图4 不同方法下点预测的预测曲线

Fig.4 Prediction curves for point prediction under different methods

表2为提前4 h预测性能。在95% 的置信度下，方法3的E_PINAW值较方法4降低22.88%，E_ICE值较方法4降低19.44%；在85%的置信度下，方法2的E_PINAW值较方法3降低 26.14%，E_ICE值较方法4降低20.02%，原因是GCN能够捕捉数据间的时空关联性，克服了方法 4不能表征场站间相互影响程度强弱的缺陷。在此基础上，方法2的E_PINAW值较方法3降低2.03%，E_ICE值较方法3降低1.80%；在85%的置信度下，方法2的E_PINAW值较方法3降低0.57%，E_ICE值较方法3降低1.06%，原因是方法2引入了子区域划分，将关联性较强的光伏电站划分为一个子区域，而不同子区域之间关联性相对较弱，这使得预测模型相较于方法2更容易捕捉到每个子区域内部的出力特性和趋势，因此方法1的预测精度高于方法2，而方法1通过聚合电站功率使功率数据更加平滑，相比于方法2有利于提高预测精度，在95% 的置信度下，方法1的E_PINAW值较方法2降低 7.20%，E_ICE值较方法2降低5.28%；在85%的置信度下，方法1的E_PINAW值相较于方法2降低 9.98%，E_ICE值较方法2降低3.14%。在95% 的置信度下，本文方法的E_PINAW值较方法1降低 5.26%，E_ICE值较方法1降低3.33%；在85%的置信度下，虽然方法2的PICP值最高，但本文方法的E_PINAW值相较于方法1降低 9.87%，E_ICE值较方法1降低7.26%，这表明本文所用的HGCN相比于平面图结构，可以在多个层次上考虑节点的关联关系，捕获节点的多阶邻居关系，因此相比于GCN可以更深层地挖掘光伏电站之间的关联关系，获得了最优的预测性能。

表2 提前4 h下光伏发电功率的预测性能

Table 2 Predictive performance of PV power under 4 h lead time

为进一步说明本文方法的有效性，对各个方法在晴天、阴天、雨天3种天气场景下提前4 h的预测效果进行了比较，3种天气类型下各方法的概率预测曲线对比如图5~7所示，可见，预测区间上下限、变化趋势均能有效包裹实际功率曲线，且本文模型在3种天气类型下相较于其他2种模型均展现出更窄的预测区间，体现了本文模型的有效性。预测指标如表3~5所示，可见雨天天气下的绝大多数评价指标均劣于其他方法，这是因为雨天天气下受复杂气象因素影响，光伏功率出力波动性强，预测难度增加，虽然在某些方法下雨天天气下的预测指标反而优于阴天天气，这是由于雨天时光伏出力水平比较低，阴天时光伏出力较雨天更大且波动更剧烈。在雨天天气情况下虽然方法3的区间覆盖率最高，但在95%置信度下，本文方法的E_PINAW和E_ICE较方法1分别降低3.02%、2.13%，较方法2分别降低9.90%、6.88%，较方法3分别降低11.03%、7.96%，较方法4分别降低32.97%、26.18%；在85%置信度下，本文方法的E_PINAW和E_ICE较方法1分别降低1.62%、5.01%，较方法2分别降低11.92%、5.29%，较方法3分别降低13.37%、7.40%，较方法4分别降低25.97%、12.94%。以上结果表明在波动性最大的雨天天气状态下本文方法在95%和85%置信度下均取得最高预测精度，因此，本文方法的区间预测结果最为出色。

表3 晴天天气提前4 h下光伏发电功率的预测性能

Table 3 Predictive performance of photovoltaic power generation under sunny weather with 4 h lead time

表4 阴天天气提前4 h下光伏发电功率的预测性能

Table 4 Predictive performance of photovoltaic power generation under cloudy weather with 4 h lead time

图5 本文方法3种天气场景的区间预测结果

Fig.5 Interval forecasting results for three weather scenarios of the method in this paper

图6 方法1下3种天气场景的区间预测结果

Fig.6 Interval forecasting results for three weather scenarios of the method 1

图7 方法2下3种天气场景的区间预测结果

Fig.7 Interval forecasting results for three weather scenarios of the method 2

表5 雨天天气提前4 h下光伏发电功率的预测性能

Table 5 Predictive performance of photovoltaic power generation under rainy weather with 4 h lead time

结论

光伏发电功率具有随机波动性，对光伏发电功率的不确定性进行量化可以为电网安全经济运行提供关键数据支撑。为此，本文提出了一个基于分层关联建模的区域分布式光伏功率概率预测方法。首先，构建了基于深度一致性聚类的子区域划分方法，该方法区别于传统聚类的表征相似性，深入挖掘了光伏电站间的内在一致性模式。在聚类基础上，通过分层图建模充分挖掘光伏电站间的深度时空关联性，设计了基于HGCN网络分位数回归概率预测模型，实现子域内-子域间关联性的有效同步建模与信息挖掘利用，提升了概率预测精度。从仿真结果可以看出，在85%和95%的置信区间中，本文方法的E_PINAW和E_ICE值均优于所有基准对照组，且在波动性最大的阴雨天气下本文方法在85%和95%置信度下均取得最高预测精度，验证了所提方法概率预测精度的有效性。

注：本文内容呈现略有调整，如需要请查看原文。

往期回顾

◀ 《中国电力》2024年第12期抢先看

◀ 三峡大学李丹等｜基于高斯混合聚类和改进条件变分自编码的多风电场功率日场景生成方法

◀ 河海大学王蕊等｜基于复杂特征提取和Sinkhorn距离的风光荷多阶段场景树生成方法

◀ 华北电力大学张兴平等｜基于多智能体深度确定策略梯度算法的火力发电商竞价策略

◀ 国网能源研究院有限公司李骏龙等｜基于双重差分模型的分时电价机制对用电成本的影响分析

◀ “交直流配电系统灵活资源规划运行及动态控制”专题征稿启事

◀ “提升新能源和新型并网主体涉网安全能力关键技术”专题征稿启事

◀ “电-碳协同下分布式能源系统运营关键技术”专题征稿启事

◀ “氢能交通与电力系统耦合下的规划、运行和交易关键技术”专题征稿启事