免费下载论文:
PSO-LSTM模型供水温度预测效果影响分析
郭晓杰,马文菁,曹姗姗,孙春华,夏国强,李孟涵
(河北工业大学 能源与环境工程学院, 天津 300401)
摘要:采用粒子群优化算法(PSO)对长短期记忆神经网络(LSTM)预测模型参数进行优化,评价PSO的优化效果,对训练集样本数量对预测效果的影响进行分析。PSO对LSTM预测模型参数的优化,可有效提高预测模型的预测效果。应选取较多的训练数据对预测模型进行训练。
关键词:供水温度预测;粒子群优化算法;长短期记忆神经网络
参考文献示例:
郭晓杰,马文菁,曹姗姗,等. PSO-LSTM 模型供水温度预测效果影响分析[J]. 煤气与热力,2025,45(1):A12-A16.
热负荷预测是集中供热系统实现精细化调控的前提,也是保证供需平衡的基础。供热过量导致能源浪费,供热不足导致室内温度不达标。因此,科学合理预测热负荷十分必要。
目前,供热系统热负荷预测方法主要包括回归分析法、时间序列法、机器学习法等。其中,基于机器学习的热负荷预测方法得到了较多关注,有极限学习机(Extreme Learning Machine,ELM)[1]、人工神经网络(Artificial Neural Network,ANN)[2]、支持向量机回归(Support Vector Regression,SVR)[3]等算法。文献[4]以室外温度、历史供热负荷等作为影响因素建立了9种ELM预测模型,结果表明ELM预测模型的预测精度高于遗传算法(GP)和ANN。文献[5]采用BP神经网络对热负荷进行预测,整体预测相对误差为6.93%。但是BP神经网络存在收敛速度慢以及不考虑时序数据之间关联性等问题。随着深度学习快速发展,深度神经网络被用于热负荷预测中。循环神经网络(Recurrent Neural Networks,RNN)、长短期记忆神经网络(Long-Short Term Memory,LSTM)作为深度神经网络,对于热负荷时间序列的变化趋势建模更加精准,能够准确表达由热惯性引发的热负荷非线性特性[6]。文献[7]使用LSTM预测模型,对比短期预测与长期预测的预测精度,结果表明LSTM预测模型的短期预测精度更高。
上述文献表明,深度神经网络对热负荷预测有较好的效果。然而,LSTM预测模型的部分参数需要人为设置,易影响预测效果。本文采用粒子群优化算法(PSO)对LSTM预测模型参数进行优化,评价粒子群优化算法的优化效果,对训练集样本数量、输入参数时间步长对预测效果的影响进行分析。
① LSTM
LSTM是由Hochreiter等人在1997年提出的一种改进的时间循环神经网络[8]。RNN与LSTM的基本构造原理相同,均利用神经元内部的循环连接,对时序信息间的内在联系进行建模。但RNN的激活函数只有tanh,LSTM则建立了记忆单元结构,通过门控单元引入sigmoid函数,避免梯度消失,同时记忆时间间隔较长的数据信息。
② PSO
PSO是通过模拟鸟群觅食行为而发展起来的一种基于群体协作的随机搜索算法,最早由Kennedy等人于1995年提出[9]。PSO首先将输入参数初始化为粒子状态,此时的粒子为随机解,然后通过每一次迭代,粒子不断调整位置和速度,追踪个体最优解和全局最优解来更新状态,得到目标函数的最优解,实现全局最优。
③ PSO-LSTM预测模型
选用PSO对LSTM预测模型进行优化。在LSTM预测模型中,有两个参数会对预测效果产生影响,分别是神经元数量、学习率。将这两个参数作为PSO的粒子寻优特征,通过不断更新粒子的位置和速度,使预测模型的适应度达到最小,预测效果最佳。PSO-LSTM预测模型包括以下主要流程。
a.数据采集。从智慧供热系统获取供热系统运行数据。
b.数据预处理。采用拉依达准则剔除异常数据,使用线性插值法补充剔除后的数据及缺失数据。
c.影响因素选取。采用Pearson系数分析供热系统运行数据与预测参数之间的相关性,选取与预测参数相关性显著的影响因素作为预测模型的输入参数。
d.特征集选择。选取一定数量训练集数据与测试集数据。
e.数据归一化。为了避免数量级较大的输入数据对预测参数产生影响,采用极大极小值法将输入数据进行归一化处理。
f.参数优化。采用PSO优化LSTM预测模型的神经元数量、学习率。
g.模型预测。将经PSO优化后的参数输入至LSTM预测模型,进行预测。
选取平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、均方根误差(RMSE)作为预测模型的评价指标。MAE、MAPE、RMSE越小,表示预测偏差越小,预测效果越好。3项指标的计算式分别为:
本文以河北省某集中供热系统为研究对象,供热系统为单热源供热,选取2020年12月8日至2021年3月10日的运行数据为样本,共13 194组数据。每10 min采集1次数据,包括热源供水温度(简称供水温度)、热源回水温度(简称回水温度)、室外温度、瞬时热流量、供水瞬时流量。
采用Pearson系数分析供热系统运行数据与供水温度之间的相关性。Pearson系数是一个介于-1和1之间的值。当两个变量的线性关系增强时,相关系数趋于1或-1:当一个变量增大,另一个变量也增大时,表明二者正相关,相关系数大于0。若一个变量增大,另一个变量减小,表明二者负相关,相关系数小于0。若相关系数等于0,表明二者不存在线性相关关系。
时间步长取1 h,计算室外温度、回水温度、瞬时热流量、供水瞬时流量以及前1~17 h供水温度与当前供水温度的Pearson系数,见表1。由表1可知,室外温度、瞬时热流量、供水瞬时流量与当前供水温度的Pearson系数的绝对值均大于0.5,相关性较大。回水温度与当前供水温度的Pearson系数仅为0.394,相关性小。由于前1~7 h供水温度与当前供水温度的Pearson系数大于0.9,取前1~7 h供水温度作为影响因素。综合上述分析,影响因素选取室外温度、瞬时热流量、供水瞬时流量、前1~7 h供水温度,作为LSTM预测模型的输入参数。
为分析训练集样本数量对预测精度的影响,本文建立6组特征集(见表2),时间步长均为1 h。特征集1、4、6的训练样本为从来源数据中随机抽取。测试样本始终保持48组数据,为2021年1月17日—18日数据。
使用特征集6的数据输入预测模型,使用PSO对LSTM预测模型参数进行优化。学习因子c1、学习因子c2均取2,惯性权重ωmax取1.2,惯性权重ωmin取0.8。在PSO对LSTM预测模型参数优化过程中,不断对比粒子的适应度对个体极值、全局极值进行更新。最终过程得到适应度最小为0.013,对应的神经元数量为176个,学习率为0.005。
采用PSO-LSTM预测模型对2021年1月17日至18日的逐时供水温度进行预测,并与LSTM预测模型的预测结果进行对比。LSTM预测模型参数:神经元数量200、学习率0.005。PSO-LSTM预测模型与LSTM预测模型的预测值见图1。由图1可知,PSO-LSTM预测模型的预测值更接近实际值。
PSO-LSTM预测模型、LSTM预测模型的绝对百分比误差见图2。与平均绝对百分比误差相比,绝对百分比误差计算单个预测值的绝对百分比误差,而非所有预测值的绝对百分比误差的平均值。由图2可知,LSTM预测模型的最大绝对百分比误差为2.72%,平均值为0.77%。PSO-LSTM预测模型的最大绝对百分比误差为2.36%,平均值为0.63%。这说明,PSO-LSTM预测模型的预测效果更好。
在相同条件下,将PSO-LSTM预测模型预测值与BP预测模型、ELM预测模型、LSTM预测模型预测值进行比较。BP预测模型的关键参数为:最大迭代次数800、学习率0.1、训练精度0.001、隐含层节点数60。ELM预测模型的隐含层节点数设置为80。与实际值相比,4种预测模型预测值的平均绝对误差、平均绝对百分比误差、均方根误差见表3。由表3可知,在4种预测模型中,PSO-LSTM预测模型的各项指标均最小,预测效果最佳。因此,PSO对LSTM预测模型参数的优化,可有效提高LSTM预测模型的预测效果。
对于不同样本数量的训练集,PSO-LSTM预测模型的参数进行优化,而BP预测模型、ELM预测模型、LSTM预测模型的参数不变。不同训练集样本数量,4种预测模型的平均绝对误差、平均绝对百分比误差、均方根误差分别见图3~5。由图3~5可知,随着训练集样本数量增加,4种预测模型的平均绝对误差、平均绝对百分比误差、均方根误差均呈下降趋势。训练集样本数量对BP预测模型、ELM预测模型的预测效果影响大,对LSTM预测模型、PSO-LSTM预测模型的预测效果影响小。训练集样本数量一定时,预测效果从优到差排名为PSO-LSTM预测模型、LSTM预测模型、ELM预测模型、BP预测模型。因此,应选取较多的训练数据对预测模型进行训练。
① 粒子群优化算法对长短期记忆神经网络预测模型参数的优化,可有效提高预测模型的预测效果。
② 应选取较多的训练数据对预测模型进行训练。
声明:本文著作权(版权)归《煤气与热力》杂志社所有,严禁任何微信号及媒体未经授权许可随意转载。PS: 当然欢迎大家转发到朋友圈!
更多论文请登录煤气与热力杂志官方网站,免费注册会员阅读电子期刊。阅读步骤:登录http://www.gasheat.cn/→页面右上角注册会员→注册成功后点击《煤气与热力》→期刊索引→点击某期期刊封面即可阅读当期文章。