【论文精选】基于机器学习的二级管网供水温度预测

学术其他 2024-12-30 17:05 天津

官网注册：

https://www.gasheat.cn

免费下载论文：

https://www.gasheat.cn/Periodical/index.html

摘自《煤气与热力》2024年12月刊>>>

基于机器学习的二级管网供水温度预测

张志浩，崔萍，周鑫磊

（山东建筑大学热能工程学院，山东济南 250101）

摘　要：以潍坊市某小区热力站为研究对象，将风向、风力、天气条件（指天空的阴晴雨雪等物理现象）、平均室外温度、平均室内温度等数据作为输入变量，构建基于机器学习的二级管网供水温度预测模型，对预测模型的预测效果进行对比。预测模型包括反向传播神经网络模型、支持向量回归模型、随机森林模型。3种预测模型均能较好预测二级管网供水温度。在3种预测模型中，随机森林模型得到的预测值与实测值吻合程度更高，预测值与实测值的误差波动范围更小。无论是否考虑天气条件，随机森林模型的各项评价指标均优于其他两种预测模型。随机森林模型的预测效果最佳。与不考虑天气条件相比，考虑天气条件的随机森林模型的预测效果有所提高。

关键词：二级管网供水温度；机器学习；预测模型

参考文献示例：

张志浩，崔萍，周鑫磊. 基于机器学习的二级管网供水温度预测［J］. 煤气与热力，2024，44（12）：A21-A27.

1　概述

集中供热系统节能控制是一项涉及多个专业领域的综合技术，对提高生活质量和节能有着重要意义^［^1-2^］。机器学习方法简单便捷，依靠真实数据，而不必深究模型的物理概念^［³^］。目前，典型机器学习方法包括神经网络、随机森林、支持向量回归等^［⁴^］。Kato等人^［⁵^］利用循环神经网络成功预测了区域热负荷，得到了较好的预测效果。

随着时代发展，机器学习领域的各种理论越发成熟，预测精度也不断提高。董晨等人^［⁶^］构建循环神经网络、深度神经网络、长短时记忆神经网络预测模型，实现了对二级管网回水温度的预测，结果表明，循环神经网络预测模型具有更高的预测精度。田晨璐^［⁷^］提出了一种基于循环特征与深度集成置信网络的建筑能耗预测方法，实验结果表明，利用循环特征与深度集成置信网络可大幅提升机器学习模型的预测精度。虢诗影^［⁸^］通过对真实数据的归纳，选定了影响医院供暖期天然气消耗量的8个气象特征与时空特征，搭建了预测模型，预测了医院供暖期天然气消耗量，模型有较好的预测效果。步婷等人^［⁹^］对比了5种常见机器学习算法在不同输入变量组合下对商业建筑负荷预测结果，证明了基于随机森林的负荷分段预测模型比多项式回归预测模型的准确度高、实用性更强。李继伟等人^［¹⁰^］以香港地区1 923座商用建筑作为研究对象，选取13种常见的机器学习模型作为建筑能耗预测模型，结果表明，XGBoost（EXtreme Gradient Boosting，极端梯度提升）算法对数据较为完整的建筑能耗预测准确度最高，决策树算法对于数据缺失严重的建筑能耗预测准确度优于XGBoost算法。周淑媛^［¹¹^］以居住建筑建造时间、建筑高度等15个影响因素为输入变量训练BP神经网络，实现了对居住建筑工程造价的预测。

机器学习在建筑领域主要用于预测回归，根据已有历史数据训练完成的预测模型有较高的准确性，与优化算法结合使用时精度进一步提高，在实际工程的应用中有着重要意义。虽然机器学习方法也有其局限性，例如过于依赖历史数据质量等，但总的来看依然是一种先进且具有潜力的技术。本文以潍坊市某小区热力站为研究对象，将风向、风力、天气条件、平均室外温度、平均室内温度等数据作为输入变量，构建基于机器学习的二级管网供水温度预测模型，对预测模型的预测效果进行对比。

2　数据获取及预处理

2.1　数据获取

从潍坊市某热力公司数据库获取了某居民小区2021年11月15日0：00至2022年3月22日11：00的二级管网供水温度、风向、风力、天气条件（指天空的阴晴雨雪等物理现象）、平均室外温度、平均室内温度。其中气象类数据（风向、风力、天气条件、室外温度）由当地气象中心提供，每1 h采集1次数据。二级管网供水温度、室内平均温度由小区热力站提供，每10 min采集1次数据，逐时数据取每1 h采集的6次数据的平均值。共获得3 050组数据样本。

2.2　数据预处理

数据的采集、上传过程均可能由于设备、网络等问题产生数据缺失和异常。数据的缺失和异常影响机器学习效果，因此对异常数据进行处理以及缺失数据填充非常重要^［¹²^］。在3 050组数据中，剔除异常数据后，对剔除数据位置及缺失数据进行均值填充。经处理，最终获得3 050组完整的数据样本。

数据样本中的风向、天气条件属于文本数据，神经网络等大部分算法无法直接识别文本数据，因此需要将其进行数值量化。风对建筑热负荷的影响主要分为两部分：一是冷风渗透，室外的冷风通过门窗等结构缝隙进入室内，热负荷增大。二是随着风速增大，风与围护结构之间的扰动增强，增大了围护结构外壁表面传热系数，使建筑热负荷增加^［¹³^］。由于风对围护结构外壁表面传热系数的影响基本与风向无关^［¹⁴^］，因此对风向的数值量化仅考虑对冷风渗透的影响。经外窗缝隙渗入室内的总空气量需用朝向修正系数来修正，因此根据GB 50736—2012《民用建筑供暖通风与空气调节设计规范》附录G选用渗透冷空气量的朝向修正系数作为风向数据的量化值，见表1。根据前人经验，对天气条件进行0~1范围的数值量化^［¹⁵^］，量化结果见表2。

表1　风向数值量化结果

表2　天气数值量化结果

神经网络与支持向量机是数值计算型算法，需要对输入变量采用极大极小值法进行归一化处理。随机森林则不需要对输入量进行归一化处理。将样本数据以8∶2的比例随机划分成训练集（2 440个样本）与测试集（610个样本），训练集用来训练模型，测试集用来测试预测模型的预测效果。

3　评价指标

采用均方误差（MSE）、平均绝对误差（MAE）、相关系数（R²）评价预测模型训练和预测效果。均方误差是反映预测值与实测值之间差异程度的一种度量，均方误差越小说明预测效果越好。平均绝对误差用于评估预测值与实测值的接近程度，平均绝对误差越小说明预测效果越好。相关系数是一种用于评估回归模型拟合优度的统计指标，表示因变量的变异性能够由模型解释的比例，即模型对数据的拟合程度，取值范围为0~1，越接近1说明拟合程度越好。

均方误差、平均绝对误差、相关系数的计算式分别为：

式中　t_MSE——均方误差，℃²

　　　n——样本数量

　　　t_k——实测值，℃

　　　t_for_，_k——预测值，℃

　　　t_MAE——平均绝对误差，℃

　　　R²——相关系数

　　　t_av——平均实测值，℃

4　预测模型建立及预测结果

预测模型输入参数为风向、风力、天气条件、平均室外温度、平均室内温度，输出参数为二级管网供水温度。

4.1　BPNN模型

①　原理

BP神经网络——BPNN（Back Propagation Neural Network，反向传播神经网络）是机器学习中常见的一种方法。BPNN由输入层、隐藏层、输出层构成，层与层之间由神经元连接^［¹⁶^］。此外，每个神经元还需要通过一个激活函数来构造非线性特性。

BPNN首先随机初始化权重，经神经元激活函数和对应权重处理后形成的信号从前向后传递，到输出层时输出的模型预测值与实际值对比，根据均方误差MSE重新调整权重，直到均方误差MSE达到要求或达到所设定的迭代次数。

②　模型构建

在考虑天气条件下，构建BPNN模型。Tensorflow是机器学习方面的一种框架，它包含许多用于机器学习的数据集，同时还封装了大量机器学习的算法和函数。

本文使用Tensorflow中的Sequential模型搭建BPNN模型。Sequential模型名为顺序模型，是最基础的线性顺序结构，由层与层按顺序堆叠而成。它的每1层都具有1个输入张量和1个输出张量。模型共4层，输入层是第1层，有5个神经元，第2、第3层为隐藏层，神经元数量需人工调试，输出层仅有1个神经元（二级管网供水温度）。4层网络都使用激活函数Relu函数。此外，为避免模型过拟合，在隐藏层中使用了Dropout策略^［¹⁷^］，层中的神经元随机失活。

使用网格搜索法对隐藏层神经元数量进行寻优。网格搜索法将参数在一定范围内划分成若干点，在训练模型时遍历这些点，并计算出相应的均方误差。当第2、第3层神经元数量分别为80、20时，均方误差MSE误差最小。迭代次数达到150次时，模型均方误差MSE基本趋于平稳。BPNN模型参数见表3。

表3　BPNN模型参数

③　预测结果

将测试集的输入特征代入完成训练的BPNN模型，得到二级管网供水温度预测值。采用BPNN模型，测试集所有样本预测值、实测值见图1。测试集1~100号、401~500号样本预测值、实测值及预测值误差分别见图2、3。

图1　采用BPNN模型测试集所有样本预测值、实测值

图2　采用BPNN模型测试集1~100号样本预测值、实测值及预测值误差

图3　采用BPNN模型测试集401~500号样本预测值、实测值及预测值误差

4.2　SVR模型

①　原理

支持向量机（Support Vector Machine，SVM）用于回归模型时称为支持向量回归（Support Vector Regression，SVR）。支持向量机的优点在于对样本数量要求不高，泛化能力强。

②　模型构建

使用Python软件中的Scikit-learn库的Support Vector Regression模块构建SVR模型。

核函数与惩罚因子的选择关系到预测模型的预测效果。核函数的选择尤为重要，高斯核函数也称为径向基函数（Radial Basis Function，RBF）是一种局部性强的核函数，可以将1个样本映射到1个更高维的空间内。无论大样本还是小样本，高斯核函数均有比较好的性能，而且比多项式核函数参数少。因此，本文选择高斯核函数作为SVR模型的核函数。

惩罚因子表示对离散点的容忍程度。惩罚因子增大，则预测模型对偏离超平面的点容忍度降低。gamma值是用于非线性支持向量机的超参数。gamma值较低表示相似半径较大，这会导致将更多的点组合在一起。对于gamma值较高的情况，点之间必须非常接近，才能将其视为同一组或一类。

SVR模型训练时采用高斯核函数。划分网格时：惩罚因子取1~100，变化步长为5。gamma值取0.5~5.0，变化步长为0.5。使用均方误差对SVR模型预测效果进行评价，进行网格搜索。当惩罚因子取10、gamma值取4时，预测模型均方误差取得最小值。因此，SVR模型的惩罚因子取10，gamma值取4。

③　预测结果

将测试集的输入特征代入完成训练的SVR模型，得到二级管网供水温度预测值。采用SVR模型，测试集所有样本预测值、实测值见图4。测试集1~100号、401~500号样本预测值、实测值及预测值误差分别见图5、6。

图4　采用SVR模型测试集所有样本预测值、实测值

图5　采用SVR模型测试集1~100号样本预测值、实测值及预测值误差

图6　采用SVR模型测试集401~500号样本预测值、实测值及预测值误差

4.3　随机森林模型

①　原理

随机森林是以决策树为基学习器的集成学习方法。集成学习的思想是建立多个独立的个体学习器，然后用某种算法将它们组合成一个优于独立个体的学习器^［¹⁸^］。随机森林回归模型由多棵回归树共同构成，树与树互不影响，模型的输出结果由所有的树共同决定，属于Bagging（Bootstrap aggregating，引导聚集算法）的拓展变体^［¹⁹^］。

②　模型构建

在考虑天气条件下，搭建随机森林模型。随机森林模型主要参数为决策树的数量，使用网格搜索法对其进行网格划分，使用均方误差MSE对随机森林模型预测效果进行评价，发现当决策树数量取140时，均方误差取得最小值。其他参数通过手动调节，随机森林模型参数见表4。

表4　随机森林模型参数

③　预测结果

将测试集的输入特征代入完成训练的随机森林模型，得到二级管网供水温度预测值。采用随机森林模型，测试集所有样本预测值、实测值见图7。测试集1~100号、401~500号样本预测值、实测值及预测值误差见图8、9。

图7　采用随机森林模型测试集所有样本预测值、实测值

图8　采用随机森林模型测试集1~100号样本预测值、实测值及预测值误差

图9　采用随机森林模型测试集401~500号样本预测值、实测值及预测值误差

4.4　预测结果分析

由图1~9的预测结果可知，3种预测模型均能较好预测二级管网供水温度。在3种预测模型中，随机森林模型得到的预测值与实测值吻合程度更高，预测值与实测值的误差波动范围更小。

5　预测效果评价

除考虑天气条件外，笔者还在不考虑天气条件的前提下建立了3种预测模型。考虑天气条件、不考虑天气条件下，3种预测模型的评价指标见表5。由表5可知，无论是否考虑天气条件，随机森林模型的各项评价指标均优于其他两种预测模型。因此，随机森林模型的预测效果最佳。与不考虑天气条件相比，考虑天气条件的随机森林模型的平均绝对误差稍有增大外，均方误差、相关系数均有所改善，总体上模型预测效果有所提高。

表5　考虑天气条件、不考虑天气条件下3种预测模型的评价指标

6　结论

①　3种预测模型均能较好预测二级管网供水温度。在3种预测模型中，随机森林模型得到的预测值与实测值吻合程度更高，预测值与实测值的误差波动范围更小。无论是否考虑天气条件，随机森林模型的各项评价指标均优于其他两种预测模型。随机森林模型的预测效果最佳。

②　与不考虑天气条件相比，考虑天气条件的随机森林模型的预测效果有所提高。

参考文献：

［ 1 ］　贾玉贵，王雪峰. 基于全寿命周期的集中供热系统管网设计优化研究［J］. 热能动力工程，2017（9）：105-108，127.

［ 2 ］　李思琦，蒋志坚. 供热站节能控制系统研究［J］. 现代电子技术，2019（22）：126-130.

［ 3 ］　孔祥玉，郑锋，鄂志君，等. 基于深度信念网络的短期负荷预测方法［J］. 电力系统自动化，2018（5）：133-139.

［ 4 ］　何清，李宁，罗文娟，等. 大数据下的机器学习算法综述［J］. 模式识别与人工智能，2014（4）：327-336.

［ 5 ］　KATO K，SAKAWA M，ISHIMARU K，et al. Heat Load Prediction Through Recurrent Neural Network in District Heating and Cooling Systems［C］// IEEE. 2008 IEEE International Conference on Systems， Man and Cybernetics. ［S.l.］：IEEE，2008：1401-1406.

［ 6 ］　董晨，周浩杰，宫铭举，等. 基于神经网络的换热站二次回水温度预测方法［J］. 计算机应用与软件，2020（6）：84-87.

［ 7 ］　田晨璐. 基于深度学习方法的建筑用能数据分析研究（博士学位论文）［D］. 济南：山东建筑大学，2020：46-47

［ 8 ］　虢诗影. 基于机器学习的气象环境与医院冬季供暖能源消耗量的分析与预测模型研究［J］. 中国设备工程，2021（11）：27-28.

［ 9 ］　步婷，范蕊，孙可欣，等. 基于机器学习算法的区域建筑负荷预测建模研究［J］. 建筑科学，2022（4）：3-5.

［10］　李继伟，冯国会，徐丽. 建筑能耗预测的机器学习回归模型研究［J］. 沈阳建筑大学学报，2021（6）：2-4.

［11］　周淑媛. 基于机器学习的居住建筑工程造价预测研究（硕士学位论文）［D］. 包头：内蒙古科技大学，2020：36-45.

［12］　吴振全. 基于NB-IoT的智能供热系统设计与实现（硕士学位论文）［D］. 哈尔滨：哈尔滨工业大学，2021：12-22.

［13］　袁闪闪. 基于综合气象预测的供热管网前馈动态调控方法研究（博士学位论文）［D］. 北京：中国建筑科学研究院，2015：37-40.

［14］　邓宁华. 风速风向对墙体表面换热系数影响的实验研究（硕士学位论文）［D］. 长沙：湖南大学，2001：53-54.

［15］　孟萌萌. 基于RBF神经网络短期热网负荷预测研究（硕士学位论文）［D］. 哈尔滨：哈尔滨工业大学，2013：27-28.

［16］　魏雪. 基于ABC-BPNN的内蒙古西部草原民居建筑节能多目标优化模型构建研究（硕士学位论文）［D］. 包头：内蒙古科技大学，2019：26-27.

［17］　SRIVASTAVA N，HINTON G，KRIZHEVSKY A，et al. Dropout：a Simple Way to Prevent Neural Networks from Overfitting［J］. Journal of Machine Learning Research，2014（1）：1929-1958.

［18］　孔维鑫. 基于热负荷预测的换热站量化供热研究（硕士学位论文）［D］. 大连：大连海事大学，2019：35-37.

［19］　BREIMAN L. Random Forests［J］. Machine Learning，2001（1）：5-32.

（本文责任编辑：贺明健）

维普免费下载《煤气与热力》论文（现刊和过刊均可）

日前，《煤气与热力》杂志社有限公司在维普网站http://cqvip.com/开通论文免费下载服务，论文刊出后两个月后，可在维普网站查询，并直接免费下载。在维普网站免费下载《煤气与热力》论文步骤如下：

1. 在维普网站注册会员。

2. 搜索出《煤气与热力》论文，点击进入。

3. 论文免费下载界面截图见上图。点击“免费下载”，可直接下载该论文。

声明：本文著作权（版权）归《煤气与热力》杂志社所有，严禁任何微信号及媒体未经授权许可随意转载。PS: 当然欢迎大家转发到朋友圈！

更多论文请登录煤气与热力杂志官方网站，免费注册会员阅读电子期刊。阅读步骤：登录http://www.gasheat.cn/→页面右上角注册会员→注册成功后点击《煤气与热力》→期刊索引→点击某期期刊封面即可阅读当期文章。

点击关注我们↘

煤气与热力杂志

《煤气与热力》始于1978年，创刊于1981年，中国核心期刊，中国土木工程学会燃气与供热分会会刊。筛选燃气与供热等能源供应领域最有价值的技术信息，新闻分类整理、政策标准、热点讨论、投稿查询、论文检索、写作指导、编委风采、精品会议……

【论文精选】蒸汽泵烟气余热回收供热系统技术经济性分析

2025供热工程建设与高效运行研讨会“兴邦杯”优秀论文征集启事

加力破除地方保护和市场分割！国家发展改革委印发《全国统一大市场建设指引（试行）》

天津市土木工程学会燃气与供热分会关于开展第二批天津市青年科技人才培养项目人选评选工作的通知

【论文精选】提升热源侧调峰能力的热电解耦技术

【征订】欢迎订阅2025年《煤气与热力》杂志

湖南省印发居民生活用天然气阶梯价格实施办法，2025年1月1日起执行！

逐步削减对燃气供暖等化石能源消费的财政补贴！《北京市财政支持做好碳达峰碳中和工作的实施意见》印发

【论文精选】燃气安全管理与政府网格化管理融合实践

【征订】欢迎订阅2025年《煤气与热力》杂志

【论文精选】储存条件下PE燃气管材氧化诱导时间变化

2025供热工程建设与高效运行研讨会“兴邦杯”优秀论文征集启事

【论文精选】燃气中央热水供应系统的设计计算和应用

【征订】欢迎订阅2025年《煤气与热力》杂志

上海市调整天然气发电上网电价、非居民天然气销售基准价格，自2025年1月1日起执行！

《加快工业领域清洁低碳氢应用实施方案》印发

【论文精选】LNG管道非满液预冷过程应力和变形模拟

【征订】欢迎订阅2025年《煤气与热力》杂志

支持鼓励地热能等新能源供热，不得新建和扩建分散式燃气自备锅炉，推动既有燃气锅炉替代改造！西安市促进供热行业提质增效

供热基础设施REIT获批！国内市政基础设施公募REIT时代到来？

【论文精选】相变材料用于电子器件散热、热防护的研究进展

【征订】欢迎订阅2025年《煤气与热力》杂志

2024年供热行业十大新闻

国家主席习近平发表二〇二五年新年贺词

【论文精选】城市燃气管网在线仿真系统开发与应用

【征订】欢迎订阅2025年《煤气与热力》杂志

2024年燃气行业十大新闻

这可能是2025年最值得期待的能源与燃气行业大会！

【论文精选】燃气行业事故零死亡目标路径和路线

【征订】欢迎订阅2025年《煤气与热力》杂志

国家发改委：最大程度鼓励民营企业参与，不断提升基础设施等项目建设运营水平！

又一省级清洁能源集团成立

【论文精选】基于机器学习的二级管网供水温度预测

2025供热工程建设与高效运行研讨会“兴邦杯”优秀论文征集启事

《面向双碳目标的新型智慧供热发展蓝皮书》重磅发布——开启供热新征程

标准动态 | 强制性国家标准《危险化学品重大危险源安全监控技术规范》发布

【论文精选】城镇燃气管道泄漏智能化分级管理

【征订】欢迎订阅2025年《煤气与热力》杂志

科学技术普及法完成首次修订

【论文精选】汽-水换热系统水击成因及消除措施

2025供热工程建设与高效运行研讨会“兴邦杯”优秀论文征集启事

《全国燃气事故分析报告（2024年·第三季度》发布

北京市丨新型储能产业发展实施方案（2024—2027年）

【论文精选】汽-水换热系统水击成因及消除措施

【征订】欢迎订阅2025年《煤气与热力》杂志

国务院：地方政府专项债券可用作天然气管网和储气设施、供热、供气等行业项目资本金，比例上限提高至30%！

昆明市住建局：天然气用户要自觉配合管道燃气经营企业入户检查

【论文精选】燃气设施与电动自行车集中充电设施的安全距离

2025供热工程建设与高效运行研讨会“兴邦杯”优秀论文征集启事

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉