云南大学袁申富Fuel:机器学习-双向推理建模预测焦炉煤气中H2和CH4浓度并推断最佳反应条件

文摘   2024-10-31 22:32   广东  

第一作者:张晓果

通讯作者:袁申富

通讯单位:云南大学

论文DOI:10.1016/j.fuel.2024.133325


全文速览


煤焦化是一种高效、环保的能源利用技术,可产生各种工业原料。然而,煤焦化反应的复杂性给化学理论的全面捕捉和推导其反应过程带来了巨大的挑战。为解决这一难题,本文提出了一种新颖的双向推理建模方法来模拟煤焦化过程。这种建模方法不仅能预测H2和CH4的浓度,还能根据所需的H2和CH4浓度推断出最佳操作条件。在这项工作中,将三种具有代表性的机器学习方法(XGBoost、随机森林和ANN)与双向推理建模方法进行对比,深入探讨影响H2和CH4浓度的关键因素。实验结果表明,影响CH4浓度的主要因素是C,H2浓度主要受固定碳的影响,而C对H2+CH4的影响最大。双向推理建模方法在预测H2和CH4浓度及运行条件方面取得了优异的性能。预测H2、CH4和H2+CH4浓度的R2分别为0.9767、0.9936和0.9851。根据所需的H2和CH4浓度预测结焦温度的结果表明,结焦温度与H2和CH4浓度之间呈正相关。

背景介绍


煤焦化技术的发展为缓解煤炭利用与环境保护之间的矛盾提供了可行的解决方案。煤焦化不仅减少传统燃煤的污染排放,还为化学工业提供了丰富的原材料资源,如焦炭、煤气和煤焦油。然而,煤炭是由各种有机和无机物质组成的非均质固体。在高温碳化条件下,煤炭中的各种成分会发生不同的热分解反应。这些反应相互作用、相互影响,使煤的焦化过程变得异常复杂。遗憾的是,目前的理论化学方法无法完全模拟或推导出这些反应之间的关联。由于缺乏对反应相关性的准确描述,使得对最佳操作条件、煤炭配比、煤炭性质的探索以及对产品浓度的预测变得更加复杂。因此,研究人员不得不采用试错法,逐一系统地研究操作条件,在探索煤焦化过程中耗费了大量的人力和时间成本。因此,迫切需要一种模拟煤焦化反应相关性的建模方法,以提高生产率并降低研究成本。

本文亮点


1、一种适用于机器学习的煤化工数据处理范式。


2、提出一种模拟煤焦化过程的新型双向推理建模方法。


3、四个机器学习模型用于预测焦炉煤气中的H2和CH4浓度。

图文解析


1.双向推理建模法示意图。


本研究旨在开发一个通用的煤焦化建模框架。首先,通过工厂和论文收集实验数据。为避免各种数据来源的负面影响,需对数据进行处理。数据处理过程应包括以下三个部分:(1)预处理数据,使其格式统一。将数据缩放至同一范围,避免因不同特征的取值范围和单位不同而影响模型的性能和稳定性;(2)清理数据,去除原始数据中不必要的输入,以减少模型的计算量;(3)存储数据,将处理后的数据存储起来,供机器学习模型使用。利用数据处理范式对收集到的数据进行处理,生成统一的高质量数据集。随后,双向推理模型将推断出煤焦化的产品浓度和最佳操作条件。



图2.煤焦化数据集的分布特征分析。


作者通过分析输入特征和目标参数的分布,发现数据集的特征主要集中在特定的值范围内。通过计算每对特征之间的皮尔逊相关系数,不同特征(不包括H2和CH4)的皮尔逊相关系数大多接近0。因此,这些特征适合在建模中保留。采用不同数量的神经元进行预测CH4和H2浓度的实验,当第三层(第二隐藏层)和第二/第四层(第一/第三隐藏层)的神经元数分别为12和14时,模型的性能最高,R2值约为0.98。因此,选择(12,14)个神经元的配置来优化模型性能。


表1四种模型预测CH4、H2和CH4+H2浓度准确性的指标。


作者计算四种模型的MAE、MSE、RMSE和R2值。开发了三种预测任务:预测CH4浓度、预测H2浓度以及联合预测CH4和H2浓度(H2+CH4)。可以看出四种不同的机器学习建模方法可以对CH4、H2和CH4的浓度做出相当准确的预测。不过,XGBoost和随机森林模型在预测性能方面优于ANN和双向推理模型。在H2、CH4和H2+CH4预测任务中,XGBoost和随机森林模型的R2值超过0.99,而ANN和双向推理模型仅在CH4预测任务中超过0.99。出现这种现象的主要原因是ANN和双向推理模型通常与深度学习有关。与传统的机器学习相比,深度学习涉及更多的参数,如权重、神经元初始值和网络架构。参数数量的增加需要更大数据量。因此,ANN和双向推理模型可能难以充分利用可用数据。


图3. 四种模型的预测性能和变量的重要性排序。


通过散点图能够更加直观地四种模型的预测性能。从中可以得出,四个建模模型都表现出良好的性能。基于以上讨论,可以看出四种不同的建模方法都能在预测焦炉煤气产品分布方面取得准确的结果。通过对模型中的元素进行重要性排序得出,固定碳在预测H2浓度方面起着至关重要的作用。这表明固定碳对煤焦化过程中的H2浓度有重大影响。固定碳与H2浓度之间存在负相关关系;固定碳含量增加,H2浓度降低;C是影响CH4浓度最显著的特征。

图4. 不同输入特征对产品浓度预测任务的影响。


通过对输入特征重要性的可视化,可以更加清晰得出C和固定碳是影响CH4浓度的主要因素,而固定碳是影响H2浓度的最重要因素。C在CH4+H2浓度中都起着重要作用,而固定碳是第二重要的特征。值得注意的是,双向推理模型中组件的重要性系数表现出更均匀的分布。这是由于输入特征的随机掩码以及训练期间原始输入的后续重建。掩码后,该模型不再专门对单向响应关系进行建模,而是利用其余输入特征推测掩码的输入特征。


图5. 基于所需的H2和CH4浓度推断煤焦化温度的热图。


将焦化温度作为双向推理模型探究操作条件的示例,可以推断,较高的温度会导致CH4和H2的浓度增加。随着温度从1005.5℃升高到1007.5℃,CH4和H2的浓度分别从0.24上升到0.32和0.56到0.64。这表明焦化温度对CH4和H2的浓度有显着影响。上述实验全面证明了双向推理模型的双向推断能力,超越了传统建模方法的单向推断局限。该模型不仅可根据所需的CH4和H2浓度得出最佳运行条件,还能大大减少研究人员的时间和人力成本。

总结与展望


为了模拟煤焦化过程,特别是推断焦炉煤气中H2和CH4的浓度以及基于所需的H2和CH4浓度的最佳反应条件,提出了一种新型双向推理模型,并将其与其它三种机器学习模型进行对比,根据MAE、MSE、RMSE和R2指标评估了它们的预测性能。此外,还对影响H2和CH4浓度的因素的重要性进行排序。实验结果表明,XGBoost和随机森林的预测精度优于ANN和双向推理模型。C和固定碳分别在预测H2和CH4浓度中发挥了关键作用,其中C被认为是H2+CH4联合预测任务中最重要的影响因素。值得注意的是,双向推理模型具有根据所需的H2和CH4浓度预测煤焦化最佳反应温度的独特优势,这是其他模型尚未实现的能力。双向推理建模方法用于探索煤焦化过程中反应条件和产物分布之间的复杂关系,为确定最佳和经济高效的煤焦化解决方案提供了新的见解。此外,还展示了传统机器学习和深度学习在煤焦化领域的潜在应用。尽管随机森林和XGBoost等传统机器学习方法在特定任务中仍具有显著优势,但在其他任务(如双向推理)中表现出色的深度学习模型则展示了其超越传统机器学习方法的潜力。随着数据量的增加,双向推理模型的性能有望进一步提高,这表明其具有广泛的潜在应用前景。

通讯作者介绍


袁申富,中国科学院大学工学博士,云南大学博士生导师,化工专业负责人,云南省碳中和绿色低碳技术重点实验室副主任。主要从事煤和生物质热解、气化及废弃物资源化利用。建立了自主知识产权的云南大学能源化学工程中试平台。


编辑: 马野

科学温故QQ群—科研爱好者集中地!(不定期发布讲座通知,分享录制视频)
微信群(学术交流/电催化/光催化/理论计算/资源共享/文献互助群;C1化学/生物质/单原子/多孔材料分舵),小编微信:hao-xinghua或alicezhaovip,备注“姓名-单位”。

温故求新
知幽渺之理而收显著之效:从实验到理论,探索催化反应隐藏的信息与机理,打开催化过程“黑匣子”!
 最新文章