【Applied Energy 最新原创论文】基于标签数据监督微调的暖通空调系统故障诊断大语言模型

学术   2024-11-07 18:31   美国  

原文信息:

Domain-specific large language models for fault diagnosis of heating, ventilation, and air conditioning systems by labeled-data-supervised fine-tuning

原文链接:

https://www.sciencedirect.com/science/article/pii/S0306261924017616

Highlights

•提出了一种基于标签数据监督的大语言模型微调方法。

开发了一种基于自校正的大语言模型微调数据集生成方法。

设计了一种用于大语言模型微调数据集动态更新的数据增强方法。

微调后的大语言模型对空气处理机组故障的诊断精度接近100 %。

微调后的大语言模型具备强大的泛化能力,并且对输入维度的变化不敏感。

摘要

大语言模型在暖通空调系统故障诊断领域展现了巨大的应用潜力。然而,现有的大语言模型在执行暖通空调系统故障诊断任务时,其精度尚难以满足实际应用的要求,因此迫切需要开发有效的提升精度方法。为了解决这一问题,本研究提出了一种基于故障和无故障标签数据监督的大语言模型微调方法,用于提升大语言模型在故障诊断任务上的精度。该方法设计了一种大语言模型自校正策略,能够基于故障和无故障标签数据自动生成大语言模型微调数据集。此外,本方法还设计了一种基于数据增强的大语言模型多轮微调技术。该技术能够根据微调后大语言模型的故障诊断性能,动态更新微调数据集,从而实现多轮迭代优化,最终获得具备高精度故障诊断能力的大语言模型。本研究采用所提出的大语言模型微调方法,并结合RP-1312空气处理机组故障数据集,对GPT-3.5模型进行了微调。结果显示,微调后的GPT-3.5模型在该数据集上的诊断精度从29.5 %提升至100.0 %,比GPT-4高出31.1 %。为了验证微调后的GPT-3.5模型的泛化能力,本研究进一步将该模型应用于另一个开源数据集中的两个空气处理机组故障诊断任务。这两个空气处理机组的系统组成和传感器配置与RP-1312空气处理机组不同,且它们的故障数据未被用于GPT-3.5模型的微调过程。结果显示,微调后的GPT-3.5模型在这两个空气处理机组故障诊断任务中的平均精度分别从46.0 %提高到99.1 %和从38.8 %提高到98.9 %。除了空气处理机组,本研究还利用变风量空调系统末端设备和冷水机组的故障数据,对所提出的大语言模型微调方法进行了验证。结果表明,微调后的GPT-3.5模型在变风量空调系统末端设备故障诊断任务中的平均精度从33.0 %提升至98.3 %,在冷水机组故障诊断任务中的平均精度从36.0 %提升至99.1 %。综上所述,本研究为故障诊断领域中特定大语言模型的开发提供了一种有效的解决方案。

Abstract

Large language models (LLMs) have exhibited great potential in fault diagnosis of heating, ventilation, and air conditioning systems. However, the fault diagnosis accuracy of LLMs is still unsatisfactory, due to the lack of effective diagnosis accuracy enhancement methods for LLMs. To fill this gap, this study proposes a LLM fine-tuning method supervised by data with fault and fault-free labels to enhance the fault diagnosis accuracy of LLMs. This method designs a LLM self-correction strategy to automatically generate a fine-tuning dataset based on the labeled data. The generated fine-tuning dataset is applied to fine-tune a LLM. Moreover, a data augmentation-based approach is put forward to adaptively update the fine-tuning dataset for iteratively developing a high-performance fine-tuned LLM. The proposed method is utilized to fine-tune the GPT-3.5 model using the air handling unit (AHU) fault dataset from the RP-1312 project. The results show that the diagnosis accuracy of the GPT-3.5 model is increased from 29.5 % to 100.0 % after model fine-tuning. Compared with the GPT-4 model, the fine-tuned GPT-3.5 model achieves a 31.1 % higher average diagnosis accuracy. The fine-tuned GPT-3.5 model is also applied to diagnose faults in two AHUs from another open-source dataset to verify the generalization ability of this model. The two AHUs have different system structures and sensor configurations compared to the AHU in the RP-1312 dataset, and this dataset is not utilized to fine-tune the GPT-3.5 model. The average diagnosis accuracy of the GPT-3.5 model is increased from 46.0 % to 99.1 % and from 38.8 % to 98.9 % for the faults in the two AHUs, respectively, after model fine-tuning. Furthermore, the proposed method is verified using two fault datasets from a variable air volume box and a chiller plant system. After fine-tuning the GPT-3.5 model using the two datasets, the average diagnosis accuracy of this model is increased from 33.0 % to 98.3 % for variable air volume box faults and from 36.0 % to 99.1 % for chiller plant system faults. This study provides an effective solution to the development of domain-specific LLMs for this domain.

Keywords

Large language models;

Generative pre-trained transformers (GPT);

Large language model fine-tuning;

Fault diagnosis;

Heating, ventilation and air conditioning systems;

Graphics

图1. 暖通空调系统故障诊断专用大语言模型的开发与部署流程图

图2. 大语言模型自校正流程图

图3. GPT-3.5模型、GPT-4模型以及经过微调的GPT-3.5模型在RP-1312空气处理机组故障数据集上的诊断精度(微调采用RP-1312数据集)

图4. GPT-3.5模型、GPT-4模型以及经过微调的GPT-3.5模型在LBNL空气处理机组故障数据集上的诊断精度(微调采用RP-1312数据集,LBNL数据集未用于模型微调)

图5. 微调后的GPT-3.5模型对“排气阀门卡死在全开位置”故障的回复示例

团队简介

       本研究由浙江大学、荷兰Eindhoven University of Technology、以及英国University of Cambridge的研究人员共同完成。

通信作者简介:

       章超波,荷兰Eindhoven University of Technology博士后。主要从事基于人工智能算法的建筑能源系统大数据分析、故障诊断、优化控制和仿真建模研究。在Applied Energy、Automation in Construction、Building and Environment和Energy and Buildings等期刊上发表论文40余篇,谷歌学术累计被引1600余次。曾获Energy and Built Environment期刊2020 Best Paper、该期刊学术新人奖提名,以及科爱十年百篇优秀论文等奖项。

第一作者简介:

      张健,浙江大学能源工程学院博士研究生。主要从事结合大语言模型的能源系统大数据分析和故障诊断研究。

关于Applied Energy

本期小编:周佛金  审核人:于丹

《Applied Energy》是世界能源领域著名学术期刊,在全球出版巨头爱思唯尔 (Elsevier) 旗下,1975年创刊,影响因子10.1,CiteScore 21.2,本刊旨在为清洁能源转换技术、能源过程和系统优化、能源效率、智慧能源、环境污染物及温室气体减排、能源与其他学科交叉融合、以及能源可持续发展等领域提供交流分享和合作的平台。开源(Open Access)姊妹新刊《Advances in Applied Energy》影响因子13.0,CiteScore 23.9。全部论文可以免费下载。在《Applied Energy》的成功经验基础上,致力于发表应用能源领域顶尖科研成果,并为广大科研人员提供一个快速权威的学术交流和发表平台,欢迎关注!

公众号团队小编招募长期开放,欢迎发送自我简介(含教育背景、研究方向等内容)至wechat@applied-energy.org

点击“阅读原文”

喜欢我们的内容?

点个“赞”或者“再看”支持下吧!

AEii国际应用能源
发布应用能源领域资讯,介绍国际应用能源创新研究院工作,推广应用能源优秀项目,增进应用能源领域合作
 最新文章