【Applied Energy 最新原创论文】基于标签数据监督微调的暖通空调系统故障诊断大语言模型

学术 2024-11-07 18:31 美国

原文信息：

Domain-specific large language models for fault diagnosis of heating, ventilation, and air conditioning systems by labeled-data-supervised fine-tuning

原文链接：

https://www.sciencedirect.com/science/article/pii/S0306261924017616

Highlights

•提出了一种基于标签数据监督的大语言模型微调方法。

•开发了一种基于自校正的大语言模型微调数据集生成方法。

•设计了一种用于大语言模型微调数据集动态更新的数据增强方法。

•微调后的大语言模型对空气处理机组故障的诊断精度接近100 %。

•微调后的大语言模型具备强大的泛化能力，并且对输入维度的变化不敏感。

摘要

大语言模型在暖通空调系统故障诊断领域展现了巨大的应用潜力。然而，现有的大语言模型在执行暖通空调系统故障诊断任务时，其精度尚难以满足实际应用的要求，因此迫切需要开发有效的提升精度方法。为了解决这一问题，本研究提出了一种基于故障和无故障标签数据监督的大语言模型微调方法，用于提升大语言模型在故障诊断任务上的精度。该方法设计了一种大语言模型自校正策略，能够基于故障和无故障标签数据自动生成大语言模型微调数据集。此外，本方法还设计了一种基于数据增强的大语言模型多轮微调技术。该技术能够根据微调后大语言模型的故障诊断性能，动态更新微调数据集，从而实现多轮迭代优化，最终获得具备高精度故障诊断能力的大语言模型。本研究采用所提出的大语言模型微调方法，并结合RP-1312空气处理机组故障数据集，对GPT-3.5模型进行了微调。结果显示，微调后的GPT-3.5模型在该数据集上的诊断精度从29.5 %提升至100.0 %，比GPT-4高出31.1 %。为了验证微调后的GPT-3.5模型的泛化能力，本研究进一步将该模型应用于另一个开源数据集中的两个空气处理机组故障诊断任务。这两个空气处理机组的系统组成和传感器配置与RP-1312空气处理机组不同，且它们的故障数据未被用于GPT-3.5模型的微调过程。结果显示，微调后的GPT-3.5模型在这两个空气处理机组故障诊断任务中的平均精度分别从46.0 %提高到99.1 %和从38.8 %提高到98.9 %。除了空气处理机组，本研究还利用变风量空调系统末端设备和冷水机组的故障数据，对所提出的大语言模型微调方法进行了验证。结果表明，微调后的GPT-3.5模型在变风量空调系统末端设备故障诊断任务中的平均精度从33.0 %提升至98.3 %，在冷水机组故障诊断任务中的平均精度从36.0 %提升至99.1 %。综上所述，本研究为故障诊断领域中特定大语言模型的开发提供了一种有效的解决方案。

Abstract

Large language models (LLMs) have exhibited great potential in fault diagnosis of heating, ventilation, and air conditioning systems. However, the fault diagnosis accuracy of LLMs is still unsatisfactory, due to the lack of effective diagnosis accuracy enhancement methods for LLMs. To fill this gap, this study proposes a LLM fine-tuning method supervised by data with fault and fault-free labels to enhance the fault diagnosis accuracy of LLMs. This method designs a LLM self-correction strategy to automatically generate a fine-tuning dataset based on the labeled data. The generated fine-tuning dataset is applied to fine-tune a LLM. Moreover, a data augmentation-based approach is put forward to adaptively update the fine-tuning dataset for iteratively developing a high-performance fine-tuned LLM. The proposed method is utilized to fine-tune the GPT-3.5 model using the air handling unit (AHU) fault dataset from the RP-1312 project. The results show that the diagnosis accuracy of the GPT-3.5 model is increased from 29.5 % to 100.0 % after model fine-tuning. Compared with the GPT-4 model, the fine-tuned GPT-3.5 model achieves a 31.1 % higher average diagnosis accuracy. The fine-tuned GPT-3.5 model is also applied to diagnose faults in two AHUs from another open-source dataset to verify the generalization ability of this model. The two AHUs have different system structures and sensor configurations compared to the AHU in the RP-1312 dataset, and this dataset is not utilized to fine-tune the GPT-3.5 model. The average diagnosis accuracy of the GPT-3.5 model is increased from 46.0 % to 99.1 % and from 38.8 % to 98.9 % for the faults in the two AHUs, respectively, after model fine-tuning. Furthermore, the proposed method is verified using two fault datasets from a variable air volume box and a chiller plant system. After fine-tuning the GPT-3.5 model using the two datasets, the average diagnosis accuracy of this model is increased from 33.0 % to 98.3 % for variable air volume box faults and from 36.0 % to 99.1 % for chiller plant system faults. This study provides an effective solution to the development of domain-specific LLMs for this domain.

Keywords

Large language models；

Generative pre-trained transformers (GPT)；

Large language model fine-tuning；

Fault diagnosis；

Heating, ventilation and air conditioning systems；

Graphics

图1. 暖通空调系统故障诊断专用大语言模型的开发与部署流程图

图2. 大语言模型自校正流程图

图3. GPT-3.5模型、GPT-4模型以及经过微调的GPT-3.5模型在RP-1312空气处理机组故障数据集上的诊断精度（微调采用RP-1312数据集）

图4. GPT-3.5模型、GPT-4模型以及经过微调的GPT-3.5模型在LBNL空气处理机组故障数据集上的诊断精度（微调采用RP-1312数据集，LBNL数据集未用于模型微调）

图5. 微调后的GPT-3.5模型对“排气阀门卡死在全开位置”故障的回复示例

团队简介

本研究由浙江大学、荷兰Eindhoven University of Technology、以及英国University of Cambridge的研究人员共同完成。

通信作者简介：

章超波，荷兰Eindhoven University of Technology博士后。主要从事基于人工智能算法的建筑能源系统大数据分析、故障诊断、优化控制和仿真建模研究。在Applied Energy、Automation in Construction、Building and Environment和Energy and Buildings等期刊上发表论文40余篇，谷歌学术累计被引1600余次。曾获Energy and Built Environment期刊2020 Best Paper、该期刊学术新人奖提名，以及科爱十年百篇优秀论文等奖项。

第一作者简介：

张健，浙江大学能源工程学院博士研究生。主要从事结合大语言模型的能源系统大数据分析和故障诊断研究。

关于Applied Energy

本期小编：周佛金审核人：于丹

《Applied Energy》是世界能源领域著名学术期刊，在全球出版巨头爱思唯尔 (Elsevier) 旗下，1975年创刊，影响因子10.1，CiteScore 21.2，本刊旨在为清洁能源转换技术、能源过程和系统优化、能源效率、智慧能源、环境污染物及温室气体减排、能源与其他学科交叉融合、以及能源可持续发展等领域提供交流分享和合作的平台。开源（Open Access）姊妹新刊《Advances in Applied Energy》影响因子13.0，CiteScore 23.9。全部论文可以免费下载。在《Applied Energy》的成功经验基础上，致力于发表应用能源领域顶尖科研成果，并为广大科研人员提供一个快速权威的学术交流和发表平台，欢迎关注！

公众号团队小编招募长期开放，欢迎发送自我简介（含教育背景、研究方向等内容）至wechat@applied-energy.org

点击“阅读原文”

喜欢我们的内容？

点个“赞”或者“再看”支持下吧！

http://mp.weixin.qq.com/s?__biz=MzAxMTE3NTAwNA==&mid=2649935124&idx=1&sn=c5128b1630d5662df3cba91fae8ec069

AEii国际应用能源

发布应用能源领域资讯，介绍国际应用能源创新研究院工作，推广应用能源优秀项目，增进应用能源领域合作

美国康奈尔大学推出AI4S访问教授计划，邀全球学者共促人工智能可持续发展

【再创新高】Advances in Applied Energy CiteScore Tracker =31.2！

【Advances in Applied Energy】使用众包数据估算全球城市的碳足迹

【Advances in Applied Energy】电池、燃料电池亦或发动机？重型货车用电经济性和环保性评估

【Advances in Applied Energy】有限电力供应下的多能枢纽电气化：如何更好地减排温室气体？

【一“图”为快】中国占据超过一半的特斯拉电动汽车产能

【Advances in Applied Energy】电力市场中零售商的战略零售定价和需求报价：一种数据驱动的机会约束规划

【Advances in Applied Energy】未来电网的无功功率市场

【Applied Energy】紫外-可见光照射下低浓度甲烷的光催化实验及其动力学研究

【Advances in Applied Energy】部分遮挡情况下光伏综合电特性的通用模型

【一“图”为快】2023年不同国家的电网储能电池容量

【Applied Energy】潜热储能管内翅片结构的数据驱动多保真拓扑设计

【Applied Energy】使用聚光式太阳能和热化学储能优化固体氧化物电解池：一种耦合的深度学习方法

【Applied Energy】提升电池耐久性：串联锂离子电池系统的多故障诊断与安全评估

【Applied Energy】面向实时电力市场风险规避报价决策的综合能源生产单元多能流能量管理方法

Nexus | 对话腾讯战略发展部 “碳寻计划”

【Advances in Applied Energy】为什么我们必须在可再生能源设计中超越平均能源成本？

【Advances in Applied Energy】气电能源系统脱碳优化规划

【Advances in Applied Energy】基于骨架网络的增强集成电气系统弹性的策略

【Advances in Applied Energy】低碳锂提取使深层地热发电厂在未来能源系统中具有成本竞争力

【Advances in Applied Energy最新原创论文】巴黎协定下欧洲未来可再生能源供应的影响

【Applied Energy】到达时间不确定下的可持续炼化一体化过程低碳计划-操作联合优化：基于大规模分层能效优化的视角

剑桥大学团队：“The World Avatar”实现研究实验室的自动化与数字化

【Advances in Applied Energy】支持模型预测控制的家庭能源管理系统对大规模光伏系统的影响

【Applied Energy】基于扩散模型图像修复的多功能短期负荷预测方法

太阳时域特性对超薄叠层太阳能电池的多尺度光学和电学特性影响

【Advances in Applied Energy】用于表示和量化建筑能源灵活性的语义本体论

【再创新高】Advances in Applied Energy CiteScore Tracker =30.6！

【Advances in Applied Energy】用于表示和量化建筑能源灵活性的语义本体论

【顶刊好文|农村电网】四川大学刘毅，许潇，许立雄等“考虑作物动态生长过程能源消耗的电力系统与农产品供应链多时间尺度协同优化运行”

【Advances in Applied Energy】转移需求：通过跟踪可再生能源发电减少必要的能源存储容量

【Applied Energy】考虑自动发电控制和电网-气网动态交互影响的随机实时调度:细时间粒度建模和非迭代分布式解法

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉