【Applied Energy 最新原创论文】基于模仿强化学习的混合储能电动汽车能量管理

学术 2024-11-17 18:30 美国

原文信息：

Imitation reinforcement learning energy management for electric vehicles with hybrid energy storage system

原文链接：

https://www.sciencedirect.com/science/article/pii/S0306261924022153

Highlights

•提出了用于功率分配的对抗模仿强化学习方法。

•通过离线优化建立专家知识。

•将智能体动态地从专家指导过渡到自我探索。

•减少无效的探索，加快训练，提高奖励。

•在不同的初始SoCs和驾驶工况下，对该方法进行了验证。

摘要

深度强化学习已成为一种很有前途的电动汽车能量管理方法。然而，深度强化学习依赖于大量的试错训练来获得接近最优的性能。针对混合储能电动汽车，本文提出了一种对抗模仿强化学习能量管理策略，以降低电池容量损耗成本。首先，强化学习在专家知识的指导下进行探索，专家知识由在标准驾驶条件下的动态规划得到。专家知识被表示为最优功率分配映射。然后，在早期模仿阶段，强化学习智能体的动作通过对抗网络快速向最优功率分配映射靠近。最后，基于对抗网络的判别器设计了动态模仿权重，使智能体在在线驾驶条件下逐步自我探索，以获得接近最优的功率分配。结果表明，与传统强化学习相比，该策略可以加速42.60%的训练速度，并提高奖励15.79%。在不同的测试驾驶工况下，该方法可以进一步降低5.1%-12.4%的电池容量损耗成本。

Abstract

Deep reinforcement learning has become a promising method for the energy management of electric vehicles. However, deep reinforcement learning relies on a large amount of trial-and-error training to acquire near-optimal performance. An adversarial imitation reinforcement learning energy management strategy is proposed for electric vehicles with a hybrid energy storage system to minimize the cost of battery capacity loss. Firstly, the reinforcement learning exploration is guided by expert knowledge, which is generated by dynamic programming under various standard driving conditions. The expert knowledge is represented as the optimal power allocation mapping. Secondly, at the early imitation stage, the action of the reinforcement learning agent approaches the optimal power allocation mapping rapidly by using adversarial networks. Thirdly, a dynamic imitation weight is developed according to the Discriminator of adversarial networks, making the agent transit to self-explore the near-optimal power allocation under online driving conditions. Results demonstrate that the proposed strategy can accelerate the training by 42.60% while enhancing the reward by 15.79% compared with traditional reinforcement learning. Under different test driving cycles, the proposed method can further reduce the battery capacity loss cost by 5.1%-12.4%.

Keywords

Imitation learning；

Hybrid energy storage system；

Deep reinforcement learning；

Battery degradation；

Generative adversarial imitation learning;

Graphics

Fig. 1. Schematic diagram of the electric vehicle with semi-active hybrid energy storage system.

Fig. 2. The framework of the energy management strategy based on the adversarial imitation reinforcement learning.

Fig. 8. Comparison of energy management results for the proposed method, DP, DDPG, the GAIL-based method under the training driving cycle: WLTP.

Fig. 9. Comparison of robustness for the proposed method, DP, DDPG, and the GAIL-based method under WLTP with different initial values of SoCsc

Fig. 10. Comparison of generalization capacity for the proposed method, DP, DDPG, and the GAIL-based method under three test driving cycles: US06, NEDC, and UDDS.

团队简介

本研究由中南大学的研究人员完成。

通信作者简介：

武悦，中南大学电子信息学院讲师，从事电动汽车混合储能系统能量管理和热管理方面的研究，在Applied Energy、Energy、Energy Conversion and Management、Solar Energy、IEEE TITS、IEEE TVT等能源电力领域SCI期刊发表论文多篇。

第一作者简介：

刘伟荣，中南大学计算机学院教授，从事电动汽车、储能系统管理与控制、人工智能等方面的研究，在Applied Energy、Energy、Applied Soft Computing、IEEE TNNLS、IEEE TITS、IEEE TVT、IEEE TPDS等SCI期刊发表论文多篇。

姚鹏飞，中南大学计算机学院硕士研究生，从事电动汽车混合储能系统能量管理和热管理方面的研究，发表Applied Energy期刊论文一篇、IEEE International Conference on High Performance Computing and Communications 会议论文一篇。

关于Applied Energy

本期小编：陈媛；审核人：武龙星

《Applied Energy》是世界能源领域著名学术期刊，在全球出版巨头爱思唯尔 (Elsevier) 旗下，1975年创刊，影响因子10.1，CiteScore 21.2，本刊旨在为清洁能源转换技术、能源过程和系统优化、能源效率、智慧能源、环境污染物及温室气体减排、能源与其他学科交叉融合、以及能源可持续发展等领域提供交流分享和合作的平台。开源（Open Access）姊妹新刊《Advances in Applied Energy》影响因子13.0，CiteScore 23.9。全部论文可以免费下载。在《Applied Energy》的成功经验基础上，致力于发表应用能源领域顶尖科研成果，并为广大科研人员提供一个快速权威的学术交流和发表平台，欢迎关注！

公众号团队小编招募长期开放，欢迎发送自我简介（含教育背景、研究方向等内容）至wechat@applied-energy.org

点击“阅读原文”

喜欢我们的内容？

点个“赞”或者“再看”支持下吧！

http://mp.weixin.qq.com/s?__biz=MzAxMTE3NTAwNA==&mid=2649935283&idx=1&sn=d25b8bd4320c38d404c005e2be23b346

AEii国际应用能源

发布应用能源领域资讯，介绍国际应用能源创新研究院工作，推广应用能源优秀项目，增进应用能源领域合作

最新文章

【Applied Energy最新原创论文】微生物矿化二氧化碳化学过程机制研究

Nexus Forum 2025 | 论文投稿邀请 Call for Papers

美国康奈尔大学推出AI4S访问教授计划，邀全球学者共促人工智能可持续发展

【再创新高】Advances in Applied Energy CiteScore Tracker =31.2！

【Advances in Applied Energy】使用众包数据估算全球城市的碳足迹

【Advances in Applied Energy】电池、燃料电池亦或发动机？重型货车用电经济性和环保性评估

【Advances in Applied Energy】有限电力供应下的多能枢纽电气化：如何更好地减排温室气体？

【一“图”为快】中国占据超过一半的特斯拉电动汽车产能

【Advances in Applied Energy】电力市场中零售商的战略零售定价和需求报价：一种数据驱动的机会约束规划

【Advances in Applied Energy】未来电网的无功功率市场

【Applied Energy】紫外-可见光照射下低浓度甲烷的光催化实验及其动力学研究

【Advances in Applied Energy】部分遮挡情况下光伏综合电特性的通用模型

【一“图”为快】2023年不同国家的电网储能电池容量

【Applied Energy】潜热储能管内翅片结构的数据驱动多保真拓扑设计

【Applied Energy】使用聚光式太阳能和热化学储能优化固体氧化物电解池：一种耦合的深度学习方法

【Applied Energy】提升电池耐久性：串联锂离子电池系统的多故障诊断与安全评估

【Applied Energy】面向实时电力市场风险规避报价决策的综合能源生产单元多能流能量管理方法

Nexus | 对话腾讯战略发展部 “碳寻计划”

【Advances in Applied Energy】为什么我们必须在可再生能源设计中超越平均能源成本？

【Advances in Applied Energy】气电能源系统脱碳优化规划

【Advances in Applied Energy】基于骨架网络的增强集成电气系统弹性的策略

【Advances in Applied Energy】低碳锂提取使深层地热发电厂在未来能源系统中具有成本竞争力

【Advances in Applied Energy最新原创论文】巴黎协定下欧洲未来可再生能源供应的影响

【Applied Energy】到达时间不确定下的可持续炼化一体化过程低碳计划-操作联合优化：基于大规模分层能效优化的视角

剑桥大学团队：“The World Avatar”实现研究实验室的自动化与数字化

【Advances in Applied Energy】支持模型预测控制的家庭能源管理系统对大规模光伏系统的影响

【Applied Energy】基于扩散模型图像修复的多功能短期负荷预测方法

太阳时域特性对超薄叠层太阳能电池的多尺度光学和电学特性影响

【Advances in Applied Energy】用于表示和量化建筑能源灵活性的语义本体论

【再创新高】Advances in Applied Energy CiteScore Tracker =30.6！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉