Charging Pricing for Autonomous Mobility-on-demand Fleets Based on Game Theory
基于博弈论进行面向自动化按需出行车队的充电定价
| DOI: 10.35833/MPCE.2024.000139
| 作者 王嘉炜 盛裕杰 葛怀畅 白翔
苏珈 郭庆来 孙宏斌
为什么需要研究面向自动化按需出行(Autonomous mobility-on-demand, AMoD)车队的充电定价?
现实世界的运营案例表明,与传统出行方式相比,共享交通可以更有效地满足城市出行需求,显著提高资源利用效率。在此基础上,车联网、自动驾驶等技术突破进一步为变革交通模式提供了强大动力。AMoD成为极具前景的交通解决方案。然而,电动化车队的高效运作离不开充电支持。AMoD车队的充电行为将会成为连接电力系统和交通系统的关键环节,需要以充电定价为代表的充电负荷管理策略加以合理引导。充电站运营商(Charging station operator, CSO)与AMoD车队这两大主体作为未来城市交通中举足轻重的角色,它们之间的交互存在着与现状不同的模式,将深刻影响着电力系统与交通系统的运行动态。
面向AMoD车队的充电定价面临哪些挑战?
目前,AMoD车队的特点已经得到充分认识。已有研究探索了车队调控优化,并已经关注到电力-交通耦合,重视车队充电行为的关键作用。然而,对于CSO与AMoD车队之间围绕充电价格展开交互的模式及其产生的效果,尚未得到充分的讨论。它面临的挑战主要包括:
1)以往的充电定价工作通过各类交通分配模型刻画以传统电动汽车为主的交通流,但交通分配模型无法描述AMoD车队的行动模式与决策理性。按需调度的AMoD车队可以在利润驱动下更有效地协调其路线安排和充电计划,而这伴随着接单、移动、充电等行为的复杂时空耦合。
2)部分现有工作尝试协同优化电力系统和AMoD系统,这忽视了CSO的独立主体地位以及充电服务价格作为车队实际可感知信息的基础性作用。两个研究对象之间的交互并非只是“充电站”与“车辆”的物理交互,而更是“充电站运营者”与“车队管理者”的决策交互。充电价格作为同时影响双方利益的关键变量,成为双方博弈的核心。
3)集中管理的自动化车队表现出的决策理性将使得车辆有资格与充电站进行对等交互(例如谈判),而这在交通系统仍被分散无序的私家车占据主导的场景中几乎是不可能的。新的交互模式为系统带来更大的效益潜力,也扩展了充电价格的形成机制。
如何描述AMoD车队和CSO的决策?
为了以适当的复杂性描述接单、移动、充电等多类型车队决策,本文在如图1所示的时间-空间-电量增强网络中基于多商品网络流问题建立AMoD车队的决策模型。在网络流的视角下,车队中一定数目的车辆从一个位置移动到另一个位置的决策被描述为在时间、空间、电量三个维度上的流动行为。尽管网络流模型的近似属性导致它可能不适用于开发AMoD系统的实时控制器,但用于评估与CSO的交互和博弈时,它可以反映出车队的行动趋势。
图1 时间-空间-电量增强网络中对于各种类型车队决策的建模
对CSO而言,从实际出发,其定价决策往往是分档位的。CSO可以按照历史运行经验和任何已有数据,给出充电价格的大致范围,并将充电价格划分为从高到低的多个档位。离散化的充电定价有助于解决后续联立构建博弈问题时可能出现的连续变量相乘的问题,有利于计算实施。同时,充电定价的时间尺度一般而言也不会过于频繁,可能具备与车队调度不同的时间尺度。
如何面向AMoD车队设计合理的充电定价与交互模式?
本文为AMoD车队和CSO设计了非合作与合作两种交互模式。
首先,如图2所示,作为基准,利用主从博弈(Stackelberg博弈)分析了CSO面对AMoD车队的非合作定价策略,捕捉到两个主体之间的基本交互趋势。
图2 CSO与AMoD车队之间的Stackelberg博弈
以非合作为基准(谈判破裂点),双方合作将带来更大的效益潜力。如图3所示,本文使用纳什谈判(Nash Bargaining)作为协商议价工具。突破非合作困境的基础在于,非合作博弈将得到低效率的均衡。在所有充电站均积极配合车队作为可用资源的情况下,车队无需过度计较充电成本,其接单顺序、路线安排都有可能得到进一步优化,低效的移动可能减少,有利于完成更多的乘客订单,从而提升总收入。
图3 CSO与AMoD车队之间的纳什谈判
面向AMoD车队的充电定价与交互模式可能有怎样的影响?
本文采用了真实世界中的网约车订单数据集进行数值实验,认为经过预处理后,数据集中的17万余条乘客出行订单能够描述该城市的乘客出行需求分布情况。
本文设置了4个用于对比的案例,以全面比较各种场景的特点与影响。
案例1:完全的集中优化。假设存在一个单一实体,它能够完全控制充电站和车队,以优化总利益为目标。
案例2:非合作博弈。CSO与AMoD车队互相考虑对手的行动,以最大化自身利益为唯一目标,达成Stackelberg均衡。
案例3:合作谈判。以非合作为基准,CSO与AMoD车队共同协商出一个使得双方利益都有所增加,且相对公平(按照纳什谈判视角)的充电价格方案。
案例4:合作谈判,但假设AMoD车队背叛了谈判协议。
表1给出了不同案例下的博弈结果并计算了与双方相关的指标。
表1 不同案例下的博弈结果与指标计算
▲左右滑动查看全表
首先可以看到,案例1决定了两个主体的总收益上限。在案例2中,即使CSO的平均充电定价较高,但AMoD车队并未非常积极地进行充电,且充电时段都尽可能避开了高价时段,CSO并没有获得很好的净收益。由于充电成本的顾虑,车队必须精细地规划路线,甚至放弃大量乘客订单,车队净收益也有下降。总体而言,案例2与案例1相比,体现了非合作所带来的整体效率损失(约为7.45%)。在案例3中,CSO按照谈判协议,平均充电价格有所下调,这使得车队无需过度顾虑充电成本,路线安排进一步优化,可以尝试接送更多乘客,净收入上升。由于移动距离的增加,车队充电需求也必然增加,一日内的总充电电量有所上升,CSO的净收入也得到提高。除去两大运营主体的净收益得到增加,乘客的出行需求也得到了更大的满足,达成了多方共赢。
案例2与案例3的对比表明,CSO作为先手方,没有主动背叛并回到Stackelberg均衡上的动机。案例4与案例3的对比表明,AMoD车队作为后手方,一旦选择背叛,确实将会明显提升净收入。然而,这种收入提升并非来源于乘客订单,而是来源于过度地追求低价时段,这将严重损害CSO的收益。同时,从整个交通系统上讲,这种情况减少了完成乘客订单的数量,明显增加了空车移动的距离。与案例1相比,这带来了严重的效率损失(约为8.83%)。为了抑制合作中的背叛行为,从博弈原理上讲,阻碍背叛可能需要重复博弈和冷酷触发策略所带来的威慑作用;从现实世界的视角,复杂的环境和监管有待进一步探索。
综上,本文设计的交互框架捕捉到了CSO与AMoD车队的决策特点,希望博弈均衡有助于为未来城市交通提供有价值的见解。
引文信息
Jiawei Wang, Yujie Sheng, Huaichang Ge, Xiang Bai, Jia Su, Qinglai Guo, and Hongbin Sun. Charging pricing for autonomous mobility-on-demand fleets based on game theory [J]. Journal of Modern Power Systems and Clean Energy, 2024, 12(6): 2006-2018.
作者介绍
ABOUT THE AUTHORS
王嘉炜
清华大学电机系博士研究生,主要研究方向为:电动汽车、能源-交通耦合分析与优化。
盛裕杰
清华大学电机系博士,现为国网福建电力调度控制中心工程师,主要研究方向为:电动汽车调度、能源-交通耦合网络建模与优化。
葛怀畅
清华大学电机系博士,主要研究方向为:电压稳定与控制、能源互联网。
白翔
华北电力大学能源动力与机械工程学院硕士,主要研究方向为:能源互联网。
苏珈
太原理工大学电气与动力工程学院讲师,主要研究方向为:综合能源系统、机器学习在能源系统中的应用。
郭庆来
清华大学电机系教授,博士生导师,主要研究方向为:能量管理系统、电压稳定与控制、信息物理系统、电动汽车。
孙宏斌
清华大学电机系教授,博士生导师,主要研究方向为:多能流系统的综合能量管理、无功电压优化控制、能源互联网。
点击下面投稿网址,给我们投稿吧
【MPCE】河海大学 殷志华,南瑞集团有限公司 郑玉平等:基于t分布随机邻域嵌入和变分模态分解的配电网高阻抗故障区段定位
郑重声明:根据国家版权局相关规定,纸媒、网站、微博、微信公众号转载、摘编本微信作品,需包含本微信名称、二维码等关键信息,并在文首注明《电力系统自动化》原创。个人请按本微信原文转发、分享。