研究团队
吕思宇:东南大学
吴臻:山东大学
熊捷:南方科技大学
文章下载
Siyu LV, Zhen WU & Jie XIONG. A zero-sum hybrid stochastic differential game with impulse controlss. Sci China Inf Sci, 2024, 67(11): 212209, doi: 10.1007/s11432-023-4062-6
混合随机系统是一组通过一个马尔科夫链耦合在一起的扩散过程,其中马尔科夫链可以刻画那些不经常发生、但对系统长期行为具有显著影响的离散事件,从而使随机系统展现出“连续”和“离散”两种特性。相比于传统随机系统,混合随机系统能够更加符合实际地描述现实世界,因此广泛应用于金融经济、运筹管理、工业工程等领域。
不同于经典的最优控制或最优停时问题,脉冲最优控制包括两个方面:一方面是要确定最优的停时序列,在这些时刻施加脉冲动作;另一方面是要确定脉冲动作的最优幅度。值得注意的是,脉冲控制是直接施加于状态过程(相当于使状态过程产生“位移”),而通常的控制是通过状态方程的系数间接地影响状态过程。上述特点赋予脉冲控制丰富的内涵和独特的作用,使脉冲控制成为当今控制理论领域的前沿重要研究方向。
本文使用动态规划方法研究无穷时间区间混合随机系统的零和脉冲微分博弈问题。首先,利用时间平移技术,通过设计恰当的“两段”(即新的起始时刻之前和之后)脉冲控制策略证明动态规划原理。然后,基于粘性解的定义,利用拓展的测试函数处理马尔科夫链的状态转移,借助混合扩散过程对应的伊藤公式证明零和博弈问题的值函数是相应 Hamilton-Jacobi-Bellman-Isaacs (HJBI) 方程的唯一粘性解。最后,我们建立验证定理,给出构造最优脉冲控制(即确定最优停时序列和最优脉冲幅度)的充分性条件。(1) 本文发展了停时逼近方法,使动态规划原理中所涉及的新的起始时刻(停时)从仅可以取可数多值情形推广至可以取不可数多值情形。(2) 本文的 HJBI 方程中包含一个马尔科夫链导致的耦合项,使其结构本质不同于经典的 HJBI 方程,我们使用创新性技术证明 HJBI 方程粘性解的存在唯一性。(3) 针对零和脉冲博弈问题的验证定理,本文将两位博弈参与者的脉冲时刻统一视作一个停时序列,则在相邻两个脉冲时刻之间可以使用伊藤公式,进而提出“逐段方法”证明验证定理。