董璐,韩涛,袁心,邓超 | 可变环境远程状态估计系统攻击者最优能量收集与分配策略
文摘
科技
2024-09-27 12:00
北京
研究团队
董璐,韩涛,袁心:东南大学
邓超:南京邮电大学
文章下载
Lu DONG, Tao HAN, Xin YUAN & Chao DENG. Optimal Noise Injection Energy Allocation and Collection of Energy Harvesting Attacker Under Quality-Changeable Environment. Sci China Inf Sci, 2024, doi: 10.1007/s11432-024-4143-4
在远程状态估计系统中,传感器通过无线传输系统将系统状态信息发送给远端估计器,攻击者可以通过噪音注入等手段干扰正常通信,降低管理方对系统状态的监控精度。攻击者出于长期潜伏等需要,需要使用能量收获装置从环境获取能源,伺机发动不同程度的攻击,达到最大的攻击效果。此外,由于环境复杂多变,能源供应不是确定的,因此需要考虑能量的收集和使用。为解决上述问题,本文将环境质量的转变建立为马尔可夫过程,同时结合能量收获装置的存储能力,将原问题转化为一个MDP问题。然后,利用远端估计器的误差,系统状态转移函数之间的超加性,结合误差因收敛而具有的有界性等条件,我们不仅证明了最优能量管理的稳态策略存在,还证明了这样的最优策略具有结构上的性质,能够降低求解的复杂度。这种结构性质还被进行推广,使得问题适用于更复杂的环境。(1) 为攻击者提供能量的环境是变化的,环境的优劣决定了攻击者的能量收获量,该设定更贴近现实情景,策略的细粒度也随之提升。 (2) 将原问题转化为MDP问题,在此基础上证明了能量收集和使用最优稳态策略的存在性、以及结构上的单调性。为了验证环境对攻击者策略和攻击效果的影响,我们设置了不同的可变环境场景,并利用标准的mdptoolbox进行仿真。实验表明,攻击者的攻击效果很大程度上依赖环境的质量,也即能量收获装置能够从环境中获得的能量大小。 此外,为了验证最优策略的存在性以及结构上的性质,我们还在不同环境下多次求解最优策略。可以看出,在给定了攻击者当前的具体环境,以及可支配的能量以后,其攻击能量随着远端估计器误差单调不减。