基于多奖励DQN框架的UAV-RIS辅助太赫兹通信系统波束赋形预测

文摘   科技   2024-11-20 12:02   北京  

研究团队

吴悦维,许鹏,吕轶:沈阳航空航天大学

王东明:东南大学

高飞飞:清华大学

王江舟:英国肯特大学


文章下载

Wu Y W, Xu P, Lv Y, et al. Beamforming prediction based on the multireward DQN framework for UAV-RIS-assisted THz communication systems. Sci China Inf Sci, 2024, 67(12): 229303


研究简介

UAV-RIS辅助THz通信系统通过优化RIS波束赋形可提供THz信号的精确覆盖。为了减少无源RIS带来的海量计算,现有研究以速率最大化为目标,利用有源RIS单元反馈,开发了一种基于DQN的RIS波束赋形预测方案。然而,有源RIS单元持续的高能耗影响了THz通信的持久性,因此现有单奖励DQN预测模型具有一定的局限性。

图1 空中RIS辅助的太赫兹通信系统场景图

为解决上述问题,本文提出了一种基于多奖励DDQN的UAV-RIS辅助THz通信系统波束赋形预测框架。该框架采用多奖励机制权衡用户可达率水平与有源RIS功耗问题,提高了THz通信的稳定性;利用DDQN消除奖励函数维度增加导致的稀疏奖励问题,提高了奖励函数在波束赋形预测的准确性。

本文的创新点如下:
(1) 提出了适用于THz通信场景的多奖励RIS波束赋形预测模型,根据用户可达率和有源RIS功耗分别计算子Q网络奖励值,提升了模型决策的全面性。
(2) 引入双Q学习,对奖励函数和动作选择同时进行评估,并结合PER加快模型收敛,避免了复杂环境导致的学习偏差,提升了模型决策的准确性。

本文基于“01-Drone Scenario”模型对所提方案进行了仿真实验。仿真实验表明,在多奖励预测框架下可有效权衡用户可达率和有源RIS能耗问题。具体来说,与候选方案平均可达率(4.49bps/Hz)相比,所提方案不但能维持4.8 bps/Hz的可达率,还可降低47.1%的有源RIS功耗


推荐阅读

智能6G频谱、覆盖与使能技术专题简介

6G专项研究进展专刊

太赫兹通信感知一体化技术综述

抵御目标窃听的全向全连接RIS辅助感知与多用户安全通信

非线性能量收集模型下STAR-RIS辅助的SWIPT方案设计

非完美相关信道下有源RIS赋能的多对用户双向全双工通信系统

SCIS通信学科最新出版文章总目录(2023-2024)

中国科学信息科学
《中国科学:信息科学》及其英文版《Science China Information Sciences》的宣传平台。
 最新文章