当前位置:首页 > 科技文档 > 电信技术 > 正文

基于深度强化学习的空天地一体化网络信息物理系统垂直切换策略

通信学报 页数: 12 2024-08-25
摘要: 针对空天地一体化网络信息物理系统模型复杂、很难获得网络拓扑先验知识和模型化假设的特点,研究其基于深度强化学习的垂直切换策略。首先,综合考虑系统稳定性、切换开销和网络使用成本约束,将垂直切换策略问题建模为约束马尔可夫决策过程(CMDP),并给出保证可行解存在的充分条件;其次,提出约束-近端策略优化(CPPO)算法解决该问题,并在基站侧引入分布式强化学习机制加速训练收敛。相较于基准... (共12页)

开通会员,享受整站包年服务立即开通 >