基于知识辅助深度强化学习的巡飞弹组动态突防决策
兵工学报
页数: 16 2024-01-16
摘要: 巡飞弹组(Loitering Munition Group, LMG)突防控制决策是提高巡飞弹群组作战自主性与智能性的关键。针对存在截击拦截器和临机防空火力区的动态环境中弹组突防机动指令在线生成困难的问题,提出一种基于知识辅助强化学习方法的LMG突防控制决策算法。结合领域知识、规则知识改进状态空间和回报函数设计提高算法泛化能力与训练收敛速度。构建基于软动作-评价方法的LMG突防... (共16页)