融合三支多属性决策与SAC的兵棋推演智能决策技术
系统工程与电子技术
页数: 13 2024-02-05
摘要: 近年来,将深度强化学习技术用于兵棋推演的智能对抗策略生成受到广泛关注。针对强化学习决策模型采样率低、训练收敛慢以及智能体博弈胜率低的问题,提出一种融合三支多属性决策(three-way multiple attribute decision making, TWMADM)与强化学习的智能决策技术。基于经典软表演者-批评家(soft actor-critic, SAC)算法开发兵... (共13页)