基于改进MADDPG的多机器人路径规划方法研究
计算机仿真
页数: 8 2024-08-15
摘要: 为完成未知环境下救援物资的运输任务,研究了基于深度强化学习的多机器人路径规划方法。首先选用多智能体深度确定性策略梯度算法MADDPG算法为基础算法,然后针对算法存在的收敛速度慢甚至不收敛问题,引入了碰撞发生区域重点训练、经验池分离机制和优先经验回放等改进措施。最后基于Gazebo三维仿真平台搭建了两种仿真环境,并从训练结果和测试结果两个方面对改进算法与原始算法进行了对比分析。实... (共8页)