基于碰撞预测的强化模仿学习机器人导航方法
计算机工程与应用
页数: 12 2023-04-11
摘要: 基于学习的机器人导航方法存在对数据的依赖性高和在一些特定环境下表现不完美的问题,例如在空旷场景下无法走直线,在障碍物密集场景下碰撞率高。为了提高机器人的导航性能,提出了一种基于碰撞预测的强化模仿学习导航方法。在无模型的情况下,根据机器人的性能,建立马尔科夫决策过程(Markov decision process,MDP)中所需要的状态空间、动作空间、奖励函数。采用深度强化学习(... (共12页)