当前位置:首页 > 科技文档 > 数学 > 正文

基于距离信息的追逃策略:信念状态连续随机博弈

自动化学报 页数: 13 2024-04-15
摘要: 追逃问题的研究在对抗、追踪以及搜查等领域极具现实意义.借助连续随机博弈与马尔科夫决策过程(Markov decision process, MDP),研究使用测量距离求解多对一追逃问题的最优策略.在此追逃问题中,追捕群体仅领导者可测量与逃逸者间的相对距离,而逃逸者具有全局视野.追逃策略求解被分为追博弈与马尔科夫决策两个过程.在求解追捕策略时,通过分割环境引入信念区域状态以估计逃... (共13页)

开通会员,享受整站包年服务立即开通 >