当前位置:首页 > 科技文档 > 公路运输 > 正文

基于双向长短时记忆与混合奖励函数的多无人车协同围捕控制

中国科学:技术科学 页数: 11 2024-09-10
摘要: 针对未知、不确定环境下多无人车协同围捕问题,本文提出了一种基于双向长短时记忆与混合奖励函数(BM-MADDPG)的多智能体协同围捕决策算法解决无人车围捕策略生成与协同控制问题.首先,通过双向长短时记忆(bidirectional long short-term memory, Bi-LSTM)网络捕捉状态和动作序列间时序信息特征,评估当前状态采取不同动作的长期效果,解决协作围捕... (共11页)

开通会员,享受整站包年服务立即开通 >