海量资源，尽在掌握

当前位置：首页 > 科技文档 > 船舶工业 > 正文

基于多智能体深度强化学习的多船协同避碰策略

计算机集成制造系统页数： 17 2023-12-13

摘要：为了提高多船会遇时智能避碰策略的协同性、安全性、实用性和节能性，在中心化训练去中心化执行框架下，结合优先经验回放机制提出一种多智能体Softmax深层双确定性策略梯度PER-MASD3算法，用于解决多船协同避碰问题，该算法不仅解决了双延迟确定策略梯度(TD3)算法存在的值估计偏差问题，还在模型训练过程中引入熵正则项，以促进探索和控制随机控制策略，采用自适应噪声对不同阶段的任务进... （共17页）

开通会员，享受整站包年服务立即开通 >

科技文档

数学力学化学金融证券保险投资会计审计园艺林业旅游体育物理学生物学天文学气象学海洋学地质学新能源金属学农艺学农作物管理学领导学自然科学系统科学资源科学无机化工有机化工燃料化工化学工业材料科学矿业工程冶金工业安全科学环境科学工业通用机械工业无线电子电信技术铁路运输汽车工业船舶工业动力工程电力工业农业科学农业工程植物保护动物医学教育理论学前教育初等教育中等教育高等教育职业教育成人教育自然地理地球物理经济统计农业经济工业经济交通经济企业经济文化经济信息经济贸易经济财政税收市场研究科学研究互联网自动化轻工业核科学服务业石油然气服务业野生动物水产渔业硬件仪器仪表航空航天武器军事公路运输水利水电建筑科学软件