当前位置:首页 > 科技文档 > 体育 > 正文

结合A2C和手牌估值方法的麻将博弈研究

重庆理工大学学报(自然科学) 页数: 8 2024-05-15
摘要: 针对大众麻将中对手牌信息利用不充分的问题,提出了手牌估值方法,并设计了基础麻将程序(MJE)。为进一步提升麻将AI的博弈能力,使用深度强化学习方法设计了麻将AI(MJE-RL)。首先,通过MJE自对弈生成深度学习的训练数据。其次,根据训练集、测试集和对比实验的结果,选择效果最好的模型作为强化学习的预训练模型。最后,使用优势演说-评论家模型作为强化学习的主要框架,将训练好的深度学...

开通会员,享受整站包年服务立即开通 >