刘昊辰
(2025-05-10 11:40):
#paper doi.org/10.1007/978-3-030-35288-2, The Application of AlphaZero to Wargaming. 这是一篇关于尝试将AlphaZero应用于军事推演游戏 “珊瑚海”,以实现推演自动化的研究论文。军事推演与传统棋盘游戏的差异包括问题表示、游戏不对称、战略深度。通过监督学习引导AlphaZero,结合启发式知识和 MCTS 探索,可有效应对挑战,训练出的模型表现优于训练所用的启发式策略,且计算时间更短。