刘昊辰
(2025-04-10 15:46):
#paper Ancestor-Based α-β Bounds for Monte-Carlo Tree Search. 这是一篇关于如何通过引入祖先节点的α-β剪枝思想,改进MCTS的探索-利用平衡,提升决策准确性的研究论文。论文动态调整路径上的α(下界)和β(上界)值,结合UCT(Upper Confidence Bound for Trees)的置信区间。 通过公式计算边界差异度量和探索调整项,修改UCT的选择策略。当α<β时优先利用已知路径,当α>β时转向探索新路径,类似极小极大剪枝。下载地址:https://bnaic2024.sites.uu.nl/wp-content/uploads/sites/986/2024/10/Ancestor-Based-%CE%B1-%CE%B2-Bounds-for-Monte-Carlo-Tree-Search.pdf
BNAIC/BeNeLearn 2024,
2024/10.
Ancestor-Based α-β Bounds for Monte-Carlo Tree Search
翻译
Abstract:
No abstract available.