MCTS / UCT是一种游戏树搜索方法,它使用强盗算法来选择有前途的节点进行探索。游戏将随机进行至完成,并且会更深入地探索导致更多胜利的节点。强盗算法在探索具有较高获胜率的节点与探索未知节点之间保持了平衡(并且以纯形式不一定使用启发式评估函数)。基于这种通用技术的程序在计算机Go中取得了惊人的效果。
是否将强盗驱动的蒙特卡洛搜索应用于其他任何搜索问题?例如,这对于近似MAX-SAT,BKP或其他组合优化问题的解决方案是否有用?问题的任何特定特征(结构/统计/等)是否暗示了强盗式方法是否有效?
由于解空间的性质,是否存在任何已知的确定性问题可以完全抵御强盗方法?