我们介绍了 "游戏玩家",这是一种通用的算法,它结合了引导性搜索、自我游戏学习和游戏理论推理,统一了以前的方法。Player of Games是第一个在大型完全和不完全信息博弈中取得强大经验性能的算法--这是迈向任意环境的真正通用算法的重要一步。我们证明了《游戏者》是健全的,随着可用计算时间和近似能力的增加,它将收敛...