两年前的Libratus,历时20天战胜4位顶级德州扑克选手,但只能1v1。现在全新的赌神Pluribus,终于取得突破,称霸多人局: 在六人无限注德扑比赛上击败人类顶尖玩家。 结束了扑克AI只能一对一的局面,Pluribus成为了多人复杂游戏的里程碑。比起围棋,比起1v1德扑,多人德扑的难度要高得多。 而Pluribus不止赢,还赢得利落...
Pluribus 在此前的德州扑克 AI Libratus 的基础上进行了几项创新,实现了这一成果,Libratus 是 2017 年在双人无限注德州扑克中击败人类职业选手的 AI,我们还借助了 Tuomas Sandholm 在卡内基梅隆大学研究实验室开发的其他算法和代码。 特别是,Pluribus 采用了一种新的在线搜索算法,可以通过前面的几个步骤而不是仅仅搜...
扑克数据模型抽象(Poker Data Type): 本文的作者倾向于使用位/字节级别来描述牌的数据模型(Hand=玩家手牌+公共牌), 也算一种高阶的抽象. 花色(Suit), 其值范围为0..3, 并假定梅花(Clubs)=0, 方块(Diamonds)=1, 红心(Hearts)=2, 黑桃(Spades)=3. 等级(rank), 其值范围为0..12, 赋予 2(deuce)=0...
扑克是一种非完美信息游戏,玩家只能根据自己手上的牌提供的非对称的信息来对游戏状态进行评估。 在一对一对战(也就是只有两位玩家)的有限下注德州扑克中,AI 曾经取得了一些成功。但是,一对一有限注的德州扑克,全部的决策点(decision points)只有不到10的14次方个。作为对比,计算机已经在围棋上完胜人类专业棋手,围棋...
今天惊奇的发现,AI打德州扑克居然也完胜人类了!此次比赛共持续 20 天,由 4 名人类职业玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 对战人工智能程序 Libratus,在为期 20 天的赛程里面对玩 12 万手,争夺 20 万美元的奖金。最终的结果是「比赛过程中,人类选手整体上从未领先过」。 随着天数的增加...
中科院自动化所兴军亮研究员领导的博弈学习研究组提出了一种高水平轻量化的两人无限注德州扑克AI程序——AlphaHoldem。其决策速度较DeepStack速度提升超1000倍,与高水平德州扑克选手对抗的结果表明其已经达到了人类专业玩家水平,相关工作被AAAI 2022接收。 从人工智能学科诞生伊始,智能博弈研究就是人工智能技术发展创新的沃土...
最近,它的缔造者、“德州扑克AI之父”Noam Brown和Tuomas Sandholm再发新论文,通过德州扑克基准平台来探讨不完全信息条件下的博弈策略问题,也许“冷扑大师2.0”真的要来了。 最近,Arxiv上的一篇题为《Solving Imperfect-Information Games via Discounted Regret Minimization》引发关注,原因主要在于本文的两位作者的鼎鼎...
吐槽一下德州扑克AI..嗯,这游戏德扑确实不难,没事就玩两局后面发现AI水平越来越高…给我打懵了…进入“单挑阶段”(只有两人且桌上筹码比较大的时候,不会有新人上桌)发现有一个AI特别猥琐,玩了现实中一个小时发现,丫居然作弊读
第50届世界扑克系列赛(WSOP)的六人桌无限德扑即将在7月13日开赛,但AI偏偏选在这个节骨眼上踢馆。 美国卡内基梅隆大学和Facebook公司7月12日在《科学》上发表论文称,他们联合开发的德扑人工智能Pluribus能在六人桌无限德扑中击败顶级人类玩家。 这些顶级高手包括拥有职业冠军头衔最多的达尔文埃利亚斯(Darren Elias)、6次...