●李亞山

人工智能終于開始掌握人性中一些獨特的能力,并且比它的老師玩得還好。要想在撲克中獲勝,就需要利用這樣一項能力:狡猾。為了獲勝,玩家必須分析對手如何出牌,然后欺騙他們交出手中的籌碼。當然,這種狡詐對人來說很自然?,F在,人工智能程序首次表現出能夠用類似的技能來欺騙人類的職業撲克選手。
近日,臉書與卡內基梅隆大學合作開發的一款新型人工智能系統Pluribus,在世界上最流行、最廣泛的撲克游戲:六人無限注德州撲克中擊敗了頂級人類職業玩家。Pluribus在“5個AI和1個人類玩家”和“1個 AI和5個人類玩家”兩種模式下都擊敗了職業玩家。這是人工智能機器人第一次在超過兩名玩家 (或兩支隊伍)的大型基準游戲中擊敗頂級專業人士。此前,人工智能技術已經能夠在只有一個對手的情況下打敗人類撲克高手。但像Pluribus這樣,在多人同桌的情況下擊敗人類精英玩家,才是關鍵的里程碑。

德撲之父發明人圖奧馬斯·桑德赫爾
Pluribus是通過基于Libratus的幾項創新,以及圖奧馬斯·桑德赫爾在卡內基梅隆大學研究實驗室開發的其他算法和代碼實現這一成果的。Libratus是2017年在雙人無限注德州撲克中擊敗人類職業選手的AI。特別是Pluribus采用了新的在線搜索算法,它可以通過之前的幾個步驟就能有效地評估其下注選項,而不用搜索到游戲結束。Pluribus還使用了新的更快的自玩算法來玩包含隱藏信息的游戲。
更讓讓人想不到的是,這些進步可以使用很少的處理能力和內存——相當于不到150美元的云計算資源——就培訓出Pluribus?!?br>