999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

這次AI突破的是麻將

2019-09-10 07:22:44camel
科海故事博覽·中旬刊 2019年3期
關鍵詞:人類游戲信息

camel

圍棋AlphaGo點燃的AI之火漸漸降溫之際,微軟發布了他們在麻將游戲中取得的重大突破:麻將AI “Suphx”在國際知名專業麻將平臺“天鳳”上榮升十段。“十段”是什么概念呢?天鳳平臺上,全球范圍內現役十段的人類選手僅十幾位。Suphx取得“十段”的成績,大致可相當于圍棋中AlphaGo挑戰勝了李世石。這是一個不凡的成績。從AI這門學科誕生之日起,游戲AI始終與AI研究進展相生相伴,跳棋、雙陸棋、國際象棋和圍棋都曾先后推動了AI的發展。相比以上這幾種棋類游戲,麻將卻是規則復雜、勝負判定煩瑣、信息非完全公開的,且更重要的是在公眾認知中麻將更多地有“運氣”和“憑直覺”的成分。因此麻將AI若能取得超越人類的水平,可以期待它將帶來新的一波熱潮。

Suphx的晉級之路

“天鳳”是日本的一個在線麻將競技平臺,創立于2006年。因其完善的競技規則及專業的段位體系,很快便成為業界知名的高水平專業麻將平臺,受到職業麻將界的廣泛承認。天鳳的評價制度,采用Rating制和段位制并行的制度。剛剛注冊時等級從“新人”開始,點數(pt)會根據游戲的情況增減,并最終決定雀士的升段(升級)和降段(降級)。玩家的段位越高,在比賽中排位第四受到的點數懲罰也越多,點數扣除到一定程度會導致降段。按照這種規則,如果雀士的實力水平一定的話,自己的等級也會相對地穩定在某一個段位上。根據段位,游戲者可以使用的桌也會發生變化。天鳳平臺為高水平麻將玩家提供了兩種競技房間:“特上房”對四段以上所有玩家免費開放,允許AI參與游戲,目前所有玩家在此房間的最高段位是十段;“鳳凰房”僅對七段以上的人類付費玩家開放,目前不允許AI參與游戲,在該房間能夠達到的最高段位是十一段,稱為“天鳳位”。自天鳳平臺在2006年推出以來,全球范圍內達到四人麻將(四麻)天鳳位的雀士也不過13人,曾經達到過十段的玩家約有180位,而現役十段的人類玩家僅有十幾位。微軟亞洲研究院開發的麻將AI Suphx在2019年3月份開始登錄天鳳平臺,經過近三個多月、與人類玩家展開了5000余場四麻對局后,6月份Suphx成功晉級天鳳十段,也是首個晉級十段的AI系統。在5000余場對局中,Suphx的穩定段位超過了8.7。這樣的穩定段位是一個極高的數字。據統計,天鳳平臺的所有頂級人類玩家在取得十段后,在“特上房”共參加過近萬場比賽,整體穩定段位為7.4。與所有取得過天鳳十段的頂級人類玩家相比,Suphx在特上房的穩定水平要領先約1.3個段位。此前,天鳳平臺還活躍著另外兩個麻將AI系統,由東京大學在2015年開發的“爆打”和Dwango公司于2018年開發的基于深度學習模型的“NAGA25”,二者的穩定段位均在6.5左右。事實上,在晉級十段之前,Suphx很長一段時間穩定在九段,其獨特的打牌風格在麻將領域刮起了不小的“AI風”,很多麻友都嘗試從中學習新的打牌方式,并且在中國很多麻友親切地稱她為“蘇菲老師”“蘇菲姐姐”。此外,麻將領域神一級存在、被天鳳平臺冠為“God of mahjong”的朝倉康心也曾表示:“我看了Suphx的比賽,我感覺它好像比我更強大!”

麻將AI難在哪里

為什么說麻將AI戰勝人類是游戲AI的又一次重大突破呢?因為麻將AI相比于棋類游戲更難。一般來說,我們可以根據信息的暴露程度將游戲分為兩大類:完美信息游戲和非完美信息游戲。如果所有的參與者,在游戲的任何階段都可以訪問所有關于游戲(包括對手)狀態及其可能延續的信息,那么稱這類游戲為完美信息游戲,否則稱為非完美信息游戲。圍棋、象棋等棋類游戲,對局雙方可以看到局面的所有信息,屬于完美信息游戲;而撲克、橋牌、麻將等游戲,雖然每個參與者都能看到對手打過的牌,但并不知道對手的手牌和游戲的底牌,也就是說各個對局者所掌握的信息是不對稱的,因此屬于不完美信息游戲。完美信息游戲和非完美信息游戲難度的衡量指標通常是有區別的。對于完美信息游戲,通常游戲的復雜度就決定了難度,我們可以用狀態空間復雜度和游戲樹復雜度對其難度進行衡量:對于傳統的完美信息棋類游戲中,圍棋不管從狀態空間復雜度,還是游戲樹復雜度上都遠遠領先其他棋類游戲。2017年,AlphaZero 利用MCTS和深度強化學習,成功解決了包括圍棋在內的多個完美信息游戲。我們也有理由相信,只要算力足夠,對于更加復雜的棋類游戲,我們都能通過已有的方法得到解決。而另一方面,對于非完美信息游戲,隱藏信息對于游戲的難度影響很大。例如麻將,參與者只能看到他手中的13張牌的信息,對于另外3家的手牌以及剩余的底牌則完全不知。由于這種信息的不完全、非對稱性,對于參與者來說許多不同的游戲狀態看起來是無法區分的。顯然,對于非完美信息游戲而言,合理的游戲策略應該建立在信息集而不是游戲狀態之上。相應地,當我們衡量非完美信息游戲的難度的時候,也應該依據信息集的數目而不是游戲狀態空間的大小。信息集的數目通常小于狀態空間的數目。對于完美信息游戲,由于所有信息都是已知的,每個信息集只包含一個游戲狀態,因此它的信息集數目與狀態空間數目是相等的。除了信息集的數目,還有一個重要的指標:信息集的平均大小,即在信息集中平均有多少不可區分的游戲狀態。按照這兩個標準來衡量非完美信息游戲的難度:2017年卡耐基梅隆大學和阿爾伯特大學相繼發布了Libratus和DeepStack,在兩人無限注德州撲克上成功擊敗了世界頂級人類玩家。目前的AI在圍棋和德州撲克上的成功很大程度上依賴于搜索算法,因為搜索可以最大程度地發揮計算機的計算優勢。但是因為巨大的信息集平均大小帶來的環境不確定性,傳統的搜索算法在橋牌和麻將面前很難發揮同樣的功效。如果把過去的游戲AI的研究看作“一維延展”(信息集數目)的話,那么德州撲克則是向二維方向(信息集平均大小)的初始嘗試。但整個二維平面還有更廣闊的空間需要探索,這需要我們發明全新的方法論,同時這也將成為游戲AI的一個主要研究方向。

開拓游戲AI二次元

具體到麻將這個游戲,一方面,136張麻將牌的排列組合可能性非常多,再加上打牌過程中4位玩家出牌的順序并不是固定的(例如碰杠等),導致游戲樹不僅不規則而且還是動態變化的。這些特點使得麻將AI很難使用AlphaGo那樣的蒙特卡洛樹搜索算法。其次是非完美信息問題。麻將中每個玩家除了手中的13張牌和已經打出的牌外,其他玩家手中的牌和剩余的底牌都是未知的,由于隱藏信息過多導致游戲樹的寬度非常大,樹搜索算法基本不可行。另外還需要注意的就是麻將本身的獎勵機制,畢竟這才是評判勝負的標準。對于日本麻將而言,一輪游戲共包含8局,最后根據8局得分總和進行排名,來形成最終影響段位的點數獎懲。因此有時麻將高手會策略性輸牌,以保證自己在最終結算時獲得最大的點數獎勵。這為構建高超的麻將AI策略帶來了額外的挑戰,AI需要審時度勢,把握進攻與防守的時機。微軟亞洲研究院的幾位研究員針對麻將的這些特點,將整個訓練過程分為3個階段。首先是“初始化”階段,本質上就是用專家數據做監督學習,得到一個初始模型。隨后在這個初始模型基礎上用自我博弈的方式進行強化學習。在這個階段,為了克服非完美信息博弈的問題,研究者在訓練階段利用不可見的一些隱藏信息來引導AI模型的訓練方向,讓它的學習路徑更加清晰、更加接近完美信息意義下的最優路徑,從而倒逼AI模型更加深入地理解可見信息,從中找到有效的決策依據。他們稱之為“先知教練”技術。第三個階段則是在線比賽,通過不斷參與到與人類玩家的對局中,從而不斷得到自我更新和提高。自2019年3月進入天鳳平臺以來,Suphx在與人類玩家的對局中學得非常快。目前,在平衡攻擊和防御方面,Suphx表現出了比許多頂尖人類玩家更明智的策略,能夠戰略性地完成短期損失與長期收益之間的權衡,并根據已有的模糊信息進行快速決策。

盡管目前來看Suphx在天鳳平臺上只達到十段水平,距離“天鳳位”還有一定距離,但我們可以相信一旦天鳳平臺開放權限,Suphx達到并超越“天鳳位”的諸位玩家將指日可待,這也將成為繼AlphaGo之后再次挑戰人類認知的歷史事件。不過它的意義并不僅在于“震驚”,更在于對研究和應用方向的開拓。正如前面提到的,麻將AI的研究為游戲AI在“第二維度”開辟了新的方向,并進行了極大地拓展。我們可以期待未來在“第二維度”上將會有更多的研究出現。甚至為了更進一步拓展研究范圍,可能會有一些研究人員發明出具有更大信息集數目和更大信息集平均大小的新游戲來。這不是不可能。此外,我們所生活的世界也正是一個非完美信息的決策過程,麻將游戲中復雜的推理策略和帶有隨機性的博弈過程比完美信息游戲更加貼近人類復雜的真實生活。我們同樣可以期待,對非完美信息游戲的研究,將有助于我們開發出適用于真實生活場景的更加“智能”的AI系統。當然,最直接的意義還在于,Suphx“蘇菲老師”在牌風上已經自成一派,創造了許多新的策略和打法,這將直接改變麻將社區的生態。許多麻將愛好者已經開始學習Suphx的打法來提升和豐富自己的麻將技巧,這其中包括天鳳位的大神,他是世界上第15位三人麻將天鳳位獲得者,也是第一位在四人麻將和三人麻將中均取得天鳳位的頂級玩家。他表示:“我已經看了300多場Suphx的比賽,我甚至不再觀看人類玩家的比賽了。我從Suphx身上學到很多新技術,它們對于我的三人麻將打法有著非常大的啟發意義。”期待“蘇菲老師”晉升天鳳位!

猜你喜歡
人類游戲信息
人類能否一覺到未來?
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
1100億個人類的清明
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數獨游戲
瘋狂的游戲
飛碟探索(2016年11期)2016-11-14 19:34:47
爆笑游戲
人類正在消滅自然
奧秘(2015年2期)2015-09-10 07:22:44
第八章直接逃出游戲
小學科學(2015年7期)2015-07-29 22:29:00
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 国产成人免费高清AⅤ| 性网站在线观看| 国产麻豆91网在线看| 香港一级毛片免费看| 最新无码专区超级碰碰碰| A级全黄试看30分钟小视频| 国产香蕉97碰碰视频VA碰碰看| 精品国产香蕉伊思人在线| 亚洲精品第五页| 91麻豆精品国产91久久久久| 91精品网站| 爱做久久久久久| 国产91小视频| 伊人AV天堂| 亚洲欧洲国产成人综合不卡| 日韩国产精品无码一区二区三区| 亚洲另类第一页| 国产欧美性爱网| 无码AV高清毛片中国一级毛片 | 国产91无码福利在线| 免费精品一区二区h| 粗大猛烈进出高潮视频无码| 精品国产免费第一区二区三区日韩| 国产美女人喷水在线观看| 日本一本正道综合久久dvd| 国产香蕉国产精品偷在线观看| 亚洲人在线| 99视频只有精品| 日日碰狠狠添天天爽| 综合色亚洲| 国产成人三级在线观看视频| 成人午夜久久| 97青青青国产在线播放| 91在线视频福利| 久久国产黑丝袜视频| 日韩二区三区| 精品国产中文一级毛片在线看| 69av免费视频| 国产综合另类小说色区色噜噜| 最新亚洲人成网站在线观看| 一级毛片免费不卡在线| 亚洲成人网在线观看| 亚洲国产日韩视频观看| 色综合国产| 视频一区亚洲| 三级欧美在线| 天天色天天综合| 久久狠狠色噜噜狠狠狠狠97视色| 日韩美一区二区| av色爱 天堂网| 免费 国产 无码久久久| 国产精品大白天新婚身材| 激情五月婷婷综合网| 国产精品999在线| 美女扒开下面流白浆在线试听| 国产区在线观看视频| 国产精品女主播| 国产超碰一区二区三区| 国产精品自在在线午夜区app| 色综合成人| 亚洲一区毛片| 毛片网站在线播放| 欧美国产菊爆免费观看 | 熟妇丰满人妻| 国产精品久久久精品三级| 亚洲欧美在线综合一区二区三区| 亚洲资源站av无码网址| 麻豆精品久久久久久久99蜜桃| 婷婷成人综合| 六月婷婷激情综合| 国产精品漂亮美女在线观看| 国产美女叼嘿视频免费看| 伊人福利视频| 国产美女免费网站| 亚洲国产成人无码AV在线影院L| 国产理论最新国产精品视频| 久久99国产乱子伦精品免| 久草中文网| 成人在线欧美| 热99精品视频| 黄色网址手机国内免费在线观看| 99视频在线免费观看|