999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

“阿爾法狗”:下一盤比圍棋更大的棋

2017-02-09 16:14:21李斑子
看世界 2017年3期
關鍵詞:人類

李斑子

自從2016年12月29日在圍棋網絡對戰平臺現身之后,截至2017年1月4日晚,一個名為“Master”的神秘賬號在與人類圍棋高手的車輪戰中取得了60勝0負1和的戰績,手下敗將不乏柯潔、樸廷桓、古力等世界頂尖名將,甚至在對局中看不到這些頂尖名將有一點點能和Master扳手腕的可能(Master戰績中唯一的和棋還是因為對手陳耀燁在對戰時掉線)。在和古力最后一戰前,Master承認自己就是升級版的“阿爾法狗”(AlphaGo,谷歌旗下DeepMind公司的一款圍棋人工智能)。

人算不如“狗”算

1月3日晚,在接連贏下樸廷桓和元晟溱之后,Master在圍棋網絡對戰平臺的連勝紀錄達到49場。當晚第50場的對手是“潛伏”,該賬號的持有者被一致認為是世界頭號選手柯潔。根據最新的世界圍棋排名,柯潔是如今世界棋壇積分排名第一的選手,也是榜單上唯一一名排在“阿爾法狗”之前的棋手。

這場對局在Master的快速攻擊面前,“潛伏”漸漸有些捉襟見肘,最終投子認負。“抬走,下一個。”這是觀戰的網友們為贏棋后的Master設計的對白。

而在去年“阿爾法狗”對陣李世石的“圍棋人機大戰1.0”之際,柯潔曾表示:“就算它戰勝了李世石,但它贏不了我。”此后他還在微博上放出豪言,“管你是阿法狗還是阿法貓!我柯潔在棋上什么大風大浪沒見過?讓風暴再來得猛烈點吧……”

與之形成鮮明對比的是,2016年的最后一天,正當Master大殺四方之時,柯潔在微博中寫道:“新的風暴即將來襲。我從3月份到現在研究了大半年的棋軟,無數次的理論、實踐,就是想知道計算機到底強在哪里?昨夜輾轉反側,不想竟一夜難眠,人類數千年的實戰演練進化,計算機卻告訴我們人類全是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊……”

那么問題來了,這只“阿爾法狗”是怎么下棋的?為什么這么強?到底強在哪里?

還記得1997年IBM公司的“深藍”計算機戰勝國際象棋世界冠軍卡斯帕羅夫那次劃時代的“人機大戰”嗎?“深藍”贏得比賽用的就是人類最不屑的辦法——窮舉——把棋盤里可能出現的所有情況都模擬出來,然后對手下的每一步棋都“了然于胸”,再選擇最能贏的走法。就像拿著幾個億去買彩票,所有有可能的組合全部下注,最后中了個500萬。

人工智能能在國際象棋領域這么做,完全是因為國際象棋的所有可能性是10^47,以電腦的“腦力”要列舉這么多種可能性還是夠用的。但要想用一模一樣的辦法稱霸圍棋棋壇,面對圍棋的十九路棋盤,“阿爾法狗”要應付的可能性是2x10^170,換成自然數的形式就是2后邊跟著170個0……要窮舉這么多的棋譜,電腦的“腦力”顯然是不夠用的。要知道,全宇宙的所有原子總數也不過是10^80個。

但是,窮舉還是要有的,不過要用一種聰明點的辦法縮小窮舉的范圍。人類不是下了幾千年的圍棋嗎?那就先拿3000萬份棋譜來學習一下人類下棋的基本套路。“阿爾法狗”剛開始通過自身的“人工神經網絡”來“深度學習”圍棋時,就是從網絡圍棋對戰平臺KGS拿來的3000萬份棋譜開始的。不過這顯然是不夠的,所以在繼續找更多的棋譜的同時“阿爾法狗”還開始了和自己下棋玩——通過學習得來的人類下棋套路來模擬博弈,盡可能地得到更加多的棋譜來學習。

這樣一來,孜孜不倦地學習了數以千萬計的棋譜“阿爾法狗”就對如何合理地下棋這件事有了自己的豐富經驗,這就形成了自己“價值網絡”——估算每一張棋譜里的每一步棋對最后贏棋有多大幫助,并找出其中的一些規律——這大概就是人類常說的“棋感”。而再看看人類,一輩子也下不了一萬盤棋,還要記要分析要總結規律?想想就心累。

“阿爾法狗”學習了海量棋譜得來的“棋感”用來模仿和預測人類下棋已經有很高的把握了,據“阿爾法狗”團隊2016年的說法,“阿爾法狗” 下圍棋時的落子選擇能正確符合57%的人類高手。就是說有57%的人類高手在面對同樣的棋局時會選擇和“阿爾法狗”一樣的下一步,而不符合人類高手想法的那部分并不意味著“阿爾法狗”是錯的,也更有可能是人類自己犯錯而已。

有了深厚的內力加持還是不夠的,“阿爾法狗”還需要在對戰時把自己的積淀用到實處。先前說過,“阿爾法狗”和“深藍”在迎戰人類的方法并沒有什么本質上的差別,都是窮舉。雖然現在“阿爾法狗”已經懂得有規律地窮舉了,但是它的運算能力還是不足以窮舉規律之中的棋局的所有可能走勢,畢竟這個運算量對于計算機來說依然是個天文數字。

所以,“阿爾法狗”引進了另一個大殺器,蒙特卡洛樹搜索(MCTS)算法。蒙特卡洛算法,是由美國數學家烏拉姆最早提出,再經數學天才馮·諾伊曼發展和完善,以賭城蒙特卡洛命名的一種算法。在過于復雜的局面中,人工智能由于硬件缺陷,無法實現窮舉級別的采樣,而蒙特卡洛算法正是在采樣不足的情況下,通過盡可能多次的隨機采樣,一步一步接近最優解。舉個簡單例子,有一堆鉆石,每次隨機選一枚,選中更大的就留下。那么經過越來越多次隨機選擇,最終留下的那枚鉆石,就必然越來越接近這堆鉆石中最大的。

1997年5月,IBM公司的國際象棋電腦“深藍”打敗國際象棋世界冠軍卡斯帕羅夫

具體到“阿爾法狗”下圍棋這件事上,蒙特卡洛樹搜索算法就是把“阿爾法狗”的“棋感”認為有可能的接下來的棋局都先過一遍(有時是走幾十步之后,有時是走到對局結束),把對自己不利的都刪除掉,剩下的便是勝率最高的走法,而且是每下一步棋時這么過一遍。

猜你喜歡
人類
顫抖吧,人類
哈哈畫報(2022年4期)2022-04-19 11:11:50
人類能否一覺到未來?
人類會成長起來嗎?
英語文摘(2021年2期)2021-07-22 07:56:54
人類沒有進化好
人類過去長啥樣
出發!去最北人類定居地
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
共建“人類之眼”
人類,快醒醒
1100億個人類的清明
主站蜘蛛池模板: 九九线精品视频在线观看| 午夜性刺激在线观看免费| 精品视频91| 色天天综合| 亚洲中文精品久久久久久不卡| 伊人狠狠丁香婷婷综合色| 亚洲成人77777| 激情国产精品一区| 免费在线色| 国产午夜精品一区二区三区软件| 毛片在线区| 亚洲欧美日韩动漫| 人妻丝袜无码视频| 精品视频在线观看你懂的一区| 99re66精品视频在线观看| 午夜三级在线| a免费毛片在线播放| 日本精品中文字幕在线不卡| 国产一级视频久久| 成人亚洲视频| 91精品啪在线观看国产91九色| 国产精品专区第1页| 欧美成人免费午夜全| 国产欧美亚洲精品第3页在线| 亚洲第一区精品日韩在线播放| 亚洲浓毛av| 国产精品区网红主播在线观看| 天天色综网| 日本成人精品视频| 久草热视频在线| 欧美日本视频在线观看| 午夜限制老子影院888| 日韩欧美中文在线| 99久久精品视香蕉蕉| 99热这里只有精品国产99| 九九热在线视频| 波多野结衣一区二区三区四区| 亚洲欧美在线精品一区二区| 熟女成人国产精品视频| 国内精品九九久久久精品| 欧美一区二区自偷自拍视频| 免费高清自慰一区二区三区| 国产精品无码在线看| 久久一级电影| 色成人亚洲| 亚洲成aⅴ人片在线影院八| 亚洲国产天堂久久九九九| 亚洲AⅤ综合在线欧美一区| 无码专区第一页| 国产综合精品一区二区| 久久99国产乱子伦精品免| 国产精品自拍合集| 亚洲人成亚洲精品| 中文字幕人妻无码系列第三区| 亚洲色图欧美激情| 久久中文字幕不卡一二区| 亚洲国内精品自在自线官| 视频二区亚洲精品| 国产亚洲男人的天堂在线观看| 亚洲 成人国产| 久久精品66| 18禁影院亚洲专区| 91娇喘视频| 天堂在线视频精品| 91娇喘视频| 亚洲精品自拍区在线观看| 国产浮力第一页永久地址| 国产精品成人不卡在线观看| 国产网站一区二区三区| 国产黄网永久免费| 亚洲男人的天堂在线| 先锋资源久久| 草逼视频国产| 国产精品污视频| 91久久天天躁狠狠躁夜夜| 欧美在线视频不卡| 亚洲女人在线| 伊人久久综在合线亚洲2019| 亚洲中文字幕97久久精品少妇| 四虎国产在线观看| 亚洲一区色| 中文无码影院|