999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

漫長的對決

2016-04-05 17:26:15潘超豪
南方人物周刊 2016年8期
關鍵詞:程序人類

潘超豪

1968年,第一個圍棋程序問世。今天,阿爾法幾度戰勝了人類的頂尖棋手。這場人機對決,漫長,而沒有終點

3月13日,首爾。當李世乭九段步入新聞發布會場之時,全場觀眾齊呼“李世乭”,一如兩千年前的羅馬市民迎接凱旋的將軍。李世乭在職業生涯中曾贏得冠軍無數,但受到如此祝賀是頭一回。李世乭說,只是贏了一盤棋,不需要這樣隆重祝賀的。不過,從他嘴角掩藏不住的笑容可以窺見,他的內心或許比現場的觀眾更為喜悅。

這是一場在三尺紋枰上“人類”與“人工智能”的巔峰對決。坐在棋盤兩邊的,一方是李世乭九段,人類最優秀的圍棋手之一;另一方是圍棋程序AlphaGo(以下稱“阿爾法”),由谷歌旗下DeepMind公司開發。

圍棋界在賽前一致看好李世乭橫掃阿爾法。然而,比賽的進程卻出乎所有人的意料。前三局比賽,李世乭不但全部落敗,而且甚至沒有尋覓到明顯的勝機。

在李世乭提前輸掉系列賽之后,棋界輿論風向調轉。韓國頂尖棋手金志錫九段稱要受讓二子才能和阿爾法一戰,中國的古力九段則在解說中開始稱阿爾法“老師”。此時,幾乎沒有人認為在余下的兩局棋中,李世乭還有機會贏一局。

在此背景下,李世乭的絕地反擊才顯得彌足珍貴。

這一盤棋,李世乭在黑方阿爾法的大陣中撒豆成兵,這正是他的成名絕技“僵尸流”。阿爾法一步步落入李世乭的圈套,卻毫無察覺。就在黑棋即將合圍大陣,將白棋一網打盡之時,李世乭祭出驚天一“挖”,正中黑棋的軟肋。阿爾法的招法開始變得凌亂。數個回合之后,阿爾法接連犯下低級錯誤。李世乭此后安全運轉,守住了勝利果實。數據顯示,阿爾法似乎沒有預見到李世乭的妙手,以至于形勢急轉直下。對此,李世乭說:“我的眼里只有那一手棋,沒有任何其他選擇,我必須走那里。我只能謙卑地感謝神明,我這些天的祈禱換來了這樣的閃光。”

令人稍感意外的是,研究計算機圍棋的工程師們在賽前也并不看好阿爾法獲勝。從計算機圍棋幾十年的發展歷史來看,他們做出如此推斷是相當客觀的。

1968年,第一個圍棋程序問世。此后的二十多年間,計算機圍棋發展緩慢。

1991年,中山大學教授陳志行退休后開始研發名為“手談”的圍棋程序。其后,“手談”在8年間九獲計算機圍棋世界冠軍,并接連受讓15子、13子、11子戰勝青年業余高手。陳志行自己也是業余圍棋高手,曾多次參加全國業余圍棋大賽,并取得不俗成績。陳志行曾經設想“手談”能夠在讓九子對局中戰勝自己。

圍棋盤縱橫19道,其上均勻分布著9個黑色的圓點,稱“星位”。讓9子對局,就是白方讓黑方先占據棋盤上的9個星位,才開始對局。部分棋手認為,能夠受讓9子戰勝業余高手,才算是“會下圍棋”。

世紀之交,國際象棋的程序在與人類頂尖棋手的對抗中已經穩穩占據上風,而圍棋的程序則在“會下圍棋”和“不會下圍棋”的邊緣徘徊。據此,有職業棋手推斷,幾十年之內都不會有圍棋程序戰勝人類頂尖棋手,或許永遠都不會。

圍棋人的自信并非無源之水。圍棋和國際象棋都是兩人對戰的完全信息游戲,而人類棋手在棋盤上的決策過程也差異不大:首先搜尋當前局面下看上去所有可行的下一步,然后對其中每一步棋產生變化之后的局面進行評估,最后通過比較,選擇對自己最有利的一步棋。

理論上來說,計算機程序只需要解決“搜尋”和“評估”這兩個問題,就可以達到很高的水平。“深藍”正是這樣做的。

“深藍”在搜尋方面近乎“窮舉”。雖然效率不如人類,但能夠比人類算得更深一層。至于評估,“深藍”采用和人類相似的辦法,給不同的棋子賦予相應的權重。“深藍”之后的國際象棋程序,原理上大同小異,卻已經將人類棋手遠遠甩在身后。

然而, 圍棋程序不可能采取相同的辦法。一方面,圍棋變化的深度和廣度都遠超國際象棋,這使得“深藍”的暴力搜索算法沒有可行性。另一方面,評估一個局面孰優孰劣,在圍棋上也并非易事。

職業圍棋手判斷形勢的方法,由于具有很大模糊性,很難被程序模仿。于是,包括“手談”在內,與“深藍”同時代的圍棋程序幾乎都是在試圖模仿人類棋手的招法。

工程師們竭盡全力讓程序理解“征子”、“雙活”、“愚形”、“小飛”等人類初學者在一個月之內就能掌握的概念,然而效果卻并不理想。也有開發者給程序輸入開局庫,使得程序在遇到常見布局時能夠復制職業棋手的招數。不過,一旦對手變招,程序便無所適從。陳志行等人苦心經營十余年,也未能讓“手談”突破頂尖業余棋手的9子大關。

就在大部分同行還在努力給程序打補丁之時,2006年,法國工程師Remi Coulom取得了突破。他將蒙特卡洛搜索法應用到他的圍棋程序CrazyStone中,并在當年的計算機圍棋世界奧林匹克9路棋盤項目上奪魁。

蒙特卡洛法的主要優勢在于其獨辟蹊徑的局面評估方法。對于某一個特定的選擇,程序用近乎隨機落子的方式快速完成一盤棋,并判定勝負。

重復此過程多次,比如說10萬次之后,黑方在其中獲勝4萬局。那么程序就認為最初的那步棋勝率是40%。這種判斷方式,與人類的“數目法”,即估計雙方領地大小的差距,有本質不同。

如果說之前的圍棋程序都只是拙劣地模仿人類的圍棋知識,那么采用蒙特卡洛法的程序則擁有了自己的“思維方式”。

此后兩年,采用蒙特卡洛法的程序如雨后春筍般出現。2008年,程序MoGo首次在受讓9子的對局中戰勝職業棋手。同年,CrazyStone接連突破職業棋手的8子和7子關。2012年,程序Zen在僅受讓4子的一局棋中,戰勝久負盛名的日本職業棋手武宮正樹九段。Zen的這一成就意味著它達到了業余5段的水平,躋身業余好手之列。這段時間,計算機圍棋的發展速度讓業內人士預測,十年之內將有程序達到職業水平。

技術的進步并非總是一帆風順。2012年之后,采用蒙特卡洛法的程序幾無寸進。Zen、CrazyStone等少數程序在計算機圍棋賽中輪流坐莊,絕對實力卻未見提升。蒙特卡洛法似乎遇到了瓶頸。幸運的是,2015年前后,深度學習技術飛速發展,研究計算機圍棋的工程師也從中找到了新的靈感。阿爾法由此橫空出世。

阿爾法的開發團隊由22名優秀的工程師組成。其中,來自臺灣的黃士杰(Aja Huang)扮演重要角色。黃士杰是臺灣的業余6段棋手,他開發的程序Erica曾擊敗Zen,奪得2010年計算機圍棋奧賽冠軍。雖然阿爾法的開發時間并不很長,但其中的關鍵部分與黃士杰等人的多年積累密不可分,可謂十年磨一劍。

阿爾法主要由走棋網絡、估值網絡和蒙特卡洛法三部分組成。

走棋網絡和估值網絡均基于“深度卷積神經網絡”技術。該技術的靈感與人類大腦的結構密切相關。走棋網絡和估值網絡就好比阿爾法的“左腦”和“右腦”,走棋網絡負責選擇招法,而估值網絡負責評估局面,然后由蒙特卡洛法將它們連結成一個完整的大腦,最后輸出招法。

走棋網絡通過學習職業(或業余高手)棋譜和大量自我對局訓練而成。經過訓練,走棋網絡對于一個特定的局面,能夠快速給盤面上所有可能的選擇給出評分。

走棋網絡的判斷賦予了阿爾法如同人類棋手一樣的特殊“棋感”,即對特殊棋形做瞬時判斷的直覺。對于人類棋手,通常需要多年的訓練才能建立這樣的“棋感”。這種棋感,曾被認為是人工智能難以模仿的。無論是手談還是Zen,它們在類似功能的實現上,基本只是對工程師輸入知識的直接反饋。一旦遇到知識庫里不存在的棋形,它們就可能一臉茫然。

阿爾法則不同。“深度卷積神經網絡”讓阿爾法能夠在輸入知識的基礎上舉一反三。不僅如此,阿爾法還通過自我對局進一步提升判斷的準確度,這使得阿爾法擁有了超越人類“棋感”的潛力。

“棋感”足以讓阿爾法成為一名業余好手,但離職業棋手還很遠。僅憑直覺做出的選擇仍然包含著大量的錯誤。與人類棋手一樣,阿爾法也需要判斷形勢。人類的形勢判斷算法大致是估計對局雙方地盤大小的差值。阿爾法的估值網絡則計算特定局面下雙方的獲勝概率。

與走棋網絡類似,阿爾法同樣進行大量(三千萬局)自我對局獲得樣本。一局棋中如果是黑方獲勝,那么阿爾法就對相似局面下黑棋優勢的判斷更有信心。

另外,阿爾法還有名為“快速走子”的技術輔助判斷。

“快速走子”,顧名思義就是以比走棋網絡更快的速度落子。雖然這樣走出的招法質量稍遜,但速度比走棋網絡快一千倍。更重要的是,通過“快速走子”代替傳統蒙特卡洛法中的隨機落子,使得阿爾法對勝率的估計更為準確。

將“快速走子”與估值網絡結合,阿爾法能夠相當準確地判斷絕大多數局面的勝率。這種形勢判斷的方法不同于人類棋手的思路。從阿爾法與李世石對戰的結果看,阿爾法的判斷在大多數時候甚至強于李世石,令職業棋手們高山仰止。

盡管深度學習技術幫助阿爾法完成了飛躍,蒙特卡洛法仍然是阿爾法不可或缺的一部分。蒙特卡洛法把走棋網絡的選擇和估值網絡的形勢判斷結合在一起,通過邏輯判斷輸出最優的招法。

阿爾法的三個組成部分分工明確,配合默契,完整地實現了類似于人類棋手的思考過程,且擁有超越人類思考能力的潛力。

阿爾法的進步速度,遠遠超出業內人士的想象,甚至可能也超出了阿爾法開發團隊的期望。

2015年10月,阿爾法擊敗樊麾之時,開發者估計阿爾法世界排名約為250名左右。2016年1月末,在新聞發布會上,阿爾法團隊聲稱對抗李世乭“有五成把握”。

前三局棋,阿爾法幾乎沒有給李世乭什么機會。若不是李世乭在逆境下的靈光一現,人類或許就要認為阿爾法是無懈可擊的了。所幸李世石九段奮力一擊,暴露了阿爾法的問題所在。

阿爾法在第四局中的低級錯誤,大致是在面對帶有劫爭的復雜變化時誤判,因而在開劫之前耗盡劫材。前一代以蒙特卡洛法為主算法的程序多數出現過相同問題。在賽前,就有業內人士懷疑阿爾法是否已經解決了此問題,從結果來看似乎并沒有。這是一個有十年歷史的“頑疾”,不一定能夠在短期內得到解決。

然而,無論如何,能夠戰勝李世乭,證明阿爾法和計算機圍棋的前方是一條康莊大道。采用類似技術的其它圍棋程序也已取得不俗成績。

由田淵棟博士開發的Facebook旗下程序Darkforest,短短幾個月就達到了業余4段的水平;新一代的Zen在結合了深度卷積神經網絡之后,也提升到了強業余5段的水平。幾年之內,擁有職業水平的圍棋軟件就將飛入尋常百姓家。

阿爾法的“思維方式”和人類棋手大相徑庭,卻達到了人類的頂尖水平。她的未來沒有極限。

阿爾法的勝利是幾代工程師智慧的結晶,是人工智能技術進步的里程碑;而李世乭的“神之一手”是人類棋力登峰造極的濃縮,是四千年圍棋藝術的冰山一角。這一場挑戰賽,沒有輸家。古老的圍棋和新興的人工智能都還有很長的路要走,希望它們在未來能夠擦出更耀眼的火花。

猜你喜歡
程序人類
顫抖吧,人類
哈哈畫報(2022年4期)2022-04-19 11:11:50
人類能否一覺到未來?
人類會成長起來嗎?
英語文摘(2021年2期)2021-07-22 07:56:54
人類第一殺手
好孩子畫報(2020年5期)2020-06-27 14:08:05
1100億個人類的清明
試論我國未決羈押程序的立法完善
人大建設(2019年12期)2019-05-21 02:55:44
失能的信仰——走向衰亡的民事訴訟程序
“程序猿”的生活什么樣
英國與歐盟正式啟動“離婚”程序程序
環球時報(2017-03-30)2017-03-30 06:44:45
創衛暗訪程序有待改進
中國衛生(2015年3期)2015-11-19 02:53:32
主站蜘蛛池模板: 国产一区二区三区夜色 | 国产成人精品第一区二区| 中文字幕久久亚洲一区| 国产成本人片免费a∨短片| 国产99免费视频| a色毛片免费视频| 欧美日韩精品一区二区视频| 99久久国产精品无码| 亚洲激情区| 国禁国产you女视频网站| 国产微拍一区| 在线观看国产精品一区| 夜夜操天天摸| 国产精品偷伦在线观看| 青青极品在线| 国产经典免费播放视频| 99热这里只有精品免费国产| 久久无码av三级| 国产高潮流白浆视频| 亚洲天堂精品视频| 69国产精品视频免费| 国产精品爽爽va在线无码观看| 22sihu国产精品视频影视资讯| 婷婷综合亚洲| 国产特级毛片| 亚洲伊人天堂| 香蕉综合在线视频91| 亚洲国产成人精品一二区| 中文字幕亚洲乱码熟女1区2区| 2021国产精品自产拍在线观看 | 国产福利拍拍拍| 91青草视频| 三上悠亚在线精品二区| 亚洲aaa视频| 囯产av无码片毛片一级| 黄色三级网站免费| 国产亚洲欧美在线中文bt天堂| 国产在线视频自拍| 亚洲va视频| 91青青视频| 婷婷亚洲最大| 黄色网站在线观看无码| 国产精品毛片一区| 亚洲人成成无码网WWW| 欧洲日本亚洲中文字幕| 72种姿势欧美久久久久大黄蕉| 天天色天天操综合网| 欧美在线精品一区二区三区| 久久综合丝袜长腿丝袜| 国产白浆视频| 精品国产美女福到在线直播| 浮力影院国产第一页| 幺女国产一级毛片| 精品国产自| 色噜噜中文网| 久久久波多野结衣av一区二区| 亚洲伦理一区二区| 国产精品人人做人人爽人人添| 一级毛片不卡片免费观看| 人妻91无码色偷偷色噜噜噜| 一级不卡毛片| 啪啪永久免费av| 亚洲av无码久久无遮挡| 97在线免费| 伊人精品视频免费在线| 国产噜噜噜视频在线观看| 国产免费黄| 国产又大又粗又猛又爽的视频| 精品一区二区三区视频免费观看| 岛国精品一区免费视频在线观看| 久久亚洲国产视频| 精品久久久久成人码免费动漫| 欧美午夜理伦三级在线观看| 99手机在线视频| 免费又黄又爽又猛大片午夜| 欧美黄网站免费观看| 91在线一9|永久视频在线| 一本久道热中字伊人| 伊在人亞洲香蕉精品區| 国产一级α片| 日本道中文字幕久久一区| 精品视频一区在线观看|