“阿爾法狗”之父是如何煉成的？

2016-04-21 01:52:28陳丹

寧夏畫報 2016年3期

陳丹

人工智能程序“阿爾法狗”（“阿爾法圍棋”）擊敗頂尖圍棋手李世石之后一戰(zhàn)成名，它的開發(fā)者、現(xiàn)年39歲的德米什·哈薩比斯走進(jìn)了大眾視線。

棋壇神童

英國《連線》雜志報道，這名顏值平平的英國人工智能工程師4歲時對父親和舅舅玩的國際象棋產(chǎn)生興趣，從而開始學(xué)棋。兩周后，他居然贏了大人。從此，哈薩比斯在象棋界漸漸嶄露頭角。

請看這名象棋神童華麗的戰(zhàn)績：5歲，參加英國國內(nèi)比賽；6歲，倫敦8歲以下錦標(biāo)賽冠軍；9歲，英國11歲以下國家象棋隊隊長。英國當(dāng)時在象棋領(lǐng)域水平的世界第二，僅次于前蘇聯(lián)。13歲，他就成為該年齡段世界排名第二的象棋大師。

“我想，當(dāng)時我是喜歡內(nèi)省和深思的孩子。”哈薩比斯接受英國《金融時報》采訪時說，“下象棋是一個深思熟慮的過程。你必須有意識地全盤規(guī)劃，這是它之所以讓人著迷的原因。”

然而，哈薩比斯并沒有繼續(xù)沿著象棋這條路走下去。他認(rèn)為，象棋賦予了他諸多技能，“但它更像是一種訓(xùn)練”。與象棋相比，電腦編程更能讓哈薩比斯熱血沸騰。

從棋盤到鍵盤

大約在8歲時，哈薩比斯用參加象棋比賽贏得的獎金給自己買了第一件東西：電腦。

“我意識到，這種機(jī)器是我們腦力的延伸，就像汽車使我們跑得更快、飛機(jī)使我們飛上天空一樣。”哈薩比斯說，“電腦同樣可以增強(qiáng)你的腦力。”

擁有電腦之后，哈薩比斯通過看書自學(xué)編程。在他11歲時，人工智能闖入他的視線。“我編寫了一個黑白棋游戲的程序，它戰(zhàn)勝了我弟弟。”哈薩比斯說。

此后，電腦編程和人工智能像磁鐵一樣牢牢吸引著哈薩比斯。16歲時，他進(jìn)入劍橋大學(xué)計算機(jī)科學(xué)專業(yè)；17歲時，他設(shè)計出游戲《主題公園》，是最早包含人工智能元素的游戲之一。

得益于這款游戲數(shù)百萬份的銷量，哈薩比斯獲得足夠資金來完成學(xué)業(yè)。這也讓他堅定了一個觀念：人工智能將會有驚人發(fā)展。

“深度思維”的誕生

大學(xué)畢業(yè)后，哈薩比斯把下象棋學(xué)到的規(guī)劃思維運(yùn)用到創(chuàng)業(yè)中。他說：“甚至在當(dāng)時，我就意識到這將是一個20年的計劃。”

1998年，哈薩比斯成立電腦游戲公司“仙丹工作室”，加入商業(yè)界為自己“充電”。

2005年，哈薩比斯回歸學(xué)術(shù)領(lǐng)域，在倫敦大學(xué)學(xué)院攻讀認(rèn)知神經(jīng)科學(xué)博士學(xué)位，開創(chuàng)性地發(fā)現(xiàn)大腦中海馬體與情景記憶間的關(guān)系。他的研究成果在2007年被頂級學(xué)術(shù)期刊《科學(xué)》評為“年度突破”。

2011年，哈薩比斯和發(fā)小穆斯塔法·蘇萊曼以及人工智能專家沙恩·萊格共同創(chuàng)立“深度思維”技術(shù)公司。然而，3年的經(jīng)營讓哈薩比斯感到分身乏術(shù)，難以集中精力于科研。

“由于一心放在籌集資金上，我只有十分之一的時間用來做研究。”哈薩比斯意識到，人的時間畢竟有限，魚和熊掌不可兼得。“如果要把（“深度思維”）打造成谷歌那樣的大公司，而同時又要研究人工智能，幾乎不太可能。”

2014年1月，谷歌以4億英鎊（約合6 .3億美元）將“深度思維”公司收歸旗下，哈薩比斯繼續(xù)擔(dān)任“深度思維”的首席執(zhí)行官。

AlphaGo由兩部分組成，Alpha對應(yīng)希臘語的首字母，也就是常說的“阿爾法”，Go是日語中對圍棋的稱呼。因此，許多人稱之為“阿爾法圍棋”，還有人根據(jù)發(fā)音親昵地叫它“阿爾法狗”或“阿狗”。

AlphaGo出生在英國。2010年，德米什·哈薩比斯等人在倫敦創(chuàng)建“深度思維”公司，該公司開發(fā)出了“阿爾法圍棋”軟件。2014年，美國谷歌公司收購了“深度思維”。

2016年1月，《自然》雜志刊文說，“阿爾法圍棋”以5∶0戰(zhàn)勝歐洲圍棋冠軍、前中國職業(yè)棋手樊麾，成為第一個擊敗人類職業(yè)棋手的電腦程序。

特點會自己學(xué)習(xí)

那“阿爾法圍棋”究竟長什么樣？很可惜，“深度思維”公司的官方網(wǎng)站說，該軟件的代碼并不開放下載。要想了解它，目前主要靠《自然》上的那篇論文，不過普通人難以看懂。那我們盡量用外行能懂的說法吧。許多專家認(rèn)為“阿爾法圍棋”最大的特點是，它會自己學(xué)習(xí)！“阿爾法圍棋”的核心系統(tǒng)屬于時下最火的基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)：模擬人腦神經(jīng)網(wǎng)絡(luò)，通過大量數(shù)據(jù)分析學(xué)習(xí)了3000萬步的職業(yè)棋手棋譜，再通過增強(qiáng)學(xué)習(xí)的方法自我博弈，尋找比基礎(chǔ)棋譜更多的打點來擊敗人類。“阿爾法圍棋”通過策略網(wǎng)絡(luò)和價值網(wǎng)絡(luò)來決定棋路，不去計算每一步的可能性，頗有人類棋手“我感覺這樣會贏”的味道。

絕對碾壓“深藍(lán)Ⅱ”

1997年戰(zhàn)勝國際象棋世界冠軍卡斯帕羅夫的“深藍(lán)Ⅱ”是一個獨特的硬件與軟件的結(jié)合體，IBM專門制造的這臺計算機(jī)浮點運(yùn)算速率超過每秒100億次，幾乎能讓相關(guān)軟件窮舉國際象棋的所有可能下法，“暴力”碾壓人腦。

圍棋一直被看做是人類最后的智力競技高地。據(jù)估算，圍棋的可能下法數(shù)量超越了可觀測宇宙范圍內(nèi)的原子總數(shù)，遠(yuǎn)遠(yuǎn)超出國際象棋，顯然“深藍(lán)Ⅱ”式的硬算在圍棋上行不通。

“阿爾法圍棋”是一個人工智能軟件，它可以運(yùn)行在不同的硬件平臺上。它的“單機(jī)”版本用到48個CPU，而還有一個分布式運(yùn)算的版本，可同時用到多臺計算機(jī)的1202個CPU，大大提升計算能力。

不過，“阿爾法圍棋”挑戰(zhàn)李世石，相對于硬件計算能力而言，更多還是靠軟件算法和學(xué)習(xí)能力。