陳丹


人工智能程序“阿爾法狗”(“阿爾法圍棋”)擊敗頂尖圍棋手李世石之后一戰(zhàn)成名,它的開發(fā)者、現(xiàn)年39歲的德米什·哈薩比斯走進(jìn)了大眾視線。
棋壇神童
英國(guó)《連線》雜志報(bào)道,這名顏值平平的英國(guó)人工智能工程師4歲時(shí)對(duì)父親和舅舅玩的國(guó)際象棋產(chǎn)生興趣,從而開始學(xué)棋。兩周后,他居然贏了大人。從此,哈薩比斯在象棋界漸漸嶄露頭角。
請(qǐng)看這名象棋神童華麗的戰(zhàn)績(jī):5歲,參加英國(guó)國(guó)內(nèi)比賽;6歲,倫敦8歲以下錦標(biāo)賽冠軍;9歲,英國(guó)11歲以下國(guó)家象棋隊(duì)隊(duì)長(zhǎng)。英國(guó)當(dāng)時(shí)在象棋領(lǐng)域水平的世界第二,僅次于前蘇聯(lián)。13歲,他就成為該年齡段世界排名第二的象棋大師。
“我想,當(dāng)時(shí)我是喜歡內(nèi)省和深思的孩子?!惫_比斯接受英國(guó)《金融時(shí)報(bào)》采訪時(shí)說,“下象棋是一個(gè)深思熟慮的過程。你必須有意識(shí)地全盤規(guī)劃,這是它之所以讓人著迷的原因?!?/p>
然而,哈薩比斯并沒有繼續(xù)沿著象棋這條路走下去。他認(rèn)為,象棋賦予了他諸多技能,“但它更像是一種訓(xùn)練”。與象棋相比,電腦編程更能讓哈薩比斯熱血沸騰。
從棋盤到鍵盤
大約在8歲時(shí),哈薩比斯用參加象棋比賽贏得的獎(jiǎng)金給自己買了第一件東西:電腦。
“我意識(shí)到,這種機(jī)器是我們腦力的延伸,就像汽車使我們跑得更快、飛機(jī)使我們飛上天空一樣。”哈薩比斯說,“電腦同樣可以增強(qiáng)你的腦力?!?/p>
擁有電腦之后,哈薩比斯通過看書自學(xué)編程。在他11歲時(shí),人工智能闖入他的視線。“我編寫了一個(gè)黑白棋游戲的程序,它戰(zhàn)勝了我弟弟?!惫_比斯說。
此后,電腦編程和人工智能像磁鐵一樣牢牢吸引著哈薩比斯。16歲時(shí),他進(jìn)入劍橋大學(xué)計(jì)算機(jī)科學(xué)專業(yè);17歲時(shí),他設(shè)計(jì)出游戲《主題公園》,是最早包含人工智能元素的游戲之一。
得益于這款游戲數(shù)百萬份的銷量,哈薩比斯獲得足夠資金來完成學(xué)業(yè)。這也讓他堅(jiān)定了一個(gè)觀念:人工智能將會(huì)有驚人發(fā)展。
“深度思維”的誕生
大學(xué)畢業(yè)后,哈薩比斯把下象棋學(xué)到的規(guī)劃思維運(yùn)用到創(chuàng)業(yè)中。他說:“甚至在當(dāng)時(shí),我就意識(shí)到這將是一個(gè)20年的計(jì)劃?!?/p>
1998年,哈薩比斯成立電腦游戲公司“仙丹工作室”,加入商業(yè)界為自己“充電”。
2005年,哈薩比斯回歸學(xué)術(shù)領(lǐng)域,在倫敦大學(xué)學(xué)院攻讀認(rèn)知神經(jīng)科學(xué)博士學(xué)位,開創(chuàng)性地發(fā)現(xiàn)大腦中海馬體與情景記憶間的關(guān)系。他的研究成果在2007年被頂級(jí)學(xué)術(shù)期刊《科學(xué)》評(píng)為“年度突破”。
2011年,哈薩比斯和發(fā)小穆斯塔法·蘇萊曼以及人工智能專家沙恩·萊格共同創(chuàng)立“深度思維”技術(shù)公司。然而,3年的經(jīng)營(yíng)讓哈薩比斯感到分身乏術(shù),難以集中精力于科研。
“由于一心放在籌集資金上,我只有十分之一的時(shí)間用來做研究?!惫_比斯意識(shí)到,人的時(shí)間畢竟有限,魚和熊掌不可兼得。“如果要把(“深度思維”)打造成谷歌那樣的大公司,而同時(shí)又要研究人工智能,幾乎不太可能。”
2014年1月,谷歌以4億英鎊(約合6 .3億美元)將“深度思維”公司收歸旗下,哈薩比斯繼續(xù)擔(dān)任“深度思維”的首席執(zhí)行官。
AlphaGo由兩部分組成,Alpha對(duì)應(yīng)希臘語的首字母,也就是常說的“阿爾法”,Go是日語中對(duì)圍棋的稱呼。因此,許多人稱之為“阿爾法圍棋”,還有人根據(jù)發(fā)音親昵地叫它“阿爾法狗”或“阿狗”。
AlphaGo出生在英國(guó)。2010年,德米什·哈薩比斯等人在倫敦創(chuàng)建“深度思維”公司,該公司開發(fā)出了“阿爾法圍棋”軟件。2014年,美國(guó)谷歌公司收購(gòu)了“深度思維”。
2016年1月,《自然》雜志刊文說,“阿爾法圍棋”以5∶0戰(zhàn)勝歐洲圍棋冠軍、前中國(guó)職業(yè)棋手樊麾,成為第一個(gè)擊敗人類職業(yè)棋手的電腦程序。
特點(diǎn)會(huì)自己學(xué)習(xí)
那“阿爾法圍棋”究竟長(zhǎng)什么樣?很可惜,“深度思維”公司的官方網(wǎng)站說,該軟件的代碼并不開放下載。要想了解它,目前主要靠《自然》上的那篇論文,不過普通人難以看懂。那我們盡量用外行能懂的說法吧。許多專家認(rèn)為“阿爾法圍棋”最大的特點(diǎn)是,它會(huì)自己學(xué)習(xí)!“阿爾法圍棋”的核心系統(tǒng)屬于時(shí)下最火的基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí):模擬人腦神經(jīng)網(wǎng)絡(luò),通過大量數(shù)據(jù)分析學(xué)習(xí)了3000萬步的職業(yè)棋手棋譜,再通過增強(qiáng)學(xué)習(xí)的方法自我博弈,尋找比基礎(chǔ)棋譜更多的打點(diǎn)來擊敗人類。“阿爾法圍棋”通過策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)來決定棋路,不去計(jì)算每一步的可能性,頗有人類棋手“我感覺這樣會(huì)贏”的味道。
絕對(duì)碾壓“深藍(lán)Ⅱ”
1997年戰(zhàn)勝國(guó)際象棋世界冠軍卡斯帕羅夫的“深藍(lán)Ⅱ”是一個(gè)獨(dú)特的硬件與軟件的結(jié)合體,IBM專門制造的這臺(tái)計(jì)算機(jī)浮點(diǎn)運(yùn)算速率超過每秒100億次,幾乎能讓相關(guān)軟件窮舉國(guó)際象棋的所有可能下法,“暴力”碾壓人腦。
圍棋一直被看做是人類最后的智力競(jìng)技高地。據(jù)估算,圍棋的可能下法數(shù)量超越了可觀測(cè)宇宙范圍內(nèi)的原子總數(shù),遠(yuǎn)遠(yuǎn)超出國(guó)際象棋,顯然“深藍(lán)Ⅱ”式的硬算在圍棋上行不通。
“阿爾法圍棋”是一個(gè)人工智能軟件,它可以運(yùn)行在不同的硬件平臺(tái)上。它的“單機(jī)”版本用到48個(gè)CPU,而還有一個(gè)分布式運(yùn)算的版本,可同時(shí)用到多臺(tái)計(jì)算機(jī)的1202個(gè)CPU,大大提升計(jì)算能力。
不過,“阿爾法圍棋”挑戰(zhàn)李世石,相對(duì)于硬件計(jì)算能力而言,更多還是靠軟件算法和學(xué)習(xí)能力。