也許你很好奇,為什么“阿爾法狗”和李世石的對戰,能夠引起那么大的輿論關注。畢竟這并不是人工智能第一次站在人類的對手席上,也不是人類第一次敗給自己的杰作。
意料之外的智能
我們從圍棋這項運動說起,星盤上共有361個落點,每步落子都會對棋局走勢產生不同影響。普林斯頓大學的研究人員計算過不重復的棋局數,最終結果是一個171位的數字。
這意味著這項棋類運動不存在套路,究竟棋子落在哪里能讓自己勝率最大,只能憑借棋手的直覺、經驗和運氣。巧的是,這三樣都是人工智能所不擅長的。在AlphaGo出現之前,它們連戰勝業余選手都很艱難。所以當這條“狗”五場零封歐洲圍棋冠軍樊麾、4:1力克李世石之后,有些人開始慌了。
人工智能的進步,已經完全超出了人類的預期,AlphaGo的研發者——DeepMind公司的反應也非常微妙。直到這場人機大戰戰局塵埃落定,該公司的首席執行官Demis Hassabis才收起了“這只能證明AI在運算速度和判斷精度方面潛能無限”的客套說辭,表示已經被自己的作品給震驚到了。
只會算算算?
如果從最簡單的層面來分析AlphaGo,它不過是利用了兩套智能分析系統,來決定自己的下法。第一個用來評估棋局,會判斷雙方的優劣勢,以及棋盤每個部分的走勢,盡可能去讀取棋盤上的全部信息,以及對手的動向和意圖。另一個則是落子選擇器,會通過掃描棋盤,找到數個合理的落子點,最終判斷出最佳的一個。
但如果僅僅是運算,那“阿爾法狗”和其他人工智能比起來,不會有質的改變。畢竟處理速度、程序和代碼這種東西,都無法拉開決定性的差距。可實際上,在和其他的人工智能對弈時,AlphaGo在500盤中贏了495盤,勝率高達恐怖的99.8%。它的背后藏著什么秘密?只有谷歌能給一個解釋。硅谷人曾說過,這臺機器人的核心精髓是“深度自學習”,也就是在對戰博弈中積累經驗。李世石輸了之后,韓國棋社跳出來指責AI對手是在赤裸裸地抄襲,可實際上,任何棋手都會去研究對手的下法,AlphaGo只不過是效率更高一些。
在擊敗李世石的前三盤中,AlphaGo是越戰越勇,第二盤甚至頻出怪招。研究人員相信,這是它讀取了李世石棋譜后,在嘗試全新下法的表現。如果這一假設成真,那即便AI現在的學習還停留在“有樣學樣”的層面上,人類想戰勝它們也會變得難上加難。比如你從五步之前就開始設局,如果AI見識過這一招,它當即就能看穿你的心思。
不只是虛擬棋王
AlphaGo的最初設定,并非棋類高手。谷歌在2014年豪擲4億美元收購了初創公司DeepMind,目的也不是在兩年后把100萬美元的獎金攬入囊中——這筆錢本來就是谷歌出的。這些硅谷大神立志于將學習類機器人和通用學習算法相結合,構造出能對人類生活產生極大影響的新行業。而擊敗頂級棋手,不過是這條路上出現的小插曲。
在天才少年柯潔的挑釁下,DeepMind方面的反應非常平淡,他們覺得AlphaGo沒有必要再在圍棋領域待著了。不久前,公司CEO表示會將AlphaGo整合到醫療、機器人領域。局外人并不知道,這些領域才是它的本職工作。此外,暴雪游戲公司方面還確定了一個消息:AlphaGo會以選手的身份挑戰《星際爭霸2》。此訊一出,有“星際第一人”之稱的韓國選手Flash主動請纓,似是要替同胞復仇。可他也許不知道,在和AlphaGo交鋒之前,李世石對它的點評是“只有三段棋手的水平”,并認為自己頂多輸一場。結果我們都看到了。
AlphaGo還有很多路要走,但有些事需要其研發者多多注意。它的智商是否有超過人類的可能?又或者說,人類在發掘AI上限的時候,能否在它們脫離自己控制之前及時收手?不要等AI已經可以俯視人類時,我們才終于回想起被AI支配的恐怖,雖然那只是在電影里。