周潔

對于人工智能來說,1997 年5月11日是歷史性的一天。
IBM的超級計算機“深藍”(Deep Blue)以2勝1負3平的成績戰勝了當時世界排名第一的國際象棋大師加里·卡斯帕羅夫,一時間全球轟動。
“深藍”的設計者們在當時就想到了下一個小目標:“何時計算機也能下圍棋呢?”
2016年3月15日,谷歌圍棋人工智能“阿爾法狗”(Alpha Go)與韓國棋手李世石對弈并以4:1的成績獲勝,這場“人機大戰”成為人工智能史上一座新的里程碑,也再次為人工智能技術做了科普——
從“深藍”到“阿爾法狗”,這二十多年的發展似乎也在預示著,人工智能終將改變人類的生活。
超越人類的思維限制,創造出一種能夠自我學習、自我進步的超級大腦,一直是人類的終極夢想。
IBM的“深藍”最早可以追溯到1985年,當時卡內基梅隆大學的博士生許峰雄開始開發一種名為“芯片測試”的國際象棋電腦“深思”(Deep Thought)(來源于科幻小說《銀河系漫游指南》中的一臺機器)。后來,許峰雄和他的同事被IBM聘用,繼續從事國際象棋的研究工作。
卡斯帕羅夫是國際象棋史上最偉大的棋手之一,他不僅精通國際象棋,還是一位數學家、計算機專家,并且精通15國語言。他的棋風活潑,有異常敏銳的感知判斷力,對弈時常常能以出人意料的策略贏得比賽。
卡斯帕羅夫曾在1989年的兩場比賽中輕松擊敗“深思”,于是IBM團隊繼續改進他們的超級計算機,1993年將其重新命名為“深藍”,這是Deep Thought和IBM藍色LOGO的組合。
1996年2月17日,卡斯帕羅夫對陣IBM“深藍”計算機,最終,卡斯帕羅夫以4:2戰勝“深藍”,一舉奪得40萬美元獎金。
這場比賽給許峰雄團隊帶來了信心,因為出乎他們的意料,世界象棋冠軍在第一場比賽中輸給了“深藍”。比賽結束后,許峰雄團隊一直在為“深藍”做升級,升級后,“深藍”每秒可以檢測2億個不同的國際象棋位置。
1997年5月3日,又一場人機大戰開始了。卡斯帕羅夫贏了第一場,深藍贏了第二場。第三、第四和第五局以平局告終。5月11日,深藍以3.5比2.5的比分贏得了第六場比賽。
對于這場勝利,“深藍”設計者許峰雄認為,這主要是依靠“深藍”強大的計算能力窮舉所有路數來選擇最佳策略:“深藍”靠硬算可以預判12步,卡斯帕羅夫可以預判10步。
如今“深藍”的性能已經不再值得一提,就CPU來說,早在2006年,英特爾推出的第一代酷睿2就已經超過了“深藍”,我們國家超級計算機天河二號的浮點運算能力,則是“深藍”的30萬倍。
但計算機戰勝人類的開端,則為人工智能的從業者帶來了更大的想象空間。
從今人的角度來看,“深藍”還算不上足夠智能,它的算法核心是暴力搜索:生成盡可能多的走法,執行盡可能深的搜索,換言之,它每走一步,幾乎都是在遍歷后續所有可能的情況下作出的決策。
因此,很多人認為這是計算機的勝利,而不是人工智能的勝利。
但2016年一戰成名的Alpha Go不同。圍棋和國際象棋在復雜程度上不可同日而語,圍棋變數極多,一回合有250種可能,而一盤棋可以長達150回合。顯然“深藍”式的硬算在圍棋上行不通。
Alpha Go勝利的秘訣不僅僅是計算機強大的計算能力,更依賴其精妙的算法。Alpha Go的算法的核心則依靠強化學習、深度學習和蒙特卡洛樹搜索。“強化學習讓Alpha Go有了自學能力,深度學習讓Alpha Go通過數據驅動的機器學習有了估值量化能力,蒙特卡洛樹則是一個連接所有技術和動作的框架。”
“感覺就像一個有血有肉的人在下棋一樣,該棄的地方也會棄,該退出的地方也會退出,非常均衡的一個棋風,真是看不出出自程序之手。”柯潔曾這樣評價Alpha Go。
2017年,Alpha Go進一步升級為新版程序 Alpha Go Zero:從空白狀態學起,在不利用人類任何圍棋比賽數據作為訓練數據的條件下,它能夠迅速通過2900萬次自我博弈、自學圍棋,并以 89比11 的戰績擊敗“前輩”。
有專家形容Alpha Go Zero在某種程度上部分突破了人類認知學習的能力,原理上可以習得包括圍棋在內的其他觀測信息是完備的、狀態動作空間是可數的各種人類技藝,甚至展現出“直覺”判斷能力。
人工智能的應用當然不會只是用來下棋,智能搜索、無人駕駛汽車、智能機器人……人工智能已經在試探著進入人類實際生活之中,許多人說,未來人類的大部分工作或許都將被人工智能取代。
對于這一點,卡斯帕羅夫或許有更深的感受。
作為第一個工作受到機器威脅的知識工作者,23年后2020年,卡斯帕羅夫再次回到了被“深藍”打敗的紐約一個酒店的宴會廳參加活動,他說自己已經與人工智能和平相處。
“這場比賽不是詛咒,而是福氣,因為我成為了一件非常重要事情的一部分。 22年前,我的想法可能不同。”卡斯帕羅夫表示,每種技術都會在創造就業機會之前就破壞就業機會。也許在未來,人類角色將會是牧羊人。人類只需輕輕推動智能算法,將正確的機器放在正確的空間中執行正確的任務,那么剩下的事就可以交給機器來完成。
而當下,幾乎所有人都認為,目前人工智能發展水平還處在初級階段。“目前人工智能算法大多依賴高質量的海量數據,需要的功率也遠高于人類大腦的能耗水平,同時也很難應用于多種場景。一個明顯的例子就是,Alpha Go的實現方法在明確定義的環境下效果明顯,而在開放環境下,結果往往不盡如人意。”
但從“深藍”到“阿爾法狗”,人工智能已經走上了正確方向,一切才剛剛開始。
1951年5月12日,第一顆氫彈爆炸試驗成功。
1968年5月13日,法國五月風暴興起。
1948年5月14日,以色列正式宣布獨立。
1991年5月15日,法國第一位女總理克勒松夫人就任。
1929年5月16日,第一屆電影“學院獎”(后來的奧斯卡)在好萊塢頒獎。
1973年5月17日,美參議院專門小組開始水門事件聽證會。