從“深藍”到“阿爾法狗”，人工智能發展的一大步

2020-05-20 07:55:52周潔

新民周刊 2020年17期

關鍵詞：計算機人工智能人類

周潔

對于人工智能來說，1997 年5月11日是歷史性的一天。

IBM的超級計算機“深藍”（Deep Blue）以2勝1負3平的成績戰勝了當時世界排名第一的國際象棋大師加里·卡斯帕羅夫，一時間全球轟動。

“深藍”的設計者們在當時就想到了下一個小目標：“何時計算機也能下圍棋呢？”

2016年3月15日，谷歌圍棋人工智能“阿爾法狗”（Alpha Go）與韓國棋手李世石對弈并以4：1的成績獲勝，這場“人機大戰”成為人工智能史上一座新的里程碑，也再次為人工智能技術做了科普——

從“深藍”到“阿爾法狗”，這二十多年的發展似乎也在預示著，人工智能終將改變人類的生活。

計算機的勝利

超越人類的思維限制，創造出一種能夠自我學習、自我進步的超級大腦，一直是人類的終極夢想。

IBM的“深藍”最早可以追溯到1985年，當時卡內基梅隆大學的博士生許峰雄開始開發一種名為“芯片測試”的國際象棋電腦“深思”（Deep Thought）（來源于科幻小說《銀河系漫游指南》中的一臺機器）。后來，許峰雄和他的同事被IBM聘用，繼續從事國際象棋的研究工作。

卡斯帕羅夫是國際象棋史上最偉大的棋手之一，他不僅精通國際象棋，還是一位數學家、計算機專家，并且精通15國語言。他的棋風活潑，有異常敏銳的感知判斷力，對弈時常常能以出人意料的策略贏得比賽。

卡斯帕羅夫曾在1989年的兩場比賽中輕松擊敗“深思”，于是IBM團隊繼續改進他們的超級計算機，1993年將其重新命名為“深藍”，這是Deep Thought和IBM藍色LOGO的組合。

1996年2月17日，卡斯帕羅夫對陣IBM“深藍”計算機，最終，卡斯帕羅夫以4：2戰勝“深藍”，一舉奪得40萬美元獎金。

這場比賽給許峰雄團隊帶來了信心，因為出乎他們的意料，世界象棋冠軍在第一場比賽中輸給了“深藍”。比賽結束后，許峰雄團隊一直在為“深藍”做升級，升級后，“深藍”每秒可以檢測2億個不同的國際象棋位置。

1997年5月3日，又一場人機大戰開始了。卡斯帕羅夫贏了第一場，深藍贏了第二場。第三、第四和第五局以平局告終。5月11日，深藍以3.5比2.5的比分贏得了第六場比賽。

對于這場勝利，“深藍”設計者許峰雄認為，這主要是依靠“深藍”強大的計算能力窮舉所有路數來選擇最佳策略：“深藍”靠硬算可以預判12步，卡斯帕羅夫可以預判10步。

如今“深藍”的性能已經不再值得一提，就CPU來說，早在2006年，英特爾推出的第一代酷睿2就已經超過了“深藍”，我們國家超級計算機天河二號的浮點運算能力，則是“深藍”的30萬倍。

但計算機戰勝人類的開端，則為人工智能的從業者帶來了更大的想象空間。

從“算”到“學”，人工智能發展的一大步

從今人的角度來看，“深藍”還算不上足夠智能，它的算法核心是暴力搜索：生成盡可能多的走法，執行盡可能深的搜索，換言之，它每走一步，幾乎都是在遍歷后續所有可能的情況下作出的決策。

因此，很多人認為這是計算機的勝利，而不是人工智能的勝利。

但2016年一戰成名的Alpha Go不同。圍棋和國際象棋在復雜程度上不可同日而語，圍棋變數極多，一回合有250種可能，而一盤棋可以長達150回合。顯然“深藍”式的硬算在圍棋上行不通。

Alpha Go勝利的秘訣不僅僅是計算機強大的計算能力，更依賴其精妙的算法。Alpha Go的算法的核心則依靠強化學習、深度學習和蒙特卡洛樹搜索。“強化學習讓Alpha Go有了自學能力，深度學習讓Alpha Go通過數據驅動的機器學習有了估值量化能力，蒙特卡洛樹則是一個連接所有技術和動作的框架。”

“感覺就像一個有血有肉的人在下棋一樣，該棄的地方也會棄，該退出的地方也會退出，非常均衡的一個棋風，真是看不出出自程序之手。”柯潔曾這樣評價Alpha Go。

2017年，Alpha Go進一步升級為新版程序 Alpha Go Zero：從空白狀態學起，在不利用人類任何圍棋比賽數據作為訓練數據的條件下，它能夠迅速通過2900萬次自我博弈、自學圍棋，并以 89比11 的戰績擊敗“前輩”。

有專家形容Alpha Go Zero在某種程度上部分突破了人類認知學習的能力，原理上可以習得包括圍棋在內的其他觀測信息是完備的、狀態動作空間是可數的各種人類技藝，甚至展現出“直覺”判斷能力。

人工智能的應用當然不會只是用來下棋，智能搜索、無人駕駛汽車、智能機器人……人工智能已經在試探著進入人類實際生活之中，許多人說，未來人類的大部分工作或許都將被人工智能取代。

對于這一點，卡斯帕羅夫或許有更深的感受。

作為第一個工作受到機器威脅的知識工作者，23年后2020年，卡斯帕羅夫再次回到了被“深藍”打敗的紐約一個酒店的宴會廳參加活動，他說自己已經與人工智能和平相處。

“這場比賽不是詛咒，而是福氣，因為我成為了一件非常重要事情的一部分。 22年前，我的想法可能不同。”卡斯帕羅夫表示，每種技術都會在創造就業機會之前就破壞就業機會。也許在未來，人類角色將會是牧羊人。人類只需輕輕推動智能算法，將正確的機器放在正確的空間中執行正確的任務，那么剩下的事就可以交給機器來完成。

而當下，幾乎所有人都認為，目前人工智能發展水平還處在初級階段。“目前人工智能算法大多依賴高質量的海量數據，需要的功率也遠高于人類大腦的能耗水平，同時也很難應用于多種場景。一個明顯的例子就是，Alpha Go的實現方法在明確定義的環境下效果明顯，而在開放環境下，結果往往不盡如人意。”

但從“深藍”到“阿爾法狗”，人工智能已經走上了正確方向，一切才剛剛開始。

歷史上的這一周

1951年5月12日，第一顆氫彈爆炸試驗成功。

1968年5月13日，法國五月風暴興起。

1948年5月14日，以色列正式宣布獨立。

1991年5月15日，法國第一位女總理克勒松夫人就任。

1929年5月16日，第一屆電影“學院獎”（后來的奧斯卡）在好萊塢頒獎。

1973年5月17日，美參議院專門小組開始水門事件聽證會。