張力平
最近,人工智能發展取得了令人震撼的重大突破:運用人工智能的圍棋軟件完勝職業棋手。
游戲是人工智能開發和測試的極佳舞臺。在過去的20多年里,電腦在諸多智力游戲領域都戰勝了人腦,國際象棋、象棋、跳棋等都被人工智能拿下。圍棋是世界上最復雜的棋類游戲,涉及的回合數及策略組合遠多于國際象棋,而且不像國際象棋和象棋那樣可以通過子力多寡直接判斷出形勢的優劣,一些棋子看似被逼入絕境,卻又能通過打劫、做活等方式起死回生,這讓電腦在形勢判斷上不如人腦那般精確,所以圍棋一直是人工智能領域的核心難題,甚至被認為是“人類智能最后的陣地”。
雖然各種數學計算表明,窮舉圍棋的狀態是不可能的,而人們也曾深信,人類所擁有的局勢的判斷力和理解力是電腦無法領悟的,然而現在,深度學習這一最尖端的人工智能技術可以讓電腦掌握不弱于人類的判斷力。圍棋這一人工智能研究高峰即將被征服,確實令科研人員大為振奮。
軟件戰勝職業棋手的“秘籍”是模仿人腦的神經回路和深度學習能力。軟件的“長棋”路徑是分析人類棋手策略、自己“苦練”下棋并從中學習,思考如何長線布局擊敗對手。軟件不再以“暴力窮舉”的計算能力來求勝,而是利用自身的深度學習能力,通過輸入職業棋手的海量棋局,模仿人類的下棋方式,
“過濾”掉明顯的差棋以大大縮小計算量,慢慢掌握了人類最引以為傲的圍棋功夫——“直覺”。
軟件不是單純模仿職業棋手。它通過事先輸入的職業棋手3000萬種下法來學--習,達到能夠以57%的概率算準對手應招的水平。在此基礎上,它將自己的對戰復盤數百萬次,在不斷積累勝負經驗的過程中,掌握取勝方式。在觀察棋子的整體布局的基礎上選擇最佳下法,這:g式接近于帶著直覺和第六感作出判斷的人腦功能。
軟件使用兩種神經網絡,如同有了兩個“大腦”。監督其學習的策略網絡著眼于棋盤中各子的位置,估算每種可能的下法成為最好下法的可能性。價值網絡則通過設想的棋子分布,估算獲勝的概率。它通過提供整體的位置判斷來配合策略網絡。這樣,有兩個“大腦”的軟件就可以達到職業棋手的水平。由此分析局面,判斷每種下子策略的優劣,“挑選”出那些比較有前途的下法,拋棄明顯的劣者,將計算量控制在電腦可以勝任的范圍內,接近了人類棋手的想棋模式。
相形之下,人有固有的弱點:有時會犯大錯,會疲勞,會因為太想贏而承受壓力,但軟件不會,它不僅強大,而且穩定。一位棋手一年或許可以下1000局棋,但軟件一天就能玩100萬局,不會疲勞。
盡管現在軟件的大局觀稍差,但其對局部棋型的感覺及計算已有相當水準。隨著電腦運算能力的不斷提高,加上云計算、大數據等新技術的廣泛應用,在云平臺的支持下,再輔以棋譜、布局、對局、定式等大數據的支撐,能打敗所有職業棋手的軟件已呼之欲出。
人工智能近年的突飛猛進令人欣喜。如今,面向特定領域的專用人工智能技術已取得突破性進展,甚至可以在單點突破、局部智能水平的單項測試中超越人類智能。電腦在與人腦的大戰中不斷過關斬將,但其智能的“通用化”是其推廣應用的最大障礙。如果能突破這個限制,人工智能將進入一個新境界。
人工智能將為人們生活帶來各種便利,并以氣候建模、復雜的災難分析等手段破解醫療、環境等方面的世界難題,并在國防、醫療、工業、農業、金融、商業、教育、公共安全等領域取得廣泛應用,“人工智能+”將成為創新時尚。