

人工智能阿爾法狗去年4勝1負戰勝圍棋高手李世石,經過9個多月的瘋狂學習后,它升級了。阿爾法狗披著Master的馬甲,在圍棋對戰網上以60勝0負的戰績橫掃中日韓圍棋大師,包括“棋圣”聶衛平。
圍棋棋路復雜多變,一直被視為人類智慧的門檻,許多人終其一生都在研究。阿爾法狗“年紀輕輕”已經達到甚至超過圍棋職業九段水平,這在圍棋界和科技界可是件了不得的事情——機器的智慧接近甚至戰勝了人類。
許多人知道阿爾法狗是一款厲害的人工智能圍棋程序,但不知道阿爾法是怎么樣學習圍棋的。其實它的學習過程模仿了人類小孩,但更加瘋狂。
人類小孩學習的過程,可以看做從書本、老師、家長和生活實際中學習知識,在頭腦中理解知識,在考試、生活中應用知識三個階段。就像先輸入,再整合,最后輸出。
用傳統的英語學習過程打比方,第一個階段是輸入,是不斷背單詞、記句式、語法的過程。完成這個階段已經很不容易,但是只完成這些還是不會用英語交流,和老外對話。
這個時候,就該進入第二個階段,整合。在腦海中整合第一階段的知識,才知道如何把單詞組合成地道的句子,知道什么場合用什么話。
在第三階段,就要輸出了,能用英語交流,表達自己的想法。
人類學習概括起來就是經歷從積累經驗到總結規律,最終靈活運用這三個階段。
那么,應該怎樣教會機器學習呢?
機器沒有辦法讀萬卷書,行萬里路,那么第一階段只能從人類給它的數據中學習了。
在第二階段,該怎么樣教會機器從數據中總結規律,是機器學習的主要問題。幾十年間,科學家們發明了各式各樣的機器學習算法。通過編程,告訴機器學習需要的模型、執行學習的流程、學習模型中的參數。
我們用機器學習圍棋做例子。專家們編寫算法,把圍棋的規則當模型,讓機器執行自己和自己下棋的流程,并且下棋速度非常快。在機器下了成千上萬盤棋后,就能獲得許多參數,比如怎樣的局勢能贏,怎樣的局勢會輸,對手的棋子占據哪些地方我輸的概率大,我的棋子占據哪些地方贏的概率大……
漸漸地,機器就學會了下圍棋,而且能戰勝人類,完成了學習的第三階段。
這樣看來,機器學習的過程是模仿人類小孩的,甚至更簡單,它不會像人類小孩一樣會聯想,會想象。
但機器學習的瘋狂之處在于,突破了人類學習的速度、腦袋的容量和生命長短的限制。阿爾法狗可以在短時間內自己和自己下棋千萬局,人類窮其一生也下不了百萬局棋。
機器學習的模式簡單,和人類如出一轍,但瘋狂的量的積累,讓機器有無限量的智慧和經驗。