張馨心
摘要:備受關注的谷歌AlphaGo和韓國棋手李世石的"人機圍棋大戰(zhàn)",最終以4:1的總比分告一段落。關于Alphago的討論熱潮此起彼伏,一個陌生的名詞現(xiàn)如今成了大街小巷最熱議的話題--深度學習。本文從深度學習的概念、發(fā)展和未來走近深度學習,并結合Alphago的技術對深度學習的具體內容有些許涉獵。
關鍵詞:人機圍棋大戰(zhàn),深度學習,人工智能,神經(jīng)網(wǎng)絡
1.深度學習的概念
講到深度學習,不得不和大家所熟知的幾個名詞做一比較,例如人工智能和神經(jīng)網(wǎng)絡。其實,它們是相互包含的關系,人工智能英文名為Artificial Intelligence,即大家所謂的AI,它包含了語言的學習與處理,知識表現(xiàn),智能搜索,推理,規(guī)劃,機器學習,神經(jīng)網(wǎng)絡,遺傳算法等多個領域,神經(jīng)網(wǎng)絡再進行分支,機器學習是其中一項,它是人工智能的核心,而所謂的深度學習就是機器學習中比較高端的技術了。也是近年來值得科學界和工程界注意的新興技術之一。
用學術的語言來說,深度學習結構就是含多隱層的多感知器,深度學習通過低層特征形成更加抽象的高層表示。
2.深度學習的發(fā)展
深度學習發(fā)展至今,不得不提一下它的發(fā)展歷史,首先要說的就是神經(jīng)網(wǎng)絡的發(fā)展。眾所周知,人類每時每刻都要處理大量數(shù)據(jù),卻總能以靈巧的方式提取值得注意的數(shù)據(jù)特征,并通過復雜的大腦對之進行處理。模仿人腦高效準確地表示信息是人類從很久很久以前就夢寐以求的技術。
神經(jīng)科學家經(jīng)過研究發(fā)現(xiàn)哺乳動物大腦表示信息的方式:通過感官信號從視網(wǎng)膜傳遞到前額大腦皮質的時間推斷出大腦皮質并未直接對數(shù)據(jù)進行特征提取和處理,而是根據(jù)分解和處理后的信息來識別物體。因此視皮層的功能是對信號進行信息特征提取和計算,而不僅僅是重建視網(wǎng)膜的影像。受大腦結構分層處理信息的啟示,神經(jīng)網(wǎng)絡科研人員一直致力于多層神經(jīng)網(wǎng)絡的研究,經(jīng)典的BP算法是解決多層神經(jīng)網(wǎng)絡的重要方法。但是該方法有一個嚴重的缺陷:由于誤差存在,結果總是趨近于局部最小,隨著網(wǎng)絡層次提高,該誤差會逐漸增大。因此BP算法僅僅對于較淺層的神經(jīng)網(wǎng)絡才能夠做到令人滿意的結果。為了更有效地解決多層神經(jīng)網(wǎng)絡,深度學習的方法呼之欲出。
2006年,加拿大多倫多教授,機器學習領域泰斗Hinton和他的學生在《Science》上發(fā)表了一篇文章,開啟了深度學習的熱潮。自此,深度學習領域的研究和應用層出不窮,在語音識別、圖像識別,甚至制藥界的發(fā)展都起到了極大的促進作用。近日,谷歌公司推出的Alphago更是深度學習的直接應用的典型。
3.Alphago所采用的關鍵技術:走棋網(wǎng)絡、估值網(wǎng)絡
回到Alphago的獲勝話題上來,我們不禁懷疑起來:為什么一個機器人通過短短數(shù)年的時間可以打敗當今圍棋界的頂尖選手呢?那就讓我們深入地了解一下Alphago的關鍵技術。
Alphago采用了兩個神經(jīng)網(wǎng)絡:走棋網(wǎng)絡和估值網(wǎng)絡。走棋網(wǎng)絡的目的是為了減少搜索的廣度,做法是對于當前的棋盤狀態(tài),我們對下一步乃至下幾步的走法,我們只考慮獲勝可能性較大的走法,而不需要考慮獲勝概率更差的走法,也不一定取得獲勝概率最高的走法。剩下的問題就是如何得到可能的走棋的獲勝概率,這就要用到深度學習了:通過已知的棋譜進行監(jiān)督訓練。為了防止相似性過高,同一個棋譜只挑選有限的幾步進行訓練,讓機器記住較優(yōu)的若干步走法,在實戰(zhàn)中只需要走棋后對棋譜進行檢測,選取勝率較高的一步走棋方案即可。
估計網(wǎng)絡的話,就更容易理解了。對于一個靜態(tài)棋盤,對黑子、白字、空白棋盤上的每個點進行賦值,比如分別賦值為1,-1,0。然后通過深度學習的方法得到該狀態(tài)的勝率。具體過程與走棋網(wǎng)絡的訓練過程很相似,也是輸入龐大的棋譜庫,然后分析得到常見狀態(tài)的勝率。在真正對戰(zhàn)時,如果當前棋盤狀態(tài)機器已經(jīng)記錄下來,我們就可以得到該狀態(tài)的勝率,從而判斷下一步該如何進行移動。
4.深度學習的未來
在賽前,圍棋界的高手們都紛紛預測,李世石將會以大比分戰(zhàn)勝Alphago,中國創(chuàng)新工場總裁李開復也認為,此次比賽李世石應該可以勝出,但是他也從理性的角度分析:人工智能最終會超越人類的左腦,成為新一代的頂尖智能代表。這也是人工智能能夠預見到的未來。深度學習作為神經(jīng)網(wǎng)絡的重要方法,它的前景也不可估量。不過同樣的,深度學習也存在著一些瓶頸需要我們去突破。
從理論的角度來說,我們對深度學習的理論樣本復雜度是不確定的,也就是說,我們并不知道要輸入多少樣本進行訓練,機器才能學到我們所期望的程度。從建模的角度,我們是否還需要更加優(yōu)化的分層來加快深度學習的進度?從工程的角度,對于大量的數(shù)據(jù)計算,我們是否能夠在更短的時間內得到結果?諸如此類的問題還有很多,那也就意味著深度學習還有更寬廣的道路需要我們去開拓,如果這些問題都能逐一解決的話,人工智能的發(fā)展水平又能上升到一個新的臺階,電影中所描述的人與機器人共存的和諧畫面將盡在眼前。
參考文獻
[1]《Draft:Deep Learning in Neural Networks:An Overview》 by Jurgen Schmidhuber
[2]《A Deep Learning Tutorial:From Perceptrons to Deep Networks》 by Ivan Vasilev
[3]《Deep Learning for Natural Language Processing and Related Applications》 by Xiaodong He,Jianfeng Gao,and Li Deng
[4]《A Gentle Introduction to Scikit-Learn:A Python Machine Learning Library》 by Jason Brownlee