劉召華
寶雞職業(yè)技術(shù)學(xué)院電子信息工程系,陜西 寶雞 721013
?
人工智能發(fā)展的新技術(shù)
——深度學(xué)習(xí)
劉召華*
寶雞職業(yè)技術(shù)學(xué)院電子信息工程系,陜西寶雞721013
摘要:近年來(lái),在計(jì)算機(jī)和互聯(lián)網(wǎng)巨頭推動(dòng)下,人工智能進(jìn)入新的發(fā)展高潮,人工神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等將人工智能推向新的高度。深度學(xué)習(xí)是人工智能的基礎(chǔ),本文針對(duì)Alpha Go深度學(xué)習(xí)分析,講述了深度學(xué)習(xí)算法實(shí)現(xiàn)原理。
關(guān)鍵詞:人工智能;深度學(xué)習(xí);深度卷積神經(jīng)網(wǎng)絡(luò)
2016年3月9日,谷歌人工智能Alpha Go與世界圍棋冠軍李世石進(jìn)行了舉世矚目的人機(jī)大戰(zhàn),人們的焦點(diǎn)再次聚集到人工智能。從人工智能提出60年來(lái),人工智能取得長(zhǎng)足發(fā)展,成為一門廣泛的交叉和前沿科學(xué)。人工智能發(fā)展到現(xiàn)在嶄新的階段,主要來(lái)自于機(jī)器學(xué)習(xí)中的一個(gè)子分支——深度學(xué)習(xí)。
一、深度學(xué)習(xí)
深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究,屬于機(jī)器學(xué)習(xí)研究中的一個(gè)新的領(lǐng)域。深度學(xué)習(xí)是指人工智能對(duì)從未經(jīng)過(guò)標(biāo)記的數(shù)據(jù)展開(kāi)學(xué)習(xí)、訓(xùn)練,自行掌握概念,學(xué)會(huì)辨識(shí)聲音、圖像和其他數(shù)據(jù),這種學(xué)習(xí)方式更接近人腦的方式。深度學(xué)習(xí)主要是以構(gòu)建深層結(jié)構(gòu)來(lái)學(xué)習(xí)多層次的表示,并不是特指某種機(jī)器學(xué)習(xí)算法或模型,而是一種技術(shù)。
在人工神經(jīng)網(wǎng)絡(luò)研究中,研究人員利用解剖學(xué)知識(shí)發(fā)現(xiàn)大腦表示信息的方式:通過(guò)感官信號(hào)接收到的刺激信號(hào)通過(guò)一個(gè)復(fù)雜的層狀網(wǎng)絡(luò)模型獲取觀測(cè)數(shù)據(jù)展現(xiàn)的規(guī)則。也就是說(shuō),人腦是根據(jù)經(jīng)聚集和分解過(guò)程處理后的信息來(lái)識(shí)別物體。因此視皮層的功能是對(duì)感知信號(hào)進(jìn)行特征提取和計(jì)算,而不僅僅是簡(jiǎn)單地重現(xiàn)視網(wǎng)膜的圖像。人類感知系統(tǒng)這種明確的層次結(jié)構(gòu)極大地降低了視覺(jué)系統(tǒng)處理的數(shù)據(jù)量,并保留了物體有用的結(jié)構(gòu)信息。人工神經(jīng)網(wǎng)絡(luò)是在對(duì)人腦組織結(jié)構(gòu)和運(yùn)行機(jī)制的認(rèn)識(shí)理解基礎(chǔ)之上模擬其結(jié)構(gòu)和智能行為的一種工程系統(tǒng),而含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。
深度學(xué)習(xí)通過(guò)組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。其動(dòng)機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),從而模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù),例如圖像,聲音和文本。它比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)擁有更多的隱含層,使用更多的網(wǎng)絡(luò)層次來(lái)模擬大腦的學(xué)習(xí)機(jī)制,并克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法在多層情況下訓(xùn)練困難的問(wèn)題。它同樣是人工神經(jīng)網(wǎng)絡(luò),突破之處在于它的網(wǎng)絡(luò)層次和解決訓(xùn)練難度的方法。
二、Alpha Go深度學(xué)習(xí)技術(shù)過(guò)程分析
從自然期刊論文提供的資料分析,Alpha Go主要是通過(guò)把已有的技術(shù)整合在一起,并利用大量的訓(xùn)練數(shù)據(jù)和計(jì)算資源來(lái)提高準(zhǔn)確性,所以其核心仍然是強(qiáng)大的計(jì)算平臺(tái)和工程能力。Alpha Go主要用到的核心技術(shù):機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí);啟發(fā)式搜索算法的蒙特卡羅樹搜索算法,另外,深度學(xué)習(xí)模型里的深度卷積神經(jīng)網(wǎng)絡(luò)和優(yōu)化方法中的一階方法一起構(gòu)成了Alpha Go的核心組件。
圍棋人工智能問(wèn)題的核心在于搜索。最簡(jiǎn)單的方法其實(shí)就是把所有的可能性羅列出來(lái),然后從中選出最優(yōu)的方案。實(shí)際圍棋比賽中這種“可能性”太多,即搜索空間過(guò)于龐大。即使耗費(fèi)再多的硬件資源,把每種可能的情況都做一遍驗(yàn)證也不現(xiàn)實(shí)。所以Alpha Go的核心技術(shù)避免窮舉這些所有的可能性,而是利用更聰明的方式(比如近似)來(lái)找到那些有可能促使勝利的策略。當(dāng)一個(gè)選手把白色棋子放在9*9小棋盤上的時(shí)候,對(duì)于機(jī)器來(lái)說(shuō)它有80種可能的走子方案(9*9-1),這稱之為廣度(Breadth)。機(jī)器確認(rèn)了下一步走子方案的時(shí)候,選手就可以選擇剩下的79種走子方案。很容易看出,僅僅簡(jiǎn)單的兩步就共產(chǎn)生了80*79種不同的組合。所以,當(dāng)一個(gè)游戲的長(zhǎng)度為N的時(shí)候(也稱之為深度Depth),考慮所有的可能性是不現(xiàn)實(shí)的。總的可能性數(shù)目依賴于前面所提到的廣度和深度,所以我們的目標(biāo)就是要降低搜索空間的大小,即要降低廣度和深度。
走棋網(wǎng)絡(luò)的目的是為了減少?gòu)V度。對(duì)于一個(gè)給定的棋盤狀態(tài),我們要盡量把需要考慮的范圍減少,同時(shí)也要考慮最優(yōu)的走子方案。通過(guò)走棋網(wǎng)絡(luò)我們可以只選擇可能性較大的走子方案,而不去考慮剩下的方案。從數(shù)學(xué)的角度來(lái)講,對(duì)于給定的一個(gè)棋盤狀態(tài),先計(jì)算概率分布,然后從中選擇最為合理的走子方案。Alpha Go系統(tǒng)中選用深度神經(jīng)網(wǎng)絡(luò)中的一種——深度卷積神經(jīng)網(wǎng)絡(luò)方法來(lái)計(jì)算概率分布。在Alpha Go系統(tǒng)里,深度卷積神經(jīng)網(wǎng)絡(luò)的輸入是一個(gè)棋盤(可以把棋盤看做是一幅圖,棋盤上的黑子和白子分別可以用1和-1來(lái)表示,剩下的空位置可以用0來(lái)表示),其實(shí)相當(dāng)于一個(gè)矩陣。它的輸出就是不同走子方案的概率分布,然后基于這個(gè)分布,可以做下一步的決策。為了達(dá)到訓(xùn)練的目的,Alpha Go需要大量的訓(xùn)練樣本,樣本就是職業(yè)玩家的比賽記錄。訓(xùn)練好的模型就可以用來(lái)模擬高手似的走法。整個(gè)樣本的訓(xùn)練過(guò)程需要大量的計(jì)算資源。Alpha Go系統(tǒng)會(huì)從已有的比賽歷史中去學(xué)習(xí)頂級(jí)高手的走子方案。也就是說(shuō),給定一個(gè)棋盤狀態(tài),Alpha Go會(huì)試圖去模仿專家的走法,并判斷哪中走法最有利。然而,Alpha Go并沒(méi)有停留在這一步,而是接著用強(qiáng)化學(xué)習(xí)的方式來(lái)進(jìn)一步提高系統(tǒng)的性能。強(qiáng)化學(xué)習(xí)主要用來(lái)搜集更多的樣本,從而提高系統(tǒng)的準(zhǔn)確率。采用做法是把訓(xùn)練出來(lái)的模型倆倆做對(duì)抗,根據(jù)比賽的結(jié)果再更新模型的參數(shù)。所以這是機(jī)器和機(jī)器之間的較量,這種迭代會(huì)反復(fù)很多次。通過(guò)這種迭代,最初的模型最后可能演變成了另一種模型,這種通過(guò)不斷地自我提升訓(xùn)練出來(lái)的模型在大部分情況下會(huì)勝出最初的專家模型。
三、深度學(xué)習(xí)應(yīng)用現(xiàn)狀及不足
深度學(xué)習(xí)的應(yīng)用對(duì)象不僅包含語(yǔ)音、圖像、視頻,也包含文本、語(yǔ)言和語(yǔ)義信息。深度學(xué)習(xí)已成功應(yīng)用于多種模式分類問(wèn)題。這一領(lǐng)域雖處于發(fā)展初期,但它的發(fā)展無(wú)疑會(huì)對(duì)機(jī)器學(xué)習(xí)和人工智能系統(tǒng)產(chǎn)生影響。同時(shí)它仍存在某些不適合處理的特定任務(wù),譬如語(yǔ)言辨識(shí),生成性預(yù)訓(xùn)練提取的特征僅能描述潛在的語(yǔ)音變化,不會(huì)包含足夠的不同語(yǔ)言間的區(qū)分性信息;虹膜識(shí)別等每類樣本僅含單個(gè)樣本的模式分類問(wèn)題也是不能很好完成的任務(wù)。
四、結(jié)束語(yǔ)
深度學(xué)習(xí)目前仍有大量工作需要研究。模型方面是否有其他更為有效且有理論依據(jù)的深度模型學(xué)習(xí)算法,探索新的特征提取模型是值得深入研究的內(nèi)容。此外有效的可并行訓(xùn)練算法也是值得研究的一個(gè)方向。在深度學(xué)習(xí)應(yīng)用拓展方面,如何充分合理地利用深度學(xué)習(xí)在增強(qiáng)傳統(tǒng)學(xué)習(xí)算法的性能仍是目前各領(lǐng)域的研究重點(diǎn)。
[參考文獻(xiàn)]
[1]李凡長(zhǎng).《機(jī)器學(xué)習(xí)》.中國(guó)科學(xué)技術(shù)大學(xué)出版社,ISBN:9787312026362.
[2]周志華.《機(jī)器學(xué)習(xí)及其應(yīng)用》.清華大學(xué)出版社,ISBN:9787302204190,2009.
*作者簡(jiǎn)介:劉召華(1976-),男,漢族,陜西鳳翔人,在職碩士,寶雞職業(yè)技術(shù)學(xué)院,計(jì)算機(jī)網(wǎng)絡(luò)專業(yè)助講,研究方向:物聯(lián)網(wǎng)。
中圖分類號(hào):B82-057
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1006-0049-(2016)14-0223-01