廖干洲 曾霞
摘要:本文首先對機器學(xué)習(xí)和模式識別下了定義,強調(diào)它們之間的主要區(qū)別位研究的核心問題不同,機器學(xué)習(xí)研究重點是在于模型上,模式識別的研究重點是在于輸入數(shù)據(jù)上。然后介紹了機器學(xué)習(xí)中的深度學(xué)習(xí)的研究方法,并應(yīng)用在模式識別的任務(wù)上,獲得良好的結(jié)果。
關(guān)鍵詞:模式識別;深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò)
中圖分類號:TP18 文獻標識碼:A 文章編號:1007-9416(2018)02-0229-02
機器學(xué)習(xí)在當(dāng)前的人工智能[1]研究中處于一個非常核心的地位。得益于近十年來機器學(xué)習(xí)中的深度學(xué)習(xí)技術(shù)[2]的飛速發(fā)展。本文主要闡述利用機器學(xué)習(xí)的方法解決模式識別[3]的若干問題。
1 機器學(xué)習(xí)定義
機器學(xué)習(xí)是一門多領(lǐng)域交叉學(xué)科。專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。
2 深度學(xué)習(xí)的研究方法
深度學(xué)習(xí)其原型是多層神經(jīng)網(wǎng)絡(luò)[4](Multilayer Neural Network)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中,采用的是BP算法[5]進行訓(xùn)練,簡單說來就是采用迭代的算法來訓(xùn)練整個網(wǎng)絡(luò),隨機設(shè)定初值,計算當(dāng)前網(wǎng)絡(luò)的輸出,然后根據(jù)當(dāng)前網(wǎng)絡(luò)輸出與標簽之間的差值去改變前面各層的參數(shù),直至收斂。
深度學(xué)習(xí)把傳統(tǒng)機器學(xué)習(xí)的尋找特征參數(shù)問題轉(zhuǎn)化為構(gòu)建深度網(wǎng)絡(luò)問題,在眾多方法當(dāng)中,最著名的可算是卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法。CNN方法通過圖像卷積以及池化的步驟,可較為容易地構(gòu)建一個多層神經(jīng)網(wǎng)絡(luò),對于手寫辨識和圖像辨識具有非常好的效果。
3 卷積神經(jīng)網(wǎng)絡(luò)在模式識別中的應(yīng)用
卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在手寫辨識上具有非常好的效果,本次卷積神經(jīng)網(wǎng)絡(luò)使用傳統(tǒng)LeNet-5[6]的基礎(chǔ)上,結(jié)合Alex-Net[7]的新方法,在nmist數(shù)據(jù)集上進行實驗,訓(xùn)練模型如下圖1所示。
3.1 訓(xùn)練模型
如圖1所示,本次模型采用和LeNet-5的相同的層數(shù),但是在第一層卷基層上采用16個3×3的卷積核,并采用relu激活函數(shù);第三層卷基層上也采用較多的24個3×3的卷積核,也采用了relu激活函數(shù),所以在最后的Flatten層上,數(shù)據(jù)量有864個,而且是連接層,所以可以預(yù)計在訓(xùn)練時間上會比LeNet-5長。
3.2 訓(xùn)練、測試結(jié)果
兩個模型均采用128的Batch,20次Epoch,結(jié)果如下表1所示。
從結(jié)果可以看出,本模型在訓(xùn)練時間是經(jīng)典模型的3倍左右,但是在訓(xùn)練的精度以及測試精度上分別提高了1.35%和1.02%。
從這些結(jié)果里拿出一組訓(xùn)練過程,如圖2所示。
其中圖2(a)是傳統(tǒng)LeNet-5下的結(jié)果,2(b)是本模型的結(jié)果。從兩圖比較可以看出,無論在訓(xùn)練或者測試,本模型從第一次Epoch開始,精度就已經(jīng)非常高,分別達到了81%和96%,進一步說明了本模型在手寫識別上具有一定的實用性。
4 結(jié)語
本文嘗試了以機器學(xué)習(xí)上建立模型的方法解決模式識別的分類任務(wù),并用一個實際的深度建模例子進行說明。本文的主要意義在于強調(diào)機器學(xué)習(xí)及模式識別之間區(qū)別,以使得的在模式識別中強化模型建立的作用,為模式識別提供更多的研究方法。
參考文獻
[1]盧妙娜,王潤.人工智能綜述[J].智能計算機與應(yīng)用,2010,(2):3-4.
[2]郭麗麗,丁世飛.深度學(xué)習(xí)研究進展[J].計算機科學(xué),2015,42(5):28-33.
[3]趙志宇,常健.模式識別概述及其應(yīng)用[J].信息與電腦:理論版,2010,(10):27-27.
[4]馮帥.合作型模塊化神經(jīng)網(wǎng)絡(luò)的研究與應(yīng)用[D].武漢理工大學(xué),2008.
[5]張鈴,張鈸.神經(jīng)網(wǎng)絡(luò)中BP算法的分析[J].模式識別與人工智能,1994,(3):191-195.
[6]Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the Acm, 2013,60(2):2012.