深度學(xué)習(xí)在模式識別中的應(yīng)用

2018-05-14 09:57:28廖干洲曾霞

數(shù)字技術(shù)與應(yīng)用 2018年2期

廖干洲　曾霞

摘要：本文首先對機器學(xué)習(xí)和模式識別下了定義，強調(diào)它們之間的主要區(qū)別位研究的核心問題不同，機器學(xué)習(xí)研究重點是在于模型上，模式識別的研究重點是在于輸入數(shù)據(jù)上。然后介紹了機器學(xué)習(xí)中的深度學(xué)習(xí)的研究方法，并應(yīng)用在模式識別的任務(wù)上，獲得良好的結(jié)果。

關(guān)鍵詞：模式識別；深度學(xué)習(xí)；卷積神經(jīng)網(wǎng)絡(luò)

中圖分類號：TP18 文獻標識碼：A 文章編號：1007-9416（2018）02-0229-02

機器學(xué)習(xí)在當(dāng)前的人工智能[1]研究中處于一個非常核心的地位。得益于近十年來機器學(xué)習(xí)中的深度學(xué)習(xí)技術(shù)[2]的飛速發(fā)展。本文主要闡述利用機器學(xué)習(xí)的方法解決模式識別[3]的若干問題。

1 機器學(xué)習(xí)定義

機器學(xué)習(xí)是一門多領(lǐng)域交叉學(xué)科。專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為，以獲取新的知識或技能，重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。

2 深度學(xué)習(xí)的研究方法

深度學(xué)習(xí)其原型是多層神經(jīng)網(wǎng)絡(luò)[4]（Multilayer Neural Network）傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中，采用的是BP算法[5]進行訓(xùn)練，簡單說來就是采用迭代的算法來訓(xùn)練整個網(wǎng)絡(luò)，隨機設(shè)定初值，計算當(dāng)前網(wǎng)絡(luò)的輸出，然后根據(jù)當(dāng)前網(wǎng)絡(luò)輸出與標簽之間的差值去改變前面各層的參數(shù)，直至收斂。

深度學(xué)習(xí)把傳統(tǒng)機器學(xué)習(xí)的尋找特征參數(shù)問題轉(zhuǎn)化為構(gòu)建深度網(wǎng)絡(luò)問題，在眾多方法當(dāng)中，最著名的可算是卷積神經(jīng)網(wǎng)絡(luò)（CNN）方法。CNN方法通過圖像卷積以及池化的步驟，可較為容易地構(gòu)建一個多層神經(jīng)網(wǎng)絡(luò)，對于手寫辨識和圖像辨識具有非常好的效果。

3 卷積神經(jīng)網(wǎng)絡(luò)在模式識別中的應(yīng)用

卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用在手寫辨識上具有非常好的效果，本次卷積神經(jīng)網(wǎng)絡(luò)使用傳統(tǒng)LeNet-5[6]的基礎(chǔ)上，結(jié)合Alex-Net[7]的新方法，在nmist數(shù)據(jù)集上進行實驗，訓(xùn)練模型如下圖1所示。

3.1 訓(xùn)練模型

如圖1所示，本次模型采用和LeNet-5的相同的層數(shù)，但是在第一層卷基層上采用16個3×3的卷積核，并采用relu激活函數(shù)；第三層卷基層上也采用較多的24個3×3的卷積核，也采用了relu激活函數(shù)，所以在最后的Flatten層上，數(shù)據(jù)量有864個，而且是連接層，所以可以預(yù)計在訓(xùn)練時間上會比LeNet-5長。

3.2 訓(xùn)練、測試結(jié)果

兩個模型均采用128的Batch，20次Epoch，結(jié)果如下表1所示。

從結(jié)果可以看出，本模型在訓(xùn)練時間是經(jīng)典模型的3倍左右，但是在訓(xùn)練的精度以及測試精度上分別提高了1.35%和1.02%。

從這些結(jié)果里拿出一組訓(xùn)練過程，如圖2所示。

其中圖2（a）是傳統(tǒng)LeNet-5下的結(jié)果，2（b）是本模型的結(jié)果。從兩圖比較可以看出，無論在訓(xùn)練或者測試，本模型從第一次Epoch開始，精度就已經(jīng)非常高，分別達到了81%和96%，進一步說明了本模型在手寫識別上具有一定的實用性。

4 結(jié)語

本文嘗試了以機器學(xué)習(xí)上建立模型的方法解決模式識別的分類任務(wù)，并用一個實際的深度建模例子進行說明。本文的主要意義在于強調(diào)機器學(xué)習(xí)及模式識別之間區(qū)別，以使得的在模式識別中強化模型建立的作用，為模式識別提供更多的研究方法。

參考文獻

[1]盧妙娜，王潤.人工智能綜述[J].智能計算機與應(yīng)用，2010，（2）：3-4.

[2]郭麗麗，丁世飛.深度學(xué)習(xí)研究進展[J].計算機科學(xué)，2015，42（5）：28-33.

[3]趙志宇，常健.模式識別概述及其應(yīng)用[J].信息與電腦：理論版，2010，（10）：27-27.

[4]馮帥.合作型模塊化神經(jīng)網(wǎng)絡(luò)的研究與應(yīng)用[D].武漢理工大學(xué)，2008.

[5]張鈴，張鈸.神經(jīng)網(wǎng)絡(luò)中BP算法的分析[J].模式識別與人工智能，1994，（3）：191-195.

[6]Krizhevsky A， Sutskever I， Hinton G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the Acm， 2013，60（2）：2012.