深度學習技術在信息系統數據分析中的應用

2017-08-08 02:04:22林偉聲

電腦與電信 2017年6期

關鍵詞：深度模型

林偉聲

（廣州市城市規劃自動化中心，廣東廣州 510000）

深度學習技術在信息系統數據分析中的應用

林偉聲

（廣州市城市規劃自動化中心，廣東廣州 510000）

深度學習是近年來機器學習領域的一個熱點研究方向，其主要方法是通過增加學習器的層數，增大其通道數和參數的規模，借助大數據學習時代的超強計算能力，發現原始數據集中的高層抽象概念，為應用領域的決策支持服務。探討了在信息系統的數據分析任務中深度學習技術的應用方法，著重闡述了卷積神經網絡和堆疊自動編碼器的主要原理和實現方法，及其在信息系統的數據分析中的應用案例，并對其應用價值進行了分析。

深度學習；信息系統數據分析；卷積神經網絡；堆疊自動編碼器

1 背景和研究現狀

深度學習是近年來機器學習領域的一個熱點研究方向，相對于淺層次學習而言，深度學習的主要特征是大大增加了學習器模型的層次，也即數據從輸入端到輸出端所需要經過的運算子個數，在這種情況下，學習器也同時增大了通道數和參數的規模，借助大數據學習時代的超強計算能力，使其具備表達復雜函數的能力，同時也使其能夠發現原始數據集中的高層抽象概念，為應用領域的決策支持服務。

隨著計算機軟硬件技術的發展，信息系統與各個具體的業務領域的結合越來越緊密，在把各種業務過程進行信息化處理的過程中，收集了大量的結構化/非結構化數據，而對這些數據的分析、理解和知識發現是對傳統信息系統技術的挑戰。例如，在一個超市的銷售數據中，通過大數據挖掘技術，發現商品購買習慣與消費者的個人信息之間的關系，為商品的進貨、擺架、促銷活動的設計等進行服務；在一個醫學圖像診斷系統中，通過對圖像和診斷結果進行深度學習，可以對醫生的診斷經驗進行建模，從而實現醫學圖像的計算機輔助診斷。以上目標的實現，有兩個先決條件，一是需要收集海量的數據；二是需要強有力的算法從海量數據中獲取知識，而這類算法均需要強大的計算能力作為支持。

在當前，深度學習技術吸引著大批機器學習研究者和應用領域研究者的興趣，無論是理論研究還是應用研究都出現了大量有價值的成果。Hinton等人[1]于2006年在Science中發表文章，提出了一個訓練深度神經網絡的有效方法，被認為是近年來深度學習研究開始走向成熟的標志。卷積神經網絡（Convolutional NeuralNetwork，CNN）[2]在圖像理解上的成功，大大鼓舞了機器學習和人工智能界，其中主要的代表為Krizhevsky等人[3]在2012年提出的AlexNet架構，在ImageNet數據集[4]的圖像理解問題上，大幅提升了機器學習模型的正確率。在隨后幾年的ImageNet大賽中，卷積神經網絡在圖像理解中的正確率不斷創出新高，其中Google的GoogleNet[5]和百度的ResNet[6]均有很好的表現，同時訓練這些模型所需要的計算代價也是巨大的。最近，采用深度學習技術的人工智能圍棋程序A lphaGo[7]在與人類頂尖棋手的對戰過程中大獲全勝，是對深度學習算法強大能力的一個很好的說明。

本文探討深度學習技術在信息系統的數據分析和知識發現中的應用，闡述兩個常用的深度學習模型的基本原理，即卷積神經網絡和堆疊自動編碼器，給出它們在信息系統的深度學習中的使用案例，并對結果進行分析。

2 深度學習模型

2.1 卷積神經網絡

卷積神經網絡（Convolutional Neural Network）在圖像理解問題中有良好的表現，它的主要原理是采用一系列的卷積層、池化層、非線性激活層和隨機屏蔽層等對原始的輸入信號進行非線性化變換，在此過程中逐步抽取原始輸入信號的本質特征，通過對誤差的反向傳播，使用一種有監督的方式對網絡中的權值進行調整，使其在訓練和評估數據集上的誤差達到最小。其中最重要的操作為卷積操作，在每一卷積層中，通過一個固定大小的卷積核，對輸入的信號進行連續掃描并進行卷積運算，可以有效獲取輸入信號中的局部性特征，適用于圖像分類、標注相關的問題求解。

對于激活層，一般采用Sigmoid函數和Relu函數，其形式公式(1)和公式(2)所示：

圖1展示了一個卷積神經網絡的基本結構。

圖1 卷積神經網絡的基本結構

在圖1中，卷積神經網絡通過多個塊（Block）的疊加，逐層進行特征的抽象化，每個塊由卷積層、非線性激活層和池化層構成，其中池化層一個鄰域內的特征通過平均或求最大值的方式對特征進行歸納，提取關鍵特征并減少特征維數。隨機屏蔽層以一定的百分比屏蔽輸出單元，使輸出不能重度依賴于少數幾個單元，提升了模型的泛化能力。SoftMax輸出層是一個多分類函數，得到一個1-of-k編碼的輸出，對于多分類問題，應使Multi-class SVM或BP網絡[8]。

2.2 堆疊自動編碼器

堆疊自動編碼器是一種無監督（Unsupervised）的特征變換器，其中每一個自動編碼器是一個三層結構的網絡，包括輸入層、中間層和輸出層，中間層執行一個非線性變換函數，訓練的目標為要求輸出的向量能盡可能地還原為輸入向量。通過多個自動編碼器的堆疊，原始輸入特征被層層變換，但每一層都盡可能保持與原始輸入等價的信息量。圖2展示了單一一個自動編碼器的基本結構。

圖2 自動編碼器的基本結構

3 應用實例

在UCI數據集[9]上進行上述深度學習模型的測試，選取其中兩個來自于信息系統的數據庫，分別是Nursery和Census Income，兩個數據集均有明顯的信息系統應用背景。主要屬性見表1。

表1 數據集的基本屬性

為了測試模型的有效性，把兩個數據集按如下方式劃分為訓練集、驗證集和測試集，其大小比例為8:1:1，其中訓練集用于訓練模型，驗證集用于在模型的訓練過程中評估模型的訓練效果，測試集用于測試完成訓練的模型的性能，在本文的設定中，測試集在訓練過程中不可見。

本應用案例中，需要實現兩個深度學習模型和一個支持向量機分類器。對于深度學習模型，采用的是MatConvNet深度學習框架[10]，該框架是基于Matlab實現的，其核心是用C語言編寫的，具有良好的用戶界面和優秀的運行效率。對于支持向量機分類器，使用當前性能最佳的LibSVM。

設計了兩個實驗用于展示深度學習模型的效果。第一個是采用卷積神經網絡對兩個數據集的分類標簽進行預測，具體的做法為把兩個數據集通過MatConvNet的API函數轉換為其內置對象imdb，對其中的數據屬性進行min-max歸一化，然后編寫網絡配置腳本進行網絡設計，參考著名的A lexNet進行設計，采用5個塊相互連接，卷積核的大小固定在5*1，池化層采用max-pooling，最后增加三個全連接層，每一個全連接層后面附有一個20%的隨機屏蔽層。訓練共進行30輪，學習率采用0.01*15、0.001*10、0.0005*5，記錄每一輪的top1err。表2展示了在這個實驗中模型對兩個數據集分類的正確率和方差。

表2 卷積神經網絡的分類正確率和方差

第二個是用堆疊自動編碼器對數據集進行編碼，然后再訓練一個支持向量機分類器，采用7層的堆疊自動編碼器，最終的輸出維數Nursery為10，Census Income為12，支持向量機采用LibSVM實現，核函數使用參數為缺省值的徑向基函數，不設置懲罰項，同時把不經過自動編碼器的原始屬性直接輸入支持向量機模型進行對比。表3展示本部分實驗的結果。

表3 卷積神經網絡的分類正確率和方差

從表3中可以看了，經過堆疊自動編碼器編碼后的數據集在SVM上的表現更好，說明了深度學習模型在信息系統的數據分析中的作用十分顯著。

4 結論和展望

本文闡述了深度學習技術在信息系統的數據分析中的應用，并給出了具體的技術路線。通過在兩個數據集上對兩個深度學習模型的應用實踐，展示了深度學習模型在數據分析中的顯著作用。在今后的研究中，將進一步把深度學習技術與大數據分析技術結合，同時引入更多信息系統所承載的業務內容，建立面向行業應用的深度學習大數據分析平臺，為企業的決策支持提供更有效的保障。

[1]Hinton，G．E．&Salakhutdinov，R．R．Reducing the dimensionality of dataw ith neuralnetworks[J]．Science，2006，313，504-507．

[2]Bengio，Y．Learning Deep Architectures for AI[J]．Foundation TrendsofMachine Learning，Now Publishers Inc．，2009，2，1-127．

[3]Krizhevsky，A．，Sutskever，I．，Hinton，G．E．ImageNetClassification w ith Deep Convolutional Neural Networks[C]．Advances in Neural Information Processing Systems，2012，25，2012．

[4]Olga Russakovsky，Jia Deng，Hao Su，Jonathan Krause，Sanjeev Satheesh，Sean Ma，Zhiheng Huang，Andrej Karpathy，Aditya Khosla，M ichael Bernstein，Alexander C．Berg and Li Fei-Fei[C]．ImageNet Large Scale VisualRecognition Challenge，IJCV，2015．

[5]Szegedy，C．；Liu，W．；Jia，Y．；Sermanet，P．；Reed，S．；Anguelov，D．；Erhan，D．；Vanhoucke，V．&Rabinovich，A．Going deeperw ith convolutions[C]．2015 IEEEConference on Computer Vision and Pattern Recognition(CVPR)，2015，1-9．

[6]Kaim ing He；Xiangyu Zhang；Shaoqing Ren；Jian Sun；undefined；undefined；undefined&undefined Deep Residual Learning for Image Recognition 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR)，IEEEComputer Society，2016，00，770-778．

[7]Silver，D．；Huang，A．；Maddison，C．J．；Guez，A．；Sifre，L．；Van，d．D．G．；Schrittw ieser，J．；Antonoglou，I．；Panneershelvam，V．& Lanctot，M．Mastering the game of Go w ith deep neural networks and tree search[J]．Nature，2016，529，484．

[8]Bishop，C．M．Pattern Recognition and Machine Learning(Information Scienceand Statistics)[B]．Springer-Verlag New York，Inc．，2006．

[9]Bache，K．&Lichman，M．UCIMachine Learning Repository [EB/OL]．University of California，Irvine，Schoolof Information and Computer Sciences，University of California，Irvine，School of Information and Computer Sciences，2013．

[10]Vedaldi，A．&Lenc，K．MatConvNet--Convolutional Neural Networks forMATLAB[C]．Proceeding of theACM Int．Conf．on Multimedia，2015．

The Application of Deep Learning Technologies in Data Analysisof Information System

LinWeisheng
（Guangzhou City Planning Automation Center，Guangzhou 510000，Guangdong）

Deep learing isan active research area inmachine learning community.Itsmain idea is to discoverhigh-levelAbstractconcepts in original datasetsw ith huge computational power of the age of big data,by increasing the number of layers of the learners,so as to increase the sizeof channelsand thequantity of parameters.Itbecomesa significantinformation source for decision supportof application domains.We explore themethodsof applying deep learning technologies in the data analysis tasksof information systems by presenting themain principles and implemetation details of two deep learningmodels,convolutionan neuralnetwork and stacked auto-encoders in emphasis,their application cases in the data analysis of information system,aswellas the analysis on their application value.

deep learning;dataanalysisof information system;convolutionalneuralnetwork;stacked auto-encoder

TP391.4

1008-6609(2017)06-0051-03

林偉聲（1980-），男，廣東揭陽人，助理工程師，研究方向為信息系統數據分析、卷積神經網絡、堆疊自動編碼器。