999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度學習技術在信息系統數據分析中的應用

2017-08-08 02:04:22林偉聲
電腦與電信 2017年6期
關鍵詞:深度模型

林偉聲

(廣州市城市規劃自動化中心,廣東 廣州 510000)

深度學習技術在信息系統數據分析中的應用

林偉聲

(廣州市城市規劃自動化中心,廣東 廣州 510000)

深度學習是近年來機器學習領域的一個熱點研究方向,其主要方法是通過增加學習器的層數,增大其通道數和參數的規模,借助大數據學習時代的超強計算能力,發現原始數據集中的高層抽象概念,為應用領域的決策支持服務。探討了在信息系統的數據分析任務中深度學習技術的應用方法,著重闡述了卷積神經網絡和堆疊自動編碼器的主要原理和實現方法,及其在信息系統的數據分析中的應用案例,并對其應用價值進行了分析。

深度學習;信息系統數據分析;卷積神經網絡;堆疊自動編碼器

1 背景和研究現狀

深度學習是近年來機器學習領域的一個熱點研究方向,相對于淺層次學習而言,深度學習的主要特征是大大增加了學習器模型的層次,也即數據從輸入端到輸出端所需要經過的運算子個數,在這種情況下,學習器也同時增大了通道數和參數的規模,借助大數據學習時代的超強計算能力,使其具備表達復雜函數的能力,同時也使其能夠發現原始數據集中的高層抽象概念,為應用領域的決策支持服務。

隨著計算機軟硬件技術的發展,信息系統與各個具體的業務領域的結合越來越緊密,在把各種業務過程進行信息化處理的過程中,收集了大量的結構化/非結構化數據,而對這些數據的分析、理解和知識發現是對傳統信息系統技術的挑戰。例如,在一個超市的銷售數據中,通過大數據挖掘技術,發現商品購買習慣與消費者的個人信息之間的關系,為商品的進貨、擺架、促銷活動的設計等進行服務;在一個醫學圖像診斷系統中,通過對圖像和診斷結果進行深度學習,可以對醫生的診斷經驗進行建模,從而實現醫學圖像的計算機輔助診斷。以上目標的實現,有兩個先決條件,一是需要收集海量的數據;二是需要強有力的算法從海量數據中獲取知識,而這類算法均需要強大的計算能力作為支持。

在當前,深度學習技術吸引著大批機器學習研究者和應用領域研究者的興趣,無論是理論研究還是應用研究都出現了大量有價值的成果。Hinton等人[1]于2006年在Science中發表文章,提出了一個訓練深度神經網絡的有效方法,被認為是近年來深度學習研究開始走向成熟的標志。卷積神經網絡(Convolutional NeuralNetwork,CNN)[2]在圖像理解上的成功,大大鼓舞了機器學習和人工智能界,其中主要的代表為Krizhevsky等人[3]在2012年提出的AlexNet架構,在ImageNet數據集[4]的圖像理解問題上,大幅提升了機器學習模型的正確率。在隨后幾年的ImageNet大賽中,卷積神經網絡在圖像理解中的正確率不斷創出新高,其中Google的GoogleNet[5]和百度的ResNet[6]均有很好的表現,同時訓練這些模型所需要的計算代價也是巨大的。最近,采用深度學習技術的人工智能圍棋程序A lphaGo[7]在與人類頂尖棋手的對戰過程中大獲全勝,是對深度學習算法強大能力的一個很好的說明。

本文探討深度學習技術在信息系統的數據分析和知識發現中的應用,闡述兩個常用的深度學習模型的基本原理,即卷積神經網絡和堆疊自動編碼器,給出它們在信息系統的深度學習中的使用案例,并對結果進行分析。

2 深度學習模型

2.1 卷積神經網絡

卷積神經網絡(Convolutional Neural Network)在圖像理解問題中有良好的表現,它的主要原理是采用一系列的卷積層、池化層、非線性激活層和隨機屏蔽層等對原始的輸入信號進行非線性化變換,在此過程中逐步抽取原始輸入信號的本質特征,通過對誤差的反向傳播,使用一種有監督的方式對網絡中的權值進行調整,使其在訓練和評估數據集上的誤差達到最小。其中最重要的操作為卷積操作,在每一卷積層中,通過一個固定大小的卷積核,對輸入的信號進行連續掃描并進行卷積運算,可以有效獲取輸入信號中的局部性特征,適用于圖像分類、標注相關的問題求解。

對于激活層,一般采用Sigmoid函數和Relu函數,其形式公式(1)和公式(2)所示:

圖1展示了一個卷積神經網絡的基本結構。

圖1 卷積神經網絡的基本結構

在圖1中,卷積神經網絡通過多個塊(Block)的疊加,逐層進行特征的抽象化,每個塊由卷積層、非線性激活層和池化層構成,其中池化層一個鄰域內的特征通過平均或求最大值的方式對特征進行歸納,提取關鍵特征并減少特征維數。隨機屏蔽層以一定的百分比屏蔽輸出單元,使輸出不能重度依賴于少數幾個單元,提升了模型的泛化能力。SoftMax輸出層是一個多分類函數,得到一個1-of-k編碼的輸出,對于多分類問題,應使Multi-class SVM或BP網絡[8]。

2.2 堆疊自動編碼器

堆疊自動編碼器是一種無監督(Unsupervised)的特征變換器,其中每一個自動編碼器是一個三層結構的網絡,包括輸入層、中間層和輸出層,中間層執行一個非線性變換函數,訓練的目標為要求輸出的向量能盡可能地還原為輸入向量。通過多個自動編碼器的堆疊,原始輸入特征被層層變換,但每一層都盡可能保持與原始輸入等價的信息量。圖2展示了單一一個自動編碼器的基本結構。

圖2 自動編碼器的基本結構

3 應用實例

在UCI數據集[9]上進行上述深度學習模型的測試,選取其中兩個來自于信息系統的數據庫,分別是Nursery和Census Income,兩個數據集均有明顯的信息系統應用背景。主要屬性見表1。

表1 數據集的基本屬性

為了測試模型的有效性,把兩個數據集按如下方式劃分為訓練集、驗證集和測試集,其大小比例為8:1:1,其中訓練集用于訓練模型,驗證集用于在模型的訓練過程中評估模型的訓練效果,測試集用于測試完成訓練的模型的性能,在本文的設定中,測試集在訓練過程中不可見。

本應用案例中,需要實現兩個深度學習模型和一個支持向量機分類器。對于深度學習模型,采用的是MatConvNet深度學習框架[10],該框架是基于Matlab實現的,其核心是用C語言編寫的,具有良好的用戶界面和優秀的運行效率。對于支持向量機分類器,使用當前性能最佳的LibSVM。

設計了兩個實驗用于展示深度學習模型的效果。第一個是采用卷積神經網絡對兩個數據集的分類標簽進行預測,具體的做法為把兩個數據集通過MatConvNet的API函數轉換為其內置對象imdb,對其中的數據屬性進行min-max歸一化,然后編寫網絡配置腳本進行網絡設計,參考著名的A lexNet進行設計,采用5個塊相互連接,卷積核的大小固定在5*1,池化層采用max-pooling,最后增加三個全連接層,每一個全連接層后面附有一個20%的隨機屏蔽層。訓練共進行30輪,學習率采用0.01*15、0.001*10、0.0005*5,記錄每一輪的top1err。表2展示了在這個實驗中模型對兩個數據集分類的正確率和方差。

表2 卷積神經網絡的分類正確率和方差

第二個是用堆疊自動編碼器對數據集進行編碼,然后再訓練一個支持向量機分類器,采用7層的堆疊自動編碼器,最終的輸出維數Nursery為10,Census Income為12,支持向量機采用LibSVM實現,核函數使用參數為缺省值的徑向基函數,不設置懲罰項,同時把不經過自動編碼器的原始屬性直接輸入支持向量機模型進行對比。表3展示本部分實驗的結果。

表3 卷積神經網絡的分類正確率和方差

從表3中可以看了,經過堆疊自動編碼器編碼后的數據集在SVM上的表現更好,說明了深度學習模型在信息系統的數據分析中的作用十分顯著。

4 結論和展望

本文闡述了深度學習技術在信息系統的數據分析中的應用,并給出了具體的技術路線。通過在兩個數據集上對兩個深度學習模型的應用實踐,展示了深度學習模型在數據分析中的顯著作用。在今后的研究中,將進一步把深度學習技術與大數據分析技術結合,同時引入更多信息系統所承載的業務內容,建立面向行業應用的深度學習大數據分析平臺,為企業的決策支持提供更有效的保障。

[1]Hinton,G.E.&Salakhutdinov,R.R.Reducing the dimensionality of dataw ith neuralnetworks[J].Science,2006,313,504-507.

[2]Bengio,Y.Learning Deep Architectures for AI[J].Foundation TrendsofMachine Learning,Now Publishers Inc.,2009,2,1-127.

[3]Krizhevsky,A.,Sutskever,I.,Hinton,G.E.ImageNetClassification w ith Deep Convolutional Neural Networks[C].Advances in Neural Information Processing Systems,2012,25,2012.

[4]Olga Russakovsky,Jia Deng,Hao Su,Jonathan Krause,Sanjeev Satheesh,Sean Ma,Zhiheng Huang,Andrej Karpathy,Aditya Khosla,M ichael Bernstein,Alexander C.Berg and Li Fei-Fei[C].ImageNet Large Scale VisualRecognition Challenge,IJCV,2015.

[5]Szegedy,C.;Liu,W.;Jia,Y.;Sermanet,P.;Reed,S.;Anguelov,D.;Erhan,D.;Vanhoucke,V.&Rabinovich,A.Going deeperw ith convolutions[C].2015 IEEEConference on Computer Vision and Pattern Recognition(CVPR),2015,1-9.

[6]Kaim ing He;Xiangyu Zhang;Shaoqing Ren;Jian Sun;undefined;undefined;undefined&undefined Deep Residual Learning for Image Recognition 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),IEEEComputer Society,2016,00,770-778.

[7]Silver,D.;Huang,A.;Maddison,C.J.;Guez,A.;Sifre,L.;Van,d.D.G.;Schrittw ieser,J.;Antonoglou,I.;Panneershelvam,V.& Lanctot,M.Mastering the game of Go w ith deep neural networks and tree search[J].Nature,2016,529,484.

[8]Bishop,C.M.Pattern Recognition and Machine Learning(Information Scienceand Statistics)[B].Springer-Verlag New York,Inc.,2006.

[9]Bache,K.&Lichman,M.UCIMachine Learning Repository [EB/OL].University of California,Irvine,Schoolof Information and Computer Sciences,University of California,Irvine,School of Information and Computer Sciences,2013.

[10]Vedaldi,A.&Lenc,K.MatConvNet--Convolutional Neural Networks forMATLAB[C].Proceeding of theACM Int.Conf.on Multimedia,2015.

The Application of Deep Learning Technologies in Data Analysisof Information System

LinWeisheng
(Guangzhou City Planning Automation Center,Guangzhou 510000,Guangdong)

Deep learing isan active research area inmachine learning community.Itsmain idea is to discoverhigh-levelAbstractconcepts in original datasetsw ith huge computational power of the age of big data,by increasing the number of layers of the learners,so as to increase the sizeof channelsand thequantity of parameters.Itbecomesa significantinformation source for decision supportof application domains.We explore themethodsof applying deep learning technologies in the data analysis tasksof information systems by presenting themain principles and implemetation details of two deep learningmodels,convolutionan neuralnetwork and stacked auto-encoders in emphasis,their application cases in the data analysis of information system,aswellas the analysis on their application value.

deep learning;dataanalysisof information system;convolutionalneuralnetwork;stacked auto-encoder

TP391.4

A

1008-6609(2017)06-0051-03

林偉聲(1980-),男,廣東揭陽人,助理工程師,研究方向為信息系統數據分析、卷積神經網絡、堆疊自動編碼器。

猜你喜歡
深度模型
一半模型
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
深度觀察
深度觀察
深度觀察
深度觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产丝袜精品| 一级毛片免费高清视频| 国产系列在线| 欧美另类图片视频无弹跳第一页| 在线另类稀缺国产呦| 黄色三级毛片网站| 在线另类稀缺国产呦| 亚洲最猛黑人xxxx黑人猛交| 一区二区偷拍美女撒尿视频| 中文字幕免费播放| 国产性生交xxxxx免费| 日韩无码黄色网站| 国产乱子伦一区二区=| 成AV人片一区二区三区久久| 国内精品久久人妻无码大片高| 国产成年无码AⅤ片在线| 天堂中文在线资源| 日韩在线欧美在线| 亚洲精品在线观看91| 亚欧乱色视频网站大全| 国产精品大尺度尺度视频| 国产青青草视频| 日韩欧美中文| 五月激情婷婷综合| 亚洲av成人无码网站在线观看| 国产美女一级毛片| 伊在人亞洲香蕉精品區| 国产白浆视频| 久久亚洲精少妇毛片午夜无码| 国产欧美中文字幕| 亚洲av无码牛牛影视在线二区| 日韩乱码免费一区二区三区| 欧美不卡视频在线| 久久国产精品嫖妓| 亚洲熟女中文字幕男人总站 | 又猛又黄又爽无遮挡的视频网站| 国产一级视频在线观看网站| 国产成人艳妇AA视频在线| 亚洲欧美成aⅴ人在线观看| 国产无遮挡裸体免费视频| 日本欧美一二三区色视频| 国产一区亚洲一区| 亚洲成网站| 亚洲另类色| 四虎影视无码永久免费观看| 国产精鲁鲁网在线视频| 国产不卡网| 国产一二三区视频| 国产男女免费完整版视频| 熟妇无码人妻| 国产精品免费露脸视频| 91色国产在线| 黄色成年视频| 婷婷色丁香综合激情| 色久综合在线| 免费看a级毛片| 日本道综合一本久久久88| 免费av一区二区三区在线| 人人看人人鲁狠狠高清| 免费一级大毛片a一观看不卡| 国内精品一区二区在线观看| 亚洲Aⅴ无码专区在线观看q| 亚洲A∨无码精品午夜在线观看| 色婷婷综合激情视频免费看| 日韩欧美中文| 国产精品太粉嫩高中在线观看| 中文字幕波多野不卡一区| 日韩黄色大片免费看| 人妻无码中文字幕一区二区三区| 青草午夜精品视频在线观看| 久久婷婷色综合老司机| 久草热视频在线| 婷婷色一二三区波多野衣| 456亚洲人成高清在线| 亚洲人成色在线观看| 日韩小视频在线观看| 欧美激情二区三区| 久久精品娱乐亚洲领先| 国产91视频观看| 国产精品林美惠子在线播放| 四虎国产精品永久在线网址| 99精品国产电影|