楊曉旭+高巍+顧颋

摘 要
2013年賈揚清博士在Github上發布了一款深度學習框架“Caffe”,為眾多研究人員和工程師們提供了一套簡單易用且性能強大的深度學習開源框架。本文首先對Caffe框架簡單介紹,其次闡述深度學習中應用的卷積神經網絡原理,最后介紹如何利用Caffe框架進行圖像分類。
【關鍵詞】深度學習 Caffe框架 卷積神經網絡 圖像分類
1 Caffe框架
目前“特征提取+分類器”的框架模式仍然是在模式識別領域中最經典的框架,Caffe框架亦是如此。通過提取圖像的特征,將圖像的特征圖像數據送入分類器中進行分類,最后實現識別分類。而作為深度學習框架的Caffe框架,與傳統的機器學習相比,在對原始圖像進行特征提取時,用的則是類似人類大腦的神經元組成的神經網絡,不需要人工設定特征提取,機器自動學習就可獲得。它的框架是將簡單模塊多層堆疊,大多數模塊都是具有學習能力的,能計算非線性輸入-輸出映射,也就是激活函數。多個非線性層構成的系統可以實現非常復雜的函數,具有非常好的泛化能力和魯棒性。
2 卷積神經網絡的原理
Caffe的全稱是Convolutional Architecture for Fast Feature Embedding,意思是快速特征嵌入的卷積結構,它實現了前饋卷積神經網絡架構(CNN)。卷積神經網絡是一種多層的監督學習神經網絡,訓練更簡單,泛化能力比相鄰層用全連接好,是目前廣泛應用的深度模型。
卷積神經網絡比一般神經網絡多了一個結構,這個結構就是由卷積層和子采樣層(pooling layer)構成的特征提取器。網絡中,每個卷積層是由若干個特征圖(feature map)組成的,每個特征圖使用不同的卷積核連接到上一卷積層特征圖的局部部分。但同個特征圖是共用一個卷積核的,即權值共享。所謂權值共享,就是圖像在做卷積時,如果圖像某一部分的統計特性與其他部分相同,那么這部分學習到的特征就可以使用到相同特征的其他部分上,這就意味著它具有位置無關性。另外,對相似度高的圖像組,由于局部像素高度相關,也更易檢測出特征,提高了效率。子采樣也叫池化,它的作用是將不同位置的相同或相似度高的特征聚合統計,降低計算量,通常有平均池化和最大值池化兩種方法。
在Caffe中,利用卷積神經網絡訓練模型時,卷積層實現了權值共享,比全連接層的計算量大,參數量小,這也就實現了降低參數的目的。當然,因為卷積層計算量比例大,參量比例小,而全連接層正好相反,因此在考慮優化參數時,全連接層是更好的方向,而當要考慮優化計算量時,則把重點放在卷積層。
3 圖像分類
圖像分類問題看似簡單,實則很深,而且應用廣泛。實際上,目標檢測、識別、分割等計算機視覺問題都可以看成是圖像分類問題。
本文以兩個實際用例對利用Caffe框架進行圖像分類作簡單介紹,通過現場采集的部分樣本圖片,用以訓練卷積神經網絡模型。此傳輸線用例的數據集由十萬張圖片組成,分為四類:絕緣子正常、脫落,導線正常、斷股。在實際應用中,據此來判斷傳輸線是否存在問題,在應用前,實驗得到的結果驗證精確度達到100%,實際應用中,識別準確率達到99.8%,這是由于在實際應用中傳輸線周遭環境的突然變化,如惡劣天氣等。
圖1是該用例系統的算法流程圖。首先,輸入待識別的圖像到設備中,再對輸入圖像進行預處理,主要是修定圖像大小,以方便提取特征進行下一步的檢測識別。
圖2所示是電力系統中線路開關閉合的監測情況實時顯示,實際應用中,識別正確率達到98.5%。
4 結束語
本文簡單介紹了Caffe框架,闡述了卷積神經網絡的原理,并用實際用例簡單說明了如何利用Caffe進行圖像分類識別。從傳輸線系統和電力線路開關系統的實際應用情況來看,其效果是非常好的,檢測精確率都很高。
參考文獻
[1]鄭胤,陳權崎,章毓晉.深度學習及其在目標和行為識別中的新進展[J].中國圖象圖形學報,2014,19(02):175-184.
[2]Jia Y,Shelhamer E,Donahue J,et al. Caffe: Convolutional ar-chitecture for fast feature embedding[C].Proceedings of the ACM International Conference on Multimedia.ACM,2014:675-678.
作者簡介
楊曉旭(1972-),男,碩士學位。高級工程師。研究方向為變電站自動化。
高巍(1973-),男,大學學歷。研究方向為變電站自動化。
顧颋(1979-),男,大學學歷。研究方向為變電站自動化。
作者單位
國電南瑞科技股份有限公司 江蘇省南京市 211106endprint