林漢斌



摘 要:基于深度學習的計算機視覺研究都是基于大量圖片數據樣本,由于有時在工業上收集目標樣本的成本很高,因此這大大限制了深度學習在計算機視覺中的應用。針對少量樣本下的圖片分類任務,本文提出一種新型的網絡模型。并跟目前主流的深度學習網絡比較。證明了我們的模型在少量樣本下仍然具有很好分類精度。
中圖分類號:TP391文獻標識碼:A文章編號:1003-9082(2020)02-000-01
一、卷積神經網絡模型
卷積神經網絡是一類特殊的人工神經網絡,其主要特點是卷積運
算操作。理論上卷積神經網絡的深度越深,模型的擬合能力越強。但研究發現,當隨著卷積神經網絡深度的加深,模型的擬合性能不升反降,這主要是因為如果網絡的深度過深,卷積神經網絡在反向傳播時容易出現梯度消失或梯度爆炸。因此一些研究人員設計出了一種殘差網絡可以有效防止網絡在反向傳播時出現梯度消失或梯度爆炸。殘差網絡的核心創新點是將前面的輸入也與后面的網絡層連接。
二、少量樣本下卷積神經網絡模型的設計
由于少量樣本下,樣本的數據有限,因此應當設計一個網絡使得網
絡能有效的提取圖片的深層次特征。為此,鑒于對殘差網絡,我們設計了一個基于殘差塊的注意力卷積神經網絡(Res-attention)模型。結構如圖1所示。
與傳統卷積神經網絡對殘差塊進行簡單堆疊所不同的是,我們還加入了如虛線所示的結構。該結構先對前置網絡輸出的特征圖先進行下采樣,以獲得更深層次的特征,接著進行上采樣,將特征圖縮放至原特征圖一樣大小。接著經過sigmoid函數將,特征圖中的值縮放至0-1之,值越大代表著特征圖區域所對應的圖像為我們的目標區域,使我們的網絡更能關注到目標區域的圖像值。
三、模型驗證
1.數據集獲取
為了驗證我們的模型在小樣本下具有很好的分類效果,我們使用爬蟲技術從網上下載213種觀賞魚的圖片,每種魚的圖片數量大約在5-40個,圖2是一些示例圖片。
2.數據增強
這里我們通過水平翻轉和改變亮度對比度增強數據,圖3是一些示例圖片。
3. 實驗對比
我們將上面通過數據增強的圖像數據集應用在幾個經典的神經網絡模型上,比較它們的分類準確率。得到的結果見表1所示:
從表中可以看出,在少量樣本我們的Res-attention網絡較其他的網絡結構擁有更高的準確率。
四、結束語
本文基于在少量數據樣本的條件下,提出了Res-atttention網絡模型。該模型基于殘差網絡,多加一個注意力模塊,使得模型更能關注到目標區域,而忽視圖片的背景區域。實驗結果顯示本文模型在小樣本下仍然具有很好的分類效果。
參考文獻
[1] Krizhevsky A, Sutskever I, Hinton G E. Imagenet Classification with Deep Convolutional Neural Networks[C]//International Conference on Neural Information Processing Systems, Curran Associations Inc. 2012: 1097-1105.
[2]李亞飛,董紅斌.基于卷積神經網絡的遙感圖像分類研究[J].智能系統學報,2018(4):550-556.
[3] Christian Szegedy, Wei Liu, Yang qing. Going Deeper with Convolution[C]. Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 2015:1-9.