999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于卷積神經網絡的智能冰箱果蔬圖像識別的研究*

2017-05-16 08:17:43曾維亮林志賢陳永灑
網絡安全與數據管理 2017年8期
關鍵詞:特征模型

曾維亮,林志賢,陳永灑

(1.福州大學 物理與信息工程學院,福建 福州 350116;2.TCL集團工業研究院,廣東 深圳 518055)

基于卷積神經網絡的智能冰箱果蔬圖像識別的研究*

曾維亮1,林志賢1,陳永灑2

(1.福州大學 物理與信息工程學院,福建 福州 350116;2.TCL集團工業研究院,廣東 深圳 518055)

智能冰箱物體識別主要涉及對水果和蔬菜的識別,冰箱中果蔬數量繁多,光照不均,環境復雜,對此提出了一種用于處理該類識別問題的卷積神經網絡。網絡采用ReLU作為激活函數,它比傳統的Sigmoid函數具有更強的稀疏能力和更大的梯度值,能夠極大地加速網絡收斂。隱含層中引入隨機Dropout,使得某些節點不工作,減少節點間的“共同適應”,降低網絡對某一局部特征的過擬合,可減少網絡計算復雜度并有效提升識別率。網絡采用帶動量項的基于梯度下降的反向傳播算法,避免網絡陷入局部極小值,提高識別率。最后通過用Supermarket Produce Dataset數據集模擬冰箱果蔬圖像進行實驗,驗證了本文方法的有效性。

卷積神經網絡;果蔬識別; Dropout;梯度下降

0 引言

智能冰箱的果蔬識別可收集用戶果蔬產品的消耗情況,利用該數據分析出用戶喜好,商家可通過終端APP適時向用戶做出果蔬產品推薦,或提醒用戶盡快食用即將過期的食品。目前智能冰箱的物體識別方法主要有:用戶手動輸入或語音輸入食物種類、無線射頻識別掃描[1]、條形碼或二維碼掃描[2]等技術。針對果蔬圖像識別,BOLLE R M等人[3]等通過提取圖像的顏色、紋理統計特征,首次實現了隨意擺放農產品的識別與分類。ROCHA A等人[4]比較了和差直方圖(Unser)、顏色聚合向量(Color Coherence Vector,CCV)、內外點顏色直方圖(Border/Interior pixel Classfication,BIC)等紋理、顏色特征,采用K-means與自底向上聚類(Bottom-up Clustering Procedure)方法對這幾類特征進行識別,同時指出采用特征融合的辦法可以取得更好的效果,但是該方法不能很好地表現果蔬紋理的差異性,且對外界光照較敏感。Zhang Yudong等人提出利用Unser、RGB顏色直方圖、外形等作為識別特征,采用多核SVM進行果蔬產品識別[5],取得了較好的識別效果,但是多核支持向量機訓練時間長,成本較大。ROCHA A等人[6]后期繼續采用特征融合的方法對果蔬識別技術進行了優化。陶華偉等人[7]提出一種基于顏色完全局部二值模式來提取物體紋理特征的方法,提高了智能果蔬系統的識別率。以上對果蔬圖像識別的研究均屬于人工提取特征的范疇。

LECUN Y等人[8]提出的LeNet-5卷積神經網絡在數字識別中取得了巨大的成功,隨后以該模型為代表的卷積神經網絡被應用到車牌識別、手寫數字識別、視頻人體動作識別[9]、人臉特征點的檢測[10]等眾多領域。KRIZHEVSKY A等人[11]提出的網絡模型在ImageNet數據集上達到了83.6%的識別率,更是引起了廣泛的關注。李思雯等人[12]利用集成的卷積神經網絡識別智能冰箱果蔬種類,但是融合多個模型的方法比較復雜、參數較多,容易出現“過擬合”。本文提出一種用于識別冰箱果蔬種類的卷積神經網絡,網絡采用ReLU做為激活函數,避免出現飽和狀態,加速網絡收斂。而在隱含層加入隨機Dropout,使得網絡結構更加“稀疏”,減少了神經元的相互依賴性。卷積神經網絡對特定的遮擋、光照、平移、旋轉、縮放及其他形式的扭曲都具有良好的魯棒性,非常適合用于處理該類果蔬識別問題,因此成為了近年該方向的研究熱點。

1 卷積神經網絡

卷積神經網絡是可以直接以2D圖像作為輸入的深度神經網絡,它主要包括特征提取和分類器兩部分。特征提取模塊由卷積層和降采樣層交替組成,卷積層通過卷積濾波的方式獲取圖像的有用特征,降采樣層通過對卷積層的數據采樣降維,減少了數據處理量。這種從隱含層逐層地自主選取圖像由邊、顏色等低層到角點、形狀等高層特征的方式,避免了人工提取特征的繁瑣與片面,使網絡具有自主選取特征并進行學習與識別的能力。最后利用分類器對提取到的特征進行識別分類,分類器通常使用一層或兩層的全連接神經網絡實現。

1.1 LeNet-5網絡模型

經典的LeNet-5模型由輸入層、兩層卷積層、兩層降采樣層、兩層全連接網絡以及輸出層組成,LeNet-5網絡模型結構如圖1所示。

圖1 LeNet-5網絡模型結構

在卷積層中,輸入圖像通過j個不同的卷積核卷積,生成j個不同的特征圖,運算過程如式(1)所示。

(1)

降采樣層的運算過程如式(2)所示。

(2)

式中:down(·)表示meanpooling降采樣,即輸入圖像中每個不同的n×n區域求和再求平均作為輸出圖像的一個點,使得輸出圖像在不同維度都縮小為原來的1/n。每個輸出圖像都有不同的乘積因子β以及偏置因子b。

分類器的第一層是與上層降采樣層的所有特征圖全連接的卷積層,因輸入大小為5×5,而卷積核的大小也為5×5,故可以看作是全連接層。分類器第二層計算輸入向量和權重之間的點積,然后通過激活函數最終產生輸出層單元的一個狀態,決定識別結果。

1.2 基于ReLU激活函數的卷積神經網絡

卷積神經網絡中常見的激活函數包括Sigmoid函數f(x)=(1+e-x)-1和雙曲正切函數f(x)=tanh(x),這兩種函數均屬于飽和非線性函數,收斂速度較慢。本文采用非飽和線性修正單元(RectifiedLinearUnits,ReLU),即f(x)=max(x),該函數通過線性修正的方式,強制某些數據為零,使得模型具有適度的稀疏表達。ReLU函數梯度值大,在反向傳播階段,能夠防止梯度傳播到前幾層網絡時彌散消失,性能比傳統的激活函數優良,并且ReLU的單邊抑制更符合生物學的觀點,其連接網絡的過程如圖2所示。

圖2 ReLU激活函數連接網絡示意圖

1.3 基于隨機Dropout的CNN網絡

圖3 加入Dropout的隱含層示意圖

卷積神經網絡模型在訓練階段受樣本庫容量影響大,在樣本數量有限的情況下要防止模型出現“過擬合”。本文網絡結構引入隨機Dropout,即隨機“凍結”某些神經元,在網絡訓練過程中保留其當前的權值,同時將輸出設定為0,而這些被選擇的神經元在下次訓練過程中又會恢復之前保留的取值,并再次隨機選擇部分神經元重復此過程。隨機Dropout可以避免每兩個神經元同時產生作用,從而使權值的更新不再依賴于有固定關系隱含節點的共同作用,即神經網絡的結構在每次訓練過程中都發生變化。這種方式降低了神經元之間的依賴,有效提高了神經網絡的泛化能力,因此能學習到魯棒性更強的特征。本文隨機設定兩個卷積層的30%的神經元輸出為零,如圖3所示。

1.4 帶動量因子的梯度下降反向傳播算法

本文訓練過程中網絡的權值更新基于帶動量因子的梯度下降反向傳播算法,權重更新規則如式(3)、(4)所示。

(3)

ωi+1=ωi+vi+1

(4)

1.5 本文的卷積神經網絡模型

本文卷積神經網絡結構如圖4所示,分別為輸入層、兩層卷積層、兩層降采樣層、全連接層、輸出層。卷積:輸入圖像經過一個可訓練的濾波器進行卷積,得到卷積層的特征圖。降采樣:對卷積層的特征圖中每個2×2的鄰域求平均得到降采樣層的一個值,因此降采樣層的特征圖在各個維度都縮小為卷積層特征圖的1/2。全連接:將最后一層降采樣層的特征圖展開成一個向量,乘上加權并通過激活函數得到輸出層神經元。

圖4 本文的卷積神經網絡結構圖

網絡模型各層采用的參數如表1所示。

表1 網絡各層的具體參數

2 實驗及結果分析

2.1 數據集

冰箱中果蔬種類、數量繁多,擺放無規則,果蔬視角多變,光照不均,情況十分復雜。采用Supermarket Produce Dataset[10]數據集模擬冰箱獲取的圖像進行實驗,該數據集共有15類、2 633張冰箱中常見果蔬的圖像,每類果蔬圖像數量為75~264張不等,圖像尺寸為1 024×768。為了使各類圖像數據整齊并相對均衡,采取隨機復制的方式使得數據集的幾類果蔬增加了167張圖像,并在這些圖像中加入高斯白噪聲。因此修正的數據集共有15類、2 800張果蔬圖像,分別為土豆(黃)、土豆(紅)、腰果、小毛桃、富士蘋果、青蘋果、香瓜、獼猴桃、油桃、洋蔥、橘、李子、梨、青桔、西瓜。

2.2 實驗方法

本文構建了如圖4所示的卷積神經網絡模型,各層的參數如表1所示。輸入圖像尺寸為28×28,因此應先將圖像裁剪并等寬高地縮小為1 ∶1的尺寸,等寬高地縮小是為了防止圖像畸變而丟失重要特征信息。采用批量隨機梯度下降法(Mini-batch Stochastic Gradient Descend,Mini-batch SGD)迭代200次(200 epochs),對每次epoch,每輸入10個樣本訓練后,進行反向傳播并更新一次權值。本文設定學習率η的初始值為0.1,待識別率沒有顯著上升或者上升趨勢變慢時,將學習率η變為原來的1/2;動量項α設值為0.6;權重衰減因子λ設為0.000 5;實驗采用留出法(hold-out)劃分數據集,隨機選取2 240張圖像作為訓練集,其余的560張作為測試集。

2.3 實驗結果與分析

2.3.1 各類果蔬識別的混淆矩陣

圖5為本文方法測試各類果蔬識別正確率的混淆矩陣。矩陣對角線位置顏色較深方塊中的數據為Y軸對應果蔬的識別率,其余較淡色方塊的數據為Y軸對應果蔬被錯誤識別為X軸對應的果蔬的識別率。從混淆矩陣中可以看出獼猴桃易被誤識別為青蘋果,梨易被誤識別為土豆(黃)。從數據集圖像中可發現這幾類水果客觀上外形比較相似;其余腰果、洋蔥、富士蘋果,香瓜、洋蔥、橘、李子、青桔等識別率較高,特別地香瓜和橘能夠達到100%的正確率。即本文的卷積神經網絡模型和參數對該類果蔬識別問題能達到一個較好的識別效果。

圖5 果蔬識別率的混淆矩陣

2.3.2 采用Sigmoid和ReLU做為激活函數的識別率對比圖

圖6為網絡采用Sigmoid函數和ReLU函數迭代200次的收斂速度對比圖,其中實線為ReLU激活函數的識別率曲線,點實線為Sigmoid激活函數的識別率曲線。從圖中可以發現采用ReLU函數前期收斂速度更快;網絡趨于穩定時,采用ReLU激活函數的整體識別率約為83.4%,遠高于Sigmoid函數的識別率67.7%,因其能夠有效地防止網絡出現“過擬合”,故能夠在較大程度上提高果蔬的識別率。

圖6 采用ReLU和Sigmoid作為激活函數的識別率對比圖

圖7 隨機Dropout與否的識別率對比圖

2.3.3 網絡加入隨機Dropout與否的識別率對比圖

圖7分別為網絡加入隨機Dropout與否的200次迭代后的識別率曲線圖,其中實線為加入隨機Dropout比例為30%時得到的識別率曲線,點實線為未加入Dropout的識別率曲線。網絡趨于穩定時,加入隨機Dropout的整體識別率約為83.4%,未加入隨機Dropout的整體識別率約為79.3%,識別率提高了4.1%。引入一定比例的隨機Dropout可以使得網絡更加稀疏,減少了神經元之間的共同作用,在一定程度上能夠提高果蔬的識別率,并且網絡“抖動”更小,魯棒性更強。

3 結論

本文通過構建卷積神經網絡模型對果蔬圖像進行識別,網絡采用ReLU線性函數作為神經元的激活函數,加快了網絡的收斂,提高了訓練效率及識別率。而在隱含層引入一定比例的Dropout,使網絡具有更好的泛化能力。今后將研究輸入較大的圖像尺寸,使得特征信息更加豐富,并將顏色信息加入到網絡中,研究顏色對果蔬圖像識別的影響以及在現有網絡結構上繼續改進達到提高識別率的效果,從而有效地處理該類識別問題。

[1] Gu Hanshen,Wang Dong. A content-aware fridge based on RFID in smart home for home-healthcare[C].Proceedings of the 11th International Conference on Advanced Communications Technology,Beijing,IEEE,2009:987-990.

[2] 戴楊,于盛林.二維條形碼編碼與譯碼的計算機實現[J].數據采集與處理,2003,18(3):356-360.

[3] BOLLE R M,CONNELL J H,HASS N,et al. Veggievison:a produce recognition system[P].United States:US 5546475A, 1996-08-13.

[4] ROCHA A,HAUAGGE D C,WAINER J,et al. Automatic produce classification from images using color,texture and appearance cues[C]. 21st Brazilian Symposium on Computer Graphics and Image Processing, CampoGrande,Brazil,IEEE,2008:3-10.

[5] Zhang Yudong,Wu Lenan. Classification of fruits using computer vision and multiclass support vector machine[J].Sensors,2012,12(9):12489-12505.

[6] FARIA F A,dos SANTOS J A, ROCHA A,et al. Automatic classifier fusion for produce recognition[C].25th SIBGRAPI on Graphics,Patterns and Images,OuroPreto,Brazil,IEEE,2012:20-25.

[7] 陶華偉,趙力,奚吉,等.基于顏色及紋理特征的果蔬種類識別方法[J]. 農業工程學報,2014,30(16):305-311.

[8] LECUN Y,BOTTOU L,BENGIO Y,et al.Gradient-based learning applied to document recognition[C].Proceedings of the IEEE 86,1998:2278-2324.

[9] Ji Shuiwang,Xu Wei,Yang Ming,et al.3D convolutional neural networks for human action recognition [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(1):221-231.

[10] Sun Yi, Wang Xiaogang,Tang Xiaoou. Deep convolutional network cascade for facial point detection[C].2013 IEEE Conference on Computer Vision and Patten Recognition(CVPR),IEEE,2013:3467-3483.

[11] KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classification with deep convolutional neural networks[C].Advances in Neural Information Processing System 25:Proceeding of the 26th Annual Conference on Neural Information Processing Systems,Lake Tahoe,USA,2012:1097-1105.

[12] 李思雯,呂建成,倪勝巧.集成的卷積神經網絡在智能冰箱果蔬識別中的應用[J].數據采集與處理,2016,18(3):205-212.

Fruits and vegetables image recognition in intelligent refrigerator based on convolutional neural network

Zeng Weiliang1,Lin Zhixian1,Chen Yongsa2

(1.College of Physics&Information Engineering,Fuzhou University,Fuzhou 350116,China;2.TCL Group Industry Research Institute,Shenzhen 518055,China)

Object recognition in intelligent refrigerator mainly involves fruits and vegetables.Large stock of fruits and vegetables and uneven illumination make a complex environment in fridge. This paper presents a model of convolutional neural network(CNN) to solve such problems.The model uses ReLU as activation function which is stronger than Sigmoid with sparse ability and has larger gradient value,and it can greatly accelerate network convergence.Random Dropout is applied to the hidden layers to make some hidden units not work,which can reduce the phenomenon of ‘co-adaptation’ between them.Besides,it can also reduce the possibility of overfitting to a local feature, which is able to simplify the algorithm complexity and improve recognition rate. The paper uses BP algorithm based on gradient descent with a momentum factor which could avoid the network falling into a local minimum value and enhance recognition rate.Finally,the supermarket produce dataset is used to simulate fruits and vegetables in fridge to identify the effectiveness of proposed methods.

convolutional neural network;fruits and vegetables recognition; Dropout;gradient descent

國家重點研發計劃課題(2016YFB0401503);福建省科技重大專項(2014HZ0003-1);廣東省科技重大專項(2016B090906001);福建省資助省屬高校專項課題(JK2014002)

TP391.4

A

10.19358/j.issn.1674- 7720.2017.08.018

曾維亮,林志賢,陳永灑.基于卷積神經網絡的智能冰箱果蔬圖像識別的研究[J].微型機與應用,2017,36(8):56-59.

2016-10-30)

曾維亮(1992-),男,碩士研究生,主要研究方向:機器學習、深度學習。

林志賢(1975-),通信作者,男,博士,教授,主要研究方向:平板顯示器件驅動技術、圖像處理技術等。E-mail:lzx2005000@163.com。

陳永灑(1984-),男,碩士,主要研究方向:數字圖像處理、機器學習。

________________________

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 人妻丰满熟妇av五码区| 亚洲看片网| 狠狠躁天天躁夜夜躁婷婷| 露脸国产精品自产在线播| 欧美人在线一区二区三区| 色婷婷亚洲综合五月| 91国内外精品自在线播放| 亚洲男人的天堂视频| 国产成人欧美| 97超级碰碰碰碰精品| 久青草网站| 亚洲综合第一页| 99在线视频网站| 四虎影院国产| 亚洲aⅴ天堂| 99精品热视频这里只有精品7| 久久综合亚洲色一区二区三区| 亚洲精品日产AⅤ| 香蕉久久国产超碰青草| 欧美天堂久久| 中字无码av在线电影| 2018日日摸夜夜添狠狠躁| 日韩少妇激情一区二区| 亚洲无码电影| 91视频首页| 91丝袜乱伦| www中文字幕在线观看| 亚洲精品视频免费观看| 成人精品在线观看| 久久婷婷色综合老司机| 久久婷婷六月| a在线观看免费| 国产在线视频福利资源站| 日韩av资源在线| 亚洲精品成人7777在线观看| 91精品国产自产91精品资源| 99精品高清在线播放| 国产91在线|中文| 日韩毛片在线播放| 国产成+人+综合+亚洲欧美| 日韩精品无码不卡无码| 亚洲中文久久精品无玛| 免费毛片视频| 福利视频一区| 精品国产黑色丝袜高跟鞋| 欧洲一区二区三区无码| 国产成人精品一区二区秒拍1o| 91久久偷偷做嫩草影院电| 全部无卡免费的毛片在线看| 亚洲免费成人网| 99热这里都是国产精品| 黄色网页在线观看| 欧美全免费aaaaaa特黄在线| 在线色综合| 免费国产黄线在线观看| аv天堂最新中文在线| 又黄又爽视频好爽视频| 五月婷婷激情四射| 国产黑人在线| 日本尹人综合香蕉在线观看 | 日韩高清一区 | 人妻中文久热无码丝袜| 一区二区三区在线不卡免费| 国产91小视频在线观看| 午夜视频在线观看区二区| 日本久久网站| 国产精品国产三级国产专业不| 91在线精品麻豆欧美在线| 国产精品刺激对白在线| 国产欧美视频一区二区三区| 毛片最新网址| 在线免费观看AV| 国产91视频观看| 99久久国产综合精品2023| 狠狠色噜噜狠狠狠狠色综合久| 手机成人午夜在线视频| 国产精品免费久久久久影院无码| 日韩中文欧美| 永久天堂网Av| 亚洲一区二区三区在线视频| 精品亚洲麻豆1区2区3区| 国产浮力第一页永久地址 |