999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于殘差網絡的食物圖像識別研究

2019-09-17 08:27:38劉鵬臻
電子技術與軟件工程 2019年16期
關鍵詞:實驗模型

文/劉鵬臻

如今,在關注人們的健康和飲食狀況方面,技術手段正扮演越來越重要的角色。因此誕生了許多應用可以讓用戶拍下的食物照片,識別食物并檢測營養成分。怎么及時有效地從食物照片中提取出有用的信息是個挑戰。在食物圖像識別領域,現在也有一些食物圖像識別的項目,這些項目主要基于手工設計特征提取的傳統方法,然后使用機器學習的分類器進行食物分類。本文中,我們提出了一個ResNetcompress50網絡模型,來實現食物識別。

1 相關介紹

圖像識別屬于人工智能的一個重要領域,國外很多高校和公司在圖像識別方面投入了大量的資金和人力研究。2012年,深度學習技術在圖像識別領域產生了巨大突破,Hinton教授的研究小組在ImageNet的大規模視覺挑戰賽的圖像分類比賽中贏得了第一名,準確率超過第二名10%之多,而其他小組均是使用的傳統的圖像識別方法。同年,谷歌受到深度學習的啟發,發布了基于深度學習的圖像搜索引擎,與之前圖像搜索引擎對比,圖像的準確率得到大幅提升。2015年的ImageNet圖像識別比賽中,微軟亞洲研究院的何凱明等人設計的殘差網絡更是達到了152層之深,并一舉奪得冠軍。2019年Hinton也因為深度學習獲得圖靈獎。

圖1:圖片增強結果示意圖

圖2:瓶頸單元塊結構示意圖

2 數據集和模型實現

2.1 數據集

數據集的圖像識別對象是新加坡的常見食物,我們使用爬蟲從網上爬取新加坡食物的圖片,進行數據清洗,給每個圖片貼上準確的食物標簽,進行監督學習。

訓練集中每種食物只包含了400張圖片,為了防止過擬合,這里我們參考使用ResNet論文中的方法進行圖像增強。通過將原始圖像統一調整到256×256像素,對圖片進行截取和翻轉將一張圖片變成多張圖片。截取是指分別在統一調整的圖像左上角,右上角,左下角,右下角以及中間截取五處,截取大小為224×224像素。每張截取的圖片都進行翻轉,一張圖片經過增強處理后,變成十張圖片。如圖1所示,這是一張辣椒螃蟹的圖片進行圖像增強后的結果。

2.2 模型實現

根據相關文獻論文,使用CIFAR-10數據集,同樣深度的深度殘差網絡和普通網絡,深度殘差網絡在解決了深度退化問題,表現顯然更好,所以我們選用深度殘差網絡。我們提出的ResNet-compress50模型是根據何凱明提出的深度殘差網絡50層模型結構改進的,減少了其中卷積層中的卷積核總數的1/4。根據實驗結果顯示,該方案確實大大減少了模型的訓練時間和模型的大小,而準確率沒有明顯衰減。我們的網絡單元塊結構使用了何凱明提出的瓶頸結構,如圖2所示。

我們使用三層網絡來描述殘差函數,三層的卷積核大小分別是1x1,3x3和1x1,其中1x1的卷積層主要是針對輸入和輸出維度不同是,使用1x1的卷積核可以做到先減少維度,后恢復維度,使得3x3的卷積層具有較小的輸入輸出尺寸。瓶頸結構相對于三層卷積層,三種卷積的時間復雜度很接近。這樣設計卷積層的操作不會改變輸入數據的維度,即輸出的特征圖和輸入數據的維度不會改變,在于使用3*3的卷積核卷積層都會配一個大小為1的pad,同時步長被設置為1,同時每做一次池化操作輸出的特征圖的長寬都會縮小一倍。而1*1的卷積核的加入可以進一步增加模型的非線性,并且不會改變特征圖的大小,這就大大增加了模型的表現能力。在輸入方面,因為殘差網絡的輸入設計一般都設置為256或者384等維度,模型不需要根據不同的輸入維度設計不同的卷積結構,這就大大方便了模型的設計,直接加深網絡結構使用同樣的單元塊就可以了。另外,我們在批量規范化層之后的激活函數都使用的是ReLU,ReLU能夠使得函數收斂得更快,取得更高的準確率。在何凱明的另一篇論文中,提出了另一個瓶頸結構,把批量規范化放到相加層之后,如圖3所示。

圖5:相加層使用BN和沒有使用BN對比圖

圖6:使用checkpoint和不使用checkpoint訓練對比圖

組合瓶頸塊結構,根據何凱明提出的殘差網絡結構,如圖4所示。我們的實現的殘差網絡共50層,有4個stage,每個stage分別包含了3,4,6,3個單元塊,為了減少模型的參數以及訓練的時間,我們對模型結構進行了一些改進,減少了卷積層conv2到conv5卷積核的個數,卷積核的個數變為原來的3/4。在輸出層,沒有使用全連接層,這就大大減少了模型的參數,縮短了訓練時間和驗證用時。在輸出之前,殘差網絡使用了全局平均池化層,全局平均池化將最后一層的特征圖進行全局的均值池化,通過輸入平鋪層,形成一個個特征點,然后將這些特征點組成特征向量,通過softmax層進行歸一化處理,計算分類概率。

3 實驗與分析

3.1 模型實驗

深度學習訓練平臺使用的是新加坡國立大學的深度學習框架SINGA,現在網絡模型越來越深,數據集也越來越大,目前一般采用的算法時上述兩種方法的折中,訓練方法采用小批量梯度下降法,小批量梯度下降法把數據分為若干個批,按批來更新參數。

我們進行三個實驗,選出最好的模型和超參數。第一個是對比不同層數的普通卷積神經網絡和殘差網絡,以及我們提出的改進的方案性能,數據集采用的是ImageNet,我們初始化網絡參數采用服從期望為0,標準差是0.01的高斯分布,網絡的學習速率被初始化為0.01,每次遇到錯誤率平臺區時學習率除以10,進行下一階段的訓練。為了提升模型的泛化能力,避免過擬合,我們在訓練過程中還使用了權值衰減懲罰技術,其速率參數大小設為0.0001,沖量參數大小設為0.9,目標函數使用了L2范式的正則化處理。

表1:不同網絡模型性能對比

表2:不同Iteration的Accuracy

表3:Sgfood50數據集兩種網絡對比

第二個實驗是在使用了另一種瓶頸結構與普通殘差網絡的瓶頸結構效果進行對比。參數相關設置同實驗一。

第三個實驗是采用了預訓練的方式,在初始化參數時,我們首先使用ImageNet的數據集進行預先訓練,得到的參數作為checkpoint,不再使用隨機參數,而是采用checkpoint。其余設置同實驗一。

3.2 實驗結果分析

3.2.1 實驗設置

使用的硬件設備是單節點機器,使用GPU進行訓練,單節點包含了3個NVIDIA GeForce GT 970 GPU,每個GPU內存4G,操作系統是Ubuntu16.04。

數據集一共包含了50種新加坡常見食物,整個數據集共有二十萬張圖片,訓練集和驗證集的比例我們設置成9:1,即訓練集有18萬張圖片,驗證集有2萬張圖片。

3.2.2 實驗結果分析

第一個實驗對比卷積神經網絡和殘差網絡。我們使用SINGA訓練了五種不同的網絡,普通卷積神經網絡19層34層及深度殘差網絡的19層,34層和50層結構。如表1所示,普通神經網絡參數大,錯誤率高。而使用ResNet則解決了梯度消失的問題,網絡越深,識別率效果越好,模型相對普通卷積神經網絡要小得多。

第二個實驗我們在第一個實驗基礎上,選擇ResNet-compress50進行繼續訓練,對50層模塊進行改進,在一個瓶頸基礎塊中的相加層之后加上批量規范化層。在使用了不同的瓶頸單元塊之后,50層的網絡結果的變化,實驗結果如圖5所示,實驗證明在相加層之后使用了模型規范化在本數據集中是較好的選擇。

第三個實驗是關于訓練方式的優化,如圖6所示,顯然使用了checkpoint的參數進行訓練的效果要好很多,通過優化,ResNetcompress50的網絡的預測準確率可以達到82.3%,準確度甚至更優,訓練收斂速度更快。

模型的訓練時間。訓練一個50層的模型需要大量的時間,使用殘差網絡向前傳播大概一張圖片需要3到4秒鐘。在我們的實驗中,訓練的時間主要受幾方面影響,一個是GPU的性能,如果使用CPU,訓練時間可能達到一周甚至更久,輸入圖片的大小,以及我們的迭代次數和mini-batch的大小。根據粗略的估計,我們使用ImageNet進行預訓練的時間大概需要10個小時,然后使用預訓練的參數模型進行訓練需要7個小時左右。

最終,我們在實現神經網絡選用的是50層的殘差網絡,訓練方法采用使用ImageNet數據集進行預訓練得到的參數進行初始化模型,再使用基于mini-batch的隨機梯度下降算法進行訓練和權重更新。第一種食物準確率達到82.3%,前五種食物的識別準確率可達95.2%。

3.2.3 模型性能評估

最后,對我們的ResNet-compress50模型的評估,我們主要從三個方面進行評估。

第一個方面是ResNet-compress50模型的準確率Accuracy,系統的功能測試結果,我們得到第一名的預測結果準確率達到82.3%,前五位包含正確結果準確率達到95.2%。如表2所示。

第二個方面是,模型參數大小,訓練總長,主要通過與原始ResNet50模型的對比。模型大小是92MB,訓練時間需要7個小時左右,相對于原始的ResNet50網絡,我們訓練時間縮短了4個小時,模型大小也縮小了35MB,而模型識別的準確率幾乎沒有明顯變化,訓練時間的縮短對于日后使用用戶數據集進行持續訓練是大有好處的,對比結果如表3所示。

第三個方面是訓練時間和預測時間,針對NVIDIA GeForce GT 970 GPU,加速庫使用的是cuDNN5.1,每次迭代訓練時間是測出一個minibatch一次迭代的時間,我們計算10次連續迭代過程間的平均時間差,我們設置每個minibatch大小是50,最后得到平均每秒可以執行1.2次迭代,而預測平均每秒可以執行6.7次迭代。

4 總結

我們提出了一個基于ResNet的網絡模型ResNet-compress50來實現食物識別,這個50層的深層神經網絡的表現很好,前五種結果識別準確率達95%,滿足了一個關注健康和飲食應用所需要的圖像準確識別的需求。

通過實驗,本文選出最適合我們食物圖像識別系統的模型,調優了模型的超參數以及最好的訓練方法。因此,利用了深度學習的技術來滿足食物圖像識別的功能需求,這對于許多食物識別的的應用都是有參考意義的。

猜你喜歡
實驗模型
一半模型
記一次有趣的實驗
微型實驗里看“燃燒”
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
做個怪怪長實驗
3D打印中的模型分割與打包
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产欧美高清| 美女毛片在线| 国产福利小视频在线播放观看| 91九色最新地址| 综合色88| 欧美成在线视频| 婷婷激情亚洲| 91口爆吞精国产对白第三集| 国产毛片高清一级国语| 色天堂无毒不卡| 热热久久狠狠偷偷色男同| av天堂最新版在线| 黄色网在线免费观看| 国产在线日本| a级毛片免费看| 日韩欧美色综合| 亚洲日韩精品伊甸| 国产a网站| 国产哺乳奶水91在线播放| 亚洲精品视频在线观看视频| 日韩在线播放中文字幕| 日本成人不卡视频| 欧美国产日本高清不卡| 国产微拍一区| 国产成人高清精品免费| 中文字幕精品一区二区三区视频| 国产第一页亚洲| 日韩欧美在线观看| 日韩精品高清自在线| 久久99热66这里只有精品一| 日韩AV无码免费一二三区| 91精品最新国内在线播放| 无码精品福利一区二区三区| 国产一级毛片在线| 国产肉感大码AV无码| 99成人在线观看| 亚洲成人播放| 久久这里只有精品23| 91精品国产91欠久久久久| 日韩精品无码免费一区二区三区 | 日本黄色a视频| 狠狠干欧美| a级毛片免费看| 国产男女XX00免费观看| 国产最新无码专区在线| 欧美狠狠干| 91成人免费观看| 久久永久视频| 亚洲日韩精品无码专区97| 午夜激情婷婷| 伊人色在线视频| 日韩色图在线观看| 日韩麻豆小视频| 成AV人片一区二区三区久久| 又大又硬又爽免费视频| 欧美黑人欧美精品刺激| 国产一级裸网站| 丁香五月激情图片| 国产精品久久国产精麻豆99网站| 国产第一页亚洲| 国产成人福利在线视老湿机| 亚洲第一香蕉视频| 日韩国产综合精选| 操国产美女| 91年精品国产福利线观看久久 | 亚洲第一成年网| 香蕉国产精品视频| 在线观看国产精美视频| 99久久精品免费看国产电影| 国产一区自拍视频| 欧美精品成人一区二区在线观看| 婷婷六月综合| 国产成人AV男人的天堂| 在线免费观看a视频| 日韩精品亚洲人旧成在线| 国产91成人| 欧美亚洲国产日韩电影在线| 欧洲高清无码在线| 欧美一级高清免费a| 无码专区国产精品一区| 97超爽成人免费视频在线播放| 日韩精品欧美国产在线|