999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于卷積神經網絡的食品圖像識別

2021-07-28 05:30:35韓筠羅澤欽
科技創新導報 2021年3期

韓筠 羅澤欽

DOI:10.16660/j.cnki.1674-098x.2011-5640-5137

摘 要:隨著消費觀念的升級,人們對飲食健康越來越重視,因此,食品圖像識別成為眾多領域研究的熱點。針對傳統食品圖像識別方法提取特征能力差、準確率差等問題,采用Google團隊發布的卷積神經網絡模型——Inception_ResNet_V2模型對食品圖像進行識別和分類,該模型曾經在圖像分類測試中實現了當下最好的成績。在Food-101數據集中隨機選取10個分類共計10000張圖片建立數據集Food-10,通過多層卷積神經網絡提取圖像特征,自動進行分類,并將其與來自Kaggle庫中的圖像集做預測對比實驗。結果表明,Inception_ResNet_V2模型能夠較好地去除背景噪音,達到較好的識別效果,迭代次數為5000次時,Loss值降至0.0512,準確率可達到82.7%,為該模型用于食品圖像識別提供有價值的參考。

關鍵詞:食品圖像? 卷積神經網絡? Inception_ResNet_V2-CNN模型? 圖像識別

中圖分類號:TP183? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2021)01(c)-0104-04

Food Image Recognition based on Convolution Neural Network

HAN Yun? LUO Zeqin

(Guangdong Ocean University, Zhanjiang, Guangdong Province, 524088 China)

Abstract: With the upgrading of consumption concepts, people pay more and more attention to healthy diet. Therefore, food image recognition has become a research focus in many fields. In view of the poor feature extraction ability and poor accuracy of traditional food image recognition methods, the Inception_ResNet_V2 model, a convolutional neural network model released by the Google team, is used to identify and classify food images. This model has achieved the current best results in the image classification test. Randomly select 10 categories in the Food-101 data set with a total of 10,000 images to build a data set Food-10, extract image features through a multi-layer convolutional neural network, automatically classify, and make predictions with the image set from the Kaggle library Comparative Experiment. The results show that this method can remove background noise well and achieve better recognition results. When the number of iterations is 5000, the loss value is reduced to 0.0512, and the accuracy rate can reach 82.7%. It provides a valuable reference for this model to be used in food image recognition.

Key Words: Food image; Convolutional neural network; Inception_ResNet_V2-CNN model; Image recognition

食品是人類生命生活的必需品,隨著物質生活水平的不斷提高,人們對健康和飲食方面也越來越重視,因此,食品圖像識別成為計算機視覺、人工智能等許多領域的熱點研究課題。目前,食品圖像識別在食品自動化檢測、食品安全與管理、飲食營養、智慧餐廳自助結賬以及智能家居等方面都有著廣泛的應用。食品圖像識別屬于細粒度分類,食品圖像子類別間相似度高且類間差異性大,與普通圖像識別相比,其識別難度更大,因此食品識別一直是計算機識別領域的難題之一。隨著深度神經網絡(深度學習)學習技術的提出,圖像識別領域也產生了巨大突破[1-4]。深度學習更容易提取特征,提取到的圖更加精確,模型識別的準確率也更高,因此,深度學習模型被成功應用到包括食品圖像識別在內的眾多領域[5-10]。傳統的圖像識別是人們告訴計算機如何去做,而深度神經網絡不需要告訴計算機如何處理問題,而是通過從輸入的數據中自動地反復學習,計算出理想的解決方案。在2012年的ImageNet大規模視覺挑戰賽(ILSVRC)中,Hinton教授小組的深度學習卷積神經網絡AlexNet以高出第二名10%的性能優勢取得了冠軍,值得一提的是,其他小組均采用了傳統的圖像識別方法,AlexNet網絡也成為了深度學習的經典網絡結構之一。之后,更多的更深的神經網絡被提出。近幾年,深度學習在計算機視覺、搜索引擎和語音識別等方面都取得了優異的表現。Tahir等[9]利用卷積神經網絡(CNN)模型對5個不同種類的真菌進行分類,準確率達94.8%,效果較好;Philipsen等[10]利用CNN模型對不同種類家禽的不同部位內臟進行識別,肌肉分類準確率高達91.58%;谷歌公司基于深度學習的圖像搜索引擎比之前的搜索引擎準確率得到大幅提升。在2015年的ILSVRC比賽中,微軟亞洲研究院的何愷明等人設計的深度殘差網絡(ResNet)達到了152層之深[11]。殘差網絡的提出有效緩解了深度學習中隨著網絡深度的加深而出現的梯度消失和梯度爆炸問題。受此啟發,谷歌公司在2016年提出CNN分類模型Inception_ResNet_V2,這是一個在ILSVRC圖像分類基準上取得頂尖準確率的卷積神經網絡[10]。它集成了早期的Inception_V3-CNN模型和微軟的ResNet的優勢。相比于Inception_V3-CNN模型,Inception_ResNet_V2-CNN模型的網絡更深,模型訓練速度更快,結果更準確。鑒于此,采用Inception_ResNet_V2-CNN模型對食品圖像進行實驗,探討其識別食品圖像的能力。

1? 卷積神經網絡(CNN)

卷積神經網絡(CNN)[12]主要包括卷積層、池化層和全連接層。卷積層的作用是提取圖片每個小部分里具有的特征。卷積層中的卷積核會按照一定的步長遍歷圖像中的像素,當所有的像素點都至少被覆蓋一次后,就可以產生一個卷積層的輸出。機器一開始并不知道要識別的部分具有哪些特征,是通過與不同的卷積核相作用得到的輸出值,相互比較來判斷哪一個卷積核最能表現圖片的特征,比如我們要識別圖像中的某種特征(如曲線),也就是說,這個卷積核要對這種曲線有很高的輸出值,對其他形狀(如三角形)則輸出較低。卷積層輸出值越高,就說明匹配程度越高,越能表現該圖片的特征。池化層的任務有兩個,一是減少訓練參數的數量,降低卷積層輸出的特征向量的維度,二是減小過擬合現象,只保留最有用的圖片信息,減少噪聲的傳遞。最常見的兩種池化層的形式包括最大池化和均值池化。最大池化是選取指定區域內最大的一個數來代表整片區域,而均值池化是選取指定區域內數值的平均值來代表整片區域。由上面的論述可知,卷積層和池化層的工作就是提取特征,并減少原始圖像帶來的參數。然而,為了生成最終的輸出,模型還需要應用全連接層來生成一個符合需求的分類器。全連接層的工作原理和之前的神經網絡學習很類似,需要把池化層輸出的張量重新切割成一些向量,乘上權重矩陣,加上偏置值,然后對其使用ReLU激活函數,用梯度下降法優化參數。

2? Inception_ResNet_V2-CNN模型

2.1 Inception網絡

Inception網絡又稱為GoogLeNet,是2014年提出的一種全新的深度學習結構,在當年的ILSVRC比賽中它和VGGNet均取得了優異的成績。在這之前,卷積神經網絡的結構都是按照先卷積層后池化層這樣的順序鏈接,因此要提高模型性能,增加網絡深度和寬度是一個有效途徑,但會出現參數量過大,當數據量較少的時候,訓練出來的網絡容易過擬合,且網絡很深時會有梯度消失的現象等副作用。這些副作用制約著又深又寬的卷積神經網絡的發展。Inception網絡使用了卷積核的并行合并(也稱為Bottleneck Layer),有效緩解了這些問題,因此,2014年之后,CNN模型在圖像分類領域有了極大的應用。Inception網絡具有局部拓撲結構,可以讓多個卷積層和池化層運算并行執行,把每一層的輸出構成一個很深的特征圖,并通過使用許多1×1的卷積核,減少計算量。在這之前的網絡為了提升學習能力都采用了隨機稀疏鏈接,以搭建出更好的框架,但稀疏數據結構會降低計算速度,而Inception的設計能兼顧網絡結構的稀疏性和網絡的高效運算性能。Inception的結構比較復雜,并經歷了幾次版本的迭代,一直到目前最新的Inception-v4,每個版本在性能上都有一定的提升。

2.2 深度殘差網絡(ResNet)

理論上,隨著網絡深度的加深,模型的性能會不斷提高,即網絡深度越深越好。基于此,CNN分類網絡從Alexnet的7層發展到了VGG的16層乃至19層,后來的Inception_V1模型達到了22層。可是隨著網絡的加深,人們發現模型會出現訓練集準確率下降、難以收斂、模型過擬合等問題,這說明當網絡變得很深以后,訓練錯誤會越來越多,深度網絡變得更加難以訓練了。針對這個問題何愷明等人在2015年提出了一種全新的網絡結構,即深度殘差網絡(Deep residual network, ResNet),其核心思想是直接跳過一個或多個層,引入一個所謂的恒等快捷連接(Identity shortcut connection),如圖1所示,這使得下一層不用學習上一層的整個部分,而只需要學習其輸出的一部分,即殘差。此外,ResNet在激活函數之前使用了Batch Normalization (BN)[45]。這種設計在訓練更深網絡的同時,又能保證良好的性能。ResNet網絡的收斂速度快,且分類效果更好,它的出現使得神經網絡的層數可以超越之前的約束,達到幾十層、上百層甚至上千層,因為隨著網絡深度的增加,模型的性能可以得到有效提升,這為高級語義的特征提取和分類提供了可行性。ResNet一經問世便在ILSVRC比賽中獲得三項冠軍,這個模型除了取得輝煌的成績之外,更重要的意義是啟發了對神經網絡的更多的思考。可以說ResNet的提出是CNN圖像史上的一件里程碑事件。Inception-ResNet網絡是在Inception模塊中引入ResNet的殘差結構,集成了Inception的檢測準和ResNet的訓練速度快的優勢。

3? 結果與分析

3.1 實驗環境與數據

采用Keras深度學習框架,實驗環境支持多GPU并行運算,操作系統采用Linux,開發語言是Python3.6。實驗的數據來自Kaggle平臺分享的數據集Food101,原始的圖像數據集有101種食品類型,每個類別有1000張,共計101000張圖像數據,從中隨機抽取10種食品圖片進行實驗,并用Python中PIL庫的Image工具統一成256×256的分辨率。將這10種食品類別共計10000張圖片定義為數據集Food-10,采用img_to_array函數對圖像進行預處理,并將其劃分成2個部分,80%作為訓練集,20%作為測試集。

3.2 訓練結果與分析

采用預先在Keras中訓練好的Inception_ResNet_V2模型。修改該模型的最后一層全連接層的參數,即將模型最終的密集層舍棄,采用平均池化,將最終的類別改成10類,激活函數選用Softmax函數。設置ModelCheckpoint,按照驗證集的準確率進行保存。設置Loss、Top1、Top3和Top5并實時監控訓練過程。設置每步的Batch-size為8,學習的輪數設置為10,輸入數據,開始訓練。

經過10輪的訓練,得到的模型的準確率為77.05%,Loss值為0.7662,效果不夠理想。于是重新導入這個模型,再對它進行10輪訓練。這一次得到的模型的準確率為80.45%,Loss值為0.1572。與第一次相比,準確率有提升,Loss值也明顯下降了。為了探究更好的準確率,在這個基礎上,對Batch_size進行了重新設置。在一定的范圍內增大Batch_size,可以使內存的使用率提高,跑一輪的迭代次數減少,模型確定的下降方向變準,減小訓練震蕩從而達到提高準確率的效果。將Batch-size的數值分別設置為8、16、24、32、40,因為Batch變大要達到相同準確率必須要增大Epoch。所以學習輪數分別設置為5、10、15、20、25。再分別進行實驗,表1統計了不同Batch_size下模型的準確率。表中的Val_loss、Val_acc_top1、Val_acc_top3和Val_acc_top5分別是指測試集上的損失值、排名第一的類別與實際結果相符的準確率、排名前三的類別包含實際結果的準確率和排名前五的類別包含實際結果的準確率;而Loss、Acc_top1、Acc_top3和Acc_top5分別是指訓練集上的相應的結果。可以看出,訓練集和測試集上的損失值和準確率并不一致,有時候模型在訓練集上取得理想的精度,但是在測試集上的表現并不理想。這里模型的準確率主要以Val_acc_top1值為準,兼顧其他參數的取值,從表1可以看出,當Batch_size為32,Epoch為20,即迭代次數為5000次時,Loss值降至0.0512,準確率可達到82.7%。同時可以看到,在訓練集中,當Batch_size為40時,準確率相較于Batch_size為32時并沒有得到提升,反而還下降了,Loss值也變大了,所以不是Batch-size越大越好。此外,可以推測Batch_size的最優解在24~40之間,此時準確率達到最大。

4? 結語

采用目前頂尖的卷積神經網絡模型對食品圖像進行識別分類,在數據集Food-101中的隨機選出10個分類共10000張圖像集進行實驗,并考察了不同的batch_size對模型準確率的影響。結果表明,當Batch_size為32,epoch為20,即迭代次數為5000次時,Loss值降至0.0512,準確率可達到82.7%;當Batch_size為40時,訓練集的準確率相較于Batch_size為32時并沒有得到提升,反而還下降了,Loss值也變大了,因此,可以推測Batch_size的最優解在24到40之間,模型準確率將會進一步提高,由于時間等條件的限制這里沒有進一步進行實驗。

參考文獻

[1] 張琦,張榮梅,陳彬.基于深度學習的圖像識別技術研究綜述[J].河北省科學院學報,2019,36(3):28-36.

[2] 羅曦.淺談深度學習在圖像識別領域的應用現狀與優勢[J].科技資訊,2020(3):21-22.

[3] 江偉忠.基于深度學習的行人檢索與模型壓縮[D]. 北京:中國科學院大學,2020.

[4] 屈薇.基于深度學習的圖像識別算法研究[J].數字技術與應用,2019,37(9):36-37.

[5] 田小路,張莉敏.基于卷積神經網絡的寵物狗種類識別[J].信息技術與信息化,2019(8):21-22.

[6] 廖恩紅,李會芳,王華,等.基于卷積神經網絡的食品圖像識別[J].華南師范大學學報:自然科學版, 2019,51(4):113-119.

[7] 厲溢成.基于web的食品圖像識別系統的設計與實現[D].武漢:武漢輕工大學,2019.

[8] 林云森, 范文強,姜佳良.基于深度學習的水果識別技術研究[J]. 光電技術應用,2019,34(6):45-58

[9] Tahir MW, Zaidi NA, Rao AA, et al. A fungus spores dataset and a convolutional neural network based approach for fungus detection [J].IEEE Trans Nanobiosci,2018,17(3):281–290.

[10] Philipsen MP, Dueholm JV, Jorgensen A, et al. Organ segmentation in poultry viscera using RGB-D [J]. Sensors, 2018, 18(1): 1-15.

[11] He KM, Zhang X, Ren S, et al. Deep residual learning for image recognition[C]. Proceedings of the IEEE conference on computer vision and pattern recognition,2016:770-778.

[12] Yu D, Wang H, Chen P, et al. Mixed pooling for convolutional neural networks [M]. Rough Sets and Knowledge Technology. Springer International Publishing,2014:364-375.

主站蜘蛛池模板: 欧美人与动牲交a欧美精品| 在线欧美一区| 亚洲欧美日韩动漫| 最新日韩AV网址在线观看| 国产a v无码专区亚洲av| 欧美区一区| 中文字幕色在线| 国产精品极品美女自在线| 老司机午夜精品视频你懂的| 色综合网址| 国产精品成人一区二区| 国产亚洲一区二区三区在线| 国内精品视频| 免费无码AV片在线观看中文| 成年片色大黄全免费网站久久| 国产制服丝袜91在线| 99久久精品无码专区免费| 国产成人久久777777| 69av在线| 亚洲日本www| 69免费在线视频| 免费全部高H视频无码无遮掩| 国产不卡一级毛片视频| 91外围女在线观看| 无码AV动漫| 国产日韩欧美一区二区三区在线| 国产欧美日韩综合在线第一| 日韩在线中文| 国产日韩精品一区在线不卡| 亚洲中文无码av永久伊人| 亚洲性一区| 国内丰满少妇猛烈精品播 | 精品久久久久久久久久久| 97久久超碰极品视觉盛宴| 91尤物国产尤物福利在线| 18禁黄无遮挡网站| 欧美狠狠干| 97视频免费在线观看| 亚洲有无码中文网| 午夜国产理论| 亚洲综合色婷婷中文字幕| 国产精品私拍99pans大尺度 | 国产亚洲一区二区三区在线| 中文字幕调教一区二区视频| 亚洲精品爱草草视频在线| 99色亚洲国产精品11p| www亚洲天堂| 热久久这里是精品6免费观看| 国产精品手机视频| 老司国产精品视频91| 国产亚洲美日韩AV中文字幕无码成人 | 日韩在线观看网站| 久草网视频在线| 欧美不卡视频在线| 久久国产精品麻豆系列| 99久久人妻精品免费二区| 国产精品v欧美| 国产一区二区福利| 老司国产精品视频| 高潮毛片无遮挡高清视频播放| 青青草原国产精品啪啪视频| 中国毛片网| 国产高清精品在线91| 动漫精品中文字幕无码| 成人午夜视频在线| 免费观看男人免费桶女人视频| 看国产毛片| 国产日韩丝袜一二三区| 亚洲第一国产综合| 香蕉久人久人青草青草| 欧美第二区| 欧美性猛交一区二区三区| 国产午夜无码片在线观看网站| 久久人体视频| 亚洲成人网在线观看| 亚洲精品无码在线播放网站| 无码人中文字幕| 久久久噜噜噜久久中文字幕色伊伊| 欧美激情综合| 午夜国产在线观看| 国产超碰在线观看| 色综合久久无码网|