999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種適用于中餐食物圖像識別的ResNet網絡結構

2025-03-20 00:00:00施晨煒
現代信息科技 2025年3期
關鍵詞:人工智能

摘" 要:隨著人工智能和計算機視覺技術的快速發展,圖像識別在許多領域中變得尤為重要,而中餐食物的復雜性和多樣性給圖像分類帶來了巨大挑戰。ResNet因其高效信息傳遞能力,在多個領域有廣泛應用。現有的ResNet結構在處理中餐食物圖像時,可能無法充分應對其獨有的特征和復雜性。通過在統一條件下對ResNet結構進行研究,訓練和比較不同的ResNet結構,選出最適合中餐食物圖像識別的模型,并進一步優化網絡性能。實驗結果表明,本實驗中探索到的ResNet結構在提高分類準確率方面具有顯著優勢。研究結果為中餐圖像識別領域的應用提供了新的技術路徑和理論支持。

關鍵詞:圖像識別;殘差神經網絡;中餐;神經網絡;人工智能

中圖分類號:TP391.4 文獻標識碼:A 文章編號:2096-4706(2025)03-0073-06

A ResNet Network Structure Suitable for Image Recognition of Chinese Food

SHI Chenwei

(School of Information Science and Engineering, East China University of Science and Technology, Shanghai" 200237, China)

Abstract: With the rapid development of Artificial Intelligence and Computer Vision technology, image recognition has become particularly important in many fields, and the complexity and diversity of Chinese food have brought great challenges to image classification. ResNet is widely used in many fields due to its efficient information transmission capability. The existing ResNet structure may not adequately cope with the unique characteristics and complexity of Chinese food images. By studying the ResNet structure under the unified conditions, training and comparing different ResNet structures, the most suitable model for Chinese food image recognition is selected, and the network performance is further optimized. The experimental results show that the ResNet structure explored in this experiment has significant advantages in improving the classification accuracy. The research results provide a new technical path and theoretical support for the application of Chinese food image recognition.

Keywords: image recognition; ResNet; Chinese food; Neural Network; Artificial Intelligence

0" 引" 言

在人類歷史上,食物作為人類進行各種活動的唯一能量來源,占據了生活中極其重要的位置,與之相關的諸多事物也在生活中占有舉足輕重的地位。目前,隨著人們生活質量的不斷提高,人們開始在飲食上有了更多的追求,例如如何得到更好吃的食物與如何吃的更健康,為滿足這些要求,一大批基于食物圖像識別的應用出現,例如食物評分、營養跟蹤和智能購物等。食物圖像識別相關的研究從20世紀末便開始了,目前已有不錯的進展,如Subhi等人提出了一種適用于馬來西亞食物識別的深度神經網絡[1],武若琪等人提出了一種使用特征融合進行的亞洲食物圖片分類方法[2],徐冰則研究了如何使用深度學習對亞洲食物圖像進行分類[3]。在當前人工智能蓬勃發展的時代,涌現出了不少適用于圖像的卷積神經網絡,如LeNet[4]、AlexNet[5]、VGGNet[6]、GoogleNet[7]、ResNet[8]等,為食物圖像識別技術不斷提供新的思路。

本文提出一種適用于中餐食物圖像識別的ResNet網絡結構。ResNet通過運用殘差連接的思想提高了神經網絡中信息的傳輸效率,運用廣泛,在表情識別[9]、癌癥診斷[10-11]、故障檢測[12]等均有重要應用。本文通過控制變量法,通過在相同條件下訓練不同結構的ResNet網絡并比較其訓練結果,進而尋找到一種適用于中餐食物識別任務的ResNet。本文首先介紹本實驗所有的關鍵技術,其次介紹實驗設計及流程,最后進行結果分析。本文希望可以為中餐食物圖像識別提供一種新的思路,以使其可以更好地運用到需要食物圖像識別的應用上。

1" 關鍵技術

1.1" 殘差神經網絡

將卷積神經網絡與殘差連接兩種技術相互結合的神經網絡,稱為殘差神經網絡,即ResNet。

1.1.1" 卷積神經網絡

卷積神經網絡自20世紀80年代開始登上了歷史舞臺,其為一種前饋神經網絡,核心組件是卷積層和池化層組成的神經網絡模型,包含輸入層、卷積層、池化層、全連接層、輸出層五種網絡層級,用于圖像識別任務[13]。其結構如圖1所示,其中“×x”表示該網絡層級重復堆疊x次。

在每種層級具體作用方面,卷積層通過卷積核對輸入圖像進行局部特征提取,生成特征圖。池化層用于減少參數數量和縮小特征圖的大小,防止過擬合。全連接層則將池化層輸出的圖像特征轉化為一維向量,以便進行圖像分類[13]。

1.1.2" 殘差連接

對于傳統神經網絡,隨著網絡深度的增加,準確性會趨于飽和,即在達到一定程度后不再提升。這是由于梯度爆炸和梯度消失問題阻礙了神經網絡的收斂。為了解決這一問題,引入了殘差連接,從而加速了信息傳遞,緩解了梯度爆炸和梯度消失問題,提高了模型的學習能力[8]。神經網絡殘差連接方式如圖2所示。

1.2" 網頁爬蟲

網頁爬蟲是一種高效的系統,用于自動遍歷互聯網上的網頁并下載內容,它在搜索引擎、網絡數據挖掘、歸檔服務和監控系統等應用中發揮著關鍵作用。通過應用特定的算法和策略,爬蟲能夠識別和抓取網頁上的鏈接,遞歸地訪問新頁面,并從這些頁面中提取有用信息。面對互聯網的龐大規模和不斷變化的內容,爬蟲設計需要解決如何高效管理數據結構、遵守網絡禮節、平衡內容覆蓋和實時更新等挑戰。此外,爬蟲還必須能夠識別和避免冗余內容、爬蟲陷阱和網絡垃圾等潛在問題,以確保收集的數據既全面又相關。隨著網絡技術的發展,爬蟲技術也在不斷進步,以適應不斷變化的網絡環境和用戶需求[14]。

在本實驗中,網頁爬蟲技術被運用到了在網頁中采集數據集圖片上,具體操作見后。

2" 實驗流程

2.1" 實驗環境

本實驗基于Windows 11操作系統,使用的編程語言為Python,使用Python的TensorFlow機器學習第三方庫構建ResNet神經網絡。硬件方面,本實驗使用NVIDIA GeForce RTX 4060 Laptop GPU進行神經網絡的訓練任務,處理器為Intel Core i9-14900HX。

2.2" 數據集制作

本實驗使用自行制作的Food-168數據集,數據集圖片示例如圖3所示,下述為詳細制作流程。

2.2.1" 數據爬取與分類

本實驗數據來源為網絡。首先編輯一個爬蟲程序,要求其可按關鍵詞列表中食物名稱順序爬取食物圖片,并將不同食物存儲于不同以食物名稱命名的文件夾中。其次,設置每個類別食物爬取圖片數量為300,經前期測試該數量可以保證每個食物類別樣本數量以及質量,在確保樣本數量足夠的同時避免爬取到無關或低質量數據。最后,查詢最常見的168種中餐食物,將其依次輸入爬蟲程序的關鍵詞列表。運行爬蟲程序,便可得到所需的168種中餐食物的圖片。該數據集文件夾內部結構如圖4所示。

2.2.2" 數據清洗

由于爬取的圖片中仍舊含有大量的無關或低質量樣本圖片,數據集需要進行人工的清洗操作。通過刪去每個類別300張圖片中不合要求的樣本圖片0至150張,可得到一個更高質量的數據集。在清洗完成后,數據集共剩余46 430張圖片。

2.3" 準備工作

準備工作包括數據加載、預處理、增強等。

數據預處理操作可以使樣本數據規格統一化且更適用于作為神經網絡的輸入,數據增強操作則可以增加樣本圖片的豐富性,從而使模型擁有更豐富更多的訓練樣本,提高訓練所得模型的泛化能力。

本實驗在加載訓練圖像及標簽后,將兩者轉化為NumPy數組形式并對標簽進行編碼,后再將標簽轉化為獨熱編碼以確保每個類別的區分性與獨立性。之后,按照8∶2的比例隨機劃分出訓練及驗證所用的樣本圖像及標簽,以作為訓練集和驗證集。

數據預處理部分包括將圖片像素值縮放到[0,1],加大神經網絡的收斂速度。數據增強部分包括隨機水平翻轉、隨機亮度和隨機對比度,在隨機亮度處,設置最大亮度變化量為10%,對比度在原對比度的80%至120%之間隨機變化。將這些操作運用到所有的樣本數據上,得到一個更優的訓練集和驗證集。

最后,對訓練數據進行隨機打亂,同時進行分批操作,每批包含32張圖像,完成數據準備工作。

2.4" 模型結構

本實驗在模型結構上保持輸入層和初始卷積層以及殘差塊內部結構不變,只改變殘差塊的數量及超參數、全連接層的數量及是否正則化與采用丟棄技術。

2.4.1" 輸入層和初始卷積層

這一部分包括輸入層、卷積層、批量歸一化層、激活層、最大池化層。其中,卷積層超參數設置為卷積核數量64、卷積核大小7×7、步長2、添加零值填充,激活層選擇ReLU激活函數、最大池化層超參數設置為池化窗口大小3×3、步長2、添加零值填充。這一部分結構如圖5所示。

2.4.2" 殘差塊

為了讓實驗中網絡結構的修改更加便捷,本實驗預先定義了殘差塊來體現ResNet中殘差連接。殘差塊有四個超參數可供修改,分別是卷積核數量filters、卷積核大小kernel_size、步長stride以及激活函數Activation(本實驗中只考慮使用ReLU激活函數)。

殘差塊內部結構包含卷積層、批量歸一化層、激活函數、殘差連接及輸出,具體連接關系如圖6所示。

2.4.3" 實驗神經網絡結構

測試了40余種不同結構的殘差神經網絡,在其中篩選出16種典型的結構,這16種殘差神經網絡的具體結構如表1所示。其中輸入層和初始卷積層用縮寫ILICL(Input Layer and Initial Convolutional Layer)表示。ResBlock表示一個殘差塊,這里用RB縮寫,有三個參數,按順序依次是卷積核數量(filters)、卷積核大小(kernal_size)與步長(stride)。GAP2D表示全局平均池化(Global Average Pooling 2D)。FC表示全連接層(Fully Connected Layers),有三個參數,按順序依次是神經元數量、激活函數(本實驗默認使用ReLU激活函數,下表不顯示)、正則化項(本實驗使用以0.01為正則化強度的L2正則化)。Dropout表示丟棄層,設置超參數丟棄率為0.5。

2.5" 超參數設置

神經網絡采用的損失函數為交叉熵損失,優化器為Adam,設置初始學習率為0.000 1。在本實驗中,為了保證網絡充分學習到圖像中的特征,設置迭代次數為600,同時設置60代驗證集損失不下降后的提前終止以防止神經網絡模型過擬合。學習率設置10代驗證集損失不下降后的折扣,設定折扣因子為0.5。

2.6" 評價指標

實驗中主要使用到了以下四個評價指標,依次是驗證集損失、驗證集準確率、驗證集前三準確率和迭代次數,其中前三者表示神經網絡模型的識別預測能力,后者顯示神經網絡的收斂速度。

在本實驗中,加入驗證集前三準確率的主要原因是有些菜品相似度過高,甚至達到肉眼無法辨別的程度,如數據集中的紅燒鯽魚與紅燒鯉魚兩個菜品,且部分菜品的配料可能有個體間差異,導致了這些菜品很難被正確識別。

3" 結果分析

3.1" 結果展示

16個模型訓練完成后,得到的模型性能指標如表2所示,包括驗證集損失(val_loss)、驗證集準確率(val_accuracy)、驗證集前三準確率(val_top_3_accuracy)及迭代次數(epoch)。

由表2可以看出,模型12在驗證集上的準確率和前三準確率最高,分別達到了0.606 8和0.824 1,說明它從中餐食物圖像數據集Food-168中學習到了最多的特征,表現出了最佳性能,是本次實驗中最適合進行中餐食物識別的模型。

3.2" 訓練過程曲線

圖7(a)是模型12訓練損失和驗證損失隨訓練次數變化的曲線圖,圖7(b)是模型12訓練和驗證準確率及前三準確率隨訓練次數變化的曲線圖。從這兩張圖可以看出,模型12的訓練過程曲線隨著迭代次數的增加逐漸收斂到了一個穩定的值。

3.3" 識別效果測試

在將模型12模型保存后,運用日常生活中拍攝的4張中餐食物圖片進行測試,4張圖片分別為白切雞、麻辣豆腐、涼拌海帶絲及蒸蛋,效果如圖8所示,可見對于4張測試圖片,模型識別效果較好,其中后兩張圖片識別準確率極高,證明該模型在測試中具有良好的性能。

4" 結" 論

為提高中餐食物識別的準確性,本實驗研究了使用合適的ResNet網絡結構來進行中餐食物識別,主要在網絡層級的中后部分(殘差塊、全連接層)進行了結構上的探索,通過不斷調參與修改網絡結構,尋找到了一種相對適合于中餐食物識別的特定結構的ResNet網絡。本實驗尋找到的網絡結構用合適數量的殘差塊并設定了合適的超參數,不僅保證了網絡能夠充分提取中餐食物圖片的特征,還成功避免提取到一些無關的噪聲。

該實驗也存在以下不足,有待繼續研究。首先,該模型的驗證集準確率還有提升空間,可以通過將多種神經網絡結構結合或探索新的神經網絡解決或改善這一問題。此外,實驗中的數據集所含有的菜品種類也可以變得更加豐富,可以加入其他地區的菜品,增加模型的通用性。

參考文獻:

[1] SUBHI M A,ALI S M. A Deep Convolutional Neural Network for Food Detection and Recognition [C]//2018 IEEE-EMBS Conference on Biomedical Engineering and Sciences(IECBES).Sarawak:IEEE,2018:284-287.

[2] 武若琪,徐冰,曲志堅.基于特征融合的亞洲食物圖片分類 [J].計算機工程與設計,2020,41(12):3464-3471.

[3] 徐冰.基于深度學習的亞洲食物圖像分類方法研究 [D].淄博:山東理工大學,2021.

[4] LECUN Y ,BOTTOU L,BENGIO Y,et al. Gradient-based Learning Applied to Document Recognition [J].Proceedings of the IEEE,1998,86(11):2278-2324.

[5] KRIZHEVSKY A,SUTSKEVER I,HINTON G E. ImageNet Classification with Deep Convolutional Neural Networks [J].Communications of the ACM,2017,60(6):84-90.

[6] SIMONYAN K,ZISSERMAN A. Very Deep Convolutional Networks for Large-scale Image Recognition [J/OL].arXiv:1409.1556 [cs.CV].(2014-09-04).https://arxiv.org/abs/1409.1556.

[7] SZEGEDY C,LIU W,JIA Y Q,et al. Going Deeper with Convolutions [J/OL].arXiv:1409.4842 [cs.CV].(2014-09-17).https://arxiv.org/abs/1409.4842.

[8] HE K M,ZHANG X Y,REN S Q,et al. Deep Residual Learning for Image Recognition [C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Las Vegas:IEEE,2016:770-778.

[9] 周婕,馬明棟.基于改進的ResNet網絡的人臉表情識別 [J].計算機技術與發展,2022,32(1):25-29.

[10] 張文悅,賈子彥,李青,等.基于ResNet和UNet的胃癌病理圖像診斷系統 [J].河北大學學報:自然科學版,2024,44(4):433-440.

[11] 鄧輝,張潔.基于改進的ResNet50網絡的黑色素瘤分類方法 [J].計算機技術與發展,2023,33(2):64-70.

[12] 謝俊波,顧詩渤,許為龍.基于M-LSTM與Resnet并聯網絡的同軸線纜開路故障定位方法 [J].機電工程技術,2024,53(6):221-226.

[13] 羅富貴,宋倩,覃運初,等.基于卷積神經網絡在圖像識別中的應用研究 [J].電腦與信息技術,2024,32(3):51-54.

[14] OLSTON C,NAJORK M. Web Crawling [J].Foundations and Trends in Information Retrieval,2010,4(3):175-246.

作者簡介:施晨煒(2003—),男,漢族,浙江上虞人,本科在讀,研究方向:神經網絡與深度學習。

猜你喜歡
人工智能
我校新增“人工智能”本科專業
用“小AI”解決人工智能的“大”煩惱
汽車零部件(2020年3期)2020-03-27 05:30:20
當人工智能遇見再制造
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
AI人工智能解疑答問
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
基于人工智能的電力系統自動化控制
人工智能,來了
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
人工智能來了
學與玩(2017年12期)2017-02-16 06:51:12
主站蜘蛛池模板: 97精品久久久大香线焦| 狠狠色综合网| 亚洲视屏在线观看| 大香伊人久久| 欧美激情视频一区| 亚洲a级毛片| 无码高清专区| 亚洲欧美不卡视频| 亚洲爱婷婷色69堂| 日韩无码白| 欧美一级色视频| 日韩毛片在线播放| a亚洲视频| 一区二区午夜| 91无码网站| a毛片在线播放| 欧洲一区二区三区无码| 日韩欧美在线观看| 成人在线不卡视频| 九九九精品成人免费视频7| 婷婷亚洲天堂| 亚洲精品色AV无码看| 色婷婷狠狠干| 精品人妻系列无码专区久久| 亚洲福利视频网址| 久久天天躁狠狠躁夜夜躁| 911亚洲精品| 精品无码国产自产野外拍在线| 在线不卡免费视频| 青青草原国产免费av观看| 亚洲国产日韩一区| 欧美日一级片| 久久这里只有精品66| 日本久久久久久免费网络| 国产日韩精品欧美一区灰| 久久免费视频播放| 国产成人精品无码一区二| 婷婷午夜天| 色婷婷电影网| 91免费国产高清观看| 久久亚洲国产最新网站| 亚洲一区第一页| 免费在线看黄网址| 国产办公室秘书无码精品| 国产欧美在线观看精品一区污| 亚洲综合精品香蕉久久网| 第一区免费在线观看| 国产丰满大乳无码免费播放| 欧美午夜视频| jizz国产视频| 国产一二三区视频| 久久久噜噜噜久久中文字幕色伊伊 | 日韩在线第三页| 精品国产欧美精品v| 在线综合亚洲欧美网站| 免费国产不卡午夜福在线观看| 日本伊人色综合网| 欧美成人精品欧美一级乱黄| 亚洲av中文无码乱人伦在线r| 欧美综合一区二区三区| 国产91蝌蚪窝| 久久性妇女精品免费| 亚洲综合九九| 日韩欧美国产精品| 日本欧美在线观看| 国产福利一区视频| 中文字幕资源站| 国产成熟女人性满足视频| 最新亚洲人成无码网站欣赏网 | 福利在线一区| 三上悠亚在线精品二区| 婷婷五月在线| 国产精品私拍99pans大尺度 | 毛片基地美国正在播放亚洲| 婷婷99视频精品全部在线观看| 东京热一区二区三区无码视频| 亚洲高清国产拍精品26u| 天堂在线亚洲| 五月婷婷导航| 色婷婷成人| 精品国产一二三区| 中字无码av在线电影|