朱澤宇
【摘?要】伴隨著智能化時代的到來,人工智能技術與傳感技術獲得了空前的進步與發展,與傳統的人工作業相比,機器生產不僅生產量穩定,而且生產效率高,可以節省大量的生產成本。針對以往人工打菜分配不均、效率低下等多種問題,對基于機器視覺的菜品智能識別技術進行研究就顯得尤為重要。本文基于機器視覺技術,結合傳統圖像識別技術,提出了一種新型的菜品智能識別技術,可以有效的代替以往通過人眼來實現對菜品的識別。
【關鍵詞】機器視覺;菜品;智能識別技術
一、基于機器視覺的菜品智能識別系統的總體設計
首先,要在該系統中根據消費者的需求來選擇適合消費者的飯量,然后通過打飯機窗口來實現自動打飯,在經過打飯程序后,消費者的餐盤會通過輸送機傳遞至工位,然后餐盤隨著該輸送機運動[1]。其次,消費者在點菜窗口對菜品或者套餐進行選擇,然后完成支付,負責整個菜品識別智能系統中則會對消費者的相關信息進行收集與顯示,并提示消費者到取菜窗口等待自己的餐盤到位。最后,在餐盤送至取菜口時,則取菜口的窗戶顯示屏會根據該餐盤的流水來提示餐盤已到位。消費者根據自己的用餐流水號來取走餐盤。如果某到達取菜口的餐盤沒有被及時取走,則會通過輸送機的出口將其排放到立式餐盤存儲機上,這樣,用戶則可以根據自己實際情況來及時取走餐盤,不會影響后續其他乘客需求。
為保證本次基于機器視覺的菜品智能識別系統設計后得到有效應用,規定該系統的定位精度誤差控制在5毫米以內,每次抓取食物重量不得超過0.3千克,食物的抓取精度不得小于0.01千克。在抓取食物過程中,要求40—60秒之內,將三個菜品抓取到飯盤上。本系統中所使用的所有機器設計都符合相關的食品衛生要求,達到《國標GB19891-2005機械安全機械設計》的衛生要求的相關要求規范。菜品識別系統中要求菜品種類不得低于10種;為保證該系統實物抓取效果的安全高效衛生,還設置報警裝置,通過視覺檢測系統,對所抓取菜品進行檢測,如果菜盤中菜品數量過少,無法及時對其菜品實現智能識別與檢測,則報警裝置會發出警報,并提醒對實驗菜品區域補充菜盤與菜品。
二、機器視覺模塊硬件選型
在設計菜品智能識別系統的總體視覺方案過程中還需要加強系統需求分許,并選擇合適的硬件選型。基于機器視覺的菜品智能識別系統設計中,為保證各項功能要求與技術要求達到標準,通過對視覺模塊各個部分的標準以及系統實際需求進行綜合分析確定,選擇工業相機的型號為Basler acA3800-10gc,其像素為1000W,然后搭配的工業相機鏡頭型號為Basler Lens C125-0418-5M F1.8 f4mm,應用光源型號為OPT-RI0090的奧普特公司的90°前向照射的環形LED白色光源。只有搭建起一套完善的菜品圖像識別體系,應用合適的機器視覺系統,才能保證所采集到的菜品成像信息識別的準確性、可靠性,在后續的研究中,還要持續改進與完善詩句模塊硬件選型的精準性[2]。
三、應用基于YOLOv3模型的菜品智能識別與目標檢測
基于機器視覺的菜品智能識別技術,其最根本的目的就是為了要根據用戶需求智能識別菜品,并根據用戶需求提供所需菜品,因此,就必須要應用基于YOLOv3模型的菜品智能識別與目標檢測。通過目標檢測來對菜品智能識別中的特定目標的所在區域進行識別,應用基于YOLOv3模型的菜品智能識別與目標檢測需要滿足目標分類與目標定位兩個功能需求。其中目標分類就是要根據計算機識別與判斷圖片中的物體其所屬的分類與檢測結果的置信率;目標定位功能則主要對對圖片中的特定目標的所在區域、位置進行確定與標記[3]。在整個智能菜品識別系統中,最關鍵的環節就是要對已經制作完成的菜品進行識別。通過菜品智能識別系統中的菜品識別系統可以實現識別菜品類別與菜品位置的目的,然后將該目標菜品圖像通過位置坐標傳遞到機械手系統,然后應用機械手來分揀菜品,從而完成菜品智能識別操作。
如果應用傳統的目標檢測算法,則在選擇區域的時候,需要定位檢測目標的區域,由于目標的形狀及位置存在明顯的不確定性特征,應用傳統目標檢測算法,往往會通過滑動窗口策略來遍覽圖像,往往會導致冗余運算多,且會對檢測速度產生嚴重影響,甚至花費較長時間仍舊也無法準確獲得該不確定圖像的具體區域。通過應用SSD(single shot multibox detector)、YOLO為代表的目標檢測法,該檢測方法將整個目標檢測任務看作是回歸問題進行處理,從而實現了由端到端的處理,可以直接將模型預測結果輸出,不僅檢測速度快,且能夠實現實時識別的目的。YOLO目標檢測法是一種基于回歸思想的目標檢測算法,截至目前為止,該檢測算法已經衍生出YOLOv2和YOLOv3版本。YOLOv3目標檢測技術的檢測數量有效提升,且檢測準確率及小目標檢測顯著提升[4]。可以說,在當前的菜品智能識別技術中YOLOv3是最適用的目標檢測算法。
通過對基于實時目標檢測模型YOLOv3目標檢測算法進行改進,使菜品智能識別技術更加完善。首先,通過應用k-means聚類算法可以實現對待識別菜品的驗框聚類,則可以使該待識別菜品的形狀更加接近與識別目標。通過對其中9組的識別目標的驗框類聚,從而將待識別目標的IoU 提升至89%以上。
針對待識別目標的特點,對其網絡結構進行優化,并將多尺度預測中小尺度與中尺度的預測步驟一處,只對大尺度特征途進行預測,從而有效提升檢測的精度、速度。
通過應用批再標準化算法來處理模型數據,從而改善網絡的訓練過程,針對一些訓練樣本批次較小或訓練樣本不獨立同分布條件的情況下,對網絡的手鏈過程加速,并提升檢測精度。
結束語:
總而言之,在當前的基于機器視覺的菜品智能設計中,還存在一定的技術難點,還需要實現機器視覺的智能識別技術與傳統圖像識別技術、深度學習圖像識別技術的有機結合,從而設計出完善的菜品智能識別系統。通過應用圖像處理技術,可以對已經拍攝的圖像進行處理,并實現對菜品區域的監測定位,對菜品的種類、菜品所在的區域進行檢測,在未來的研究中仍然需要對該菜品智能識別技術的實時性、準確性進行深入的研究。
參考文獻:
[1]李振,廖同慶,馮青春,等.基于機器視覺的蔬菜種子活力指數檢測算法研究及系統實現[J]. 浙江農業學報,2015,27(12):2218-2224.
[2]陶沙,何敏.基于機器視覺的智能制造系統圖像識別技術研究[J].洛陽理工學院學報(自然科學版),2019.
(作者單位:荊楚理工學院)