杜俊波,李文正
(江西理工大學(xué) 電氣工程與自動(dòng)化學(xué)院,江西 贛州 341000)
隨著計(jì)算機(jī)技術(shù)的發(fā)展,圖像識(shí)別技術(shù)被應(yīng)用到各大領(lǐng)域[1]。在農(nóng)業(yè)領(lǐng)域中,圖像識(shí)別技術(shù)的應(yīng)用也較為廣泛。例如,農(nóng)作物蟲害圖像識(shí)別,農(nóng)產(chǎn)品自動(dòng)分揀及品質(zhì)分級(jí)等等。我國(guó)是水果大國(guó),對(duì)于水果圖像識(shí)別的研究尤為重要。水果圖像識(shí)別能對(duì)不同水果進(jìn)行識(shí)別分類,有利于水果的自動(dòng)分揀及水果品質(zhì)分級(jí)。在西方的發(fā)達(dá)國(guó)家,已經(jīng)開始對(duì)水果行業(yè)智能化、規(guī)模化,在選果包裝車間中,已經(jīng)普遍采用無損傷檢測(cè)手段。因此,水果圖像識(shí)別技術(shù)具有很大的效益潛力。
20世紀(jì)80年代初,國(guó)內(nèi)外學(xué)者開始對(duì)水果識(shí)別分類進(jìn)行研究,包括研究水果的計(jì)算機(jī)自動(dòng)識(shí)別分類等。但是傳統(tǒng)的水果識(shí)別僅僅基于水果的輪廓曲線特征或者顏色特征,識(shí)別精度不高,分類效果較差。近年來,隨著計(jì)算機(jī)技術(shù)的提升和新型算法的提出,出現(xiàn)了一些基于模式識(shí)別算法的較新方法,比如基于卷積神經(jīng)網(wǎng)絡(luò)的水果識(shí)別系統(tǒng)和基于深度學(xué)習(xí)的水果圖像識(shí)別系統(tǒng)[2-3]。
最初,深度學(xué)習(xí)是為了解決圖像識(shí)別問題而提出的;如今,深度學(xué)習(xí)已經(jīng)在圖像、語音等方面取得了重大突破。目前,深度學(xué)習(xí)技術(shù)已經(jīng)廣泛應(yīng)用到圖像識(shí)別中,主要應(yīng)用于圖像的分類識(shí)別、圖像的目標(biāo)檢測(cè)、圖像修復(fù)和圖像分割等領(lǐng)域[4]。
鑒于圖像識(shí)別技術(shù)的發(fā)展及國(guó)內(nèi)外研究現(xiàn)狀,本文提出一種基于閾值分類器的水果識(shí)別系統(tǒng)。水果圖像識(shí)別的研究將有利于水果分揀實(shí)現(xiàn)智能化,同時(shí),也給其他圖像識(shí)別領(lǐng)域提供了一定的參考。
一個(gè)基本的圖像識(shí)別系統(tǒng)主要由圖像采集、圖像預(yù)處理、圖像特征提取、圖像識(shí)別算法等步驟組成。每一步驟都會(huì)對(duì)圖像識(shí)別的精度起著至關(guān)重要的作用,但是根據(jù)研究的不同,可以適當(dāng)?shù)膫?cè)重其中一個(gè)流程。本文水果系統(tǒng)識(shí)別流程如圖1所示。

圖1 水果識(shí)別流程
在分析和使用圖像之前,需要對(duì)圖像進(jìn)行預(yù)處理,包括水果圖像二值化、形態(tài)學(xué)處理,水果圖像填充和水果圖像邊緣檢測(cè)。
水果圖像二值化處理一般采用OTSU算法[5]。水果圖像經(jīng)二值化處理后仍然有一些獨(dú)立的小白點(diǎn),而且邊緣有許多毛刺,整體二值化圖像不圓潤(rùn),不是很光滑,于是對(duì)二值化的圖像進(jìn)行形態(tài)學(xué)處理,并對(duì)二值化圖像進(jìn)行開運(yùn)算[6]。開運(yùn)算處理之后,再對(duì)圖像進(jìn)行邊緣檢測(cè)、水果圖像填充。實(shí)驗(yàn)結(jié)果如圖2所示。

圖2 水果圖像預(yù)處理
特征是一個(gè)對(duì)物體進(jìn)行描述的量,任何識(shí)別算法都需要選取一個(gè)好的特征,這是確保算法有效的關(guān)鍵。為了識(shí)別不同種類的水果,采集到的水果圖像經(jīng)預(yù)處理后,還需要進(jìn)行特征提取。水果較為明顯的特征包括:顏色特征、形狀特征及紋理[7]。就本研究而言,主要考慮的是水果的形狀特征。水果形狀特征是識(shí)別水果種類的要重依據(jù),水果形狀特征比較多,主要包括水果的大小、水果的周長(zhǎng)、水果的面積、水果的圓度、水果的離心率等等。
在水果識(shí)別中,桃子和蘋果的形狀更加圓滑,也更加接近圓形;香蕉形狀比較長(zhǎng),它是屬于條形的;而像菠蘿則類似一個(gè)矩形。對(duì)水果整體區(qū)域進(jìn)行填充時(shí),可以通過圖像像素的個(gè)數(shù)求出的水果面積S,也可以根據(jù)邊緣檢測(cè)求出水果的周長(zhǎng)L。用圓度t來表示與圓形的近似程度,則有:

式中:π是圓周率;S是圖像面積;L是圖像的周長(zhǎng)。
水果識(shí)別中,先求出圓度t,圓度越趨近于1,說明水果形狀越近似為圓形,圓度越趨近于0,說明水果形狀偏離圓形。除了圓度t,還設(shè)置了其他形狀參數(shù),比如離心率e,長(zhǎng)軸和短軸之比f等。本文選擇不同水果圖像,對(duì)其形狀特征參數(shù)進(jìn)行比對(duì),見表1所列。通過表1可以看出,水果的種類不同,其形狀特征參數(shù)差別比較大,就圓度而言,桃子的圓度接近為1,故其形狀與圓相近;菠蘿的圓度最小,接近為0,其形狀與圓形差別比較大,與實(shí)際情況大致相符。

表1 形狀特征比對(duì)
圖像的精準(zhǔn)識(shí)別是一個(gè)比較困難的研究課題,圖像識(shí)別技術(shù)是模式識(shí)別技術(shù)的一個(gè)重要分支。基于圖像的模式識(shí)別流程如圖3所示。

圖3 模式識(shí)別流程
從圖3可以看出,模式識(shí)別主要包括訓(xùn)練和測(cè)試兩個(gè)方面,其中,圖像的訓(xùn)練尤為重要。在訓(xùn)練數(shù)據(jù)時(shí),訓(xùn)練算法起至關(guān)重要的作用。識(shí)別分類算法即對(duì)提取的特征進(jìn)行訓(xùn)練測(cè)試,是水果識(shí)別系統(tǒng)核心。
本次研究中選取了8種常見水果,在形狀特征參數(shù)中,只考慮了3個(gè)特征參數(shù),分別是長(zhǎng)短軸之比f,離心率e和圓度t。在此訓(xùn)練每種水果圖像30張,并訓(xùn)練同種水果圖像3個(gè)形狀參數(shù)的閾值,見表2所列。

表2 形狀特征閾值參數(shù)
定義好水果形狀閾值之后,在新的圖像中提取3個(gè)形狀參數(shù)。如果3個(gè)形狀參數(shù)同時(shí)滿足閾值中的數(shù)據(jù),就會(huì)輸出相應(yīng)的水果識(shí)別結(jié)果;否則,就不能正確輸出識(shí)別結(jié)果。
水果識(shí)別的性能測(cè)試主要是測(cè)試水果識(shí)別的適用范圍和水果識(shí)別的精度。本研究中主要包含了8種不同的水果,每種水果又選擇多張不同的圖像進(jìn)行調(diào)試,其背景都是白色。可以任意選擇一張水果圖片進(jìn)行識(shí)別。
對(duì)于待識(shí)別的圖像,主要對(duì)比3個(gè)形狀參數(shù),包括圓度、離心率和長(zhǎng)軸與短軸之比。調(diào)試界面如圖4所示。

圖4 水果識(shí)別調(diào)試結(jié)果
通過訓(xùn)練每種水果30張圖像,得出水果的形狀參數(shù)的閾值。通過閾值分類器測(cè)試每種水果圖像多張,得出基于閾值分類器水果識(shí)別系統(tǒng)的精度,如圖5所示。

圖5 水果識(shí)別精度
本文設(shè)計(jì)了一種基于閾值分類器的水果識(shí)別系統(tǒng),實(shí)驗(yàn)結(jié)果表明,水果識(shí)別系統(tǒng)能夠識(shí)別一些常見的水果,并且水果識(shí)別率約為90%。該系統(tǒng)為水果識(shí)別分類提供了一定的借鑒作用,但是也存在著一些局限性,如不能直接對(duì)農(nóng)場(chǎng)中的水果進(jìn)行識(shí)別分類。這個(gè)不足可以通過大量訓(xùn)練水果的圖像加以解決。此外,為了方便識(shí)別各種水果種類,可制作APP或微信小程序,當(dāng)遇到不認(rèn)識(shí)的水果時(shí),通過掃一掃,便可得到該種水果的信息,如水果等級(jí)和品質(zhì)等,甚至能夠精準(zhǔn)識(shí)別水果盤中所呈現(xiàn)水果的種類。
物聯(lián)網(wǎng)技術(shù)2020年12期