李 凡 吳 杰 李繼霞
(1.克拉瑪依職業技術學院,新疆 克拉瑪依 833600;2.石河子大學機械電氣工程學院,新疆 石河子 832000)
庫爾勒香梨是新疆特色水果,是新疆出口創匯的重要果品。用戶對香梨一般要求大小均勻,形狀一致,以減少包裝和運輸成本,提高商品價值。但是庫爾勒香梨存在許多不具有商品價值的畸形果(Malformed Fruit)。畸形果主要有偏果和突頂果2類,偏果俗稱“鳥梨”或“龜背果”,香梨的偏果率達到7.82%。突頂果則是萼部生長特別突出,果心大,石細胞含量高,風味較差,庫爾勒香梨農業部標準NY/T585-2002中要求特級梨中突頂果不超過10%,一級梨中突頂果不超過20%。因此,基于機器視覺方法將這2類畸形果從香梨的標準果形中自動識別出來,對進一步開發庫爾勒香梨自動化分級裝備具有重要意義。
從庫爾勒市大墩子鄉果園采摘采摘香梨,通過當地經驗豐富的果農,選取樣本180個,其中標準果、禿頂果和偏果各60個(圖1)。人工選取標準果、禿頂果和偏果各10個用于訓練樣本。剩余各50個作為測試樣本,驗證試驗效果。

圖1 香梨的不同果形比較

圖2 圖像采集系統
香梨的圖像采集裝置如圖3所示,由數碼攝相頭(奧林巴斯,120萬像素,焦距20mm-∞)、計算機、高度調節裝置、背景板、光源箱(300mm×300mm×250mm)組成,圖像采集時,相機攝像頭與測量臺間距20cm,光源為白熾燈光源,香梨放置于白背景的底板上,采集香梨側面圖像(其中外形扁平的偏果采集圖像時畸形面放在側面,以采集到其特征形狀)。
利用圖2圖像采集系統采集的香梨圖像(圖3(a)),為了減少運算,將彩色圖像轉換為灰度圖像(圖3(b)),并對灰度圖像進行濾波處理。然后采用最大類間方差法自動選取分割閾值,對灰度圖像進行閾值分割并轉換二值圖像(圖3(c)),由圖3易見圖像有比較明顯的噪聲,香梨圖像內部有一些空洞,我們可以使用數學形態學填充的方法對其進行噪聲去除,消除因光照產生的空洞(圖3(d))。
果梗的完好通常是果實新鮮度的象征,果梗缺損會導致其內部水分流失,加速其干枯和腐爛,果梗的存在對于香梨既有重要意義。但果梗的的存在會影響計算機對于果形的判斷,因此在進行果形判斷前,必須去掉香梨圖像中的果梗。通過提取(d)中二值圖像的邊緣(圖3(e)),然后設置結構元素先進行形態學膨脹(圖3(f))然后再進行形態學腐蝕,來提取果梗(圖3(g)),最后將含有果梗的二值圖像(d)和提取的果梗(g)進行減法運算來得到去除果梗的香梨圖像(圖3(h))。

要判別果形,必須從香梨的圖片中提取果形的特征參數,常用的提取果形特征參數方法是進行區域標記,提取目標的周長,面積,長短軸徑等參數,利用各參數之間的關系來描述果品的形狀。馬本學利用離散指數(周長的平方比面積)作為特征參數來區分畸形果和正常果。這種方法描述特征過于簡單,不能有效識別突頂果和標準果。
本文在水平和豎直方向分別用一定數量的直線均分香梨,如圖3水平方向和豎直方向分別用H1,H2,H3,…Hn和V1,V2,V3,…Vn來均分香梨,由這些直線表示水果形狀。然后利用公式(1)和公式(2)將這些均分直線長度做作歸一化處理。

其中,Hmax為H1,H2,H3,…Hn中最大值。Vmax為V1,V2,V3,…Vn中最大值。
歸一化可消除香梨大小對果形的影響,得到2n個形狀特征參數。偏果和正常果在偏側豎直均分線長度不同,因此可區分香梨偏果和正常果。由于香梨突頂果和標準果在下端水平均分線長度有很大區別(圖4),因此可以很容易區分突頂果和正常果。

圖4 香梨各種果形均分直線比較
本研究基于MATLAB建立了一個神經網絡識別系統,它是以BP網絡分類器為核心的系統,如圖5所示。網絡分類器為一個BP網絡訓練子系統;訓練和測試樣本圖像由數碼攝像頭獲取,經圖像采集卡數字化后輸入計算機,該圖像經過預處理,提取均分直線特征獲得特征參數,然后將這些參數輸入BP網絡進行訓練或識別。人工神經網絡的操作分兩步,首先是訓練學習,接著是分類操作。訓練時,把要教給網絡的信息輸入到神經網絡的訓練過程中去,使得神經網絡按某種規則調節各處理單元間的連接權值,直到輸入給定輸入時網絡就能產生給定輸出時為止。網絡訓練過程是網絡獲取知識的過程,當網絡訓練完成時,各連接權已調節好,即知識被隱含地儲存在網絡中。網絡分類操作就是對訓練好的網絡輸入一組信息時,網絡就可輸出與此輸入相對應的輸出信息。

圖5 香梨的神經網絡識別系統
輸入層神經元個數:每個香梨采用均分直線法提取100個特征參數(其中橫向和縱向各50個),因此inpoint=100;輸出層神經元個數:由于需鑒定的香梨為正常果、突頂果和鳥梨三類,則outpoint=3;中間隱含層神經元個數:midpoint=(inpoint +outpoint)/2=51;
訓練誤差:目標誤差過大,會影響分類的準確性。反之,則會增加訓練時間,而且可能會造成神經網絡不收斂。本研究選擇誤差為0.01。
選取各層激活函數:網絡隱含層和輸出層都選取S型對數激活函數f(t)=。式中t為神經元傳遞的參量。
當神經網絡參數設定好以后,利用選取好的較標準的標準果、禿頂果和偏果各10個樣本來訓練網絡,使訓練誤差小于0.01或訓練步數達到5000步。
上述神經網絡訓練好以后,用其余標準果、禿頂果和偏果各50個來測試樣本檢驗其分類性能。識別結果如表1所示。

表1 香梨的BP網絡識別結果
標準果、禿頂果和偏果果形均分直線的統計量是完全不同的,但3種果形在實際果形分布范圍上各種果形形狀界限并不是那么清楚,因此分類結果不可避免的存在識別誤差。由于選取的突頂果特征明顯因此能較好的識別,識別正確率為96%。偏果和標準果由于拍照位置,圖像處理誤差,和神經網絡識別誤差,再加上有些香梨形狀怪異其均分直線偏離其特征值區域因此這兩種果形會發生相互誤判。
本文針對香梨果形分類的需求,對香梨圖像進行閾值分割,并利用形態學方法去除香梨果梗,再從處理好的圖像中采用均分直線的方法提取香梨的形狀特征參數,并將這些特征參數進行歸一化處理,作為神經網絡的輸入參數,設計一個單隱層的BP神經網絡。選取合適的輸入層、隱含層和輸出層節點個數利用BP網絡對香梨進行訓練和測試。實驗結果表明,平均正確率為88.6%,分級效果較好。
[1]何子順,李世強,茹仙古麗.庫爾勒香梨果實外觀描述概況及其調控研究進展[J].北方果樹,2010,4,1-4.
[2]徐慶岫,李江,韓軍.授粉條件對庫爾勒香梨果實性狀的影響[J].果樹科學,1997,14(2):113-114.
[3]高敦祿.庫爾勒香梨也有“公”和“母”[J].新疆農墾科,1988,5(46):21-26.
[4]中華人民共和國農業行業標準.庫爾勒香梨NY/T585-2002[S].2002,1-3.
[5]馬本學.基于數學形態學的香梨果梗提取方法[J].石河子大學學報:自然科學版,2008,26(05):636-638.
[6]何子順,牛建新,邵月霞.庫爾勒香梨果實萼片脫落與宿存研究概述[J].中國果菜,2006,2:10-11.