李學軍 程 紅
(1. 四川大學錦城學院,四川 成都 611731;2. 成都理工大學管理科學學院,四川 成都 610059)
目前,蘋果分級主要以人工分揀為主,其工作量大/效率低且速度慢[1]。近年來,隨著機械視覺技術的發展,基于機械視覺技術的農產品自動分級方法已迅速發展為一種取代人眼的快速、無損、高效的檢測技術[2]。趙利平等[3]提出了一種結合小波算法和模糊算法的蘋果分級方法,該算法在蘋果分級的3個層次中的分類準確率均>97%。王陽陽等[4]提出了一種蘋果分級算法,該算法將同構濾波與改進的k均值相結合,可以減少傳統圖像分割的影響,且該方法對蘋果尺寸、質量、色澤、形狀和缺陷的識別準確率>97%。王立揚等[5]提出了一種改進的LeNet-5t自動分級方法,將卷積層添加至第4層以加深網絡深度,使用Leakerel激勵函數,并添加一個dropout層以防止過度擬合。結果表明,該算法具有良好的檢測效果,準確率達97.37%。樊澤澤等[6]提出了一種基于顏色和果徑的水果檢測和分級算法,對卷積神經網絡提取的多尺度特征圖進行回歸預測,并根據顏色分量進一步校正檢測幀的位置。結果表明,該方法的準確率為96.6%。上述研究多是基于單一特征分類,分類過程復雜且效率低。
文章擬提出一種基于判別樹和粒子群優化(PSO)支持向量機(SVM)的蘋果分級檢測特征融合方法,引入核主成分分析(KPCA)降低高維特征的維數,采用判別樹法根據水果的果徑、缺陷區域和顏色進行分類,采用改進的支持向量機根據果形、紋理和成熟度進行分級,結合各單一特征對蘋果進行綜合評估,旨在為蘋果分級檢測技術的發展提供依據。
機器視覺是集動力學、光學設備、電磁感應、數字視頻和圖像處理技術的系統學科[7]。為了解決人工分類精度差的問題,國內外制造商開始使用機器視覺對蘋果質量進行分級[8]。如圖1所示,在傳送帶的驅動下,蘋果和傳送帶沿相同方向運行,穿過暗箱3時,3個內部視覺傳感器分別從頂部和側面拍攝蘋果照片,從而可以一次收集每個蘋果90%以上的表面信息。圖像采集完成后,將3個不同角度的采集圖像發送至計算機,由圖像采集卡進行處理,并通過軟件編程完成圖像的預處理。再根據標準提取蘋果的特征參數,并根據果徑、缺陷面積、顏色、果形、紋理和成熟度對蘋果進行分級[9]。

1. 視覺傳感器 2. 光源 3. 暗箱 4. 輸送結構圖1 系統結構Figure 1 System structure
蘋果在線分級檢測是實現蘋果商業化的重要途徑,不僅要滿足分類精度要求,還要滿足速度要求[10]。蘋果分級過程中,各特征間無關性且單一特征無法確定蘋果的等級,因此引入決策融合概念。采用基于決策樹分類模型和改進的支持向量機分類模型結合的決策融合方法實現蘋果的分級。

圖2 蘋果分級流程Figure 2 Apple grading process
(1) 果徑R:按式(1)計算[11]。
(1)
式中:
Np——蘋果區域內像素數;
Pe——像素當量;
Cp——圖像壓縮率。
(2) 缺陷面積S:按式(2)計算[12]。
(2)
式中:
Nq——蘋果缺陷區域中的像素數。
(3) 色澤Q:蘋果紅色區域中的像素數與像素總數之比[13]。
(4) 果形:使用凸度Dc表示水果形狀的規則度,并按式(3)計算[14]。
(3)
式中:
So、Sc——目標和目標最小凸殼的像素數。
(5) 果面紋理:紋理可以表示蘋果表面的光滑性。通過灰度共生矩陣對紋理特征進行分析,采用對比度、能量、熵和逆差距描述紋理特征[15]。
(6) 成熟度:蘋果的成熟度特征主要包括R分量平均值和方差、G分量均值與方差、平均灰度5個參數值[16]。
判別樹可以清楚地顯示條件、決策與下一步的邏輯關系[17]。使用以下步驟創建決策表:
(1) 確定判斷的必要條件,只能是發生(Y)或不發生(N)兩種值[18]。
(2) 根據情況確定適當的動作。
(3) 排除所有組合。
(4) 以各種組合確定相應的動作,為條件項和動作項創建決策規則,并指導決策。
(5) 檢查決策表中的決策規則是否冗余[19]。
根據果實直徑、缺陷面積和色澤特征,以評分指標建立判別樹模型,對樣本進行判斷,得出候選等級,其層次結構如圖3所示。

圖3 判別樹分級流程Figure 3 Apple grading process
為了滿足分類的實時要求,有必要對高維特征進行降維處理。由于特征集是非線性的,因此引入核主成分分析以降低高維特征的維數[20]。為了避免在降維訓練中盲目選擇參數,使用“粒子群優化”來優化徑向基函數的參數[21]。
(1) 核主成分分析:設輸入樣本矩陣X={x1,x2,…,xN},對X進行非線性變換φ(·)映射向特征F空間。設j=1,2,…,N,協方差矩陣為[22]:
(4)
解方程λv=Cv的特征值λ和特征向量v,設i=1,2,…,N,存在系數α={α1,α2,…,αN}。特征向量v為:
(5)
KPCA利用核函數實現非線性變換,定義核函數K(xi,x)=[φ(xi),φ(x)],則
Nλα=Kα。
(6)
設特征值λ1≥λ2≥…≥λp>0(p≤N),則對應的向量為α1,α2,…,αp,能得到特征空間F主軸方向,v1,v2,…,vp。 設m=1,2,…,p,任一向量x在特征空間F中第m個非線性主元tm為
(7)
核函數選擇徑向基核函數:
K(xi,x)=exp(-‖x-xi‖2/g),
(8)
式中:
g——選定的參數。
(2) 粒子群優化的支持向量機:使用“粒子”作為進化過程中優化問題的解決方案[23]。新粒子的位置由飛行速度v1確定,v1根據群進化過程的個體最優pbestid和全局最優gbest計算:
(9)
(10)
式中:
i=1,2,…,l;
d=1,2,…,o;
l——粒子數;
o——維數;
r1、r2——[0,1]的隨機數;

c1、c2——自學習和社會學習系數。
支持向量機是建立一個分類超平面,作為非線性、小樣本、高維實際問題的決策面,具有良好解析能力。
假設訓練樣本xi∈Rn,i=1,2,…,L,標簽向量yi=±1和核函數K,ai為每個樣本的Lagrange乘數。對于特定的分類問題,關鍵是計算ai,構造和求解優化問題如式(11)所示[24]。
(11)
式中:
ζ——懲罰因子。
由式(11)可得最佳解a*=(a1,a2,…,aL)T,偏項b*為
(12)
則 SVM 的分類函數P(x)為:
(13)
式中:
sgn(·)——符號函數(徑向基函數作為核函數)。
因為支持向量機只適用于兩類,所以使用一對一的識別策略。對于3類的問題,需要創建3個分類函數。在對樣本進行分類時,其結果是通過投票產生的。
由于對支持向量機的參數ζ和核參數g影響較大。為了避免盲目選擇參數,引入全局遍歷能力較好的粒子群優化算法(PSO-SVM),其分級流程如圖4所示。

圖4 PSO優化SVM分類流程Figure 4 Virtual machine allocation process
將判別樹分級結果與粒子群優化的支持向量機分類結果進行決策融合,可以避免單個分類器的局限性,并為不同的分級方法進行優勢互補。使用C-SVC分類類型和RBF核函數,網格方法參數的搜索范圍為[1e-1,1e2]。考慮到PSO算法的隨機性,將5次運算后的最優值作為最終結果。對于蘋果樣本,決策融合策略是:將判別樹分類模型的分類結果與粒子群優化支持向量機分類模型進行比較,最終樣本分別對應于兩個結果的較低級別。例如,對于特定樣本,如果判別樹分類模型的分類級別為一級,而粒子群優化支持向量機分類模型的分類級別為二級,則蘋果樣本的級別為二級。
利用基于機器視覺的蘋果在線檢測分級系統采集蘋果圖像,對背景區域進行裁剪以減少背景區域在圖像框架中的比例。經排序和分類后,每個級別選擇1 000個蘋果樣本,訓練樣本500個,待識別樣本500個。
為了驗證融合決策的有效性,將文中分級方法與判別樹分級方法、SVM、KPCA-SVM分級方法和KPCA-PSO-SVM分級方法進行比較。每次隨機在蘋果圖片中抽取1 000張蘋果圖片,進行7次測試識別,其結果見表1。
由表1可知,判別樹的分類精度高于單個SVM分類器的識別結果。與單個SVM分類器相比,使用KPCA降維功能進行SVM分類不僅可以提高識別精度,還可以提高分類率。與單一分類器相比,決策融合明顯提高了蘋果識別的準確性。試驗方法的分類速度與KPCA+PSO-SVM相同,但其準確率提高了0.61%。因此,試驗分類方法不僅提高了識別能力,還滿足了實時性要求。

表1 分級方法對比Table 1 Detection result
為了驗證試驗檢測方法的準確性,選擇500個有缺陷的蘋果和1 000個完好的蘋果(一級蘋果和二級蘋果各500個),并通過試驗采集所需的蘋果圖像進行測試,結果見表2。由表2可知,采用試驗分類方法分別檢出一等品497個,二等品507個,三等品496個;6個一等品被錯誤地分類為二等品,3個二等品被錯誤地分類為一等品,7個二等品被錯誤地分類為三等品,11個三等品被錯誤地分類為二等品;平均分類準確率為98.20%。

表2 等級分類結果Table 2 Detection result
若按缺陷果和完好果進行劃分,其識別結果準確率如表3所示。由表3可知,缺陷和完整蘋果的識別率分別為97.80%,98.40%,說明文中所提出的決策融合方法具有實用性,分類準確率可以達到98%以上,平均分類率為4個/s,不僅提高了識別精度,還滿足了實時性要求。

表3 識別結果Table 3 Detection result
研究了一種判別樹和改進支持向量機決策融合的蘋果分級方法。結果表明,該方法的分類準確率>98%,該融合方法具有實際應用價值。但該方法沒有對蘋果缺陷進行細分,后續將不斷改進和完善基于決策融合的蘋果分級檢測技術。