王春普 文懷興 王俊杰
(陜西科技大學機電工程學院,陜西 西安 710021)
大棗的營養價值高[1],但由于皮薄且脆,容易損傷[2],特別是在采收、運輸和貯存過程中,由于自然和人為的因素容易造成表面缺陷[3]。根據相關標準[4]描述,大棗表面缺陷主要有銹斑、黑斑、畸形果,爛漿果,裂果,機械傷等。表面破損的大棗容易受到外界空氣的氧化發生變質,在清洗過程中也容易受到污染,影響大棗產品附加值,同時也一定程度上阻礙了大棗的商品流通化[5]。
人工檢測不僅對工人要求高,工作量大,且受個人主觀因素影響,造成分選偏差,很難保證檢測精度的一致性[6]。機器視覺系統通過工業相機獲取大棗的圖像,具有快速、準確、可靠、無損等優點,極大地提高檢測效率和機械自動化程度。張萌等[7]提出了一種亮度快速校正的算法,對蟲害棗、霉爛棗有很好的檢測效果,但未對黑斑、爛漿果、裂果等進行檢測。
支持向量機在解決小樣本、非線性和高維模式識別中表現出許多特有的優勢,并能推廣應用到函數擬合等其他機器學習問題中。為此,本試驗擬以中國靈武長棗為試驗對象,通過支持向量機的方法對大棗表面的爛漿、機械傷、斑痕、病蟲、裂紋5種缺陷進行檢測,以期為大棗的分級提供理論依據與技術支持。
該檢測分級設備主要由上料箱、輸送鏈、圖像采集裝置、氣吹分級機構、電機以及落料箱等組成,保證接通電源、開啟啟動按鈕后可以實現靈武長棗的自動上料、單個傳送、自動獲取大棗表面圖像、檢測等級、氣吹落料5個主要功能。
檢測分級設備三維模型如圖1所示,具體工作過程為:啟動分級機電機,輥軸傳送鏈在電機的帶動下隨著主動軸運動,大棗從上料斗處上料,上料部分的鏈輪為傾斜向上,未平穩定位的大棗從傳送帶上滑落重新定位,保證大棗能夠單排輸送;傳送鏈上的輥輪采用凹槽型設計,可以讓未落入輥輪輸送鏈的大棗隨著輥輪滾動,與輥輪邊緣不斷摩擦,進入輥輪輸送鏈中,保證大棗快速平穩定位。當大棗經過觸發開關時,攝像機采集圖像,圖像采集區處輥輪下方依然安裝柔性搓動板,輥輪與柔性搓動板不斷摩擦,帶動大棗轉動。柔性搓動板的長度至少能讓大棗繞自身旋轉一圈,保證相機能采集到大棗全方位圖像,拍攝到的同一大棗3幅圖片依次被傳送到圖像處理系統,完成對大棗圖像的采集;大棗檢測分級系統對棗進行分析判定,得出棗的等級,隨之將分級結果信息傳送給氣動分級系統,氣動分級系統控制電磁閥的開關,當大棗被傳送帶傳送到對應的噴氣嘴時,電磁閥打開,噴氣嘴噴出氣流,將大棗吹入對應的落料箱中,完成大棗整個分級過程。其中工業相機型號為MV-GED500M-T,具有感應器面積小,焦距短等特點。LED光源具有壽命高、響應速度快、穩定性好、波長可以根據用途選擇等優點,故選擇環形LED燈作為光源。

1.上料箱 2.輸送鏈 3.圖像采集裝置 4.氣吹分級機構 5.機架 6.落料箱 7.電機圖1 大棗分級機三維模型Figure 1 Three-dimensional model of jujube classifier
通過對大棗表面信息的訓練,根據大棗表面是否存在缺陷,通過支持向量機的判別方法,將棗分為“good”和“bad”兩類。超平面H是從n維空間到n-1維空間的1個映射子空間,假設訓練樣本數據T={(xi,yi),i=1,……,n,x∈Rd,y∈(+1,-1)}可以被超平面ωTx+b=0準確分開,且距離超平面最近的向量與超平面之間的距離最大,則稱該訓練樣本數據被超平面分開[8]。對于超平面H:ωTx+b=0,假設x為超平面上任意一點,那么x點到超平面H之間的距離為x點到超平面H的法向量長度,距離為:
(1)
假設線性可分的訓練集T={(xi,yi),i=1,……,n,x∈Rd,y∈(+1,-1)}。
分類面方程為:
ωTx+b=0,
(2)
yi(ωTxi+b)≥1。
(3)
其中兩個分類超平面為:ωTx+b=1,ωTx+b=-1。
兩個分類超平面之間距離可表示為2/‖w‖,幾何間隔與誤分次數存在一定的關系,幾何間隔越大,誤分次數越少。使兩個分類超平面距離最大,即在式(3)的基礎上,求函數(4)的最小值。
(4)
對于線性可分問題,可以非常準確地選擇出分化訓練集的超平面;對于一般分類問題,由于包含線性不可分問題,上述方法是行不通的,可能是由于此分類超平面不存在。故需要在式(3)中添加松弛變量ξi≥0,i=1,……,n,使約束條件[式(3)]變為:
yi(ωTxi+b)≥1-ξi,
(5)
當ξi足夠大,訓練點(xi,yi)總有滿足上述約束條件,但需避免ξi取值過大。在目標函數里加入含有∑iξi的項,使其成為最優化問題。
(6)
式中:
C——懲罰因子,C值始終大于0。
懲罰因子越大,意味著目標分類函數準確性越小,同時也意味著對此類離群樣本點越重視[9]。
構造分化超平面(ω*x)+b*=0,則支持向量機的判決函數:
f(x)=sign[g(x)]=
(7)
其中大部分系數αi=0,只有少部分αi不為0,不為0的數確定了支持向量機,多種分類情況時可以通過二交叉樹方法解決。引入核函數,其作用為輸入2個低維度向量,可得到經過某個變換后在高維空間中向量的內積值。其中K(xi,x)=xi·x,則式(7)變形為:
(8)
在支持向量機判別中,將f(x)大于某個臨界值的分為一類,小于某個臨界值的分為一類。
圖像特征反映了目標特征的差異性,具有明顯的實用價值。由于缺陷大棗的判別主要根據大棗的表面性質,與大棗的顏色息息相關,且圖像或圖像區域的方向、大小對顏色的影響較小,故本課題選用大棗的顏色特征作為圖像特征。統計物體描述采用基本數值表示,稱為特征。HSI顏色空間比RGB顏色空間更能顯示人類的視覺特征,方便計算,為計算機圖像處理中常用的模型,故試驗中將RGB顏色模型轉換為HSI顏色模型,由式(11)~(14)可以看出I分量為R、G、B三分量和的均值,S分量只與RGB中最小分量有關,故I,S分量在缺陷處變化不明顯,不適合作為特征值。H分量在缺陷處變化較為明顯,故選用H分量作為特征值。

(9)
(10)
式中:
σH——大棗色調的均值;
N——大棗像素的總數;
Hi——大棗第i個像素的色調。
RGB顏色模型轉換為HIS顏色模型的關系為:
(11)

(12)
(13)
(14)
核函數的選擇對于支持向量機的判別檢測性能非常重要,常甜甜[10]對核函數的選擇做了深入的研究。通過不同的試驗,確定了采用徑向基核函數得出的試驗結果準確率較高。徑向基核函數具有以下優點:① 參數少,只有核參數和懲罰因子,模型復雜性較低,穩定性較好,結果不會有太大偏差;② 能隱藏節點數,避免了神經網絡方法求解不出局部極小點問題。故選用徑向基核函數作為支持向量機模型的核。
核函數c和正則常數γ影響著核函數及分類器的分類準確性。目前無統一的方法求核函數和正則常數,一般是通過多次試驗選擇合適的值。本試驗采用二因素三水平正交試驗(表1)比較核函數和正則常數對檢測分級效果的影響,選擇最佳核函數和正則常數。
從表2中可以看出核函數的極差較大,表明核函數的影響較大,正則常數次之。核函數要求指標適中,取3個水平中間所對應的值,即0.2。正則常數要求指標越大越好,取3個水平中最大值,即88.233,對應的正則常數為0.005。

表1 因素水平表Table 1 The factor design level table

表2 核函數及正則常數正交表Table 2 The kernel function and regular constant orthogonal Tablele

由圖4可知,開始時準確率隨著c的增大而增大;當γ>0.2時,隨著c的增大,準確率逐漸降低;當γ<0.05,c<0.5時檢測結果較為滿意;當c=0.2,γ=0.005時,正確率最高,為94.6%。
本文提出了基于支持向量機的大棗表面缺陷檢測方法,選用HSI顏色模型中色調(H)分量的均值和方差作為特征參數,通過正交試驗得出最佳的核函數和正則常數,建立基于支持向量機的大棗表面缺陷檢測模型。通過試驗驗證,對測試樣本缺陷的識別率達到94.6%,相比趙杰文等[11]的準確率(89.4%),平均水平已滿足在線檢測的準確性、效率性要求,說明機器視覺在線檢測的準確率和效率完全不低于人工檢測,并驗證了支持向量機分類是一種優秀的分類方法應予以推廣。該研究成果可以用于大棗的在線檢測分級,同時也可以為其他水果的檢測分級提供一定的參考。由于實驗室中光照不夠均勻,鮮棗表面光滑使得采集到的圖像容易形成亮斑,若蟲棗的缺陷在大棗左右兩端將無法被相機拍到,導致分級效果較差,后續可以采用改變大棗圖像采集時的拍照方式,確保整個大棗表面均能被拍到,從而提高蟲棗識別率;此外褶皺棗易識別為裂棗,需通過改變特征提取和識別的方式改進。

圖2 正常大棗Figure 2 The normal jujube

圖3 缺陷大棗Figure 3 The defect jujube

圖4 SVM參數選擇3D效果圖Figure 4 The SVM parameters select 3D renderings