馬亞楠,黃 敏,,李艷華,張 慜,步培銀(.江南大學輕工過程先進控制教育部重點實驗室,江蘇無錫4;.食品科學與技術國家重點實驗室,江蘇無錫4;.無錫出入境檢驗檢疫局,江蘇無錫40)
基于能量信息的毛豆豆莢螟高光譜圖像檢測
馬亞楠1,黃 敏1,2,李艷華3,張 慜2,步培銀3
(1.江南大學輕工過程先進控制教育部重點實驗室,江蘇無錫214122;2.食品科學與技術國家重點實驗室,江蘇無錫214122;3.無錫出入境檢驗檢疫局,江蘇無錫214101)
為了尋求快速有效的毛豆內部豆莢螟的檢測方法,將高光譜圖像技術應用于毛豆內部的豆莢螟無損檢測。以225個樣本為研究對象,首先采用平均灰度值的方法自動獲取毛豆感興趣區域,然后提取400~1000nm波長范圍內共94個波段的能量信息作為特征參數,最后結合支持向量數據描述分類器建立豆莢螟的分類檢測模型。研究結果顯示,在自動提取的感興趣區域驗證集中,正常樣本的分類精度為100%,有蟲樣本分類精度為75%,驗證集的總體分類精度為95.6%,可有效識別出含豆莢螟的毛豆樣本。
毛豆,感興趣區域,能量,支持向量數據描述
毛豆,又稱菜用大豆,因其營養豐富,口感好、風味清香,富含蛋白質、脂肪、礦物質、碳水化合物和多種維生素等人體必需的營養成分深受世界各地人民的喜愛。隨著人們生活水平的提高,毛豆的安全成為消費者和生產廠家頗為關心的指標。豆莢螟是豆類主要害蟲之一,幼時就存于毛豆內部咬食豆仁,被啃食后的毛豆失去了食用價值,因此各國對豆類產品的豆莢螟數目有嚴格要求。傳統的害蟲檢測方法包括染色體法、比重法等檢測方法,不僅破環了樣本而且費時費力。近些年來,越來越多的學者將無損檢測技術應用到農業害蟲領域,包括聲音法[1]、微波雷達法[2]、X-射線法[3]、機器視覺技術[4]、近紅外光譜分析技術[5]。其中聲音法和微波雷達方法需要害蟲能夠運動;機器視覺技術基于可見光光源,只能檢測農作物表面的害蟲;近紅外光譜分析技術只能提供一個小區域的檢測。這些檢測技術很難實現豆莢螟的準確檢測。
高光譜圖像技術是一種集成光譜技術和圖像技術的無損檢測新方法,相比于單一的機器視覺技術或光譜分析技術,該技術提供了被測對象外在形態學特征、內部結構特征和化學成分特征的所有信息,為其在農產品的內部品質預測和內部質量識別等領域的應用提供了保障[6-11]。本課題組[12]利用高光譜圖像技術結合圖像感興趣區域的多維統計特征對毛豆豆莢螟無損檢測技術進行了初步研究,取得了較高的檢測精度。但是在該研究中,毛豆的感興趣區域采用人工手動提取方式,存在著對人員依賴性強、耗時耗力,難于實時在線應用的缺點;同時,原有研究中利用的圖像統計特征參數較多,增加了算法的復雜性。為了解決上述問題,本研究提出一種基于平均灰度值的感興趣區域自動提取方法,獲取豆粒位置的有效區域,結合能量信息特征參數建立毛豆豆莢螟的分類檢測模型,可有效識別出含豆莢螟的毛豆樣本。
1.1 實驗材料
實驗所用的毛豆樣本 2011年7月采摘于浙江省慈溪市海通食品有限公司的毛豆種植基地,經過分揀、清洗、漂燙后儲藏在-18℃的環境下,每次實驗前在室溫為24℃的條件下放置大約4h,在其完全解凍后,依次對實驗樣本進行編號,標記。
1.2 等級的劃分
實驗中正常樣本定義為表面完好內部無蟲,豆粒完好,此時樣本設定為等級1。有蟲樣本定義為外部沒有蟲眼但是內部有蟲,或者內部有蟲的排泄物,此時樣本設定為等級-1。正常樣本和有蟲樣本如圖1所示。
為了做比較,本實驗和文獻[12]中采用同一批樣本。實驗中利用Kennard-Stone算法選取217個正常樣本中的180個樣本為校正集,剩下的37個樣本和8個有蟲樣本構成預測集。

圖1 正常樣本(a)和有蟲樣本(b)Fig.1 Normal sample(a)and insect-damaged sample(b)
1.3 高光譜透射圖像采集
實驗中毛豆高光譜透射圖像數據是利用如圖2所示的高光譜成像系統所采集。本實驗中所用儀器是美國Headwall公司提供的高光譜圖像采集處理裝置,整個系統由高光譜成像單元、透射光源和樣品輸送平臺三部分組成[15]。其中,高光譜成像單元由CCD攝像頭(pixelfly QE IC×285AL,Cooke,USA)、光譜儀(1003A-10140 HyperspcTM VNIR C-Series,Headwall Photonics Inc.,USA)、變焦鏡頭(10004A-21226 Lens,F/1.4 FL23mm,Standard Barrel,C-Mount.,USA)USA)和一個控制圖像采集的計算機組成。光譜儀的狹縫是25μm,有效光譜的范圍400~1000nm,光譜分辨率1.29nm,波段間隔為0.64nm/pixel空間分辨率0.15mm/pixel。透射光源為150W的直流鹵素燈(3250K,Techniquip,USA),為了保證透射光強的均勻性,光源上方安裝了一個3″厚的由石英玻璃制成的擴散片。樣本輸送單元包括一個水平機動平臺和一個帶有厚為2mm、面積為100mm×100mm、透射率為92%的鈉鈣硅酸鹽玻璃(ROCOES Electro-Optics CO.,LTD. Taiwan)。

圖2 高光譜透射圖像采集系統結構圖Fig.2 Schematic of the hyperspectral transmittance imaging system
實驗中,在保證圖像不失真的情況下儀器參數設置曝光時間為180ms,縱向掃描長度為30mm,步長為60μm,光譜壓縮倍數(binning)為10,即實際圖像的波段間隔是6.4nm。實驗時首先把樣本放到機動平臺上,水平機動平臺在初始位置開始移動,同時獲得高光譜圖像。在實驗中,因為存在分布不均勻的光照強度和暗電流的存在,會有較大的噪聲干擾,同時隨著實驗時間的長短,其會存在一定的變化,故每采集10次樣本圖像進行一次玻璃圖像和全黑圖像標定,以減弱噪聲的影響。每采完一個樣本圖像后,用手剝開毛豆,檢測是否有豆莢螟,并作記錄。
1.4 數據分析
1.4.1 高光譜圖像數據預處理 毛豆高光譜圖像通過式(1)獲得校正后的相對透射圖像:

其中,TA、TG、TD分別是豆莢的透射圖像、玻璃圖像和CCD檢測器的暗電流圖像,TR為校正后的相對透射圖像。后期所有豆莢螟蟲檢測分析都是基于校正后的相對透射圖像TR進行。
1.4.2 感興趣區域的提取 毛豆含蟲部位的區域提取是豆莢螟檢測的關鍵因素,考慮到豆莢螟幼蟲時期主要啃食豆粒,所以提取豆粒為感興趣區域(Region of Interest,ROI)來研究組織結構和化學成分的變化即可。文獻[12]中借助于ENVI V.4.3(Research System,Inc.,USA)軟件在豆粒位置手動提取區域來作為ROI,因為此時可以人為控制無需考慮毛豆的彎曲程度,所以選擇豆粒的最佳內接方形區域來作為ROI,此區域大小為150pixel×150pixel。然后經過一系列的格式轉換,最后提取區域特征參數。
手動提取需要人為的來控制,對每個樣本的每個波段圖像都要進行ROI提取,效率低,費時費力。所以ROI的自動提取方法至關重要。
本文研究了基于平均灰度值的ROI自動提取方法,效率高,省時省力。具體的提取方法步驟如下:
a.對所含豆粒個數不同的樣本分別做標記。
b.對樣本的相對透射圖像進行校正濾波等預處理。
c.計算每個樣本在每個波段下的橫坐標上所有灰度的平均值。
d.利用前突變點差值運算以及后突變點差值運算的方法來確定每個豆粒在橫坐標上的大概位置邊界(圖4中的波谷處),然后取兩個邊界的中心位置做豆粒縱軸的中心坐標。對每個豆粒都要進行前突變點差值和后突變點差值運算。
e.用毛豆輪廓的上下邊界之間的最大距離做整個毛豆的縱向寬度,以(4)中求得的x軸坐標為中心點,選擇大小為[x-60,x+60]的區域為橫向寬度,然后計算此區域上的平均灰度值,用此做豆粒的中心位置的橫坐標。
f.以每個豆粒的中心坐標為中心,向左向右向上向下各取四個值,也就是感興趣區域的左上頂點坐標和右下頂點坐標,最后以這兩點的坐標為邊界選擇感興趣區域。因為此時要考慮到毛豆的彎曲程度,如果選擇區域過大可能會提取到背景和輪廓,再者考慮到豆粒本身的形狀,此時選擇大小為120pixel× 100pixel的區域來作為豆粒的ROI,這樣既減少了數據的冗余性又加快了數據的計算速度。
圖3是含有兩豆粒的毛豆樣本在750nm波段下原始圖,圖4是樣本的平均灰度值曲線,從中可以看到橫向方向上豆粒的位置在整條曲線的波谷處,然后就可以提取到的豆粒上的感興趣區域。
1.4.3 圖像特征提取 考慮到毛豆物理結構和化學成分會對光產生不同的現象,例如,吸收、反射、散射、透射等,使得不同波段下不同毛豆的高光譜圖像的光強不同,而且豆粒和含蟲部位的紋理粗細度存在很大的差異性。圖像的能量信息是度量圖像灰度分布均勻程度和紋理粗細度的良好指標,因此本文利用不同波段下的圖像能量信息作為豆莢螟的識別特征。具體實現過程如下:

圖4 平均灰度值曲線Fig.4 The profile of mean gray
a.設波長為λ的毛豆的高光譜透射圖像為f(λ,i,j),其中,λ=1,…,W,i=1,2,…I,j=1,2,…J。W為總波段數;I和J分別為圖像的寬度和高度。對f(λ,i,j)進行自動ROI提取,獲得p=1,2,…P(P為高光譜透射圖像中豆粒的個數)個ROI的區域圖像f(λ,m,n),此時的圖像f(λ,m,n)作為ROI是因為它是根據灰度差異選擇出來的灰度值較小的區域,而豆粒位置的灰度值小于豆莢位置,把豆粒作為ROI來研究組織結構和化學成分的變化,即研究此區域圖像的紋理特征差異即可;
b.按公式(2)計算每個波段下的第個ROI區域能量E(λ):

其中,M和N分別為ROI區域圖像的寬度和高度,并且因為提取的ROI區域大小一樣,所以本實驗中M=120和N=100。
1.4.4 SVDD基本原理 為了能有效的解決單分類的問題,Tax和Duin在SVM的基礎上提出了支持向量數據描述(support vector data description,SVDD)。它是通過核映射在高維空間建立涵蓋目標樣本拒絕非目標樣本的最小超球體的單類分類器。因為實驗中有蟲樣本較少,無蟲樣本較多,正常樣本和有蟲樣本數量上存在非平衡性,所以選擇SVDD算法來建立分類模型。該算法的主要原理可以描述為給定對象數據集X={xh,h=1,…ω},尋找盡可能多的包含xh的球心a為半徑為R的最小超球體F(R,α)。為增加分類的魯棒性降低奇異樣本的影響,引入懲罰系數C和松弛變量ξi。超球面求解可定義為[13-15]:

其中,參數C為控制錯分樣本的懲罰程度的常數。
首先將式(3)轉化為求解拉格朗日極值問題,求得最小值。然后引入高維映射函數將數據映射到高維空間,并引入核函數K,計算最小超球體的半徑R。最后判別新測試的樣本y與超球體的距離是否小于R,如果小于,則測試樣本與樣本數據集X同類,否則拒絕識別。其中核函數采用徑向基函數如公式(4)所示:
K(xh,y)=exp(-‖xh-y‖2/s2) 式(4)
其中s為控制邊界緊密程度的自由參數。
參數C和s的選擇對SVDD建模分類精度非常重要。實驗用網格選優法自動選擇參數。參數C取值在0.1和1之間,步長設置為0.1,s取值位于0.01和10之間,步長設置為0.01。結合留一交叉驗證方法,根據錯誤分類率選擇的最優參數值為C=0.2,s=0.01。
2.1 能量特征提取結果
圖5是4個正常樣本和4個有蟲樣本能量特征曲線。由于受光源功率及量子效率等綜合因素的影響,采集的光譜圖像的光譜數據噪音較大[16],所以能量特征曲線在小于500nm波段下波動較大。在700nm后,由于毛豆內部的化學成分對光的透射和吸收作用增強,有蟲樣本和正常樣本曲線會有較大的差別。因為被蟲啃食過的豆粒,其內部的化學成分和紋理發生了變化,呈現不規則性。而正常樣本的化學成分和紋理比較均一,所以有蟲樣本的能量值小于正常樣本,這也與當樣本能量特征矩陣中全部數值相差較大時紋理粗能量大、數值相差較小時紋理細能量小相符合。

圖5 四個正常樣本和四個有蟲樣本能量特征曲線Fig.5 The profile of power values for four normal samples and four insect-damaged samples
2.2 手動提取ROI分類結果比較
在手動方法中,用文獻[12]一樣的方法來提取大小為150pixel×150pixel的方形區域作為ROI。與文獻[12]的統計特征預測集分類精度相比較見表1所示。基于能量特征參數的分類中,正常和有蟲樣本分類精度同為100%,總精度為100%。而文獻[12]中四統計特征(最大,最小,平均,方差)分類精度中,正常樣本分類精度為97.3%,有蟲樣本分類精度為87.5%,總精度為95.6%。基于能量特征參數分類精度都好于四特征的分類精度。

表1 手動提取ROI統計特征的預測集分類結果比較Table 1 Comparative analysis of prediction set of extracting manually characteristic parameters of ROI
2.3 自動提取ROI分類結果比較
基于灰度平均值自動提取ROI的統計特征預測集分類精度如表2所示,基于能量特征的正常樣本分類精度100%,有蟲樣本分類精度為75%,總精度為95.6%,為了便于比較,表2也給出了本文的自動提取ROI方法并結合最大、最小、平均、方差四種統計特征的分類精度,正常樣本分類精度100%,有蟲樣本分類精度為62.5%,總精度為93.3%。盡管從總體分類精度來說區別不大,但是對有蟲樣本的分類正確率,基于能量特征的分類精度要大大高于基于4參數統計特征的分類精度。可能的原因在于過多的統計參數,導致SVDD在構建分類超平面時的過擬合,并最終產生對未知含蟲樣本的分類錯誤。實驗結果表明基于平均灰度值自動提取ROI的方法是有效的,而且為樣本大批量處理和在線處理提供了很好的方法。

表2 自動提取ROI統計特征的預測集分類結果比較Table 2 Comparative analysis of prediction set of extracting auto characteristic parameters of ROI
基于平均灰度值的自動提取ROI方法中的能量特征參數分類精度低于手動提取ROI中能量特征參數的分類精度,這是因為手動提取過程中,ROI區域的位置可以人為控制。而自動提取ROI過程中,ROI的提取受到一些客觀因素的影響,例如如果毛豆彎曲程度特別大或者毛豆位置放置太過傾斜的話,ROI提取過程中就會提取到背景或者豆莢,或者ROI提取的豆粒不完整,所以自動提取ROI的方法還需進一步的研究。
盡管自動提取ROI的方法,在分類精度上要低于人工手動提取,但是自動提取方法可較好克服對人員的依賴性,效率更高,便于在線運用。就特征提取方法來說,本文提出的能量特征方法,由于采用了較少的分類特征參數,減少了SVDD分類超平面過擬合的風險,因此無論是結合自動提取感興趣區域,還是手動提取感興趣區域,其分類精度都要高于文獻[12]報道的四特征參數方法。
由于本次實驗樣本來自于2011年7月浙江省慈溪市海通食品有限公司的毛豆種植基地,公司已經過分揀、挑選、清洗和漂燙等處理,所以有蟲樣本較少,為了增加模型的可靠性,在后續研究中也需要提高有蟲害樣本的數目來進行更加有效的驗證。
本文利用高光譜圖像技術既能反映圖像信息又能反映光譜信息的特點,應用于毛豆內部豆莢螟的無損檢測。結果表明:灰度平均值自動提取方法可以有效提取豆莢的ROI,而且省時省力,效率高,這對于實現樣本的大批量處理和在線應用提供了很好的方法。利用圖像能量信息作為樣本的識別特征,在一定程度上簡化了特征提取的復雜性。采用能量特征結合SVDD分類算法,正常樣本分類精度為100%,有蟲含本分類精度為75%,總精度達到了95.6%,說明利用高光譜圖像技術對毛豆內部的豆莢螟進行無損檢測是可行的。
[1]Hagstrum D W,Vick K W,Webb J C.Acoustical monitoring of Rhyzopertha dominica(Coleoptera:Bostrichidae)populations in stored wheat[J].Journal of Economic Entomology,1990,83(2):625-628.
[2]Mankin R W.Microwave radar detection of stored-product insects[J].Journal of Economic Entomology,2004,97(3):1168-1173.
[3]Melvin S,Kanunakaran C,Javas D S,et al.Design and development of a grain kernel singulation device[J].Canadian Biosystems Engineering,2003,45(3):1-3.
[4]張紅濤,毛罕平,邱道尹.儲糧害蟲圖像識別中的特征提取[J].農業工程學報,2009,25(2):126-130.
[5]陳浩梁,李金甫,邱國強,等.植物害蟲檢疫中的近紅外光譜檢測技術[J].植物檢疫,2008,22(4):256-259.
[6]周竹,李小昱,陶海龍,等.基于高光譜成像技術的馬鈴薯外部缺陷檢測[J].農業工程學報,2012,28(21):221-228.
[7]薛龍,黎靜,劉木華.基于高光譜圖像技術的水果表面農藥殘留檢測實驗研究[J].光學學報,2008,28(12):2277-2280.
[8]李江波,饒秀勤,應義斌,等.基于高光譜成像技術檢測臍橙潰瘍[J].農業工程學報,2010,26(8):222-228.
[9]馬本學,應義斌,饒秀勤,等.高光譜成像在水果內部品質無損檢測中的研究進展[J].光譜學與光譜分析,2009,29(6):1611-1615.
[10]趙杰文,劉劍華,陳全勝,等.利用高光譜圖像技術檢測水果輕微損傷[J].農業機械學報,2008,39(1):106-109.
[11]朱啟兵,馮朝麗,黃敏,等.基于圖像熵信息的玉米種子純度高光譜圖像識別[J].農業工程學報,2012,28(23):271-276.
[12]HUANG Min,WAN Xiang-mei,ZHANG Min,et al.Detection of insect-damaged vegetable soybeans using hyperspectral transmittance image[J].Journal of Engineering,2013,116(1):45-49.
[13]朱啟兵,馮朝麗,黃敏,等.基于高光譜圖像技術和SVDD的玉米種子識別[J].光譜學與光譜分析,2013,33(2):517-521.
[14]楊振章,方景龍.基于SVDD的分類新方法[J].機電工程,2009,26(11):48-50,97.
[15]Sakla W,Chan A,Ji J,et al.An SVDD-based algorithm for target detection in hyperspectral imagery[J].IEEE Geoscience and Remote Sensing Letters,2011,8(2):384-388.
[16]張紅濤,毛罕平,韓綠化.近紅外高光譜成像技術檢測糧倉米象活蟲[J].農業工程學報,2012,28(8):263-268.
Detection of insect-damaged edamame based on image power using hyperspectral imaging technique
MA Ya-nan1,HUANG Min1,2,LI Yan-hua3,ZHANG Min2,BU Pei-yin3
(1.Key Laboratory of Advanced Process Control for Light Industry,Ministry of Education,Jiangnan University,Wuxi 214122,China;2.State Key Laboratory of Food Science and Technology,Jiangnan University,Wuxi 214122,China;3.Wuxi Entry-exit Inspection and Quarantine Bureau,Wuxi 214101,China)
In order to seek a quick and efficient detection method of edamame,hyperspectral imaging technique was applied to the nondestructive detection of insect-damaged edamame in this study.It was well known that the ROI of the vegetable soybean pods is the position of the beans,A ROI selection approach based on the mean gray values in the horizontal coordinate and vertical coordinate was proposed.In this experiment,hyperspectral transmission images were acquired from normal and insect-damaged vegetable soybeans(225 beans),These beans were used as the research samples.First,a region of interest(ROI)of edamame was extracted automatically using the mean gray value method from hyperspectral images.Then,the image power of ROI was extracted as classification feature,which the spectral region covered 400~1000nm and contained 94 wavelengths.At last,support vector data description(SVDD)was used to develop the classification models for the insect-damaged edamame.In the validation set,the results indicated the automatic extracting ROI method based on the mean gray value achieved 100%accuracy for the normal samples,75%accuracy for the insect-damaged samples,and 95.6%overall classification accuracy,which could discriminate insectdamaged edamame.
edamame;a region of interest;power;support vector data description
TS207.3
A
1002-0306(2014)14-0059-05
10.13386/j.issn1002-0306.2014.14.003
2013-10-10
馬亞楠(1989-),女,碩士研究生,研究方向:基于高光譜圖像技術的無損檢測。
國家自然科學基金項目(61271384,61275155);國家質檢總局科技計劃項目(2013KJ58);江蘇省自然科學基金項目(BK2011148);中國博士后基金項目(2011M500851)。