吳一全 王 凱 陶飛翔
(南京航空航天大學電子信息工程學院1,南京 210016)(南京財經大學江蘇省糧油品質控制及深加工技術重點實驗室2,南京 210046)
基于擴展Shearlet變換、Krawtchouk矩和SVM 的儲糧害蟲分類
吳一全1,2王 凱1陶飛翔1
(南京航空航天大學電子信息工程學院1,南京 210016)(南京財經大學江蘇省糧油品質控制及深加工技術重點實驗室2,南京 210046)
為了進一步提高儲糧害蟲的識別精度,以便更有效地防治儲糧害蟲,提出了一種基于紋理和形狀綜合特征及全局混沌蜂群優化支持向量機(SVM)的儲糧害蟲分類方法。首先對儲糧害蟲圖像進行擴展Shearlet變換,利用變換系數得到能量分布均值,加權后的能量分布均值構成紋理特征向量,用Krawtchouk矩不變量描述儲糧害蟲的形狀特征;然后將紋理特征向量和形狀特征向量分別歸一化,兩者結合構成儲糧害蟲的綜合特征向量;最后用全局混沌蜂群算法優化SVM的核參數與懲罰因子,并應用參數優化的SVM進行分類。結果表明:與基于Gabor小波和支持向量機方法、基于Krawtchouk不變矩和支持向量機方法相比,本方法提取的儲糧害蟲特征信息更加完整,識別率更高。
儲糧害蟲分類 紋理特征 形狀特征 擴展Shearlet變換 Krawtchouk矩不變量 支持向量機全局混沌蜂群算法
我國是糧食生產和儲藏大國,搞好糧食儲藏對保障國家糧食安全、維護國計民生意義重大。儲糧害蟲檢測與防治是做好糧食儲藏工作的重要任務之一。檢測的要求是能夠實時獲取糧食中害蟲發生的種類、密度、危害情況等信息,便于糧庫管理人員進行科學的決策,以減少蟲害引起的損失,避免因盲目防治造成的浪費及不必要的污染[1]。國內外較常用的在線檢測方法有誘捕器法、誘集法、電導率檢測法[2]。這些檢測方法易受環境干擾、效率較低并且可靠性差,不能滿足儲糧害蟲檢測的要求,且難以實現害蟲檢測、分析和控制的自動化。
近年來,利用圖像處理方法檢測儲糧害蟲成為重要的研究課題[3-5]?;趫D像處理的儲糧害蟲檢測系統具有準確、高效、便利、價格低廉、無環境污染等優點,并能利用計算機實現自動控制。其技術研究主要包括儲糧害蟲圖像特征提取和分類識別兩個方面。目前,常用的儲糧害蟲圖像特征提取方法可分為兩類:1)紋理特征提取方法[1],紋理特征包括斑點、花紋等高頻細節;2)形態特征提取方法[6-7],形態特征包括面積、周長、不變矩等幾何特征。文獻[8]對圖像進行Gabor濾波以提取紋理特征,得到了較好的識別效果。但Gabor小波基函數是非正交的,導致特征信息大量冗余,影響了計算效率。而擴展剪切波變換采用正交的基函數,且具有方向變換不受數目限制的優點,更能捕捉紋理細節。為此,文獻[9]將擴展剪切波變換應用于紋理圖像分類。其取各子帶加權能量值作為特征,減少了冗余數據,與Gabor小波方法相比,更有利于分類器的準確識別。而對于紋理特征不顯著的圖像,文獻[10]以形狀特征為出發點,分別研究了基于 Hu矩、Zernike矩、Krawtchouk矩等不變矩的害蟲分類方法。實驗結果表明,基于Krawtchouk不變矩的分類方法具有更高的識別精度。但是,對于形狀相近的害蟲,該方法的識別能力并不強。此外,儲糧害蟲可能會受到糧粒的遮擋、拍攝角度的影響,使得呈現在圖像中的害蟲形態不完整,或者產生局部變形?;谛螒B特征的方法易受到這些因素的干擾。因此,分別提取儲糧害蟲的紋理特征和形狀特征,通過聯合兩類特征,期望獲取更為完善的儲糧害蟲信息。至于儲糧害蟲分類識別方面,其方法主要有支持向量機(Support Vector Machine,SVM)分類法[7]和神經網絡分類法[11]。對于相同的有限樣本特征,支持向量機的泛化能力優于神經網絡[12]。此外,對于支持向量機中涉及的核參數與懲罰因子,可進行智能優化[13]。人工蜂群優化算法的全局搜索能力較強,其收斂速度尚有進一步提高的空間。因此,擬采用支持向量機對儲糧害蟲進行分類識別,并改進蜂群優化算法,以此搜索最佳核參數與懲罰因子。
本研究提出了一種基于紋理和形狀綜合特征的儲糧害蟲分類方法。首先利用擴展剪切波變換提取紋理特征,依據Krawtchouk矩不變量描述形狀特征;然后運用支持向量機對綜合特征向量樣本進行訓練和分類,通過全局混沌蜂群算法優化支持向量機的核參數與懲罰因子,大大節省了搜尋時間;最后給出了基于紋理和形狀綜合特征的儲糧害蟲分類方法結果,并分別與基于Gabor小波和支持向量機方法、基于Krawtchouk不變矩和支持向量機方法進行了定量比較。
Shearlet是合成小波的一個特例,Shearlet變換可由合成小波理論導出[14]。在二維空間里,若合成膨脹的仿射系統構成緊框架,則該系統的元素稱為合成小波。該仿射系統形式見式(1)。

式中:ψ∈L2(R2),j,l∈Z,k∈Z2;A和B為2×2可逆矩陣,|detB|=1。如果ψ滿足文獻[15]中的相關條件,且各向異性擴張矩陣剪切矩陣那么函數系統{Ψa,s,k(x)=a-3/4Ψ(Aa-1Bs-1x-k)}稱 作Shearlet系統。式中:a∈R+,為尺度參數;s∈R,為剪切參數;k∈R2,為平移參數。
對于任一函數f∈L2(R2),連續Shearlet變換定義為:

在Shearlet變換的基礎上,Wang-Q重新構造了緊支撐Shearlet框架,提出了擴展離散Shearlet變換(簡稱擴展Shearlet變換),能夠快速實現離散Shearlet變換[16]。該變換定義 a=2j(j稱為尺度值),承繼原有的Shearlet變換框架,用可分離小波得到額外的基函數,使得每個剪切矩陣獲得一個正交基。正交基的基元素即是一個各向異性窗口函數,方向由剪切參數s所確定。采用擴展Shearlet變換分解圖像f時,可按照圖1所示的流程進行。首先,分別利用剪切矩陣得到水平錐子圖和垂直錐子圖;再分別進行剪切變換,各得到m個方向子圖像;最后,分別根據尺度值j進行各向異性離散小波變換,得到不同方向i和不同尺度值j的水平錐子帶圖像 si,j、垂直錐子帶圖像 ci,j,從而實現多尺度多方向性離散Shearlet變換。當分解層數為L時,尺度向量 χ=[χ1,χ2,...,χj,...,χL]的每個分量決定了尺度j下的水平錐方向或垂直錐方向的支撐大小。參數m由方向向量 D=[d1,d2,…,dj,…,dL]確定,尺度j時m=2×2dj+1。

圖1 擴展Shearlet變換
擴展Shearlet變換得到的子帶圖像,是原圖像在不同方向、不同頻段上的映射結果,代表不同分辨率的時頻局部信息。頻段由尺度值j決定。j越小,對應頻段的頻率越高,子帶圖像顯示的細節越明顯。
計算子帶圖像的平方均值ei,j:

式中:P和Q分別為子帶圖像的行數和列數;x為子帶圖像si,j或ci,j的系數;ei,j表示子帶圖像的能量分布均值,以此作為儲糧害蟲的紋理特征值。
不同子帶圖像的能量分布均值不一樣,反映不同程度的紋理細節,體現不同的分類能力。能量分布均值總體是隨著尺度j的增大逐漸提高。高尺度子帶圖像的能量分布均值較大,對分類的影響過于顯著;而低尺度的子帶圖像含有更豐富的紋理細節,其能量分布均值更有利于分類器的正確分類。因此,需要對不同尺度下子帶圖像的能量分布均值加權,用以平衡對分類器的貢獻。以水平錐子圖為例,加權過程:
1)計算尺度j下的能量均值之和
3)得到加權后的能量分布均值hi,j=zj·ei,j,則原圖像的水平錐部分紋理特征向量H1={ hi,j}。
同理可得垂直錐部分紋理特征向量H2,從而得到儲糧害蟲圖像的紋理特征向量:

Krawtchouk矩作為離散正交矩,克服了連續矩誤差大、計算復雜的缺點,與Hu矩、Zernike矩等其他矩相比,對圖像形狀特征的描述更有優勢?,F利用Krawtchouk矩不變量方法[17],來獲取儲糧害蟲圖像的形狀特征。
n階Krawtchouk多項式是Krawtchouk矩的基函數,其定義為:

式中:x,n=0,1,2,...,G,G>0,p∈ (0,1),2F1(·)是超幾何函數[18]。
設圖像大小為M×N,對圖像平移、旋轉、尺度變換保持不變性的(m+n)階Krawtchouk矩不變量為:

式中:m,n≥0,p1,p2∈(0,1),ρ(m)?ρ(m;p1,M),

式中:w(x)?w(x,p1,M),w(y)?w(y,p2,N),


由Krawtchouk矩不變量構造儲糧害蟲圖像的形狀特征向量:

為了避免特征向量元素因過大或過小而影響儲糧害蟲分類的準確率,首先將儲糧害蟲圖像紋理特征向量H的元素和形狀特征向量K的元素分別歸一化,然后組合成綜合特征向量。
設特征向量(紋理特征向量H或形狀特征向量K)為 Γ=(Γ1,Γ2,...,Γi,...,Γt),t∈Z+,Γ中元素的最大值為Γmax,最小值為Γmin。設歸一化后的特征向量為,則

按式(8)將H的元素和K的元素分別歸一化后得到和,由此構成儲糧害蟲圖像的綜合特征向量為:

提取了儲糧害蟲圖像的綜合特征向量之后,需要尋求合適的分類器。由于儲糧害蟲的樣本數相對有限,而支持向量機對小樣本具有較優越的學習能力和較高的分類精度,考慮到支持向量機是兩類識別模型,要識別多種儲糧害蟲,需要構造支持向量機多分類算法。常見的多分類算法有一對一、一對其余。針對J類分類問題,一對一算法需構造C2J個支持向量機,而一對其余算法僅需構造J個支持向量機,且適用于中小規模問題。因此選擇一對其余算法,其原理為:每類訓練樣本有一個分類器,用以區分本類和剩余其他類訓練樣本,分類結果由分類間隔最大的分類器決定。
支持向量機需要選擇合適的核函數變換到高維空間。鑒于高斯徑向基核函數在缺乏先驗知識環境下具有解決分類問題的能力,本研究即采用高斯徑向基核函數的支持向量機作為分類器。該分類器涉及樣本錯分懲罰因子G和高斯徑向基核參數δ。G和δ2個參數的正確選取直接影響樣本的分類精度。
現采用全局混沌蜂群算法對懲罰因子G和核參數δ進行優化,以便達到最佳分類效果。
受蜂群采蜜模式的啟發,建立起了基本人工蜂群優化算法。其主要特點是引領蜂、觀察蜂、偵查蜂3種蜂群協作運行,通過局部尋優得到全局最優值。基本人工蜂群優化算法具有較強的全局搜索能力,但算法性能易受最大循環次數設定值的影響。如果最大循環次數設置得過小,可能難以搜索到最佳值;反之設置得過大,又會降低收斂速度,同時還可能因為遍歷性不夠,出現“早熟”現象。鑒于以上問題,將中心Tent映射的混沌序列引入到基本人工蜂群算法。中心Tent映射的數學表達式為:

在當前可能的全局最佳值連續σ次循環不變時,用中心Tent映射的混沌序列代替較差的食物源,繼續搜索,直至可能的全局最佳值循環不變次數達到設定值τ時終止。這種改進后的人工蜂群算法(稱之為全局混沌蜂群算法)能夠提高算法的遍歷性,加快收斂速度。
現利用全局混沌蜂群算法優化支持向量機的懲罰因子G和核參數δ,具體算法步驟:
1)設置算法的控制參數。設蜜蜂總數為40,引領蜂和觀察蜂的個數各20,最大循環次數為20,跳出局部極值的次數界限CL為3,維數為2,G和δ的搜索范圍分別為[0.1,1000]、[0.01,10],循環次數C的初始值為1,σ、τ分別設為3、6;
2)對引領蜂相應食物源的位置進行初始化。食物源的位置是二維向量,其2個分量各在G和δ的搜索范圍之間隨機產生;
3)首先計算訓練樣本的特征向量,供支持向量機進行訓練;然后計算測試樣本的特征向量,輸入到訓練后的支持向量機進行分類,并根據輸出結果得到分類識別率,將其作為目標函數。
4)每1只引領蜂在其周圍隨機搜尋具有更高識別率的食物源;
5)引領蜂對應食物源的優劣程度決定觀察蜂選擇該引領蜂的概率,隨后觀察蜂進一步搜索。
6)如果經過CL次循環,某些食物源沒有改善,用隨機產生的新食物源代替。
7)當次循環結束時,儲存當前全局最優解。如果連續σ次或σ+1次不變,利用中心Tent映射的混沌序列代替目前較差食物源。如果不變次數達到τ次,即得到全局最佳值,跳出循環,否則C自動加1;
8)若C達到最大循環次數,輸出懲罰因子G和核參數δ的最佳值。否則,轉第3步。
針對玉米象、鋸谷盜和赤擬谷盜3種最為常見、危害最大的儲糧害蟲,進行了特征提取和分類試驗。經過圖像采集、灰度化、閾值分割步驟后,將害蟲從儲糧環境中提取出來,最后共獲取78幅儲糧害蟲圖像(每種害蟲圖像26幅),每幅圖像的大小為128×128、灰度級數為256。圖像中害蟲種類已在圖像采集前經過生物鑒定。圖2為其中6幅分割后的儲糧害蟲圖像。隨機選取每種害蟲的10幅圖像作為全局混沌蜂群算法優化后支持向量機的訓練樣本,其余16幅圖像作為分類的測試樣本。

圖2 分割后的儲糧害蟲圖像
對儲糧害蟲圖像進行特征提取時,須設置擴展Shearlet變換和Krawtchouk矩不變量的相關參數。經過大量試驗和比較,參數設置:擴展Shearlet變換的分解層數L=4,j=1,2,3,4,χ=[2 2 3 4],D=[2 2 1 1],則紋理特征向量H的維數為56;Krawtchouk矩不變量的階數m+n=3,形狀特征向量K的維數為6。從而,綜合特征向量Π的維數為62。
具體步驟:
1)對儲糧害蟲圖像進行擴展Shearlet變換,依據式(4)提取其紋理特征向量H;計算儲糧害蟲圖像的Krawtchouk矩不變量,由式(7)構造其形狀特征向量K;按照式(9)將這2種特征向量組合為儲糧害蟲圖像的綜合特征向量Π;
2)將30組儲糧害蟲圖像的綜合特征向量作為訓練樣本數據,載入支持向量機進行訓練,將剩余48組綜合特征向量作為測試樣本數據,輸入支持向量機進行分類,用全局混沌蜂群優化算法選取達到最佳分類識別率的參數;
3)利用優化后的支持向量機對玉米象、鋸谷盜和赤擬谷盜3種害蟲的任一圖像進行分類識別。如果要識別其他種類害蟲,可按照類似方式進行。
結果得出當支持向量機的懲罰因子G=814.58、核參數δ=1.33時,分類識別率最高。為了驗證方法的有效性,將本研究提出的基于擴展Shearlet變換、Krawtchouk矩不變量及全局混沌蜂群優化支持向量機的儲糧害蟲分類方法,與基于Gabor小波和SVM方法、基于Krawtchouk不變矩和SVM方法進行了比較。表1為3種方法的分類結果。其中,方法A、方法B、方法C分別表示基于Gabor小波和SVM方法、基于Krawtchouk不變矩和SVM方法及本方法。計算3種方法對應的識別率,列于表2。
從表1可以看出,方法A判斷錯誤的圖像為第12、15、27、29、33、44、45、47、48幀;方法 B判斷錯誤的圖像為第 2、24、26、27、29、30、32、47;方法 C判斷錯誤的圖像為第34幀。對于方法A和方法B僅1種方法誤判的第 2、12、15、24、26、30、32、33、44、45、48圖像,方法C都做出了正確判斷;而對于方法A和方法B同時判斷錯誤的第27、29、47幀圖像,方法C也同樣都做出了正確判斷。表1中序號12為圖2b、序號24為圖2c,圖2b和圖2c中害蟲皆有缺陷。圖2b的玉米象紋理不顯著,基于Gabor小波方法未能識別;圖2c的鋸谷盜肢體缺失導致形狀不完整,基于Krawtchouk不變矩方法判斷錯誤。由此表明,Gabor小波的紋理特征提取方法或基于Krawtchouk不變矩的形狀特征提取方法失效的情況下,本研究提出的基于擴展Shearlet變換、Krawtchouk矩不變量的紋理和形狀綜合特征提取方法能夠有效地識別儲糧害蟲圖像。再由表2可知,基于Gabor小波和SVM

表1 3種方法的分類結果

表2 3種方法的識別率比較
采集有些害蟲圖像時,可能受到糧食顆粒、光照等影響,產生圖2所示的紋理不顯著、局部變形或害蟲肢體缺失等不利因素。對這些樣本僅僅提取單一的紋理特征或者形狀特征,不能充分地表示儲糧害蟲圖像特征,影響了支持向量機的準確訓練和分類。此外,Gabor小波變換捕捉細節能力的不足,也降低方法對赤擬谷盜的識別率較低,基于Krawtchouk不變矩和SVM方法對鋸谷盜的識別能力較差。而本研究提出的方法對玉米象、鋸谷盜和赤擬谷盜的分類識別率都很高,說明本研究提出的基于擴展Shearlet變換、Krawtchouk矩不變量及全局混沌蜂群優化支持向量機方法是一種行之有效的儲糧害蟲分類識別方法。了儲糧害蟲分類水平。而依據擴展Shearlet變換提取紋理特征,用Krawtchouk矩不變量描述形狀特征,能夠優勢互補,更加完整地描述儲糧害蟲圖像特征。其對圖像中儲糧害蟲的紋理或形狀缺陷有較強的抗干擾性,有利于支持向量機的分類識別。
針對儲糧害蟲圖像,提出了一種基于紋理和形狀的分類識別方法。首先,依據擴展Shearlet變換提取儲糧害蟲圖像的紋理特征,用Krawtchouk矩不變量描述其形狀特征,2種特征相結合構成儲糧害蟲圖像的綜合特征向量;然后利用SVM對其進行分類識別,采用改進后的全局混沌蜂群算法優化支持向量機的懲罰因子和核參數,使分類性能達到最優。該方法充分利用了擴展Shearlet變換和Krawtchouk矩不變量特征提取方面的優勢,具有更好的識別效果。結果表明,與基于 Gabor小波和 SVM方法、基于Krawtchouk不變矩和SVM方法相比,本研究提出的基于擴展Shearlet變換、Krawtchouk矩不變量及全局混沌蜂群優化支持向量機的儲糧害蟲分類方法,具有更好的分類識別性能,有更強的魯棒性,可望在儲糧害蟲自動檢測中得到廣泛應用。
[1]范艷峰,吳建軍,甄彤.基于屬性降維的糧庫害蟲檢測與識別[J].微電子學與計算機,2006,23(11):12-15
[2]Pearson T C,Brabec D L,Schwartz C R.Automated detection of internal insect infestations in whole wheat kernels using a Perten SKCS4100[J].Applied Engineering in Agriculture,2003,19(6):727-733
[3]Ridgway C,Davies E R,Chambers J,et al.Rapid machine vision method for the detection of insects and other particulate bio-contaminants of bulk grain in transit[J].Biosystems Engineering,2002,83(1):21-30
[4]郭敏,秦昕,馬苗.基于圖像處理的谷物檢測與識別方法研究進展[J].中國糧油學報,2012,27(4):123-128
[5]毛罕平,張紅濤.儲糧害蟲圖像識別的研究進展及展望[J].農業機械學報,2008,39(4):175-179
[6]張紅濤,毛罕平,邱道尹.儲糧害蟲圖像識別中的特征提取[J].農業工程學報,2009,25(2):126-130
[7]胡玉霞,張紅濤,羅康,等.基于ACO-SVM的糧蟲特征提取研究[J].安徽農業科學,2012,40(6):3781-3782,3785
[8]趙娟.基于Gabor小波與支持向量機對儲糧害蟲分類識別[J].計算機與現代化,2008,(4):67-69,73
[9]胥斌,唐遠炎,房斌.基于剪切波變換的紋理圖像分類[J].計算機工程與應用,2011,47(29):15-17,68.
[10]皺修國,丁為民,劉德營,等.基于4種不變矩和BP神經網絡的稻飛虱分類[J].農業工程學報,2013,29(18):171-178.
[11]許振偉.BP神經網絡分類器在儲糧害蟲圖像檢索中的應用研究[J].中國糧油學報,2010(1):103-106
[12]甄彤,范艷峰.基于支持向量機的儲糧害蟲分類識別技術研究[J].計算機工程,2006,32(9):167-169
[13]胡玉霞,張紅濤.基于模擬退火算法-支持向量機的儲糧害蟲識別分類 [J].農業機械學報,2008,39(9):108-111
[14]Guo K,Labate D.Optimally sparsemultidimensional representation using Shearlets[J].SIAM Journal on Mathematical Analysis,2007,39(1):298-318
[15]Easley G,Lim W,Labate D.Sparse directional image representations using the discrete Shearlet transform[J].Applied and Computational Harmonic Analysis,2008,25(1):25-46
[16]Wang-Q Lim.The discrete Shearlet transform:A new directional transform and compactly supported Shearlet frames[J].IEEE Transactions on Image Processing.2010,5(19):1166-1180
[17]吳一全,朱麗,周懷春.基于Krawtchouk矩和支持向量機的火焰狀態識別[J].中國電機工程學報,2013,33:1-7
[18]Zhang L,Xiao W,Qian G,et al.Rotation,scaling,and translation invariant local watermarking technique with Krawtchouk moments[J].Chinese Optics Letters,2007,5(1):21-24.
A Classification Method of Stored-Grain Pests Based on the Extended Shearlet Transform,Krawtchouk Moment and SVM
Wu Yiquan1,2Wang Kai1Tao Feixiang1
(College of Electronic and Information Engineering,Nanjing University of Aeronautics and Astronautics1,Nanjing 210016)(Jiangsu Key Laboratory of Quality Control and Further Processing of Cereals and Oils,Nanjing University of Finance Economics2,Nanjing 210046)
To further improve the recognition accuracy of stored-grain pests and control stored-grain pests in amore effective way,a classificationmethod of stored-grain pests has been proposed based on the synthetic features combining texture feature with shape feature and Support Vector Machine(SVM)to be optimized by global chaotic bee colony algorithm.First,an image with stored-grain pests was decomposed by the extended shearlet transform;means of energy distribution were calculated by transform coefficients;texture feature vector was produced with the weighted energy distribution.The shape feature vector of stored-grain pestswas represented by Krawtchouk moment invariants.Second,the normalized texture feature vector and the normalized shape feature vector were combined to form the synthetic feature vector of stored-grain pests.Finally,the kernel parameter and the penalty factor of support vectormachine were optimized with global chaotic bee colony algorithm;the optimized support vectormachine was applied for classification of stored-grain pests.The experimental results showed that compared with themethod based on Gabor wavelet and SVM and themethod based on Krawtchouk moment invariants and SVM,the proposed method extracted more complete characteristic information of stored-grain pestswith higher recognition rate.
classification of stored-grain pests,texture feature,shape feature,extended shearlet transform,Krawtchouk moment invariants,support vectormachine,global chaotic bee colony algorithm
S24;TP391.41
A
1003-0174(2015)11-0103-07
江蘇省糧油品質控制及深加工技術重點實驗室開放基金(LYPK201304),江蘇高校優勢學科建設工程資助(20111008)
2014-04-20
吳一全,男,1963年出生,教授,圖像處理與計算機視覺