999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進差分進化算法的鱗翅目昆蟲圖像識別方法*

2020-04-28 07:10:12林達坤黃世國張飛萍梁光紅吳松青
林業科學 2020年3期
關鍵詞:特征

林達坤 黃世國 張飛萍 梁光紅 吳松青 胡 霞 王 榮

(1. 福建農林大學 智慧農林褔建省高校重點實驗室 福州 350002; 2. 福建農林大學 生態公益林重大有害生物防控福建省高校重點實驗室 福州 350002)

鱗翅目(Lepidopteran)昆蟲是昆蟲綱(Insecta)中第二大目,包括蛾、蝶2類,對林木和農作物危害嚴重,盡早發現并準確鑒別對其生物防治具有重要意義。但鱗翅目昆蟲種類繁多,形態各異,尤其是森林生態系統的復雜性,導致其鱗翅目昆蟲種類多樣性遠高于農田生態系統(趙汗青等, 2002),極大地增加了基層林業部門及時、科學地防控害蟲的難度。因此,研發該類昆蟲自動識別技術十分必要。

20世紀90年代以來,圖像處理技術的發展使昆蟲自動識別成為可能,通過計算機視覺技術模擬人類識別標本的方式實現昆蟲自動識別的研究取得了實質性進展(竺樂慶等, 2013)。Tofilski(2004)開發出DrawWing軟件,通過提取昆蟲翅脈交點實現了昆蟲識別。Ashaghathra等(2007)基于圖像的模板匹配技術,自動識別出象甲類昆蟲。Larios等(2010)采用Haar方法提取圖像特征,并將其與一種具有空間匹配核的支持向量機(support vector machine, SVM)相結合,自動識別了石蠅類昆蟲。Yang等(2015)通過提取昆蟲翅膀輪廓特征實現了昆蟲自動識別,并開發出相應的軟件系統。竺樂慶等(2015a)提取鱗翅目昆蟲圖像的顏色名和OpponentSIFT(Opponent scale invariant feature transform)特征,并使用SVM進行分類,有效實現了對鱗翅目昆蟲圖像的識別。蔡小娜等(2016)利用蛾類右前翅翅脈特征對7種夜蛾昆蟲進行數字化分類研究,證明該特征參數可用于蛾類昆蟲的數字化分類鑒定。周愛明等(2017)運用遷移學習方法對已訓練好的CaffeNet模型進行參數微調,獲得了蝴蝶科級標本圖像自動識別的卷積神經網絡模型。

然而,現有研究尚存在一些問題:一是基于深度學習的昆蟲圖像識別需要大量圖像,在小的圖像數據集上的識別性能不理想;二是傳統圖像識別方法在圖像數量較少的情況下也有可能取得較好效果,但較少考慮相關特征、冗余特征以及噪聲特征對分類性能的影響,性能仍有提升的空間;三是較少使用開源的鱗翅目昆蟲圖像數據集。

特征選擇是影響昆蟲識別性能的重要因素,在鱗翅目昆蟲識別過程中,紋理特征已被證明是有效識別特征之一(竺樂慶等, 2015b),筆者局部二值模式是表征紋理特征的有效方法(黃世國, 2008; 李小林等, 2016),但特征選擇對昆蟲識別的影響還需進一步研究(Mehtaetal., 2016)。

鑒于此,本研究采用開源的利茲蝴蝶數據集和拍攝的以森林鱗翅目昆蟲為主的數據集,利用局部二值模式算法提取昆蟲圖像特征形成特征矩陣,應用改進的差分進化算法進行特征選擇,并將篩選后的特征輸入到基于概率協同表示的分類器(probabilistic collaborative representation based classifier, PROCRC)中(Caietal., 2016),構建高效率、高識別率的昆蟲識別模型,以準確、快速地識別出鱗翅目昆蟲種類。

1 材料與方法

1.1 鱗翅目昆蟲圖像數據集

本研究使用2個鱗翅目昆蟲圖像數據集,分別為利茲蝴蝶數據集(Wangetal., 2009)和本課題組拍攝的鱗翅目昆蟲標本照。這些鱗翅目昆蟲大多棲息在森林中,其中馬尾松毛蟲(Dendrolimuspunctatus)、柳杉毛蟲(Dendrolimushoui)、榕透翅毒蛾(Perinanuda)、綠尾大蠶蛾(Actiasseleneningpoana)、茶蠶蛾(Andracabipunctata)、灰白蠶蛾(Ocinaravarians)、蕾鹿蛾(Amatagermana)等還是重要的林業害蟲。

利茲蝴蝶數據集為開源數據集,包含10種蝴蝶,共832幅蝴蝶圖像(圖1)。拍攝的圖像均來自不同的蝴蝶樣本,姿態各異。

圖1 利茲蝴蝶數據集的10種蝴蝶圖像Fig.1 Images of ten species of butterflies from Leeds butterfly datasetA: 黑脈金斑蝶 Danaus plexippus; B: 黃條袖蝶 Heliconius charitonius; C: 紅帶袖蝶 Heliconius erato; D: 鹿眼蛺蝶 Junonia coenia; E: 紅灰蝶 Lycaena phlaeas; F: 喪服蛺蝶 Nymphalis antiopa; G: 美洲大芷鳳蝶 Papilio cresphontes; H: 白粉蝶 Pieris rapae; I: 優紅蛺蝶 Vanessa atalanta; J: 小紅蛺蝶 Vanessa cardui.

鱗翅目昆蟲標本照是在不同拍攝條件用數碼相機拍攝獲得的,其拍攝條件分別為是否開閃光、不同感光度(400、800、1 600、3 200和6 400)、不同快門速度(1/250 s、1/500 s、1/1 000 s、1/2 000 s和1/3 200 s)、不同光圈大小(F5.6、F8、F11、F16、F22)以及不同拍攝角度(0°和90°)。拍攝了12種鱗翅目昆蟲,共1 761幅圖像(圖2)。該數據集是針對不同種類的多個標本進行拍攝的,每個種類的原始標本數量不等。

圖2 12種鱗翅目昆蟲的標本圖像Fig.2 Images of twelve Lepidopteran species taken from specimensA: 檗黃粉蝶 Eurema blanda; B: 茶蠶蛾 Andraca bipunctata; C: 東方粉蝶 Pieris canidia; D: 斐豹蛺蝶 Argynnis hyperbius; E: 黃星尺蛾 Arichanna melanaria fraternal; F: 灰白蠶蛾 Ocinara varians; G: 蕾鹿蛾 Amata germana; H: 柳杉毛蟲 Dendrolimus houi; I: 綠尾大蠶蛾 Actias selene ningpoana; J: 馬尾松毛蟲 Dendrolimus punctatus; K: 榕透翅毒蛾 Perina nuda; L: 長喙天蛾 Macroglossum corythus luteata.

1.2 鱗翅目昆蟲圖像特征提取

鱗翅目昆蟲翅膀具有明顯的紋理特征。紋理是指存在于圖像中某一范圍內的形狀很小的、半周期性或有規律地排列的圖案,而紋理特征則是對紋理的數字化描述。局部二值模式是描述紋理的有效方法,主旋轉局部二值模式(Dominant rotated local binary patterns, DRLBP)(Mehtaetal., 2016)則是具旋轉不變性的局部二值模式方法。同時,由于背景簡單,在本研究中,直接對整張圖像應用DRLBP提取昆蟲圖像紋理特征。該算法能有效提取完整結構信息,具有旋轉不變性和計算效率高的特點。

1.3 紋理特征選擇

群智能計算方法在全局搜索方面比傳統特征選擇算法更具優勢,其中差分進化算法(Stornetal., 1997)是有代表性的群智能計算方法,其二進制差分進化算法(binary differential evolution, BDE)已用于特征選擇(Pamparaetal., 2006)。該算法包括初始化種群、評價種群、變異操作、交叉操作、選擇操作等。

為了將算法從連續空間變換到離散空間,初始化種群時采用下式:

(1)

式中:xi,j代表種群里第i個粒子在第j維上的取值;randj代表在[0,1]之間產生的隨機數。

評價種群應用5-fold交叉驗證劃分數據,采用基于概率協同表示的分類器(probabilistic collaborative representation based classifier, PROCRC)預測鱗翅目昆蟲種類,該分類器是比支持向量機和K最近鄰具有更好的分類性能(Zhangetal., 2011; Caietal., 2016)。

變異操作方式為DE/current-to-best/1,見下式:

(2)

交叉操作見下式:

(3)

上述操作中,CR和F的取值是否適當將顯著影響算法的性能。

為此,本研究提出一種具有動態變化F值的二進制差分進化算法,簡稱二進制自適應差分進化算法(binary adaptive differential evolution, BADE)。該算法的主要思想是根據種群多樣性的變化來自適應地調節F值。

BADE采用漢明距離來度量兩粒子間的相似性,見下式:

(4)

式中:D是維數;Xi,Xj是種群中2個不同的粒子。

通過計算種群中粒子兩兩之間的相似性,可得種群的多樣性,見下式:

(5)

式中:N代表種群大??;mean表示求平均值。

在算法迭代過程的前期需要較多的全局搜索,后期隨著種群多樣性慢慢遞減則需要較多的局部搜索。一般縮放因子F的取值在[0,2]之間,因此根據種群多樣性的遞減情況可構造出下式來自適應地計算F值:

(6)

式中:Avet代表第t次迭代時種群的多樣性;Ave0代表種群初始化時的多樣性。

本研究提出的BADE方法的偽代碼如算法1所示。

算法1

輸入: 種群粒子的數量N,算法的總迭代次數T,問題的維數D。

輸出: 問題的最優解,最佳適應度值。

初始化種群

Whilet

利用式(6)計算當前迭代的F值。

Fori=1 toN

利用式(2)進行變異操作。

利用式(3)進行交叉操作。

評價產生的新粒子后,進行選擇操作。

End

End

該算法中適應度值即昆蟲識別的準確率用下式表示:

(7)

為說明BADE算法的性能,采用K近鄰(Knearest neighbor, KNN)(李凡, 2015)和PROCRC分類器,比較了無特征選擇、基于頻繁出現模式的特征選擇(Mehtaetal., 2016)、BDE、BADE方法的鱗翅目昆蟲識別準確率。同時,為了進一步說明算法的魯棒性,本研究也給出了F1得分值,該指標基于混淆矩陣,綜合考慮了查準率和召回率(周志華等, 2009)。其計算公式如下:

(8)

式中:R和P分別是召回率和查準率。

1.4 參數設置

KNN分類器的K值為5。BADE的參數設置為: 種群大小為50,最大迭代次數為200,CR為0.6,BDE的F值為0.9。

所有算法操作由美國MathWorks公司出品的MATLAB(R2014b)編程實現。所有試驗均在3.40 GHz CPU和8 GB RAM的Intel Core i5機器上運行。

2 結果與分析

2.1 無特征選擇的鱗翅目昆蟲圖像識別

對利茲蝴蝶數據集和本課題組收集的鱗翅目昆蟲圖像數據集用DRLBP提取紋理特征,將其作為PROCRC和KNN分類器的輸入。同時,為了保證算法的魯棒性,算法重復運行5次。每次運行均采用5折交叉驗證方法,每次將數據集分成5份,任意選擇其中4份作為訓練集,剩余1份作為測試集。應用t檢驗衡量不同方法在識別準確性上的差異顯著性(薛薇, 2011)。其分類結果見表1。

表1 2個數據集的識別結果Tab.1 Recognition result of two datasets

由表1可知,對利茲蝴蝶數據集,使用PROCRC分類器和KNN分類器的平均識別率為81.73%和39.61%; 對本課題組收集的鱗翅目昆蟲圖像數據集,則平均識別率分別為88.18%和83.87%。這說明對上述2個數據集PROCRC分類器的識別性能均顯著高于KNN分類器。

由表2可知,分類器對不同種類的昆蟲識別率差異較大。在利茲數據集中,紅帶袖蝶體色紅、白、黑相間,體表較為光滑,紋理特征不明顯,樣本數量較少; 優紅蛺蝶的花紋較為復雜,輪廓與黑脈金斑蝶、白粉蝶和小紅蛺蝶相似,容易造成誤判。因此,2種分類器對紅帶袖蝶和優紅蛺蝶的分類性能均較差。在本課題組中拍攝的昆蟲圖像數據集中,2種分類器對檗黃粉蝶、東方粉蝶、斐豹蛺蝶和長喙天蛾的識別性能不理想,其主要原因是檗黃粉蝶、東方粉蝶、斐豹蛺蝶和長喙天蛾的樣本數量相對較少,不利于模型的構建,其樣本數量分別為7、12、5和27。

綜上所述,對于鱗翅目昆蟲圖像識別而言,PROCRC分類器具有更優的識別性能。同時,該分類器對不同種類的昆蟲識別性能差異大,說明該方法在性能上有進一步提升的空間。

2.2 基于改進的差分進化算法的鱗翅目昆蟲識別

為了進一步評價本研究提出的BADE算法的性能,將其與基于頻繁出現模式的特征選擇方法、BDE進行比較。

利用2.1部分提取的昆蟲圖像紋理特征數據集,分別利用頻繁出現模式、BDE和BADE方法篩選紋理特征,其識別準確性見表3。由表3可知,對利茲蝴蝶數據集和本課題收集的圖像數據集,基于頻繁出現模式的PROCRC算法的識別率分別為65.92%和84.55%,與原來相比分別降低了15.81%和3.63%,這說明該方法在特征選擇過程中可能濾掉了部分有用的特征; 基于頻繁出現模式的KNN算法的識別率與原來相比則分別提升了12.64%和0.24%。BDE特征選擇方法也能有效提高分類器的識別準確性,其對PROCRC算法的提升率分別為3.29%和0.68%,對KNN算法的提升率分別為9.93%和2.29%。與BDE相比,BADE更進一步提高了識別準確性,用PROCRC分類器時,其準確性分別提高了5.81%和1.66%,用KNN分類器時則分別提高了13.49%和3.09%。

由上可知,應用合適的特征選擇方法有助于提高鱗翅目昆蟲的識別準確性。本研究提出的BADE算法在不同的數據集下均比BDE算法和基于頻繁出現模式的特征選擇方法取得最優的分類準確性。

為了進一步說明BADE算法的性能,本研究給出了該算法對2個數據集的每類昆蟲識別率的影響(表4)。

由表4可知,對利茲蝴蝶數據集分類時,使用PROCRC分類器,BADE方法提升了黑脈金斑蝶、紅帶袖蝶、鹿眼蛺蝶、紅灰蝶、喪服蛺蝶以及美洲大芷鳳蝶的識別率,其提升率分別為2.43%、7.95%、10%、4.7%、3%、8.03%,這說明了BADE有效去除了降低識別率的冗余特征。使用KNN分類器時,除了白粉蝶外,其他種類的昆蟲的識別率均得到提升,其中黑脈金斑蝶的識別提升率甚至達到29.41%,這說明在利茲蝴蝶數據集分類識別中,BADE方法也顯著提升了KNN算法的分類性能。

表2 2個數據集中每類昆蟲的識別率Tab.2 Recognition rate of each insect species in two datasets

對本試驗收集的圖像數據集進行分類時,使用PROCRC分類器時,BADE方法提升了黃星尺蛾、柳杉毛蟲和馬尾松毛蟲的識別率,其提升率分別為1.85%、0.27%、0.28%。使用KNN分類器時,BADE方法則提升了檗黃粉蝶、黃星尺蛾、蕾鹿蛾、柳杉毛蟲、綠尾大蠶蛾、榕透翅毒蛾以及長喙天蛾的識別率,其提升率分別為20%、0.61%、16.66%、1.07%、20%、1.73%、11.34%。

由上可知,在不同的鱗翅目數據集中,BADE算法可以顯著提升大部分昆蟲類別的識別準確性。為了進一步說明BADE算法的優點,分別從算法穩定性、降低的維數和運行時間進行評價。應用F1值評價不同特征選擇方法的穩定性(表5)。由表5可知,BADE在不同數據集和不同分類算法上的F1值均大于其他2種特征選擇方法。

表3 基于特征選擇的2個數據集識別結果Tab.3 Recognition result of two datasets based on feature selection

表4 基于BADE的2個數據集中每類昆蟲的識別率Tab.4 Recognition rate of each insect species in two datasets based on BADE

表5 BADE與其他2種特征選擇方法的F1值Tab.5 F1-score between BADE and other two feature selection methods

由表6可知,使用BADE算法后,2個數據集的維數均顯著降低,其維數下降率接近50%。由圖3可知,經BADE特征選擇后,簡化了識別過程的計算量使昆蟲的識別時間都減小了,其時間減少率最高達到50%。

表6 BADE選擇后的特征維數Tab.6 Dimension of feature after BADE selection

圖3 BADE特征選擇后的時間差異Fig.3 Time difference after BADE feature selectionLBD-PROCRC: 對利茲蝴蝶數據集使用PROCRC進行分類 Classify Leeds butterfly dataset by PROCRC; LBD-KNN: 對利茲蝴蝶數據集使用KNN進行分類 Classify Leeds butterfly dataset by KNN; LID-PROCRC: 對鱗翅目昆蟲數據集使用PROCRC進行分類Classify Lepidopteran insect dataset by PROCRC; LID-KNN: 對鱗翅目昆蟲數據集使用KNN進行分類 Classify Lepidopteran insect dataset by KNN.

3 討論

近年來,隨著計算機圖像處理技術的發展,基于圖像的昆蟲識別取得了許多突破,但在實際應用中仍存在一定的問題。

在圖像收集方面,目前大部分研究在收集圖像時都采用統一的標準,例如趙汗青等(2002)在拍攝昆蟲圖像時,統一了焦距且利用昆蟲左右對稱原理修補了殘缺的圖像; 竺樂慶等(2015a)在拍攝鱗翅目昆蟲圖像時,統一了光圈大小、快門速度、焦距以及排放姿態。這些措施提高了圖像的識別精度,但降低了識別模型的普適性。因此,本研究在拍攝標本圖像時,采用不同的拍攝條件,其拍攝條件分別為是否開閃光、不同感光度、不同快門速度、不同光圈大小以及不同拍攝角度。同時我們還利用了開源的利茲蝴蝶數據集。基于這些數據集更能測試模型的普適性和魯棒性。

在特征提取方面,傳統的圖像特征往往是顏色、形狀特征、翅脈特征等。顏色特征對圖像本身尺寸、方向、視角的依賴性較小,從而具有較高的魯棒性,但基于顏色特征的昆蟲自動識別難點在于同種昆蟲顏色特征差異有可能很大; 形態特征適用于體態較完整的昆蟲以及個體和形態差異較大的昆蟲識別,但昆蟲樣本的完整性和標本擺放一致性嚴重影響識別結果。同時,卷積神經網絡方法可以有效獲得圖像的特征,但要求有大量的圖像集作為訓練數據(Krizhevskyetal., 2012)。因此,本研究利用DRLBP算法提取鱗翅目昆蟲圖像的紋理特征。該算法保留了傳統算法有效提取完整結構信息的優點,對噪聲有較強的抵抗能力,也適用于小數據集。與傳統紋理特征提取算法相比,DRLBP提取的紋理特征具有更強的辨別能力與旋轉不變性(Mehtaetal., 2016)。

已有的昆蟲圖像的特征向量過多,降低了模型的識別精度、增加了識別時間,存在冗余或者不相關的特征。因此,本研究引進智能優化算法進行特征選擇,并提出了改進的BADE算法。該算法具有結構簡單、易于實現的優點,且得到的特征子集的分類性能較好。同時,注意到在本研究中當某種昆蟲樣本數量較少時,該種類的識別率易受到影響,如本研究中個別昆蟲種類在特征選擇后其識別率反而降低了。這說明足夠數量的昆蟲樣本對于識別也很重要。

在分類器選擇方面,目前應用于昆蟲識別的分類器有SVM(Lariosetal., 2010; 竺樂慶等, 2015a; 周愛明等, 2017)、BP神經網絡(竺樂慶等, 2013)等。這些分類器適用性能良好、穩定,但難以應對類別量大的復雜場景,不利實際應用。相比之下,PROCRC算法具有良好的分類性能與高計算效率,能夠應對類別量大的復雜場景。同時,為了比較不同分類器對識別性能的影響,也選用了經典的分類器KNN。

4 結論

本研究提出一種利用DRLBP算法提取鱗翅目昆蟲圖像紋理特征進行圖像自動識別的方法,且將該方法成功應用于2種不同的鱗翅目昆蟲圖像數據集上。識別過程中加入了BADE方法進行特征選擇操作。同時也為防止分類器與模型出現過度擬合現象,選擇PROCRC與KNN2種分類器進行識別。

應用DRLBP算法提取昆蟲圖像的紋理特征,并通過合適的特征選擇算法進行特征篩選,可有效提高昆蟲的分類準確性。筆者提出的BADE算法結合PROCRC分類器時,與不做特征選擇相比,在2個數據集上其準確性分別提高了5.81%和1.66%。與現有的頻繁出現模式和BDE特征選擇方法相比,BADE算法的準確性也顯著提高。本研究也表明與傳統的KNN算法相比,PROCRC是更理想的分類器。本研究利用2種不同的鱗翅目昆蟲圖像數據集建立識別模型是為了提高所建立的鱗翅目昆蟲圖像識別模型的普適性。因此,如何進一步擴大數據集,提高識別模型的普適性,使其更具實用價值,是今后的研究目標。

猜你喜歡
特征
抓住特征巧觀察
離散型隨機變量的分布列與數字特征
具有兩個P’維非線性不可約特征標的非可解群
月震特征及與地震的對比
如何表達“特征”
被k(2≤k≤16)整除的正整數的特征
中等數學(2019年8期)2019-11-25 01:38:14
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
詈語的文化蘊含與現代特征
新聞傳播(2018年11期)2018-08-29 08:15:24
抓住特征巧觀察
基于特征篩選的模型選擇
主站蜘蛛池模板: 亚洲网综合| 亚洲天堂首页| 欧美影院久久| 成人国产一区二区三区| 波多野结衣的av一区二区三区| 福利在线免费视频| 久热re国产手机在线观看| 99免费在线观看视频| 在线免费看黄的网站| 国产乱子伦视频在线播放| 国产一区自拍视频| 99久久性生片| 日韩无码白| 热热久久狠狠偷偷色男同| 午夜国产精品视频| 日本不卡视频在线| 欧美第九页| 亚洲人视频在线观看| 中文字幕免费视频| 999国产精品| 中文成人在线| 亚洲最大福利网站| 婷婷五月在线| 久久精品亚洲专区| 制服丝袜亚洲| 啊嗯不日本网站| 在线观看av永久| a免费毛片在线播放| h视频在线播放| 久久精品波多野结衣| 69视频国产| 视频二区中文无码| 美女一级毛片无遮挡内谢| 国产精品免费露脸视频| 在线观看网站国产| 国产精品女主播| 国产主播在线一区| 国产成人精品优优av| 日韩在线中文| 中文字幕在线观看日本| 国产精品美女自慰喷水| 精品欧美日韩国产日漫一区不卡| 综合色88| 亚洲欧洲天堂色AV| 72种姿势欧美久久久大黄蕉| 国产精品亚洲片在线va| 亚洲一区二区三区国产精品 | 四虎免费视频网站| 99re热精品视频中文字幕不卡| 一级毛片网| 国产精品漂亮美女在线观看| 亚洲欧美在线综合一区二区三区| 极品国产一区二区三区| 熟女视频91| 日韩成人在线视频| 国产精品九九视频| 亚洲欧美成人在线视频| 日本成人不卡视频| 99999久久久久久亚洲| 538国产在线| 亚洲天堂视频网站| 天天色天天综合| 亚洲国产看片基地久久1024| 丁香五月婷婷激情基地| 中文字幕精品一区二区三区视频| 国产丝袜91| 欧美第一页在线| 日韩午夜伦| 亚洲久悠悠色悠在线播放| 亚洲天堂首页| 88国产经典欧美一区二区三区| 国产精品丝袜视频| 色屁屁一区二区三区视频国产| 午夜不卡视频| 国产网友愉拍精品| 免费一级α片在线观看| 日韩国产黄色网站| 伊人大杳蕉中文无码| 日韩久久精品无码aV| 久久黄色一级视频| 伊人大杳蕉中文无码| 国产免费福利网站|