999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于特征選擇的小麥籽粒品種識別研究*

2022-06-27 08:12:22馮繼克鄭穎李平李艷翠張自陽郭曉娟
中國農機化學報 2022年7期
關鍵詞:特征模型

馮繼克,鄭穎,李平,李艷翠,張自陽,郭曉娟

(1. 河南科技學院信息工程學院,河南新鄉,453003; 2. 河南師范大學計算機與信息工程學院,河南新鄉,453000;3. 河南科技學院生命科技學院,河南新鄉,453003)

0 引言

小麥是我國重要糧食作物之一,培育優良品種對提高糧食產量有重要作用。籽粒是育種基礎,提高籽粒識別準確率可有效提高育種效率。目前,國內外對小麥與類似谷物分類的識別研究主要通過數碼相機、傳感器、掃描儀、光譜儀等獲取RGB圖像或高光譜圖像,通過對圖像提取特征或直接使用圖像構建神經網絡模型進行識別,識別準確率大多能達90%以上[1-9]。基于特征的籽粒識別方法在小麥、水稻、玉米和苦蕎等作物中均得到應用。在小麥籽粒品種識別方面,孟惜等[10]提取了小麥的23個特征參數,利用PSO算法優化網絡后識別6個品種的小麥,平均識別準確率增加至94.3%。馮麗娟等[11]提出了利用稀疏表示的方法識別4個小麥品種,與BP神經網絡方法比較,稀疏表示方法對于4個小麥品種識別準確率達到96.7%,比BP神經網絡高2個百分點。何紅霞[12]提取了8類小麥的顏色特征、形態特征和紋理特征共37個參數,使用粒子群算法對神經網絡進行優化,分類準確率達96.32%,均方根誤差0.443。劉飛[13]提取了小麥的4個形狀特征和6個顏色特征,使用顏色和形狀特征相結合,對3個品種、4個品種和5個品種的小麥籽粒識別準確率分別達95.6%,93.3%和89.3%。張強[14]使用圖像處理軟件提取了苦蕎種子的28個特征參數,對11個品種的苦蕎種子識別,取得較好的識別效果。馮曉星等[15]提取了5個品種稻谷的光譜信息和圖像特征共27個參數,采用BP-ANN的分類效果較好。彭燦[16]對提取的玉米籽粒圖像特征,通過線性相關性分析篩選參數,提高了系統識別效率。

由于對圖像提取特征進行籽粒識別的方法需要提取的特征較多,數據維度較大,很多研究者對特征進行融合、降維等處理以提高效率。李秀昊等[17]將提取的6個形狀特征參數和15個顏色特征參數融合,采用SVM分類器對稻谷進行識別,識別準確率達99.5%。付曉鵬[18]采集了44個品種的大豆種粒圖像并構建數據集,提取了大豆種粒圖像的形狀、HSI顏色以及紋理3類特征參數,并采用PCA對特征參數進行降維,采用LWKNCN算法識別6種大豆種粒圖像,最高識別率為85.61%。李東[19]利用主成分分析方法對提取的4類水稻種子的10個自變量進行數據分析與降維處理,運用余弦相似度的方法對稻花香2號水稻進行最終鑒別,識別正確率為88%。黃瓊等[20]利用貝葉斯分類器對經過LDA降維處理后的水稻種子進行識別,識別準確率高達99.4%。馮曉星等[15]對提取稻谷的27個特征參數進行PCA降維,使得稻谷識別更加高效。

結合籽粒識別和專家人工分辨發現,小麥籽粒品種的識別準確率僅與少數重要的特征關系較大。為判別影響品種識別的重要特征參數和提高識別效率,本文進行基于特征選擇的小麥籽粒品種識別。首先采集農大3416-18、內樂288、衡水6632、百農419、洛麥28和新麥26六個不同品種的小麥籽粒圖像,經過預處理提取了小麥的顏色、紋理和形態共計28個特征參數。然后采用不同的分類器進行識別,構建不同的特征融合模型和對特征數據進行降維處理,并對圖像進行數據增強。通過多個試驗對比分析,篩選出影響小麥籽粒識別的重要特征,并確定適合小麥籽粒識別的模型,以達到快速并準確識別小麥籽粒品種的目的。

1 試驗材料與方法

1.1 圖像采集

本文小麥籽粒樣本均由河南科技學院生命科技學院提供,其獲取時間為2020年9—10月。選用農大3416-18、內樂288、衡水6632、百農419、洛麥28和新麥26共6個品種的小麥種子作為試驗對象,圖1給出每個品種的圖片樣例。

(a) 農大3416-18

為獲取清晰準確的圖片,本文使用體視顯微鏡拍攝小麥種子圖片,拍攝時以黑色吸光絨布為背景,“體視顯微鏡”參數設置為放大倍數為1倍,2 688×1 520 的分辨率,自動白平衡(AWB)和寬動態平衡(WDR)選擇關閉,LED補光燈設置為中等,通過調整體視顯微鏡右側焦螺旋對小麥種子聚焦,在室內自然光照和燈光條件下,完成小麥種子圖片拍攝。為保證籽粒完整性,每個品種小麥籽粒挑選出顆粒飽滿的種子1 100粒。小麥籽粒圖像采集考慮實際情況,圖片保存為PNG格式,圖片大小為2 688×1 520像素。拍攝采取單粒分角度拍攝,每粒小麥分別拍攝腹溝向上、腹溝朝前45°和腹溝向下3個角度的3張圖片,最后篩選出拍攝清晰、背景純的1 000粒小麥籽粒圖像,共計18 000張圖片。分別將小麥籽粒圖片分品種按角度進行存儲。

1.2 圖像預處理

本試驗采集的小麥籽粒圖像為RGB圖像,在實驗室拍攝過程中,圖像的獲取容易受拍攝器材、拍攝背景及光照等因素影響,形成圖像噪聲,影響識別精度。因此,在特征提取之前需要對原始圖像進行去背景、濾波降噪和二值化等處理,以降低圖像噪聲,如圖2所示。

(a) RGB圖像

本文預處理過程及結果如下:原始圖像經過去背景,如圖2(a)所示;灰度處理,將RGB圖像經過灰度化得到小麥的灰度圖像,采用高斯濾波方法對灰度圖像增強,以達到降低噪聲,保證邊緣的效果,如圖2(b)所示;圖像二值化,圖2(c)是對高斯濾波圖像進行二值化處理后的圖像;獲取圖像邊緣,圖2(d)的邊緣圖像用于提取小麥的形態特征。

1.3 特征提取與分析

根據拍攝角度,將小麥圖片按腹溝向上、腹溝朝前45°和腹溝向下分別提取形態特征、顏色特征和紋理特征3方面共計28個參數,不同品種、不同小麥籽粒之間有不同的參數值。將提取的特征按品種分角度保存成“.csv”文件。

1.3.1 小麥籽粒形態特征提取

小麥籽粒的形態特征是可以直接展現小麥外觀的重要參數,本文選取面積A、周長C、長軸軸長L、短軸軸長W、離心率e1、外接矩形面積S1、慣性矩con、圓形度C1和矩形度R1共9個特征參數。6個品種小麥平均形態特征參數如表1所示。

表1 6個品種的小麥形態特征參數均值

可以看出,對比面積百農419明顯區分于其他5個品種,并且不同品種小麥籽粒的其他形態特征參數均存在一定差異。因此,形態特征可用來識別不同小麥籽粒品種。

1.3.2 小麥籽粒顏色特征提取

顏色特征同樣是識別小麥籽粒品種信息的重要指標。本文提取了RGB顏色模型的R、G、B分量,但是R、G、B分量受光照等因素影響較大,為降低客觀因素帶來的品種識別率誤差。同時提取了HSV模型中的色調H、飽和度S和亮度V。

顏色矩是一種有效表示顏色特征的方法,有一階矩(即均值,mean)、二階矩(即標準差,variance)和三階矩(即斜度,skewness)等,由于顏色信息主要分布于低階矩中,所以本文提取了一階矩、二階矩和三階矩用來表達小麥籽粒圖像的顏色分布。

6個品種小麥平均顏色特征參數如表2所示,由于受小麥本身色度及光照等影響,不同小麥之間的R、G和B均存在差異,同時不同品種之間的H、S和V及其分量也存在較大不同,因此顏色特征可以用來區分小麥品種。

表2 6個品種的小麥顏色特征參數均值

1.3.3 小麥籽粒紋理特征提取

本文采用灰度共生矩陣的方法提取了紋理特征中的逆方差IDM、能量ASM、熵ENT和對比度CON共4個特征參數。逆方差反應紋理的清晰和規則程度,值越大,紋理越清晰,規律性越強;能量是圖像的灰度分布和紋理粗細的度量值;熵表示該超像素塊的紋理復雜度;逆方差用來度量局部灰度相關性。6個品種小麥的平均紋理特征參數如表3所示。

表3 6個品種的小麥紋理特征參數均值

1.3.4 特征相關性分析

為分析提取到的特征之間的關聯,本文采用相關系數的方法對特征參數進行相關性分析。結果如圖3~圖5所示,分別為形態、顏色和紋理3個特征相關性熱力圖,顏色刻度條越淺,說明兩特征相關性越強,相關系數越接近1或-1,表明正/反線性關系越強,相關系數為0則表示兩個變量間沒有線性關系。

圖3 形態特征相關性熱力圖

圖4 顏色特征相關性熱力圖

圖5 紋理特征相關性熱力圖

由圖3可知周長和矩形度,短軸軸長和離心率,離心率和慣性矩刻度條顏色較深,其之間負相關性較弱。矩形度和短軸軸長相關性為-0.035,相關性較小。外接矩形面積和慣性矩相關性為0.97,其正相關性最大。

從圖4可以看出,R、G和B與亮度均存在較大負相關性,說明R、G和B顏色分量越大,亮度就越高。飽和度和亮度與其分量之間均存在較大正相關。從圖5可以看出,逆方差與熵之間存在較大負相關性,能量和熵存在較大正相關性。

1.4 試驗方法

本試驗用到了6個品種小麥籽粒特征數據,剔除個別無效數據,共保留17 997組特征數據,將80%的小麥籽粒圖像特征參數作為訓練集,10%的特征參數作為驗證集,剩余10%的特征參數作為測試集,將提取的小麥籽粒圖像的顏色、形態和紋理3方面共28個特征參數,作為K近鄰(KNN)、貝葉斯(Bayes)、支持向量機(SVM)和隨機森林(Random Forest)的輸入數據,實現小麥籽粒的品種識別。

具體的操作流程如下。

1) 隨機選取80%的特征參數作為訓練集,10%的特征參數作為驗證集,剩余10%的特征作為測試集。

2) 提取小麥圖像的顏色、形態和紋理3方面共計28個特征參數。

3) 將28個特征參數進行[0,1]歸一化處理,分別作為K近鄰、貝葉斯、支持向量機和隨機森林的輸入數據。

4) 訓練K近鄰、貝葉斯、支持向量機和隨機森林分類模型。

5) 采用訓練好的模型對測試集進行測試,得到分類預測結果并作對比。

1.4.1 構建不同特征融合模型

為了驗證不同特征對小麥籽粒品種識別的效果,本試驗將提取的小麥種子圖像的9個形態特征、4個紋理特征和15個顏色特征,以及兩兩特征和3個方面特征融合,構建7個特征融合模型,即形態特征模型、紋理特征模型、顏色特征模型、紋理+顏色特征模型、紋理+形態特征模型、形態+顏色特征模型和紋理+形態+顏色特征模型,并對不同特征模型進行識別結果比較。

1.4.2 構建不同特征數據降維模型

為提升小麥籽粒品種識別效率和判別影響識別準確率主要因素,采用機器學習軟件包sklearn庫中SelectKBest、PCA和LDA模型降維與原始數據集識別結果進行對比,對28個特征參數進行降維分析,分別選出前5個重要特征參數作為KNN分類器輸入數據,以精確率、召回率和F1值等作評價指標,對降維數據結果進行分析對比。

1.4.3 構建數據增強模型

由于小麥籽粒圖像采集過程中容易受光照、背景和拍攝儀器等影響,為提升識別精確度,提高模型的泛化能力,經過分析對比選取腹溝朝前45°這一角度原始圖像,采用python中PIL的ImageEnhance函數,對亮度、色度、對比度和銳度進行隨機增強,數據增強的標準以不明顯影響原始圖像區分度為準,將原始數據擴充4倍,并提取對應特征參數,作為分類器輸入參數,對識別結果進行分析。數據增強后圖像如圖6所示。

(a) 原始圖像

2 試驗結果與分析

本文試驗均用到了農大3416-18、內樂288、衡水6632、百農419、洛麥28和新麥26六個小麥籽粒品種特征數據,因受隨機因子等因素影響,每次試驗結果存在一定不同,故任選取5次試驗結果平均值。

表4為28個原始特征參數歸一化處理后,在Bayes、SVM、Random Forest和KNN四個分類器上的識別結果,可以看出Random Forest分類器訓練時間最短,僅0.035 s,遠低于KNN分類器訓練時間,但KNN分類器測試集識別準確率高達91.02%,高出Bayes識別率18.12個百分點,高出SVM識別率5.85個百分點,高出Random Forest識別率7.55個百分點。同時,以分類結果的準確率、精確率、召回率和F1值為評價指標,KNN模型均優于其他3類模型,因此在本文提取的特征數據上,KNN模型較其他3個模型更適用于小麥籽粒品種分類。

表4 小麥籽粒原始數據集分類結果

2.1 基于不同特征融合的分類結果

原始特征共有形態、顏色、紋理3類28個特征參數,本試驗將3類特征進行組合構建了7組特征融合模型,利用上述分類效果較好的KNN模型對其進行分類識別,識別精確率結果如表5所示,其中平均識別率為單個特征模型的平均識別準確率。

由表5可知,相比形態和紋理特征模型,在單個特征模型作為數據集用來識別時,顏色特征模型平均識別率達到89.13%,其中農大3416-18識別精確率達96.2%。在兩個特征融合的識別率中,紋理+顏色特征模型平均識別率最高,達90.66%,高于紋理+形態特征模型34.52個百分點。紋理+形態+顏色三個特征融合模型平均識別率為91.02%,為7個特征融合模型識別準確率最高。在所有品種識別精確率中,基于紋理+形態+顏色特征模型的洛麥28識別精確率最高,達97.0%,基于紋理特征模型農大3416-18識別精確率最低,為26.0%,兩者相差71個百分點。

通過分析表5識別結果,可以看出基于不同特征融合的小麥籽粒品種識別中,紋理+形態+顏色特征模型平均識別率為91.02%,高于識別率最低的紋理特征模型47.88個百分點。與顏色特征融合的3個特征模型,平均識別率均達89%以上,遠高于形態、紋理和紋理+形態特征融合模型的識別準確率。由此可見,顏色特征在識別結果中貢獻度較大,鑒于個別特征參數的提取可能受拍攝條件、光照及拍攝儀器等外在因素影響,以下試驗將對特征參數做降維處理與分析。

表5 基于不同特征融合的小麥籽粒品種識別精確率

2.2 基于特征降維的分類結果

2.2.1 特征降維數據分析

由于LDA降維最多降到類別數k-1,即5維,因此試驗中降維模型均選取5維數據作對比。

利用sklearn.SelectKBest函數選取了model.scores_得分最高的前5個重要特征,分別為飽和度(S)、飽和度的三階矩(S斜度)、飽和度的二階矩(S標準差)、色調的三階矩(H斜度)和飽和度一階矩(S均值);經過PCA降維后,選取了貢獻率最大前5個主成分,前5個主成分貢獻率累計87.57%,占比分別為39.87%、19.57%、17.64%、5.7%和4.79%。

如圖7(a)所示,經PCA降維后的數據,受拍攝角度影響,洛麥28、衡水6632和新麥26等同樣本內比較分散。衡水6632、百農419和農大3416-18樣本之間分布距離較大,容易區分。其他品種之間既有分散又存在重合;經過LDA降維后,前5個判別因子累計貢獻率將近100%,判別因子貢獻率分別為55.14%、20.79%、12.74%、7.34%和3.99%。

如圖7(b)所示,不同樣本之間重合度較大,農大3416-18、衡水6632和新麥26之間既有少部分重合,同時其他樣本之間又較分散。

(a) PCA對特征降維

2.2.2 特征降維數據分類結果對比

經過SelectKBest、PCA和LDA降維處理后,采用KNN分類模型進行識別,如表6所示。

表6 特征降維數據分類結果

根據SelectKBest的model.scores_得分模型將原始28個特征降到5維,測試集識別準確率下降到75.38%,但識別效率提升。經過LDA降維處理后的識別結果,訓練時間僅為0.87 s,較原始數據訓練時間大大降低,同時也優于其他兩個降維數據的訓練時間。就識別準確率來講,LDA方法測試集識別準確率為86.19%,高于SelectKBest方法10.81個百分點,高于PCA方法6.63個百分點,但是就全部特征識別準確率下降了4.83個百分點。依據訓練時間、準確率、精確率、召回率和F1評價結果,說明LDA降維模型具有一定的高效性和實用性。

2.3 基于數據增強的分類結果

2.3.1 不同角度小麥籽粒識別結果

本文試驗數據在拍攝時采用3個角度分別拍攝一個籽粒,本部分采用分角度試驗來考察不同角度對小麥籽粒識別結果的影響。表7為腹溝向上、腹溝朝前45°和腹溝朝下3個不同角度的識別結果,可以看出,腹溝朝前45°在測試集識別準確率為91.83%,高于腹溝向上1.16個百分點,高于腹溝朝下1.43個百分點。同時,在測試集的精確率、召回率和F1值3個評價指標上,腹溝朝前45°均高于其他兩個角度的,因此在接下來試驗中選取腹溝朝前45°這一角度的小麥籽粒圖像作數據增強。

表7 不同角度小麥籽粒分類結果

2.3.2 原始數據與數據增強識別結果

腹溝朝前45°的小麥籽粒圖像共抽取5 999組特征數據,但原始數據有17 997組。為避免數據過少,本部分采用圖像增加方法進行試驗,數據增強方法如1.4.3節所述。數據增強4倍后共抽取29 995組特征數據,在KNN模型分類結果如表8所示。

表8 數據增強前后分類結果

從表8可以看出,隨著數據量的增多,增強后的數據集運算時間增加。在訓練集識別上,增強后數據集識別準確率達96.67%,高于其他兩個數據集識別準確率。測試集中增強后數據集識別準確率達94.26%,高于原始數據集3.24個百分點,高于腹溝朝前45°單角度識別率2.43個百分點。增強后的數據集精確率、召回率和F1值均明顯優于其他兩類數據集。因此通過數據增強的方法對小麥籽粒品種識別準確率有一定提高。

3 結論

1) 采集了6個市場推廣面積比較廣的小麥籽粒品種圖像,每個品種分別采集1 000粒,每粒分別采集腹溝向上、腹溝朝前45°和腹溝朝下3張圖像,每個品種采集了3 000張圖像,共計18 000張,構建小麥籽粒圖像數據庫。提取小麥籽粒的顏色特征、形態特征和紋理特征共28個特征參數后,保留可用的17 997組特征數據,用于小麥品種的識別。

2) 提取小麥籽粒的9個形態特征、15個顏色特征和4個紋理特征,構建了形態特征模型、紋理特征模型、顏色特征模型、紋理+顏色特征模型、紋理+形態特征模型、形態+顏色特征模型和紋理+形態+顏色特征模型7個特征模型,采用KNN分類器對不同特征模型進行識別結果比較,結果表明:基于紋理+形態+顏色特征模型,平均識別準確率為91.02%,高于其他特征融合模型,其中基于紋理+形態+顏色特征模型的洛麥28識別率最高,達97.0%。

3) 針對小麥籽粒品種識別容易受光照等外在因素的影響,對提取的28個特征參數進行降維處理與分析,利用SelectKBest函數方法選取前5個重要特征,分別為飽和度(S)、飽和度的三階矩(S斜度)、飽和度的二階矩(S標準差)、色調的三階矩(H斜度)和飽和度一階矩(S均值);采用LDA降維,前5個判別因子貢獻率累計接近100%,測試集識別準確率達86.19%,模型訓練時間0.87 s,極大提升了小麥籽粒識別效率。

4) 選取腹溝朝前45°小麥籽粒圖像進行亮度、色度、對比度和銳度的隨機增強,并對提取特征識別結果與原始3個角度和單角度識別結果分析對比,增強后數據集識別準確率達94.26%,高于原始數據集3.24個百分點,高于腹溝朝前45°單角度識別率2.43個百分點。提升了小麥籽粒品種識別模型的泛化能力,同時一定程度提高了小麥籽粒品種識別效果。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲最黄视频| 国产另类视频| 91久久精品国产| 992tv国产人成在线观看| 欧美三級片黃色三級片黃色1| 71pao成人国产永久免费视频| 青青极品在线| 最新国产高清在线| 成人午夜视频免费看欧美| 思思热精品在线8| a级毛片免费播放| 国产一区二区三区免费观看| 亚欧美国产综合| 国产日本欧美亚洲精品视| 久久亚洲日本不卡一区二区| P尤物久久99国产综合精品| 综合色88| 国产精品福利在线观看无码卡| 无码免费视频| 日韩乱码免费一区二区三区| 久久久久久国产精品mv| 亚洲精品自拍区在线观看| 午夜精品影院| 国产成人亚洲精品无码电影| 福利在线一区| 欧美一级大片在线观看| 丁香六月激情综合| 免费av一区二区三区在线| 91伊人国产| 国产激情无码一区二区三区免费| www亚洲天堂| 亚洲第一区精品日韩在线播放| 亚洲乱码在线播放| 女人av社区男人的天堂| 精久久久久无码区中文字幕| 亚洲制服丝袜第一页| 四虎成人在线视频| 亚洲永久免费网站| 亚洲国产AV无码综合原创| 午夜限制老子影院888| 91亚洲精选| 亚洲成在线观看| 亚洲色图综合在线| 制服丝袜 91视频| 成人在线综合| 亚洲午夜18| 1024国产在线| 老色鬼久久亚洲AV综合| 国产午夜看片| 亚洲一区精品视频在线| 午夜三级在线| 国产在线一区视频| 91久久国产综合精品| 国产粉嫩粉嫩的18在线播放91| 亚洲精品中文字幕无乱码| 四虎在线高清无码| 人人爽人人爽人人片| 精品国产一区91在线| 精品国产aⅴ一区二区三区| 青青草原偷拍视频| 一级毛片免费观看久| 中文字幕乱码中文乱码51精品| 亚洲国产中文综合专区在| 欧美成人免费| 国产在线观看第二页| 亚洲欧洲日韩综合色天使| 欧美影院久久| 永久免费无码日韩视频| 日韩无码视频专区| 九九这里只有精品视频| 色综合五月| 国产成人a在线观看视频| 亚洲美女久久| 色综合五月| 午夜少妇精品视频小电影| 97国产精品视频自在拍| 国产综合亚洲欧洲区精品无码| 人妻精品久久无码区| 中文字幕资源站| a级毛片网| 国产精品综合色区在线观看| 免费不卡视频|