999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于高光譜信息的煙葉分級(jí)方法比較

2021-11-02 09:23:16李士靜陳熙卓朱均燕吳碧致謝小芳溫永仙
煙草科技 2021年10期
關(guān)鍵詞:分類特征模型

李士靜,潘 羲,陳熙卓,朱均燕,吳碧致,謝小芳,溫永仙*

1.福建農(nóng)林大學(xué)計(jì)算機(jī)與信息學(xué)院,福州市倉(cāng)山區(qū)上下店路15號(hào) 350002 2.福建農(nóng)林大學(xué)統(tǒng)計(jì)及應(yīng)用研究所,福州市倉(cāng)山區(qū)上下店路15號(hào) 350002 3.福建省三明市煙草公司寧化分公司,福建省寧化縣鎮(zhèn)南大街煙草大廈 365400 4.福建省煙草公司三明市公司,福建省三明市崇桂新村100幢 365000 5.廈門大學(xué)近海海洋環(huán)境科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,福建省廈門市翔安區(qū)S201 361000 6.福建農(nóng)林大學(xué)生命科學(xué)學(xué)院,福州市倉(cāng)山區(qū)上下店路15號(hào) 350002

煙葉是我國(guó)重要的經(jīng)濟(jì)作物之一,嚴(yán)格規(guī)范其品質(zhì)檢驗(yàn)與等級(jí)劃分過(guò)程具有重要意義。傳統(tǒng)的煙葉分級(jí)主要依靠人工感官和經(jīng)驗(yàn)進(jìn)行判定,但不同人的感官和經(jīng)驗(yàn)存在差異,因此人工分級(jí)具有較強(qiáng)的主觀性和隨意性,容易導(dǎo)致煙葉分級(jí)不準(zhǔn)確,對(duì)卷煙生產(chǎn)造成不良影響[1]。針對(duì)此問(wèn)題,近年來(lái)采用人工智能技術(shù)代替人工分級(jí)已有較多研究,主要分為3個(gè)方面:①基于機(jī)器視覺(jué)技術(shù)結(jié)合神經(jīng)網(wǎng)絡(luò)的煙葉自動(dòng)分級(jí)研究[2-4],利用機(jī)器視覺(jué)技術(shù)提取煙葉表面特征,將煙葉的顏色、形狀、紋理等特征作為神經(jīng)網(wǎng)絡(luò)的輸入變量,建立基于煙葉圖像特征的分類模型。該方法對(duì)同一片煙葉需要進(jìn)行3次以上圖像采集,采集樣本量大,耗費(fèi)時(shí)間長(zhǎng),且采集過(guò)程容易受到外部因素影響,導(dǎo)致圖像質(zhì)量不高,從而影響煙葉等級(jí)識(shí)別的正確率[5]。此外,機(jī)器視覺(jué)技術(shù)只提取煙葉表面特征,當(dāng)煙葉存在未完整放置、未完整鋪開(kāi)、正反面放置不一致、葉片之間有重疊等問(wèn)題時(shí),會(huì)導(dǎo)致煙葉分級(jí)效果降低[6]。②基于模糊模式識(shí)別的煙葉自動(dòng)分級(jí)研究[7-8],結(jié)合模糊數(shù)學(xué)和模糊模式識(shí)別并基于化學(xué)指標(biāo)建立煙葉等級(jí)識(shí)別模型,但該方法的數(shù)學(xué)規(guī)則推導(dǎo)復(fù)雜且化學(xué)指標(biāo)測(cè)量過(guò)程耗時(shí)長(zhǎng),導(dǎo)致分類正確率不高。③基于光譜技術(shù)的煙葉自動(dòng)分級(jí)研究[9-10],通過(guò)無(wú)損方式獲得煙葉光譜數(shù)據(jù),進(jìn)而建立基于光譜特征的煙葉分類模型。光譜技術(shù)具有快速、簡(jiǎn)單、無(wú)損等特點(diǎn),利用光譜技術(shù)可以獲得反映煙葉外部結(jié)構(gòu)特征的光譜,以及與煙葉密切相關(guān)的化學(xué)指標(biāo)和內(nèi)部結(jié)構(gòu)信息。與機(jī)器視覺(jué)技術(shù)相比,利用光譜技術(shù)建立的煙葉分類模型可靠性更高。

高光譜成像是一種將成像技術(shù)與光譜技術(shù)相結(jié)合的影像數(shù)據(jù)技術(shù),具有光譜分辨率高、多波段、檢測(cè)速度快且無(wú)損等特點(diǎn)[11]。高光譜圖像包含圖像信息和光譜信息,圖像信息可以真實(shí)地展現(xiàn)農(nóng)作物的表面損失及外部特征,光譜信息則能反映出農(nóng)作物的內(nèi)部結(jié)構(gòu)及成分組成。高光譜成像技術(shù)目前已廣泛應(yīng)用于農(nóng)產(chǎn)品內(nèi)外部品質(zhì)檢測(cè)、損傷識(shí)別、作物信息獲取等方面[12]。程術(shù)希等[11]采用多元散射校正(Multivariate Scattering Correction,MSC)預(yù)處理方法對(duì)大白菜種子的高光譜信息進(jìn)行消噪,利用極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)和 隨 機(jī) 森 林(Random Forest,RF)等方法識(shí)別大白菜種子,識(shí)別正確率均超過(guò)90%。楊思成等[13]基于PCA(Principal Component Analysis)提取特征光譜的圖像信息,結(jié)合Fisher識(shí)別模型、偏最小二乘回歸模型、人工神經(jīng)網(wǎng)絡(luò)模型對(duì)稻谷品種進(jìn)行分類識(shí)別,分類正確率均達(dá)到95%。李丹等[14]采用多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normal Variate transformation,SNV)等方法對(duì)樹種葉片的高光譜數(shù)據(jù)進(jìn)行預(yù)處理,運(yùn)用隨機(jī)森林(RF)和支持向量機(jī)(Support Vector Machine,SVM)分類模型進(jìn)行建模,分類正確率在54.41%~77.06%之間。張龍等[15]利用高光譜成像技術(shù)對(duì)煙葉和雜物進(jìn)行分類,分類正確率達(dá)到99.92%,提高了除雜效果。邢雪霞等[16]基于烤煙葉片的高光譜曲線特征,建立了色素含量的預(yù)測(cè)模型,選擇出與色素含量相關(guān)性最高的高光譜特征參數(shù)。但利用高光譜成像技術(shù)進(jìn)行煙葉分級(jí)的研究則鮮見(jiàn)報(bào)道。為此,基于高光譜信息探討了不同數(shù)據(jù)預(yù)處理方法以及分類模型對(duì)煙葉分類正確率的影響,建立了基于特征波段的4種煙葉分類模型并對(duì)其進(jìn)行驗(yàn)證,以期提高煙葉等級(jí)識(shí)別正確率,提升煙葉分級(jí)智能化水平。

1 材料與方法

1.1材料

數(shù)據(jù)集A的煙葉樣本為31個(gè)2019年國(guó)家標(biāo)準(zhǔn)樣本,包含B1F、B2F和B3F共3個(gè)等級(jí);數(shù)據(jù)集B的煙葉樣本為147個(gè)2020年國(guó)家標(biāo)準(zhǔn)樣本,包含C2F、C3F和C4F共3個(gè)等級(jí)。所有煙葉樣本均由福建省煙草專賣局煙草科學(xué)研究所提供,并按照烤煙分級(jí)國(guó)家標(biāo)準(zhǔn)(42級(jí))GB2635—1992[17]進(jìn)行定級(jí)。具體樣本信息見(jiàn)表1。

表1 煙葉樣本信息Tab.1 Information of tobacco leaf samples

1.2 設(shè)備與儀器

數(shù)據(jù)集A的高光譜成像系統(tǒng)由Gaiasky-mini2-VN光譜儀(四川雙利合譜科技有限公司)、HSIALS-T-200W專用光源(四川雙利合譜科技有限公司)以及安裝有Spectral-image(臺(tái)灣五鈴光學(xué)股份有限公司)的專用計(jì)算機(jī)組成,見(jiàn)圖1。系統(tǒng)參數(shù):圖像分辨率為960 pixel×176 pixel;波長(zhǎng)范圍為400~1 000 nm,共包含176個(gè)波段;光譜分辨率為3.5 nm;曝光時(shí)間為6.4 ms;光源強(qiáng)度為200 W。由于波長(zhǎng)400~1 000 nm范圍內(nèi)的波段頭尾處存在較大噪聲,故選取500~900 nm范圍內(nèi)的116個(gè)波段進(jìn)行分析。

圖1 數(shù)據(jù)集A的高光譜成像系統(tǒng)結(jié)構(gòu)示意圖Fig.1 Structure of hyperspectral imaging system for dataset A

數(shù)據(jù)集B的采集系統(tǒng)由高感度EM285CL EMCCD相機(jī)(北愛(ài)爾蘭Raptor Photonics公司)、Imspector V10E成像光譜儀(芬蘭Spectral Imaging公司)、IT 3900 150 W鹵素?zé)簦绹?guó)Ocean Optics公司)以及安裝有Spectral-image(臺(tái)灣五鈴光學(xué)股份有限公司)的專用計(jì)算機(jī)組成,見(jiàn)圖2。系統(tǒng)參數(shù):圖像分辨率為1 024 pixel×237 pixel;波長(zhǎng)范圍為400~1 000 nm,共包含237個(gè)波段;光譜分辨率為2.4 nm;曝光時(shí)間為8 ms;光源強(qiáng)度為70 W;平臺(tái)移動(dòng)速度為13.3 mm/s。

圖2 數(shù)據(jù)集B的高光譜成像系統(tǒng)結(jié)構(gòu)示意圖Fig.2 Structure of hyperspectral imaging system for dataset B

1.3 高光譜圖像采集

如圖3所示,將每個(gè)煙葉樣本展開(kāi)平鋪在載物臺(tái)的黑布上,通過(guò)高光譜成像系統(tǒng)進(jìn)行數(shù)據(jù)采集。利用遮蓋鏡頭及標(biāo)準(zhǔn)白板圖像獲得黑板和白板校正圖像,用于對(duì)原始高光譜圖像進(jìn)行校正[12]。計(jì)算公式為:

圖3 煙葉樣本的高光譜圖像Fig.3 Hyperspectral image of tobacco sample

式中:R表示校正后樣本圖像;I表示樣本原始圖像;B表示黑板校正圖像;W表示白板校正圖像。

在黑白板校正后的高光譜圖像中,利用ENVI(Enviroment for Visualizing Images,美國(guó)ITT Visual Information Solutions公司)軟件在葉莖兩側(cè)的葉片部位隨機(jī)選取15 pixel×15 pixel的感興趣區(qū)域(Region of Interest,ROI),每個(gè)像素點(diǎn)包含一條光譜信息,將ROI內(nèi)所有像素點(diǎn)的平均光譜反射率作為樣本的高光譜數(shù)據(jù)。每個(gè)等級(jí)煙葉選取300個(gè)ROI,數(shù)據(jù)集A和B分別得到900個(gè)樣本。隨機(jī)選擇800個(gè)樣本作為訓(xùn)練集,100個(gè)樣本作為測(cè)試集。

1.4 數(shù)據(jù)預(yù)處理

高光譜數(shù)據(jù)中除了包含煙葉樣本化學(xué)指標(biāo)信息外,還含有其他無(wú)關(guān)信息和噪聲。因此,在建立模型前,利用多元散射校正(MSC)、標(biāo)準(zhǔn)正態(tài)變量變換(SNV)、Savitzky-Golay卷積平滑(SG)3種方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理[18],以消除高光譜數(shù)據(jù)中的無(wú)關(guān)信息和噪聲。

(1)多元散射校正(MSC)是一種多變量散射校正技術(shù),可以消除樣本間散射所導(dǎo)致的基線平移和偏移現(xiàn)象,增強(qiáng)與成分含量相關(guān)的光譜吸收信息,提高原始光譜的信噪比[19]。

式中:xi表示所需校正光譜集的第i條光譜(i=1,2,…,n);xi(MSC)表示多元散射校正處理后的第i條光譜;n表示需要校正的光譜數(shù)量;mi和bi分別表示利用最小二乘法求取的第i條光譜的系數(shù)和截距。

(2)標(biāo)準(zhǔn)正態(tài)變量變換(SNV)的作用是消除固體顆粒大小、表面散射的影響,以及光程變換對(duì)NIR漫反射光譜的影響[18]。

式中:xi,k表示第i條光譜在第k處波長(zhǎng)(k=1,2,…,m)的反射率值;m表示波長(zhǎng)點(diǎn)數(shù);x(iSNV)表示標(biāo)準(zhǔn)正態(tài)變量變換處理后的第i條光譜。

(3)Savitzky-Golay卷積平滑法(SG)是一種信號(hào)平滑方法,主要用于消除高光譜數(shù)據(jù)的隨機(jī)噪聲。

式中:xi,(kSG)表示SG卷積平滑處理后的第i條光譜在第k處波長(zhǎng)的反射率值;xi,k+j表示第i條光譜在第(k+j)處波長(zhǎng)的反射率值;2ω+1表示平滑窗口的寬度;hj表示平滑系數(shù),測(cè)量值乘以平滑系數(shù)hj的目的是盡可能地減少平滑處理對(duì)有用信息的影響;H表示歸一化因子。

1.5 化學(xué)計(jì)量學(xué)方法

采用隨機(jī)森林(RF)、支持向量機(jī)(SVM)、極限學(xué)習(xí)機(jī)(ELM)和梯度提升決策樹(GBDT)4種算法分別建立分類模型;采用F-Score算法選取煙葉高光譜數(shù)據(jù)的特征波段。隨機(jī)森林(RF)是Breiman等[20]提出的一種基于決策樹的集成算法,對(duì)數(shù)據(jù)噪聲容忍度好,具有人工干預(yù)少、運(yùn)算速度快等優(yōu)點(diǎn)[21]。支持向量機(jī)(SVM)是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化的統(tǒng)計(jì)學(xué)習(xí)方法[22],其決策函數(shù)由少數(shù)的支持向量確定,在某種意義上避免了“維數(shù)災(zāi)難”問(wèn)題[23],因此具有較強(qiáng)的泛化能力。本研究中選擇了用于處理SVM模式識(shí)別與回歸的軟件包LIBSVM[24],核函數(shù)選用了徑向基函數(shù)(Radial Basis Function,RBF)。極限學(xué)習(xí)機(jī)(ELM)是由Huang等[25]提出的一種簡(jiǎn)單高效的單隱層前饋神經(jīng)網(wǎng)絡(luò)算法,具有學(xué)習(xí)速度快、耗時(shí)短、效率高、算法復(fù)雜度低等優(yōu)點(diǎn)[26]。梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)是 由Friedman[27]提出的一種由多個(gè)弱分類器經(jīng)過(guò)迭代形成的強(qiáng)分類器,可靈活處理各種數(shù)據(jù),預(yù)測(cè)準(zhǔn)確率高,對(duì)異常值具有較強(qiáng)的魯棒性[28]。F-Score算法主要用于衡量特征在不同類別間的分辨能力,通過(guò)計(jì)算數(shù)據(jù)集中每個(gè)特征的F-Score值以及所有特征的F-Score平均值而得到閾值。如果某一特征的F-Score值大于閾值,則將該特征加入特征空間;否則,則將該特征從特征空間中移除[29]。F-Score算法能夠選擇較小的變量子集進(jìn)行計(jì)算,從而減少計(jì)算消耗,提高算法性能。

1.6 數(shù)據(jù)分析軟件

采用ENVI 5.3軟件提取煙葉樣本ROI的光譜反射率信息;采用MATLAB 2016a建立隨機(jī)森林(RF)、支持向量機(jī)(SVM)和極限學(xué)習(xí)機(jī)(ELM)的分類模型,并利用F-Score算法選取特征波段;采用Python 3.8建立梯度提升決策樹(GBDT)的分類模型。

2 結(jié)果與分析

2.1 煙葉原始光譜曲線和平均光譜曲線

兩個(gè)數(shù)據(jù)集中所有煙葉樣本的原始光譜反射率隨波長(zhǎng)變化曲線見(jiàn)圖4。可見(jiàn),不同波長(zhǎng)下反射率整體呈上升趨勢(shì),在670~680 nm范圍內(nèi)存在一個(gè)反射率波谷,原因是該波段范圍為葉綠素的強(qiáng)吸收帶,而葉綠素a和b對(duì)植物的反射率光譜曲線影響較大[30]。數(shù)據(jù)集A和B在680~700 nm范圍內(nèi)反射率急劇上升,曲線幾乎垂直于x軸。

圖4 兩個(gè)數(shù)據(jù)集中所有煙葉樣本的原始光譜曲線Fig.4 Original spectral curves of tobacco leaf samples in two datasets

兩個(gè)數(shù)據(jù)集中同一等級(jí)煙葉樣本的平均光譜在不同波長(zhǎng)下的反射率變化曲線見(jiàn)圖5。可見(jiàn),同一數(shù)據(jù)集中不同等級(jí)煙葉的平均光譜曲線變化趨勢(shì)相似,曲線之間的間隔較小,這種現(xiàn)象在數(shù)據(jù)集B中更為明顯,說(shuō)明依靠原始數(shù)據(jù)區(qū)分不同等級(jí)煙葉難度較大,需要進(jìn)一步進(jìn)行數(shù)據(jù)預(yù)處理和建模分析。

圖5 兩個(gè)數(shù)據(jù)集中同一等級(jí)煙葉樣本的平均光譜曲線Fig.5 Average spectral curves of tobacco leaf samples of different grades in two datasets

2.2 不同數(shù)據(jù)預(yù)處理法對(duì)分類正確率的影響

分別采用MSC、SNV、SG這3種方法對(duì)兩個(gè)數(shù)據(jù)集中不同等級(jí)煙葉的高光譜數(shù)據(jù)進(jìn)行預(yù)處理,并繪制預(yù)處理后所有煙葉樣本的光譜曲線,見(jiàn)圖6和圖7。可見(jiàn),經(jīng)MSC預(yù)處理后兩個(gè)數(shù)據(jù)集的光譜曲線更加集中,其中數(shù)據(jù)集A預(yù)處理后在波長(zhǎng)500~600 nm和800~900 nm處的曲線沒(méi)有原始數(shù)據(jù)曲線光滑,原因可能是數(shù)據(jù)集A煙葉樣本間的基線平移和偏移現(xiàn)象不明顯,經(jīng)過(guò)預(yù)處理反而加入了噪聲。經(jīng)SNV預(yù)處理后數(shù)據(jù)集B的相對(duì)反射率(原始反射率經(jīng)預(yù)處理變換后得到的反射率)相比數(shù)據(jù)集A波動(dòng)較大,可能是由于數(shù)據(jù)集B的波長(zhǎng)點(diǎn)數(shù)多于數(shù)據(jù)集A,導(dǎo)致標(biāo)準(zhǔn)偏差增大。數(shù)據(jù)集A與B經(jīng)SG預(yù)處理后的光譜曲線與原始光譜曲線差異不明顯。

圖6 數(shù)據(jù)集A預(yù)處理后的光譜曲線Fig.6 Preprocessed spectral curve of dataset A

圖7 數(shù)據(jù)集B預(yù)處理后的光譜曲線Fig.7 Preprocessed spectral curve of dataset B

將預(yù)處理后的數(shù)據(jù)集作為輸入變量,煙葉等級(jí)對(duì)應(yīng)的標(biāo)簽作為輸出變量,建立隨機(jī)森林(RF)、支持向量機(jī)(SVM)、極限學(xué)習(xí)機(jī)(ELM)以及梯度提升決策樹(GBDT)4種煙葉分類模型。選擇分類正確率作為分類模型的評(píng)價(jià)指標(biāo),分類正確率是指正確分類的樣本占所有樣本的比例。對(duì)原始數(shù)據(jù)和不同預(yù)處理后數(shù)據(jù)進(jìn)行分類,結(jié)果見(jiàn)表2和表3。可見(jiàn),經(jīng)SG或SNV預(yù)處理后兩個(gè)數(shù)據(jù)集的分類正確率整體上與原始數(shù)據(jù)的分類正確率接近,可能是煙葉樣本間散射現(xiàn)象不明顯,隨機(jī)噪聲小,導(dǎo)致經(jīng)過(guò)預(yù)處理的數(shù)據(jù)丟失了有效信息。數(shù)據(jù)集A經(jīng)MSC預(yù)處理后,SVM模型的分類正確率明顯下降,可能是經(jīng)MSC預(yù)處理后增加了噪聲,而SVM模型對(duì)噪聲比較敏感。MSC預(yù)處理在數(shù)據(jù)集A中提高了ELM和GBDT模型的分類正確率,在數(shù)據(jù)集B中提高了全部4種模型的分類正確率。對(duì)比發(fā)現(xiàn),經(jīng)MSC預(yù)處理后分類正確率相對(duì)較高,在數(shù)據(jù)集A中平均分類正確率僅比SNV、SG低1.00百分點(diǎn)、1.75百分點(diǎn),但在數(shù)據(jù)集B中比SNV、SG高18.25百分點(diǎn)、11.75百分點(diǎn)。綜上,MSC預(yù)處理略優(yōu)于其他兩種預(yù)處理方法,能夠提高分類模型的識(shí)別效果。

2.3 不同模型的分類正確率比較

在RF模型中,利用逐步搜索法選擇決策樹的個(gè)數(shù),得到數(shù)據(jù)集A和B的決策樹個(gè)數(shù)分別為200和50。在SVM模型中,利用LIBSVM軟件包中K折交叉驗(yàn)證法(本文中為五折交叉驗(yàn)證法)進(jìn)行參數(shù)選擇,得到數(shù)據(jù)集A的懲罰系數(shù)C為256,核函數(shù)參數(shù)γ為0.25;數(shù)據(jù)集B的懲罰系數(shù)C為1 024,核函數(shù)參數(shù)γ為0.062 5。在ELM模型中,選擇常用的Sigmoidal函數(shù)作為激勵(lì)函數(shù),采用十折交叉驗(yàn)證法對(duì)隱層節(jié)點(diǎn)數(shù)進(jìn)行選擇,數(shù)據(jù)集A和B的分類正確率隨隱層節(jié)點(diǎn)數(shù)變化的曲線見(jiàn)圖8。當(dāng)驗(yàn)證集的分類正確率逐漸趨于穩(wěn)定時(shí),得到分類正確率最大時(shí)數(shù)據(jù)集A對(duì)應(yīng)的隱層節(jié)點(diǎn)數(shù)為139個(gè),數(shù)據(jù)集B為169個(gè)。在GBDT模型中,利用網(wǎng)格搜索法對(duì)參數(shù)進(jìn)行選擇,得到數(shù)據(jù)集A的學(xué)習(xí)率為0.1,迭代次數(shù)為180次,決策樹深度為7;數(shù)據(jù)集B的學(xué)習(xí)率為0.1,迭代次數(shù)為170次,決策樹深度為7。

圖8 不同隱層節(jié)點(diǎn)數(shù)下兩個(gè)數(shù)據(jù)集分類正確率變化曲線Fig.8 Variation curves of classification accuracy at different hidden node numbers for two datasets

4種分類模型下兩個(gè)數(shù)據(jù)集的分類正確率見(jiàn)表2和表3。可見(jiàn),RF和GBDT模型對(duì)數(shù)據(jù)集A原始數(shù)據(jù)(波段數(shù)116個(gè),維數(shù)116)的分類正確率為77%和76%,對(duì)數(shù)據(jù)集B原始數(shù)據(jù)(波段數(shù)237個(gè),維數(shù)237)的分類正確率為54%和55%。在數(shù)據(jù)集B中分類正確率下降的原因,除了基線平移和偏移外,還可能是隨著數(shù)據(jù)維數(shù)的增加,存在過(guò)擬合現(xiàn)象。對(duì)比發(fā)現(xiàn),ELM和SVM模型的識(shí)別效果最佳,基于MSC預(yù)處理的分類正確率在數(shù)據(jù)集A中分別達(dá)到84%和80%,在數(shù)據(jù)集B中分別達(dá)到96%和95%。其中,ELM模型可能對(duì)SNV預(yù)處理后的數(shù)據(jù)比較敏感,分類正確率受到較大影響,在數(shù)據(jù)集A中從83%下降到77%,在數(shù)據(jù)集B中從91%下降到62%。綜上,基于全波段建立的分類模型識(shí)別效果較優(yōu),其建模方案是預(yù)處理方法為多元散射校正(MSC),分類模型為極限學(xué)習(xí)機(jī)(ELM)或支持向量機(jī)(SVM)。

表2 不同預(yù)處理方法和分類模型下數(shù)據(jù)集A的分類正確率Tab.2 Classification accuracy for dataset A with different preprocessing methods and classification models(%)

表3 不同預(yù)處理方法和分類模型下數(shù)據(jù)集B的分類正確率Tab.3 Classification accuracy for dataset B with different preprocessing methods and classification models(%)

2.4 不同特征波段的分類正確率比較

采用光譜全波段建模,信息量大、變量多,且樣本的部分光譜信息與樣本性質(zhì)無(wú)明顯相關(guān)性,對(duì)樣本等級(jí)的識(shí)別貢獻(xiàn)小。因此,利用F-Score算法選取對(duì)煙葉分類有較大貢獻(xiàn)的特征波段作為分類模型的輸入變量。F-Score算法能夠在降低高光譜數(shù)據(jù)維度的同時(shí),保留原有高光譜波段的物理意義,提高模型運(yùn)行速度[31]。由上述分析結(jié)果可知,經(jīng)MSC預(yù)處理后分類正確率相對(duì)較高,因此對(duì)數(shù)據(jù)集A和B先進(jìn)行MSC預(yù)處理,再利用F-Score算法選取特征波段。按照全波段F-Score值的大小進(jìn)行降序排列,選擇前10%~90%作為特征波段,然后按照波長(zhǎng)大小對(duì)特征波段進(jìn)行排序,結(jié)果見(jiàn)表4。

根據(jù)表4結(jié)果建立RF、ELM、SVM和GBDT分類模型,不同特征波段數(shù)量和分類模型下兩個(gè)數(shù)據(jù)集的分類正確率見(jiàn)表5和表6。可見(jiàn),當(dāng)特征波段數(shù)量較少時(shí),4種模型的識(shí)別效果均不理想。隨著特征波段數(shù)量的增加,4種模型的分類正確率均有所提高,其中ELM和SVM模型的分類正確率增加20百分點(diǎn)左右。在數(shù)據(jù)集B中可能是受到特征波段數(shù)量的影響,SVM模型隨著維數(shù)的增加呈先上升后下降趨勢(shì),由于SVM模型能夠克服“維數(shù)災(zāi)難”,最終分類正確率趨于穩(wěn)定。當(dāng)特征波段數(shù)量達(dá)到70%時(shí),4種模型的分類正確率大部分接近全波段。在數(shù)據(jù)集B中,當(dāng)特征波段數(shù)量達(dá)到30%時(shí),SVM模型的分類正確率(97%)已經(jīng)優(yōu)于全波段(95%,見(jiàn)表3),說(shuō)明特征波段的選擇有益于SVM模型進(jìn)行數(shù)據(jù)分類。綜上,當(dāng)特征波段數(shù)量占比為70%時(shí),煙葉分類正確率已接近基于全波段的分類正確率,且可減小數(shù)據(jù)規(guī)模,提升運(yùn)算速度。

表4 兩個(gè)數(shù)據(jù)集中特征波段數(shù)量選擇結(jié)果Tab.4 Numbers of characteristic bands selected by F-Score algorithm based on two datasets

表5 不同特征波段數(shù)量和分類模型下數(shù)據(jù)集A分類正確率Tab.5 Classification accuracy for dataset A in case of different numbers of characteristic bands and different classification models (%)

表6 不同特征波段數(shù)量和分類模型下數(shù)據(jù)集B分類正確率Tab.6 Classification accuracy for dataset B in case of different numbers of characteristic bands and different classification models (%)

3 結(jié)論

基于煙葉高光譜信息,采用多元散射校正(MSC)等3種預(yù)處理方法以及支持向量機(jī)(SVM)等4種分類模型,分析了煙葉等級(jí)的分類正確率。結(jié)果表明:①M(fèi)SC預(yù)處理的分類正確率較高,在數(shù)據(jù)集A中平均分類正確率僅比SNV、SG低1.00百分點(diǎn)、1.75百分點(diǎn),但在數(shù)據(jù)集B中比SNV、SG高18.25百分點(diǎn)、11.75百分點(diǎn)。②在4種模型中,ELM和SVM模型識(shí)別效果較優(yōu),基于全波段和特征波段的分類正確率均高于其他模型,其中經(jīng)MSC預(yù)處理后基于全波段的分類正確率在數(shù)據(jù)集A中達(dá)到84%和80%,在數(shù)據(jù)集B中達(dá)到96%和95%。③當(dāng)選擇的特征波段數(shù)量達(dá)到全波段的70%時(shí),4種模型的分類正確率已接近基于全波段的分類正確率,其中SVM模型對(duì)數(shù)據(jù)集B的分類正確率達(dá)到96%。研究結(jié)果顯示利用煙葉的高光譜信息對(duì)煙葉進(jìn)行分級(jí)是可行的。

猜你喜歡
分類特征模型
一半模型
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
如何表達(dá)“特征”
不忠誠(chéng)的四個(gè)特征
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
抓住特征巧觀察
主站蜘蛛池模板: 无码内射在线| 综合五月天网| 中文字幕在线不卡视频| 欧美色香蕉| 19国产精品麻豆免费观看| 国产亚洲精| 波多野结衣无码AV在线| 亚洲天堂网在线观看视频| 中文字幕在线一区二区在线| 国产成本人片免费a∨短片| 亚洲最猛黑人xxxx黑人猛交| 国产精品久久自在自线观看| 亚洲综合片| 精品伊人久久久香线蕉| 狠狠五月天中文字幕| 久久这里只有精品8| 一级毛片在线免费视频| 国产永久在线视频| 成人欧美日韩| 美女潮喷出白浆在线观看视频| 欧洲日本亚洲中文字幕| 亚洲av无码人妻| 中文字幕乱妇无码AV在线| 97成人在线视频| 国产美女在线观看| 亚洲欧美一区二区三区麻豆| 国模粉嫩小泬视频在线观看| 欧美在线精品一区二区三区| 久久中文字幕不卡一二区| 人妖无码第一页| 国内精品免费| 日韩高清在线观看不卡一区二区| 国产91小视频| 青青操视频免费观看| 久久女人网| 高清乱码精品福利在线视频| 国产精品久久久免费视频| 直接黄91麻豆网站| 青青国产视频| 毛片免费观看视频| 亚洲欧洲自拍拍偷午夜色| 在线观看国产精品一区| 国产免费看久久久| 久青草国产高清在线视频| 丁香婷婷激情综合激情| 99久久精彩视频| 免费观看成人久久网免费观看| 黄色成年视频| 亚洲AV电影不卡在线观看| 国产成人区在线观看视频| 久热中文字幕在线观看| 国产欧美日本在线观看| 久久综合九色综合97网| 国产玖玖视频| 亚洲小视频网站| 亚洲成人福利网站| 国产精品极品美女自在线看免费一区二区 | 久久不卡国产精品无码| 欧洲高清无码在线| 国产精品久久久精品三级| 免费又爽又刺激高潮网址 | 夜夜拍夜夜爽| 亚洲精品国产精品乱码不卞| 多人乱p欧美在线观看| 国产特一级毛片| 免费国产福利| 国产欧美在线观看精品一区污| 成人免费午夜视频| 日韩欧美在线观看| 色综合中文字幕| 国产精品成人免费视频99| 午夜啪啪网| 亚洲综合久久成人AV| 怡春院欧美一区二区三区免费| 国产精品手机视频| 亚洲一区二区日韩欧美gif| 国产一级毛片网站| 欧美一级在线| 日本a级免费| 国产高潮流白浆视频| 久久亚洲国产视频| 国产在线八区|