999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GA-PLS-SPA的辣椒葉片葉綠素含量高光譜估測

2024-05-22 19:49:21彭俊杰汪泓王宇肖玖軍李可相邢丹
江蘇農業科學 2024年7期

彭俊杰 汪泓 王宇 肖玖軍 李可相 邢丹

彭俊杰,汪 泓,王 宇,等. 基于GA-PLS-SPA的辣椒葉片葉綠素含量高光譜估測[J]. 江蘇農業科學,2024,52(7):184-192.

doi:10.15889/j.issn.1002-1302.2024.07.025

(1.貴州大學礦業學院,貴州貴陽 550025; 2.貴州省山地資源研究所,貴州貴陽 550001; 3.貴州省土地綠色整治工程研究中心,貴州貴陽 550001; 4.貴州省農業科學院辣椒研究所,貴州貴陽 550009)

摘要:葉綠素對辣椒的長勢評估和營養狀況管理具有重要的意義,針對高光譜存在數據量大和冗余度高的問題,探究不同特征選擇算法相結合進行高光譜葉綠素含量估測的可行性。以貴州省遵義市栽培辣椒為研究對象,采集盛果期辣椒冠層高光譜數據,通過卷積平滑(SG)、一階微分(FD)、二階微分(SD)和多元散射校正(MSC)處理原始光譜數據,比較不同預處理方法下的貝葉斯優化隨機森林(BO-RF)估測效果,以MSC預處理后的數據為基礎,運用遺傳偏最小二乘算法結合連續投影算法(GA-PLS-SPA)進行最優特征波段選取,最后以GA-PLS、SPA和GA-PLS-SPA分別選取的特征波段作為輸入變量,建立BO-RF、RF和BP神經網絡模型來驗證GA-PLS-SPA的普適性和廣泛性。結果表明,MSC相比其他預處理方法對葉綠素含量的反演效果最好;相同估測模型條件下,基于GA-PLS-SPA建立的估測模型精度最高,選取特征波段數量最少,為7個,GA-PLS-SPA-BO-RF是估測葉綠素含量的最佳模型,訓練集的R2、RMSE和RPD分別為0.896、2.791和3.124,測試集的R2、RMSE和RPD分別為0.913、2.965和3.414;相同算法建模條件下,BO-RF的精度明顯高于RF和BP神經網絡。MSC處理后的光譜能極大程度提取出辣椒葉片的葉綠素信息,GA-PLS-SPA能有效實現特征波段選取,降低模型復雜度,BO-RF具有良好的葉綠素含量反演能力。

關鍵詞:辣椒;葉綠素;高光譜波段選擇;遺傳偏最小二乘算法;連續投影算法;貝葉斯優化隨機森林

中圖分類號:S127;641.301? 文獻標志碼:A? 文章編號:1002-1302(2024)07-0184-08

葉綠素含量是作物的重要生理生化參數,是進行光合作用的重要物質,能反映作物的生長狀況,是重要的長勢監測指標,因此,快速、精準地監測葉綠素含量對田間生產具有科學指導意義[1]。傳統葉綠素含量測定方法存在破壞性、價格昂貴和費時等特點,便攜式葉綠素儀通常用于測定植物葉片的SPAD值,可以在不破壞植物的情況下快速精確測定葉綠素含量。高光譜遙感因其提供了快速、無損、及時的數據采集方法,被廣泛用于精確葉綠素含量測定[2]。SPAD值只能反映植株個體水平,實際監測作物群體長勢相對耗時,因此,分析作物光譜信息與植株個體SPAD值之間的關系,對于快速估算SPAD值和發展精準農業具有重要意義[3]。

辣椒種植和加工產業是貴州省的優勢產業,其產加銷規模位居全國首位,是賦能鄉村振興的重要抓手,然而目前對于高光譜葉綠素含量估測的研究主要集中在水稻、小麥和棉花等作物上,關于辣椒葉片葉綠素含量估測的研究較少,因此有必要進行相關探討[4-6]。針對辣椒葉片葉綠素含量估測研究方法較少和研究內容不夠豐富等問題,蔣煥煜等利用近紅外漫反射全波段范圍內原始光譜結合偏最小二乘法(PLS)構建了尖椒葉片葉綠素含量估測模型[7]。郭宏亮等使用多元線性回歸分別建立辣椒葉片葉綠素a、葉綠素b含量的檢測模型并進行對比,但是該模型存在可能會丟失部分有用光譜信息或回歸過程中沒有考慮光譜矩陣中的噪聲導致過擬合情況[8]。以往的研究主要采用單波段和多波段植被指數或全光譜數據建立的機器學習模型來估測葉綠素含量,然而采用全光譜數據時未考慮各波段間的共線性,難以解決光譜數據的冗余問題,而使用單一敏感波段時未考慮到其他波段,會造成光譜數據的浪費[9]。因此,對高光譜數據進行特征波段選取是提高模型精度、降低模型復雜度的必要條件。遺傳算法(GA)、遺傳偏最小二乘算法(GA-PLS)和連續投影算法(SPA)是常見的特征選取算法,GA是一種模擬自然進化搜索全局最優解的方法,GA-PLS綜合了GA的全局優化搜索能力和PLS可有效解決變量間多重共線性問題的能力,SPA不僅能夠減少參與建模的光譜波段個數,而且能夠保證特征波段之間的共線性最小,從而提高建模效率[10-11]。目前在葉綠素含量估測研究中,利用特征選取算法相互結合進行波段選取的研究較少,劉潭等提出一種融合相關系數法、連續投影算法和隨機蛙跳算法的算法來選取特征波段,并證明融合后的算法所建立的葉綠素含量估測模型精度更高[12]。高洪燕等在對生菜冠層氮素含量進行檢測的研究中提出,BiPLS-GA-SPA 3種算法聯用能極大程度去除光譜和相鄰變量間的共線性[13]。章海亮等提出,遺傳算法結合連續投影算法挑選的特征波長可以應用于近紅外光譜檢測土壤有機質含量[14]。以上研究表明,特征選取算法組合使用的效果比單一算法好,能最大程度提高模型精度和簡化模型。

合適的光譜預處理方法,可以有效降低光譜中的噪聲信息,提高模型的穩健性[15]。趙菡利用多項式基線扣除、多元散射校正(MSC)和卷積平滑(SG)等光譜變換方法結合XGBoost構建蘋果葉片生化參數反演模型,提出SG-MSC-SPA-XGBoost算法組合反演效果最好[16]。楊曉宇等利用標準正態變量變換(SNV)、MSC、光譜一階微分(FD)和二階微分(SD)4種方法對高光譜數據進行預處理并進行對比分析,提出MSC能有效降低原始光譜噪聲,增強光譜反射率與土壤屬性間的相關性[17]。以上研究表明,MSC能有效去除光譜散射影響,提高模型精度和普適性。隨機森林是基于多棵回歸樹的集成學習模型,較單棵決策樹回歸具有更高的估測精度和更好的泛化性能,是目前應用于反演研究較多的機器學習模型[18-20]。貝葉斯優化框架只需經過少數次的目標函數評估即可獲得理想解,對于求解目標函數表達式未知、非凸的復雜優化問題,貝葉斯優化是一種有效方法[21]。然而,BO-RF在葉綠素反演研究中的應用還鮮有報道。

本研究以貴州省遵義市栽種的辣椒為研究對象,測定SPAD值和冠層高光譜數據,首先利用SG、FD、SD和MSC 4種光譜變換方法對原始光譜進行處理,并對比分析出最佳預處理方法,然后引入GA-PLS結合SPA算法選取最優特征波段,最后以最優特征波段為輸入變量,構建貝葉斯優化隨機森林(BO-RF)、隨機森林(RF)和BP神經網絡(反向傳播網絡)3個模型進行辣椒葉片葉綠素含量估測研究,以對比分析貝葉斯優化模型相比傳統機器學習模型的優越性,驗證GA-PLS-SPA方法的普適性和泛化性。

1 材料與方法

1.1 研究區概況與試驗設計

研究時間為2021年9月6日(辣椒盛果期)。研究地點位于貴州省遵義市新蒲新區貴州省農業科學院辣椒研究所官莊示范基地(104°18′20″E,25°19′44″N),屬于亞熱帶高原季風濕潤性氣候區,海拔高度為 800~1 150 m,日照充足,年降水量約為1 200 mm,氣候、土壤等自然條件十分適合辣椒栽培。研究區采用2因素裂區設計,主要種植黔椒8號、紅辣18號、辣研101號和紅全球4個辣椒品種,種植時間為2021年4月9日。

1.2 數據獲取與處理

1.2.1 辣椒葉片SPAD值測定

采用日本生產的SPAD-502葉綠素儀測定辣椒葉片SPAD值。測定時避開葉脈和不平整區域,在每張葉片上、中、下部分分別測定6~10次,然后取平均值作為樣本實測值。

1.2.2 高光譜數據測定

采用美國ASD FieldSpec4 Standard-Res便攜式地物光譜儀對辣椒冠層光譜信號予以測定,光譜范圍為350~2 500 nm,取樣間隔為1 nm。天氣晴朗無風,采集時間為10:00—15:00。傳感器探頭垂直于植被,距離葉片高度15~30 cm,每采集5株植株進行白板校正,每株植株重復測量5次,取平均值作為該樣本的反射率。

1.2.3 高光譜數據預處理

由于葉綠素主要與高光譜的可見光和近紅外波段有相關性,因此選取的試驗光譜區域為400~1 000 nm。為減少外界噪聲影響和突出辣椒光譜曲線的特征信息,對原始光譜進行SG處理、并在SG處理的基礎上分別進行MSC、FD和SD預處理,所有預處理過程均在Matlab R2020b中完成。

1.3 特征波段選取

1.3.1 遺傳偏最小二乘算法

GA-PLS是通過結合遺傳算法全局尋優和偏最小二乘法消除共線性的特點,實現對光譜數據的特征參數選擇[2,22]。本研究以SPAD值為優化目標,葉片光譜數據為基因,進行二進制編碼,隨機生成初始種群,再將偏最小二乘算法中交叉均方根驗證誤差(RMSECV)作為遺傳算法中的適應度函數,并使用遺傳算法進行變量篩選。GA-PLS的結果具有隨機性,因此重復執行10次,再根據貢獻率高、RMSECV值小的篩選原則選取特征波段。

1.3.2 連續投影算法

SPA能基于相關性計算快速選擇低冗余有效波長[23-24]。這種方法能最大程度消除光譜信息冗余和特征波段之間的共線性影響,提高模型運行效率和估測精度。本研究通過GA-PLS第1次特征選取獲得有效特征波段,再利用SPA進行第2次特征波段選取,使最大投影向量所對應的波段為有效特征波段,消除了通過GA-PLS篩選出的變量子集中可能包含的冗余變量。SPA和GA-PLS均通過Matlab R2020b完成。

1.4 模型構建及精度驗證

1.4.1 模型構建

本研究以GA-PLS-SPA篩選后的最優特征光譜為輸入變量,葉綠素含量實測值為輸出變量,通過Matlab R2020b分別構建貝葉斯優化隨機森林(BO-RF)、隨機森林(RF)和BP神經網絡3種回歸模型,首先利用貝葉斯優化隨機森林對比分析不同光譜預處理對辣椒葉片葉綠素含量的估測效果,獲得最優光譜預處理方法,然后利用上述3種模型對比分析GA-PLS結合SPA對葉綠素含量的估測效果和該方法的適用性和普適性。

RF具有非常強的擬合能力,建模速度快,處理大數據集(高光譜數據)時非常高效,而且算法對于結果具有可解釋性,在解決反演問題方面具有獨特的優勢[25]。RF善于處理變量間的非線性關系,但其估測性能受回歸樹棵數、回歸樹最大深度、節點劃分所需最小樣本數、葉子節點最小樣本數等參數的影響[18]。本研究中隨機森林的超參數設置為n_estimators=100,max_depths=3,其他參數采用隨機森林默認值。

超參數優化能有效提高機器學習模型精度,貝葉斯優化是高效的全局優化算法,可以在短時間內獲得最優超參數值。其在優化過程中利用了貝葉斯定理[26]:

p(f|1 ∶t)=p(M1 ∶t|f)p(f)p(M1 ∶t);(1)

1 ∶t= {(x1,y1),(x2,y2),…,(xt,yt)};?(2)

yt=f(xt)+εt。(3)

式中:f表示參數模型中的參數,M1 ∶t表示已觀測集合;xt表示決策向量;yt表示觀測值;εt表示觀測誤差;p(M1 ∶t|f)表示近似分布;p(f)表示f的先驗概率分布;p(M1 ∶t)表示邊際化f的邊際似然分布;p(f|M1 ∶t) 表示f的后驗概率分布。

貝葉斯優化采用迭代的方式執行優化流程,首先隨機生成初始化點,然后將選定的評估點值代入目標函數求出函數值,形成新的觀測值點來擴充歷史觀測集,并根據新的觀測集更新概率代理模型,為下一次迭代做準備;重復上述過程,直到滿足精度要求[18]。本研究以高斯過程為概率代理模型,交叉驗證精度為目標函數,重復優化迭代多次尋找最優超參數。貝葉斯進行隨機森林超參數優化的結果為n_estimators=120,max_depths=6,其他參數采用隨機森林默認值。

BP神經網絡是一種具有良好非線性映射能力的神經網絡[27]。國內外一些研究人員已經使用BP神經網絡建立了作物葉綠素含量估測模型,并取得了良好的效果。模型主要參數設置為訓練均方根誤差小于1×10-5,學習率為0.01。

1.4.2 精度驗證

本研究選用決定系數(R2)、均方根誤差(RMSE)和相對分析誤差(RPD)作為模型精度評價指標。R2用來評價模型的穩定性,R2越接近1,說明模型穩定性越好;RPD和RMSE用來評價模型的估測能力,RMSE越小模型估測能力越強;當RPD<1.4時,表示模型不能估測樣本;當1.4≤RPD<2.0時,表示模型可以對樣本進行大致估計,可以通過對模型進行改進,提高模型的估測能力;當RPD≥2.0時,表示該模型魯棒性較強[28]。具體公式見式(4)~式(6)。

RMSE=∑ni=1(y^i-y^)2[]n;?(4)

R2=1-∑n[]i=1(y[DD(-*1]^i-yi)2[]∑n[]i=1(yi-y)2 ;(5)

RPD=SD[]RMSE。(6)

式中:n表示樣本數;y^i為估測值;yi為實測值;y為樣品均值;SD表示估測樣本的標準差。

2 結果與分析

2.1 辣椒SPAD值統計分析

本研究共采集80株植株作為有效研究樣本,每株植株為1個樣本,采用最小距離算法(KS)劃分數據集,選取75%的樣本數據(60株)用來訓練模型,25%(20株)用來測試模型,劃分結果如表1所示。訓練集樣品的辣椒葉片SPAD值范圍為37.0~76.5,均值為61.42,標準差為8.66;測試集樣品的辣椒葉片SPAD值范圍為37.0~71.9,均值為61.04,標準差為10.07,訓練集和測試集樣本的變異系數分別為14.10%和16.50%,變異系數均小于20%,變異程度較小,樣本劃分合理。

2.2 原始光譜和光譜預處理分析

為分析不同高光譜預處理方法對辣椒葉片葉綠素含量估測模型的影響,分別對原始光譜進行SG、FD、SD和MSC 4種預處理,原始光譜和預處理后的光譜如圖1所示,不同預處理方法下的模型估測結果如表2所示。由圖1-a可知,辣椒葉片的原始光譜曲線與典型植被光譜曲線的變化趨勢基本相同,具有明顯的變化規律,即可見光波段(400~780 nm)反射率較低,光譜曲線大量重疊,近紅外波段(780~1 000 nm)反射率較高,然而光譜反射率值差異較大,其中在400~500 nm和600~680 nm波段內出現葉綠素強吸收帶,綠光波段(550 nm)出現反射峰,680~760 nm波段隨波長增加反射率急劇上升,760~1 000 nm波段形成植被特有的高反射率平臺。通過圖1-b至圖1-e可知,SG、FD、SD和MSC 4種預處理均可在不同程度上消除原始光譜的基線平移和漂移問題,減少因環境、儀器自身等因素造成的背景噪聲,增強部分波段反射率。

由表2可知,通過原始光譜建模的訓練集和測試集的R2分別為0.786和0.534,RPD分別為2.160和1.473,說明原始光譜存在一定的噪聲影響,模型存在過擬合現象。進行SG、FD、SD和MSC這4種預處理后,模型的估測精度都有一定程度的提高,均能較好地實現葉綠素含量估測,其中MSC預處理后的估測精度最高,訓練集和測試集的R2均大于0.8,RPD均在2.5左右,說明MSC預處理能最大程度消除光譜散射影響;SD預處理后的估測精度最低,訓練集和測試集的R2均小于0.75,RPD均在2左右。FD和SD預處理后的建模精度比MSC處理后的建模精度低,說明整數階微分會忽略一些與葉綠素含量相關的信息,造成光譜信息丟失或背景噪聲放大,影響模型性能[29-30]。因此,將MSC預處理后的光譜作為后續分析研究特征波段選取的基礎。

2.3 特征波段選取結果分析

2.3.1 GA-PLS選取特征波段分析

高光譜數據具有信息冗余和波譜間信息重疊的特征,需要進行特征波段選取,以減少建模波段數并提升估測精度。本研究利用GA-PLS對MSC處理后的辣椒葉片反射光譜(400~1 000 nm)進行第1次特征波段選取,共計選取601個波段,GA-PLS返回貢獻率及RMSECV結果如表3所示。由表3可知,共篩選了4個波段數,分別為9、17、49、126個波段,對應的貢獻率均達到99%以上,對應的RMSECV值最大為0.075,最小為0.071。當49個波段被選用時,貢獻率最大,為99.486%,RMSECV值最小,為0.071,根據貢獻率高、RMSECV值小的篩選原則,選擇49個特征波段用于后續連續投影算法研究。圖2表示GA-PLS所選取特征波段在MSC光譜曲線上的分布情況。綜合分析來看,GA-PLS具有良好的全局搜索和信息提取能力,選取49個特征波段,被剔除波段數占總波段數的91.847%,可以最大程度消除無用波段;所選特征波段分布在550 nm和 700 nm 附近以及近紅外波段,集中在可見光波段內的特征波段較多,說明此處含有與葉綠素相關的信息較多,但也可能含有少量冗余信息,因此被選取的49個特征波段不是最優特征波段數。

2.3.2 GA-PLS-SPA選取特征波段分析

為了進一步簡化模型和減少冗余信息以提高模型精度,在GA-PLS篩選出49個波段的基礎上,利用SPA進行第2次特征波段選取。GA-PLS-SPA所選取特征波段在MSC光譜曲線上的分布情況如圖3-a所示。由圖3-a可知,通過SPA算法進一步篩選后,被選特征波段數量大幅減少,共選出7個波段,占GA-PLS選取波段總數的14.286%,占MSC光譜波段總數的1.165%,即原始MSC光譜數據的壓縮率為98.835%,輸入變量減少的同時簡化了模型結構;GA-PLS-SPA選取出的7個最優特征波段為524、598、644、685、712、784、903 nm,所選波段分布在綠峰(500~600 nm)、紅邊(700 nm左右)和近紅外波段(780~1 000 nm)處,其中位于可見光波段內的特征波段最多,有5個波段,位于近紅外波段內的特征波段最少,有2個波段。圖3-b表示利用SPA對MSC光譜選取特征波段的結果,可以看出,SPA選取特征波段數為78個,被剔除波段數占總波段數的87.022%,所選特征波段集中在可見光和近紅外波段,說明直接利用SPA對MSC原始光譜進行波段特征選取可以在一定程度上消除冗余波段,但不能明顯確定對辣椒葉片葉綠素敏感性強的波段。

2.4 葉綠素含量估測模型結果與分析

表4是基于不同特征選取方法的不同回歸模型的估測結果,可以看出,通過SPA、GA-PLS和GA-PLS-SPA構建的回歸模型均能在一定程度上提高模型精度和減少需要輸入的特征波段數量?;贛SC全光譜建模中BO-RF精度最高,訓練集R2、RMSE和RPD分別為0.839、3.472和2.498,測試集R2、RMSE和RPD分別為0.838、4.055和2.507,RF和BP精度偏低,估測效果一般,RPD均小于2,說明全光譜數據量大且含有冗余信息較多,需要進行特征波段優選?;赟PA或者GA-PLS建模中BO-RF、RF和BP 3個模型均能達到估測辣椒葉片葉綠素含量的要求,其中BO-RF模型效果最好,RF和BP效果表現一般,RF和BP訓練集的R2均小于0.82,RMSE最小為3.743,RPD范圍為2.091~2.313,測試集的R2均小于0.81,RMSE最小為4.404,RPD范圍為2.042~2.286?;贕A-PLS-SPA建模中BO-RF、RF和BP 3個模型精度均得到顯著提高并且明顯高于全光譜、SPA或GA-PLS建模,其中BO-RF模型精度最優,訓練集的R2、RMSE和RPD分別為0.896、2.791和3.124,測試集的R2、RMSE和RPD分別為0.913、2.965和3.414。說明SPA和GA-PLS選取出的特征波段還含有不同程度的冗余信息,波段間存在信息重疊,GA-PLS-SPA通過2次特征波段選取進一步消除了冗余信息,選出的波段更具有代表性,模型也大大簡化。

綜上所述,GA-PLS-SPA是一種高效的特征波段選取方法,BO-RF在反演葉綠素含量方面具有極大的優越性,兩者結合構建的辣椒葉片葉綠素含量反演模型的估測效果明顯優于RF或BP建立的模型,GA-PLS-SPA-BO-RF可有效提高建模效率和精度。圖4表示GA-PLS-SPA-BO-RF模型的訓練集和測試集散點分布。

3 討論與結論

3.1 討論

本研究結果顯示,辣椒葉片的原始光譜曲線符合綠色植物葉片光譜曲線的變化規律,即在葉綠素和類胡蘿卜素的強吸收帶(400~490 nm)處反射率較低;在綠光波段,葉綠素的強反射導致光譜曲線出現波峰;在近紅外波段反射率急劇上升后出現反射率平臺,這可能與葉綠素對紅光波段強烈吸收和近紅外波段在葉片內部多次散射而形成強反射有關[31]。卷積平滑、多元散射校正、一階導數和二階導數4種光譜預處理方法可有效提高模型估測精度,其中基于多元散射校正方法構建的模型精度最高。這主要是因為多元散射校正解決了冠層反射光譜絕對強度差異大,光譜間存在基線平移和偏移的問題,增強了與葉綠素相關的有效信息,提高了光譜信噪比,這與毛博慧等研究得出的結論[32-33]一致。對復雜樣品的光譜數據進行分析時,雖然多種預處理方法可以被用于數據的預處理,但找到一種最佳的預處理方法是很重要的工作[34]。

GA-PLS、SPA、GA-PLS-SPA分別選擇了49、78、7個特征波段進行建模。結果表明,對高光譜數據進行特征波段選取,可在提升模型精度的同時簡化模型結構,而且GA-PLS-SPA建模效果要優于單一的GA-PLS或SPA建模。這是因為高光譜能帶來豐富光譜信息的同時,也帶來了信息冗余,需要進行特征波段選?。?5-36]。相關研究表明,SPA篩選出的波段子集中可能包含一些無信息波段甚至是干擾波段,不能保證選取出的波段之間共線性最小[37-38]。GA-PLS具有良好的全局搜索能力和信息提取能力,通過GA-PLS在全光譜范圍內選取特征波段構成SPA的候選集,然后在此基礎上進行SPA特征波段選取,避免了SPA選擇結果中包含無信息波段和干擾波段。本研究所選取的特征波段分布在綠峰(500~600 nm)、紅邊(700 nm左右)和近紅外波段(780~1 000 nm)處,與前人的研究基本相同,然而具體特征波段不同[2,32]。這是因為辣椒品種和果實顏色不同會造成所選具體特征波段不同,并且辣椒葉片光譜內可能存在土壤和雜草等干擾物造成的背景噪聲。

傳統線性回歸模型可能會忽略高光譜與葉綠素的非線性關系,導致估測模型精度受到影響[39]。因此,本研究利用貝葉斯優化隨機森林方法,輸入通過GA-PLS-SPA選取的7個最優特征波段,建立辣椒葉片葉綠素含量估測模型。由結果可知,BO-RF 模型的精度明顯高于RF模型,這主要是因為貝葉斯優化調節了n_estimators和max_depths等對隨機森林模型性能影響較大的超參數,并且貝葉斯優化迭代次數少,收斂速度快,適合小維度的調參需求。

3.2 結論

本研究以80個辣椒葉片的SPAD值為研究對象,對原始光譜進行SG、FD、SD和MSC 4種預處理,并進行對比分析,提出結合GA-PLS和SPA選取最優特征波段,并與全光譜、SPA和GA-PLS進行比較,同時構建了BO-RF、RF和BP估測模型,主要結論如下:

(1)SG、FD、SD和MSC 4種預處理均在不同程度上提高了模型精度,其中利用MSC預處理后的光譜數據建立的模型精度最高,說明MSC能有效解決基線偏移和漂移問題,是一種能有效提高建模精度的光譜預處理方法。

(2)GA-PLS-SPA選取的7個最優特征波長建模精度最高,并且構建的BO-RF、RF和BP 3個模型均能實現辣椒葉片葉綠素含量估測,其中GA-PLS-SPA-BO-RF精度最高,訓練集的R2、RMSE和RPD分別為0.896、2.791和3.124,測試集的R2、RMSE和RPD分別為0.913、2.965和3.414。表明GA-PLS-SPA能提高模型精度的同時簡化模型復雜度,是一種具有強泛化性和適用性的特征波長選取算法。

(3)在相同特征波段建模時,BO-RF模型的精度比RF模型高,說明貝葉斯優化可以避免不必要的參數評估,能有效解決RF模型的局部最優問題,提高RF模型的性能。

本研究僅針對辣椒盛果期的葉綠素含量進行研究和模型構建,同時樣本數量還不夠豐富,未來將繼續研究關于不同品種或相同品種不同生育期的辣椒葉片葉綠素含量估測方法。

參考文獻:

[1]馮海寬,陶惠林,趙 鈺,等. 利用無人機高光譜估算冬小麥葉綠素含量[J]. 光譜學與光譜分析,2022,42(11):3575-3580.

[2]Chen X W,Dong Z Y,Liu J B,et al. Hyperspectral characteristics and quantitative analysis of leaf chlorophyll by reflectance spectroscopy based on a genetic algorithm in combination with partial least squares regression[J]. Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2020,243:118786.

[3]武改紅,馮美臣,楊武德,等. 冬小麥葉片SPAD值高光譜估測的預處理方法[J]. 生態學雜志,2018,37(5):1589-1594.

[4]Ban S T,Liu W Z,Tian M L,et al. Rice leaf chlorophyll content estimation using UAV-based spectral images in different regions[J]. Agronomy,2022,12(11):2832.

[5]Wang T L,Gao M F,Cao C L,et al. Winter wheat chlorophyll content retrieval based on machine learning using in situ hyperspectral data[J]. Computers and Electronics in Agriculture,2022,193:106728.

[6]Xiao Q L,Tang W T,Zhang C,et al. Spectral preprocessing combined with deep transfer learning to evaluate chlorophyll content in cotton leaves[J]. Plant Phenomics,2022,2022:9813841.

[7]蔣煥煜,應義斌. 尖椒葉片葉綠素含量的近紅外檢測分析實驗研究[J]. 光譜學與光譜分析,2007,27(3):499-502.

[8]郭宏亮,黃 帥,聶楚楚,等. 基于分光吸收特性的辣椒葉片葉綠素含量測量方法研究[J]. 東北農業科學,2021,46(5):82-86.

[9]肖志云,王伊凝. 基于RF-VR的紫丁香葉片葉綠素含量高光譜反演[J]. 浙江農業學報,2021,33(11):2164-2173.

[10]王玉娜,李粉玲,王偉東,等. 基于連續投影算法和光譜變換的冬小麥生物量高光譜遙感估算[J]. 麥類作物學報,2020,40(11):1389-1398.

[11]蔡建楠,劉海龍,姜 波,等. 基于GA-PLS算法的河網水體化學需氧量高光譜反演[J]. 灌溉排水學報,2020,39(9):126-131.

[12]劉 潭,許童羽,于豐華,等. 改進特征波段選取和混合集成建模的東北粳稻葉綠素含量估算[J]. 光譜學與光譜分析,2021,41(8):2556-2564.

[13]高洪燕,毛罕平,張曉東. 光譜技術結合BiPLS-GA-SPA和ELM算法的生菜冠層氮素含量檢測研究[J]. 光譜學與光譜分析,2016,36(2):491-495.

[14]章海亮,羅 微,劉雪梅,等. 應用遺傳算法結合連續投影算法近紅外光譜檢測土壤有機質研究[J]. 光譜學與光譜分析,2017,37(2):584-587.

[15]劉燕德,程夢杰,郝 勇,等. 柑橘葉片葉綠素含量拉曼光譜定量分析方法研究[J]. 光譜學與光譜分析,2019,39(6):1768-1772.

[16]趙 菡. 蘋果葉片高光譜生化參數高通量反演模型研究[D]. 阿拉爾市:塔里木大學,2022:38-66.

[17]楊曉宇,包妮沙,曹 粵,等. 基于無人機成像光譜技術的農田土壤養分估測及制圖[J]. 地理與地理信息科學,2021,37(5):38-45.

[18]楊練兵,陳春波,鄭宏偉,等. 基于優化隨機森林回歸模型的土壤鹽漬化反演[J]. 地球信息科學學報,2021,23(9):1662-1674.

[19]陳 瀾,常慶瑞,高一帆,等. 獼猴桃葉片葉綠素含量高光譜估算模型研究[J]. 西北農林科技大學學報(自然科學版),2020,48(6):79-89,98.

[20]王 慶,車熒璞,柴宏紅,等. 基于無人機影像的冠層光譜和結構特征監測甜菜長勢[J]. 農業工程學報,2021,37(20):90-98.

[21]李愛民,王海隆,許有成. 優化隨機森林算法的城市湖泊DOC質量濃度遙感反演[J]. 鄭州大學學報(工學版),2022,43(6):90-96.

[22]Jin J,Wang Q. Evaluation of informative bands used in different PLS regressions for estimating leaf biochemical contents from hyperspectral reflectance[J]. Remote Sensing,2019,11(2):197.

[23]袁 瑩,王 偉,褚 璇,等. 光譜特征波長的SPA選取和基于SVM的玉米顆粒霉變程度定性判別[J]. 光譜學與光譜分析,2016,36(1):226-230.

[24]Wang X W,Xing X Y,Zhao M C,et al. Comparison of multispectral modeling of physiochemical attributes of greengage:Brix and pH values[J]. Food Science and Technology,2021,41(S2):611-618.

[25]由明明,常慶瑞,田明璐,等. 基于隨機森林回歸的油菜葉片SPAD值遙感估算[J]. 干旱地區農業研究,2019,37(1):74-81.

[26]崔佳旭,楊 博. 貝葉斯優化方法和應用綜述[J]. 軟件學報,2018,29(10):3068-3090.

[27]Qi H X,Wu Z Y,Zhang L,et al. Monitoring of peanut leaves chlorophyll content based on drone-based multispectral image feature extraction[J]. Computers and Electronics in Agriculture,2021,187:106292.

[28]Wang F L,Yang M,Ma L F,et al. Estimation of above-ground biomass of winter wheat based on consumer-grade multi-spectral UAV[J]. Remote Sensing,2022,14(5):1251.

[29]李長春,施錦錦,馬春艷,等. 基于小波變換和分數階微分的冬小麥葉綠素含量估算[J]. 農業機械學報,2021,52(8):172-182. [HJ2mm]

[30]Bhadra S,Sagan V,Maimaitijiang M,et al. Quantifying leaf chlorophyll concentration of Sorghum from hyperspectral data using derivative calculus and machine learning[J]. Remote Sensing,2020,12(13):2082.

[31]唐恒朋,錢曉剛,李莉婕,等. 不同施氮水平辣椒單葉光譜特征及SPAD值與葉綠素含量的相關性[J]. 西南農業學報,2016,29(10):2324-2329.

[32]毛博慧,李民贊,孫 紅,等. 冬小麥苗期葉綠素含量檢測光譜學參數尋優[J]. 農業工程學報,2017,33(增刊1):164-169.

[33]Kong L J,Yu H Y,Piao Z J,et al. Study of spectral response characteristics of oilseed rape (Brassica napus) to particulate [JP3]matters based on hyper-spectral technique[J]. Phyton-International [JP]Journal of Experimental Botany,2021,90(3):1015-1030.

[34]第五鵬瑤,卞希慧,王姿方,等. 光譜預處理方法選擇研究[J]. 光譜學與光譜分析,2019,39(9):2800-2806.

[35]楊紅艷,杜健民. 高光譜遙感圖像波段選擇研究進展綜述[J]. 計算機工程與應用,2022,58(10):1-12.

[36]Yang J,Yang S X,Zhang Y Y,et al. Improving characteristic band selection in leaf biochemical property estimation considering interrelations among biochemical parameters based on the PROSPECT-D model[J]. Optics Express,2021,29(1):400-414.

[37]程介虹,陳爭光. 基于迭代保留信息變量和連續投影的近紅外光譜波長選擇方法[J]. 分析化學,2021,49(8):1402-1409.

[38]Tang R N,Chen X P,Li C.Detection of nitrogen content in rubber leaves using near-infrared (NIR) spectroscopy with correlation-based successive projections algorithm (SPA)[J]. Applied Spectroscopy,2018,72(5):740-749.

[39]于豐華,馮 帥,趙依然,等. 粳稻冠層葉綠素含量PSO-ELM高光譜遙感反演估算[J]. 華南農業大學學報,2020,41(6):59-66.

基金項目:國家重點研發計劃(編號:2022YFD1100307);貴州省科技支撐計劃(編號:黔科合支撐[2020]1Y172號、黔科合支撐[2021]一般496號、黔科合支撐[2021]一般173號);貴州科學院青年基金(編號:黔科院J字[2018]25號)。

作者簡介:彭俊杰(1996—),男,貴州貴陽人,碩士,主要從事攝影測量與遙感方面的研究工作。E-mail:1962671749@qq.com。

通信作者:汪 泓,博士,副教授,主要從事喀斯特地區遙感與數字攝影測量方面的研究。E-mail:7653606@qq.com。

主站蜘蛛池模板: 国产国产人成免费视频77777| 亚洲黄色激情网站| 国产乱视频网站| 97青草最新免费精品视频| 大学生久久香蕉国产线观看| 欧美国产综合色视频| 国产99热| 久久青草精品一区二区三区| 久久国产精品嫖妓| 国产成熟女人性满足视频| 亚洲AV无码久久天堂| 亚洲无码在线午夜电影| 熟妇丰满人妻| 久久美女精品国产精品亚洲| 99久久精品免费观看国产| 亚卅精品无码久久毛片乌克兰| 亚洲欧美在线精品一区二区| 日韩国产精品无码一区二区三区| 欧洲极品无码一区二区三区| 精品久久香蕉国产线看观看gif | 午夜一级做a爰片久久毛片| 99精品在线看| 扒开粉嫩的小缝隙喷白浆视频| 澳门av无码| 亚洲国产一区在线观看| 色综合手机在线| 99热在线只有精品| 国产在线视频导航| 在线免费看片a| 亚洲综合经典在线一区二区| 玩两个丰满老熟女久久网| 亚洲一区无码在线| 国产中文在线亚洲精品官网| 激情六月丁香婷婷四房播| 成人免费视频一区二区三区| 真实国产精品vr专区| 久久国产高潮流白浆免费观看| 国产91全国探花系列在线播放| 欧美视频在线播放观看免费福利资源 | 亚洲国内精品自在自线官| 亚洲国产综合精品一区| 四虎免费视频网站| 日本三级精品| 狠狠躁天天躁夜夜躁婷婷| 免费在线a视频| 97亚洲色综久久精品| 国产精品蜜芽在线观看| 国产精品第三页在线看| 久久免费视频6| 国产男人的天堂| 国产浮力第一页永久地址| 99热这里只有精品国产99| 天天躁夜夜躁狠狠躁躁88| 国产女人水多毛片18| 亚洲综合片| 最新日韩AV网址在线观看| 四虎永久在线精品影院| 欧美日韩中文字幕在线| 国产小视频网站| 国产人成在线视频| 成人年鲁鲁在线观看视频| 亚洲69视频| 老汉色老汉首页a亚洲| 国产精品自在在线午夜| 国产亚洲精品97AA片在线播放| 波多野结衣爽到高潮漏水大喷| 欧美69视频在线| 精品国产香蕉伊思人在线| 免费A∨中文乱码专区| 在线欧美a| 在线欧美日韩国产| 亚洲第一区在线| 国产区福利小视频在线观看尤物| 综1合AV在线播放| 中文字幕人成人乱码亚洲电影| 久久精品aⅴ无码中文字幕| 在线免费观看AV| 亚洲丝袜第一页| 99视频在线免费| 中文字幕无码av专区久久| 国产美女在线免费观看| 国产毛片不卡|