






doi:10.3969/j.issn.1000-4440.2024.05.011
收稿日期:2023-05-31
基金項目:國家重點研發計劃項目(2017YFD1100307);貴州省科技支撐計劃項目;貴州省農業科學院青年基金項目
作者簡介:王" 宇(1998-),女,貴州安順人,碩士研究生,主要從事農業攝影測量方面的研究。(E-mail)2029807592@qq.com
通訊作者:肖玖軍,(E-mail)xiaojiujun0504@163.com
摘要:" 為了準確監測辣椒生長,本研究對辣椒冠層光譜反射率進行對數處理、倒數處理、倒數的對數處理、連續統去除處理、一階微分處理、二階微分處理,并與SPAD值進行相關性分析,用最大相關系數法(MCC)選取相關性較好的特征波段生成特征波段數據集,再用遺傳算法-偏最小二乘法(GAPLS)進行降維得到最優特征波段組合,采用偏最小二乘法(PLSR)、反向傳播神經網絡(BPNN)、隨機森林(RF)和最小二乘支持向量機(LSSVM)4種機器學習算法構建辣椒葉綠素含量反演模型。結果表明,最優波段和對應處理分別為700 nm(原始光譜)、699 nm(對數處理)、713 nm(連續統去除處理)、500 nm(二階微分處理)、713 nm(二階微分處理)。GAPLS的降維效果較好,與降維前相比PLSR模型的精度提升率最高,R2、RPD分別提升了82.22%、136.98%,RMSE降低了29.96%。4種模型中,GAPLS降維處理后的PLSR模型的精度最好,R2、RMSE和RPD分別為0.82、1.94、4.55。本研究構建的MCC-GAPLS-PLSR模型具有較好的反演潛力,適用于研究區辣椒葉片葉綠素含量測定,推動辣椒高效種植。
關鍵詞:" 葉綠素含量;辣椒;高光譜;光譜變換;遺傳算法-偏最小二乘法
中圖分類號:" S127;S641.3""" 文獻標識碼:" A""" 文章編號:" 1000-4440(2024)05-0865-09
Hyperspectral quantitative inversion of chlorophyll content in pepper based on MCC-GAPLS-PLSR
WANG Yu1," WANG Hong2," XIAO Jiujun3,4,5," XING Dan6," LI Kexiang3,4," ZHANG Yongliang2," YUE Yanbin7
(1.Guiyang Engineering Corporation Limited, Power China, Guiyang 550081, China;2.College of Mining, Guizhou University, Guiyang 550025, China;3.Institute of Mountain Resources, Guizhou Academy of Sciences, Guiyang 550001, China;4.Engineering Research Center for Land Green Consolidation of Guizhou, Guiyang 550001, China;5.College of Resources and Environmental Engineering, Guizhou University, Guiyang 550025, China;6.Pepper Research Institute, Guizhou Academy of Agricultural Sciences, Guiyang 550009, China;7.Institute of Agricultural Science and Technology Information, Guizhou Academy of Agricultural Sciences, Guiyang 550009, China)
Abstract:" In order to accurately monitor the growth of peppers, this study performed logarithmic treatment, reciprocal treatment, reciprocal logarithmic treatment, continuum removal treatment, first derivative treatment, second derivate treatment on the canopy spectral reflectance of peppers, and conducted correlation analysis with SPAD values. The maximum correlation coefficient method (MCC) was used to select the feature bands with good correlation to generate a feature band dataset. And the genetic algorithm-partial least squares (GAPLS) was used to reduce the dimensionality to obtain the optimal feature band combination. Pepper chlorophyll content inversion model was constructed by using four machine learning algorithms: partial least squares regression (PLSR), backpropagation neural network (BPNN), random forest (RF) and least squares support vector machine (LSSVM). The results showed that the optimal wavelengths and corresponding treatments were 700 nm (original reflectivity), 699 nm (logarithmic treatment), 713 nm (continuum removal treatment), 500 nm (second derivate treatment), 713 nm (second derivate treatment). The dimensionality reduction effect by GAPLS was good. And compared with before dimension reduction, the accuracy improvement rate of PLSR model was the highest, R2 and RPD increased by 82.22% and 136.98% respectively, and RMSE decreased by 29.96%. Among the four models, PLSR model after dimensionality reduction by GAPLS had the best accuracy, with R2, RMSE, and RPD of 0.82, 1.94, and 4.55, respectively. The MCC-GAPLS-PLSR model constructed in this study has good inversion potential and is suitable for measuring the chlorophyll content of pepper leaves in the study area, thus promoting efficient cultivation of peppers.
Key words:" chlorophyll content;pepper;hyperspectral;spectral transformation;genetic algorithm-partial least squares
葉綠素是植被進行光合作用的主要物質,可以作為植被生長狀況的監測指標。監測葉綠素含量動態變化可幫助了解植物健康、營養狀況和生產力。前人常采用化學試驗法對葉綠素含量進行測定,該方法費時費力,且在葉綠素提取過程中易造成色素損失,破壞性取樣也無法保證樣品完整性,同時該方法僅能實現點狀檢測,需達到一定樣本量后才能借助一些空間插值法擴展為面狀尺度,離植物生長快速區域性監測有一定距離,無法滿足精準農業要求。SPAD(Soil and plant analyzer develotrnent)-502葉綠素計被廣泛用于葉綠素含量測定,SPAD值能準確表征葉綠素相對含量,可用于測量植被葉綠素含量。由于高光譜遙感技術具有連續且豐富的光譜信息,它可以更加精確地估算出植物的葉綠素含量,并且高光譜遙感技術還具有快速、無損監測的優勢,可以在不損害植物的前提下,對植物的長勢進行監測。
近年來,針對高光譜反演SPAD值展開的研究取得了一定成果,通常在對原始光譜進行預處理后利用相關模型對植被參數進行反演。學者們在植被指數構建、光譜數據處理、特征波長選擇等具體方面又各有所側重。如Zheng等研究原位高光譜測量反演山地草原葉綠素含量時發現植被指數MSR(Modified simple ratio)、MCARI(Modified chlorophyⅡ absorption ratio index)、MCARI/OSAVI(Modified chlorophyⅡ absorption ratio index/Optimized soil-adjusted vegetation index)和TCARI(Transformed chlorophyⅡ absorption ratio index)在估計冠層葉綠素含量方面具有較高準確性。Jiang等開發出三波段高光譜植被指數用于反演受不同程度病蟲害威脅的紅樹林的葉片相對葉綠素含量。依爾夏提·阿不來提等對棉花原始光譜進行連續統去除、立方根轉換等處理,發現轉換后的光譜反射率與SPAD值相關性比原始光譜反射率高。李長春等對光譜反射率進行分數階微分處理,結果表明處理后的光譜反射率與冬小麥葉綠素含量的相關系數絕對值有所提升。苑迎春等提出在對顏色特征進行篩選時采用熵權法,并利用機器學習法對小麥冠層葉綠素含量進行反演。張佳偉等利用不同紅邊位置算法估測了玉米葉綠素含量。在模型構建方面,線性模型法簡單,建模速度快,如多元逐步線性回歸(MSLR)、主成分回歸(PCR)、偏最小二乘回歸(PLSR)等,其中PLSR應用最為廣泛。但線性模型無法理解多個變量之間的相互作用,不能很好地擬合非線性數據。現階段大量的非線性數據挖掘技術如人工神經網絡(ANN)、隨機森林(RF)、后向傳播神經網絡(BPNN)被廣泛應用于遙感反演建模中。采用聯合回歸方法建立葉綠素含量混合反演模型的研究也有零星報道。總體上多以單種光譜預處理后再經過特征波段選擇來直接回歸建模或構建植被指數間接回歸建模。
目前作物葉綠素含量反演研究對象多為玉米、高梁、大麥等糧食作物,對經濟作物研究較少,鮮見有對辣椒的高光譜反演研究。辣椒是重要的蔬菜作物,構建辣椒葉綠素含量反演模型對監測辣椒生長速度、智慧化種植、提升辣椒果實品質具有重要意義。本研究對辣椒冠層高光譜數據進行多種方法預處理,各預處理方法的特征波段提取采用最大相關系數法(MCC,Maximum correlation coefficient),組成特征波段數據集,再利用遺傳算法-偏最小二乘法(GAPLS)對特征波段數據集進行變量選擇,將選擇的波段作為自變量輸入偏最小二乘法回歸(PLSR)、最小二乘支持向量機(LSSVM)、后向傳播神經網絡(BPNN)和隨機森林(RF)4個機器學習模型中構建辣椒葉綠素含量反演模型,并對模型精度進行驗證,優選最佳反演模型,探討辣椒葉綠素含量高光譜反演方法,以期提高辣椒葉綠素含量反演模型的反演能力,推動辣椒高效、綠色種植。
1" 材料與方法
1.1" 研究區概況與試驗設計
研究區位于貴州省遵義市辣椒研究基地(107°2′27″E,27°44′5″N)(圖1),屬亞熱帶季風氣候,年平均降水量1 200 mm,日照充足,其氣候、土壤等自然條件十分適合辣椒栽培。
2021年4-10月在研究區對各辣椒品種進行不同施肥處理。選用貴州主栽辣椒的線椒和朝天椒,線椒品種為黔椒8號和紅辣18號,朝天椒品種為辣研101號和紅全球,共4個品種。每個辣椒品種都以0 kg/hm2、200 kg/hm2、350 kg/hm2、500 kg/hm2 4個施氮量進行處理, 3次重復。共計48個試驗區,每個試驗區長6 m,寬5 m。分別于播種期和開花期施肥,播種期和開花期施肥量相等。在最能反映辣椒生長狀況、決定辣椒產量與品質的盛花期、盛果期采集試驗數據。
1.2" 光譜反射率和葉綠素含量測定方法
1.2.1" 光譜反射率測定" 利用美國 ASD公司制造的FieldSpec4 Standard-Res便攜式地物光譜儀,在350~2 500 nm波段測量辣椒冠層的反射率,采樣間隔為1 nm。在10:00~15:00對高光譜數據進行測量,測量當天為晴天,無風,無云。在測量過程中,傳感器探頭垂直于地面,并且與辣椒植株頂部的高度距離為30 cm,視場角25°。每隔5株植株進行1次標準白板校正,每株植株重復測量5次,該植株最終光譜反射率為測量數據的平均值。在高光譜波段范圍內,可見光和近紅外波段為葉綠素的主要響應波段,所以將研究光譜區域定為400~1 000 nm。
1.2.2" 葉綠素含量測定" 本研究用SPAD值表征辣椒葉綠素含量。葉綠素含量采用SPAD-502 Plus葉綠素儀進行測定,與高光譜測量同步。每株辣椒測定15~20片辣椒冠層葉片葉綠素含量,測定時對每片葉片上、中、下部測定6~10次,取平均值作為辣椒葉綠素含量,測定時避開葉脈。
1.3" 數據處理方法
1.3.1" 異常值處理" 用3倍標準差法檢查SPAD數據集異常樣本,剔除均值-3倍標準差以及均值+3倍標準差之外的數據,對剔除后的SPAD數據集再次用3倍標準差法檢查,如此反復,直至無異常樣本。用主成分分析法檢測光譜數據,在主成分分布圖中,95%置信橢圓之外的點被認為是異常樣本,予以剔除,經多次反復檢測,直至無異常樣本。最后得到光譜數據和SPAD數據對,共80對。
1.3.2" 光譜預處理" 對光譜數據進行Svitzky-Golay平滑處理,對反射率進行降噪處理,以此曲線為基礎再進行光譜變換。光譜變換方法為連續統去除、對數、倒數的對數、一階微分、倒數和二階微分處理,以不變換光譜為對照。Svitzky-Golay卷積平滑利用Origin運算,光譜變換利用Matlab運算。
1.3.3" 特征變量選擇" (1)最大相關系數法(MCC)。Pearson相關性系數可用來度量變量X和變量Y之間的相關性,取值為。通過MCC可以一定程度上減少光譜數據的冗余信息,從而篩選特征波段。將從各光譜變換中篩選出的特征變量進行組合,形成特征波段數據集。(2)遺傳算法-偏最小二乘法(GAPLS)。特征波段對于構建模型至關重要。偏最小二乘法擅于處理小樣本數據,可降低特征維數,使低維數據更具解釋性,從而獲得更好的識別精度。GAPLS不僅具有遺傳算法的全局優化搜索能力,還能利用偏最小二乘法對特征波段進行篩選。其基本思路是將偏最小二乘法中交叉均方根RMSECV作為遺傳算法中的適應度函數,用遺傳算法進行變量篩選,提取特征參數。本研究控制參數為:規模30,種群規模大小視樣本個數決定,最大迭代次數120,交叉概率50%,變異概率1%,收斂終止條件由迭代次數決定。對特征波段數據集執行10次GAPLS運算,根據貢獻率高、RMSECV值小的原則提取特征波段,組成特征波段組合。
1.4" 模型構建方法
為了保證模型構造與反演的穩定性與魯棒性,本研究采用Kennard-Stone方法,選取75%的數據進行建模,25%的數據進行驗證。分別利用偏最小二乘回歸(PLSR)、反向傳播神經網絡(BPNN)、隨機森林(RF)和最小二乘支持向量機(LSSVM)4種機器學習算法構建辣椒葉綠素含量反演模型,并對模型精度進行驗證。(1)偏最小二乘回歸(PLSR)。PLSR不僅可以有效解決多重線性模型帶來的問題,還可以解決諸如主成分分析等分析方法能解決的問題,進而提供更加深入、有用的信息。(2)隨機森林(RF)。RF可以對數據進行分類和回歸,它將問題劃分成多棵樹進行解決,從根源上提高模型的準確性,規避擬合現象,主要原理是集成學習思想。其參數設置:決策樹數為200,方法為回歸,每個樹葉的最小觀察數為3。(3)反向傳播神經網絡(BPNN)。BPNN屬于非線性模型,具有很好的監督學習功能,被廣泛應用到測繪遙感領域中,其參數設置:迭代次數1 000次,誤差1×10-5,學習率0.05,附加動量因子0.9,最小性能梯度1×10-5,最大失敗次數3。(4)最小二乘支持向量機(LSSVM)。LSSVM將經典SVM中的不等式限制轉化為等式限制,并通過求解一系列線性方程組來實現,從而提高了SVM運行效率,可以處理線性和非線性多元變量建模問題,還可以解決多元變量的復雜性問題。
1.5" 模型參數驗證方法
用決定系數(R2)、均方根誤差(RMSE)和相對分析誤差(RPD)對高光譜信息和葉綠素含量進行評估。采用Chang等提出的RPD評判等級,即當RPD<1.4時,模型將不能對數據進行預測;當1.4<RPD<2.0時,模型可較好地對數據進行預測;而當RPD>2.0時,模型可以非常好地對數據進行預測。當R2越接近1,RPD值越大,RMSE值越接近0,模型預測結果越接近真實值。
R2=n1(yi^-y-)2(yi-y-)2(1)
RMSE=n1(yi^-y-)2n(2)
RPD=SD/RMSE(3)
式中,n為樣本數,yi^為反演值,yi為實測值,y-為平均值,SD為yi^的標準差。
2" 結果與分析
2.1" 最大相關系數法生成特征波段數據集
相關系數被廣泛用于度量變量間線性相關的強弱程度。將原始光譜的反射率和經處理后的反射率與SPAD值進行Pearson相關性分析(圖2)。由圖2A可見,辣椒原始光譜反射率與SPAD值在可見光421~726 nm波段呈極顯著負相關(P<0.01),在近紅外波段(780~1 000 nm)相關性不顯著,相關性最高的波長是572 nm和700 nm,相關系數分別為-0.717和-0.691。
對數處理(LR)、倒數處理(IR)和倒數的對數處理(RL)因光照條件對光譜產生的乘性因素降低,可見光區光譜差異放大。由圖2B~圖2D可知,相對于原始光譜反射率,對數處理、倒數處理和倒數的對數處理僅改變了反射率與SPAD值相關系數大小及正負相關性,特征波段僅相差1~2 nm,并沒有突出其他特征波段。在429~725 nm波段,對數處理后的反射率與SPAD值呈極顯著負相關(P<0.01),相關性最好的波長是573 nm和700 nm,相關系數分別為-0.658和-0.675。在446~724 nm波段,倒數處理后的反射率和SPAD值呈極顯著正相關(P<0.01),相關性最好的波長是571 nm和700 nm,相關系數分別為0.606和0.619。在428~726 nm波段,倒數的對數處理后的反射率和SPAD值呈極顯著正相關(P<0.01),相關性最好的波長是572 nm和699 nm,相關系數分別為0.686和0.712。
連續統去除處理可削弱背景噪聲,并放大弱吸收特征信息。由圖2E可知,在520~748 nm波段,連續統去除處理后的反射率與葉綠素含量呈顯著負相關(P<0.01),相關性最好的波長是632 nm和713 nm,相關系數分別為-0.478和-0.741。
微分處理可提升光譜反射率與樣品之間的敏感度,其中,一階微分處理主要解決的是線性雜聲帶來的影響問題,二階微分處理主要解決的是土壤、其他植被等背景帶來的影響問題,提高分析精度,這2種微分處理是近紅外常用的光譜預處理方法。從圖2F可見,在400~421 nm、435~554 nm、677~704 nm波段一階微分處理后的反射率和SPAD值呈極顯著負相關(P<0.01),相關性最好的波長為500 nm和688 nm,其對應的相關系數值分別為-0.789和-0.791,在563~621 nm、633~672 nm、716~758 nm波段一階微分處理后的反射率和SPAD值呈極顯著正相關(P<0.01),相關性最好的波長為644 nm和662 nm,其對應的相關系數值分別為0.718和0.716。在483~541nm、573~580 nm、616~625 nm、643~651 nm、662~692nm、736~752 nm波段,二階微分處理后的反射率和SPAD值呈極顯著負相關(P<0.01),相關性最好的波段為500 nm和647 nm,其對應的相關系數值分別為-0.721和-0.832;在518~568 nm、626~640 nm、654~659 nm、696~714 nm波段,二階微分處理后的反射率和SPAD值呈極顯著正相關(P<0.01),相關性最好的波長為632 nm和702 nm,其對應的相關系數值分別為0.819和0.845。
經過MCC降維處理,7種光譜數據由4 027個特征變量減少到18個,并由這18個特征變量組成特征波段數據集。
2.2" GAPLS選擇變量生成最優特征波段組合
用GAPLS算法對MCC生成的特征波段數據集進一步篩選,進而建立更加穩定、反演能力更強的模型。由表1和表2可見,當變量選擇數為1、2時,交叉驗證均方根誤差(RMSECV)在0.2以上,誤差較大,當變量選擇數>2,RMSECV降至0.08左右。根據貢獻率高、RMSECV小的篩選原則選擇特征波段,當變量選擇數為5,可獲得最高貢獻率(99.34%),最低RMSECV(0.081 0),故選出第10、8、2、15、18波段作為最優特征波段組合,最優波段和對應處理分別為700 nm(原始光譜)、699 nm(對數處理)、713 nm(連續統去除處理)、500 nm(二階微分處理)、713 nm(二階微分處理)。
2.3" 回歸建模與評價
將MCC生成的特征波段數據集作為自變量輸入到4種機器學習回歸模型中,驗證集精度評價結果如表3所示,根據評價指標R2排序,4種模型的精度由高到低為LSSVM>RF>BPNN>PLSR;根據評價指標RMSE排序,4種模型的精度由高到低為PLSR>LSSVM>RF>BPNN;根據評價指標RPD排序,4種模型的精度由高到低為PLSR>BPNN>RF>LSSVM。綜合以上結果可以看出,線性模型優于非線性模型,三個非線性模型精度各異。
PLSR:偏最小二乘法回歸;LSSVM:最小二乘支持向量機;BPNN:后向傳播神經網絡;RF:隨機森林。R2:決定系數;RMSE:均方根誤差;RPD:相對分析誤差。
將經過GAPLS降維處理后得到的最優特征波段組合作為自變量也輸入4種機器學習回歸模型中,同樣用60個校正樣本進行模型構建,20個驗證樣本進行模型驗證,其精度評價結果如表4所示。4種回歸模型R2均大于0.7,4個模型反演值和實測值間均極顯著相關(P<0.01)。GAPLS降維處理后的PLSR模型的RMSE最小,為1.94,其余3種模型的RMSE在4以上。4種模型的RPD均大于1.4,均可對葉綠素含量進行粗略反演。GAPLS降維處理后的PLSR模型的RPD最高,在2以上,達到了4.55,表明該模型具有較好的反演能力。
根據R2值越接近1、RMSE值越小、RPD值越大模型越好的原則,通過對不同模型的反演值和實測值進行擬合(圖3),可以看出,4種模型均能很好反演辣椒葉綠素含量。PLSR模型反演效果最好,曲線斜率為0.913 9,最接近1,其次是BPNN模型,斜率達到1.127 2。綜上分析,GAPLS降維處理后的PLSR模型最優,其R2為0.82,RMSE為1.94,RPD為4.55,對辣椒葉綠素含量反演效果最佳。
PLSR:偏最小二乘法回歸;LSSVM:最小二乘支持向量機;BPNN:后向傳播神經網絡;RF:隨機森林。R2:決定系數;RMSE:均方根誤差;RPD:相對分析誤差。
PLSR:偏最小二乘法回歸;LSSVM:最小二乘支持向量機;BPNN:后向傳播神經網絡;RF:隨機森林。R2:決定系數;RMSE:均方根誤差;RPD:相對分析誤差。
GAPLS降維處理前后對比可見(圖4),GAPLS降維處理后模型精度普遍比未經GAPLS降維處理升高,說明GAPLS處理達到了進一步降低MCC生成的特征波段數據集維數的效果。同時不同模型精度提升情況存在差異,精度提升率最高的是GAPLS降維處理后的PLSR模型,其次是GAPLS降維處理后的BPNN模型。
PLSR:偏最小二乘法回歸;LSSVM:最小二乘支持向量機;BPNN:后向傳播神經網絡;RF:隨機森林。R2:決定系數;RMSE:均方根誤差;RPD:相對分析誤差。
3" 討論
為了提高光譜數據與葉綠素含量的相關性,減少噪聲等環境的影響,本研究對辣椒冠層光譜反射率數據進行連續統去除等6種數學變換處理,并在此基礎上用最大相關系數法篩選出18個特征波段,這些對辣椒葉綠素含量敏感的波段多位于500 nm、570 nm、640 nm、700 nm處,與大多數綠色植物特征波段一致,方慧等指出葉綠素響應光譜主要集中在紅邊位置(波段為700 nm左右)及綠峰位置(波段為500~600 nm)。在6種數學變換處理中,微分處理后的反射率與SPAD值相關性最強,在702 nm處相關性系數達到最大值0.845,這可能是由于辣椒沒有封行現象,葉片空隙較大,辣椒栽培時的薄膜和土壤會產生較大背景噪聲而影響光譜反射率,而微分處理能夠較好地消除這些噪聲。對數、倒數和倒數的對數處理后的特征波段與原始光譜的特征波段位置大致不變,這可能是3種變換的主要作用是降低光照影響因素,放大光譜差異,而本試驗在測量辣椒光譜反射率過程中受光照條件因素影響不大。
特征光譜數據集經GAPLS算法降維處理后,4種機器學習回歸模型的精度均有所提升,這主要是因為GAPLS算法改進了全局優化搜索能力,同時降低了特征維數,使低維數據更具解釋性,從而獲得更好的識別精度,不僅避免了光譜數據局部最優問題,還能解決光譜數據多重共線性問題,更利于搭建一個穩定、精度高的模型。
PLSR、RF、LSSVM、BPNN模型的R2、RMSE、RPD均表現出較好的預測精度,故4個模型都具有較好的反演能力,其中PLSR模型的反演精度最好,遠高于其他3種模型,可能是由于經過GAPLS處理后的最優特征波段數量減少,且已較大程度消除了共線性、數據噪聲等問題,故由2個變量構建的線性回歸模型表現出較好的反演能力,在高維數據、高變量時表現更加突出,孔鈺如等研究結果進一步證實了該結論。而非線性模型中的BPNN模型也具有較好的反演效果,這可能是由于辣椒葉綠素含量與最優特征波段組合間除了線性關系之外,還有一定的非線性關系,值得后續進一步研究。
4" 結論
本研究以西南地區盛花、盛果期辣椒冠層葉片為研究對象,對原始光譜反射率進行數學變換處理,并與辣椒SPAD值進行相關性分析,采用MCC、GAPLS算法對特征波段數據集進行降維,獲取最優波段組合,從而建立辣椒葉綠素含量反演模型,并對各模型的精度進行比較,得到如下結論:(1)辣椒葉片葉綠素的敏感波段主要分布在紅光區域和綠光區域,最優波段和對應處理分別為700 nm(原始光譜)、699 nm(對數處理)、713 nm(連續統去除處理)、500 nm(二階微分處理)、713 nm(二階微分處理)。(2)GAPLS對特征波段數據集的降維處理效果較為明顯,各機器學習回歸模型精度均呈現不同程度的提升,其中PLSR提升效果最突出,R2、RPD分別提升了0.37、0.83,RMSE降低了2.63。(3)4種機器學習回歸模型中,PLSR模型的精度最好,由MCC-GAPLS-PLSR構建的辣椒葉綠素含量反演模型具有較好的反演潛力。
參考文獻:
王" 雪,吉海彥. 基于便攜式光譜儀和反射、透射光譜技術的小麥葉片葉綠素定量分析研究. 中國農學通報,2011,27(21):39-43.
ZHENG F L, XU B, XIAO P F, et al. Estimation of chlorophyll content in mountain steppe using in situ hyperspectral measurements. Spectroscopy Letters,2021,54(7):495-506.
JANG S H, HWANG Y K, LEE H J, et al. Selecting significant wavelengths to predict chlorophyⅡ content of grafted cucumber seedlings using hyperspectral images. Korean Journal of Remote Sensing,2018,34(4):681-692.
GUO Y H, CHEN S Z, LI X X, et al. Machine learning-based approaches for predicting SPAD values of maize using multi-spectral images. Remote Sensing,2022,14(6):1337.
陳" 瀾,常慶瑞,高一帆,等. 獼猴桃葉片葉綠素含量高光譜反演模型研究. 西北農林科技大學學報(自然科學版),2020,48(6):79-89,98.
徐若涵,楊再強,申夢吟,等. 苗期低溫脅迫對“紅顏”草莓葉綠素含量及冠層高光譜的影響. 中國農業氣象,2022,43(2):148-158.
李長春,施錦錦,馬春艷,等. 基于小波變換和分數階微分的冬小麥葉綠素含量反演. 農業機械學報,2021,52(8):172-182.
JIANG X P, ZHEN J N, MIAO J, et al. Newly-developed three-band hyperspectral vegetation index for estimating leaf relative chlorophyll content of mangrove under different severities of pest and disease. Ecological Indicators,2022,140:108978.
依爾夏提·阿不來提,買買提·沙吾提,白燈莎·買買提艾力,等. 基于隨機森林法的棉花葉片葉綠素含量反演. 作物學報,2019,45(1):81-90.
李長春,施錦錦,馬春艷,等. 基于小波變換和分數階微分的冬小麥葉綠素含量反演. 農業機械學報,2021,52(8):172-182.
苑迎春,周" 毅,宋宇斐,等. 基于信息熵特征選擇的小麥冠層葉綠素含量估測方法. 農業機械學報,2022,53(8):186-195.
張佳偉,王仲林,譚先明,等. 利用不同紅邊位置算法估測玉米葉綠素含量. 浙江大學學報(農業與生命科學版),2021,47(4):464-472.
劉" 濤,張" 寰,王志業,等. 利用無人機多光譜反演小麥葉面積指數和葉綠素含量. 農業工程學報,2021,37(19):65-72.
CANDIANI G, TAGLIABUE G, PANIGADA C, et al. Evaluation of hybrid models to estimate chlorophyⅡand nitrogen content of maize crops in the framework of the future CHIME mission. Remote Sensing,2022,14(8):1792.
王芳東,嚴志雁,趙小敏,等. 油茶葉片葉綠素含量高光譜估測的偏最小二乘模型參數選擇. 江西農業大學學報,2022,44(1):86-96.
NAU J, PROKOPOV J, RˇEBCˇEK J, et al. SPAD chlorophyⅡ meter reading can be pronouncedly affected by chloroplast movement. Photosynthesis Research,2010,105(3):265-271.
付波霖,鄧良超,張" 麗,等. 聯合星載高光譜影像和堆棧集成學習回歸算法的紅樹林冠層葉綠素含量遙感反演. 遙感學報,2022,26(6):1182-1205.
李" 勝,張培林,李" 兵,等. 量子GA-PLS特征選擇算法及其應用. 量子電子學報,2014,31(2):194-201.
JIA W K, ZHAO D A, DING L. An optimized RBF neural network algorithm based on partial least squares and genetic algorithm for classification of small sample. Applied Soft Computing,2016,48:373-384.
SONG K S, LI L, LI S, et al. Hyperspectral retrieval of phycocyanin in potable water sources using genetic algorithm-partial least squares (GA-PLS) modeling. International Journal of Applied Earth Observation and Geoinformation,2012,18:368-385.
紀文君. 基于野外vis-NIR高光譜的土壤屬性反演及田間水分影響去除研究. 杭州:浙江大學,2014.
彭曉偉,張愛軍,楊曉楠,等. 谷子葉綠素含量高光譜特征分析及其反演模型構建. 干旱地區農業研究,2022,40(2):69-77.
ZHOU W, YANG H, XIE L J, et al. Hyperspectral inversion of soil heavy metals in Three-River Source Region based on random forest model. CATENA,2021,202:105222.
郭云開,許" 敏,張曉炯,等. 結合PRO-4SAIL和BP神經網絡的葉綠素含量高光譜反演. 測繪通報,2020 (3):21-24.
SHAO Y H, LI C N, HUANG L W, et al. Joint sample and feature selection via sparse primal and dual LSSVM. Knowledge-Based Systems,2019,185:104915.
CHANG C W, LAIRD D A, MAUSBACH M J, et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties. Soil Science Society of America Journal,2001,65(2):480-490.
SERRANO L, PEUELAS J, USTIN S L. Remote sensing of nitrogen and lignin in Mediterranean vegetation from AVIRIS data:Decomposing biochemical from structural signals. Remote Sensing of Environment,2002,81(2):355-364.
李嵐濤,汪善勤,任" 濤,等. 基于高光譜的冬油菜葉片磷含量診斷模型. 農業工程學報,2016,32(14):209-218.
郭超凡,郭逍宇. 基于可見光波段包絡線去除的濕地植物葉片葉綠素反演. 生態學報,2016,36(20):6538-6546.
李敏夏,張林森,李丙智,等. 蘋果葉片高光譜特性與葉綠素含量和SPAD值的關系. 西北林學院學報,2010,25(2):35-39.
羅" 靖,楊再強,楊" 立,等. 基于高光譜參數建立苗期高溫條件下草莓葉片葉綠素含量反演模型. 中國農業氣象,2022,43(10):832-845.
方" 慧,宋海燕,曹" 芳,等. 油菜葉片的光譜特征與葉綠素含量之間的關系研究. 光譜學與光譜分析,2007,27(9):1731-1734.
蔡建楠,劉海龍,姜" 波,等. 基于GA-PLS算法的河網水體化學需氧量高光譜反演. 灌溉排水學報,2020,39(9):126-131.
WANG C, FENG M C, YANG W D, et al. Extraction of sensitive bands for monitoring the winter wheat (Triticum aestivum) growth status and yields based on the spectral reflectance. PLoS One,2017,12(1):e167679.
孔鈺如,王李娟,馮海寬,等. 無人機高光譜波段選擇的葉面積指數反演. 光譜學與光譜分析,2022,42(3):933-939.
(責任編輯:成紓寒)