吳劍飛



摘 要:為探討實際應用中高光譜技術快速準確獲取農作物葉片含水量,本文以拔節期冬小麥含水量為研究對象,對冬小麥原始光譜進行三種光譜變換處理,采用雙波段光譜指數和競爭性自適應重加權采樣(Competitive Adaptive Reweighted Sampling, CARS)獲取高光譜數據中與LWC高度相關的波段組合,進行多種LWC建模并對比預測精度。結果表明:由CARS篩選的波段組合壓縮率達98%以上,結合偏最小二乘回歸(Partial Least Squares Regression, PLSR)構建的含水量預測模型擬合精度最高,所建模型中最高預測決定系數為0.8441,模型預測精度均高于以雙波段組合所建模型的預測精度。CARS在篩選與冬小麥葉片含水量相關的光譜波段組合方面較為適用,可為估算冬小麥種植區干旱情況和水分管理提供技術支持。
關鍵詞:冬小麥;葉片含水量;高光譜技術;競爭性自適應重加權采樣算法
中圖分類號:S512.1;S314 ?文獻標識碼:A ?文章編號:1673-260X(2021)07-0022-05
引言
作物含水量是體現作物生長狀況的重要品質指標,直接影響作物對光能的利用和營養供給水平,最終影響其生長質量、品質及產量[1]。冬小麥在中國國民飲食結構中占主導地位,對高產穩產有著重要意義。傳統的烘干法檢測精度較高,但難以滿足生產實踐中對大范圍冬小麥含水量實時、無損的檢測需求,且存在時效性差、有損檢測等弊端[2]。遙感技術為冬小麥含水量的動態無損監測提供了新的技術手段,其中高光譜分析技術具有快速、高效、無損的優點,能夠獲取豐富的地物光譜信息,估算作物生化參數進而診斷其健康狀態[3]。
相對于其他遙感技術,高光譜遙感屬于前沿領域,具有波段數目多、精度高等特點。國內外學者針對高光譜技術的在農業方面的應用開展了大量研究。如王玉娜等[4]利用FD-SPA建模獲取了多個時期冬小麥生物量與高光譜數據的響應關系,模型預測決定系數達0.78,得出抽穗期是估算冬小麥地上部生物量的較佳生育時期。任怡等[5]采用CARS算法對香蔥含水量和葉綠素含量的高光譜敏感變量優選,壓縮率達3.24%和1.78%,采用偏最小二乘法和支持向量回歸建立了定量分析模型,預測決定系數達0.9046和0.9143。
本研究以淮南阜陽地區拔節期冬小麥為實驗材料,通過對冬小麥高光譜數據和含水量的測定,采用原始光譜(Original Spectrum, OS)和一階導數(First Derivative, FD)、二階導數(Seconder Derivative,SD)和多元散射校正(Multiplicative Scatter Correction, MSC)處理后的共4種光譜數據形式,采用差值光譜指數(Difference Spectral Index,DSI)、比值光譜指數(Ratio Spectral Index, RSI)、歸一化光譜指數(Normalized Spectral Index, NDSI)、競爭性自適應重加權采樣(Competitive Adaptive Reweighted Sampling, CARS)共四種波段篩選方法獲取與葉片含水量(Leaf Water Content, LWC)高度相關的波段組合,結合支持向量回歸(Support Vector Regression,SVR)、BP神經網絡和偏最小二乘回歸(Partial Least Squares Regression, PLSR)建立波段組合和含水量的關系模型,對比分析預測精度,以期為實際應用中高光譜技術獲取作物含水量提供技術支持。
1 材料與方法
1.1 研究區概況
研究區位于安徽省阜陽市潁上縣謝橋鎮(東經115°56′-116°38′、北緯32°27′-32°4′)。該地區屬于北溫帶與亞熱帶之間過渡型氣候,地勢平坦,土壤肥沃;主要分布的土地類型為砂礓黑土;主要種植小麥、稻谷、玉米等作物,該地區是“農業綠色發展先行先試支撐體系建設試點縣”。選擇該地為研究區域,是考慮到該地的土壤和降水條件,且該地區小麥種植產量超過農作物總產量的一半,有著豐富的小麥資源和適宜的實驗條件。
1.2 光譜數據獲取
2019年4月15日,在當地小麥拔節期分多次采集光譜數據,采樣時間為10:30—13:30,測量時天氣晴朗,采用ASD FieldSpec4便攜式地物光譜儀共采集96組冬小麥冠層高光譜數據。儀器波長范圍為350~2500nm,其中350~1000nm波長的采樣間隔為1.4nm,1000~2500nm波長的采樣間隔為2nm,每個樣本測得30條光譜,剔除異常光譜后取平均值作為該樣本的光譜,每組數據采樣前均進行標準白板校正。
1.3 樣本采集與測試
在對應光譜測定位置選取10-15株小麥連根拔起,裝入取樣袋后迅速運回實驗室。在實驗室分離出葉片和莖,并稱取其飽和鮮重,放入烘箱105℃殺青1h后放置于75℃下烘干至恒重,測定干重。葉片含水量(Leaf Water Content,LWC)的計算公式如下:
式中,FWleaf和DWleaf分別表示葉片鮮重和干重(g)。表1為冬小麥樣本中葉片含水量的統計特征。
1.4 光譜數據處理
利用ViewSpecPro對采集的光譜數據進行處理,保留與LWC相關性較高的400~1350nm波段、1400~1800nm波段和1950~2400nm波段[6]。采用MATLAB 2017a軟件對OS進行預處理,并利用Origin 2019b軟件制圖。預處理包括FD、SD和MSC[7,8]。預處理結果如圖1所示。圖1(a)展示了拔節期冬小麥樣品的原始反射光譜曲線。光譜曲線有明顯的綠色植物的輪廓特征。
1.5 數據分析方法
光譜指數被認為是增強植被光譜信息的重要方法。其中最常見的形式是RSI、DSI和NDSI[9]。在數據范圍內,組合任意兩波段構成雙波段光譜指數,建立估算模型。
其中Rλ1和Rλ2分別為λ1和λ2兩個波段對應的光譜反射率。
1.6 CARS競爭性自適應重加權采樣算法
CARS是以達爾文進化論的“適者生存“為指導理論,采用蒙特卡洛采樣以及偏最小二乘回歸法的特征波段優選方法。CARS法的每個采樣周期可分為4個連續的步驟[12,13]:首先采用蒙特卡洛采樣法從校正集中選取樣本,進行PLSR建模;然后計算波段回歸系數的絕對值權重,經衰減指數法計算后,剔除絕對值較小的波段變量;接著采用自適應加權算法在剩余波段變量中選取波段,進行PLSR建模;最后選取交叉驗證的均方根誤差最小的模型對應的波段變量作為選擇的特征波段變量。
1.7 模型構建與精度檢驗
采用SVR、BP神經網絡和PLS建立光譜數據與葉片含水量的預測模型,由決定系數R2、均方根誤差RMSE作為模型精度評價指標。其中,R2越大估算效果越好;RMSE越小,模型估算效果越好,反之則越差。
2 結果與討論
2.1 雙波段植被指數回歸建模
基于OS、FD、SD和MSC構建的雙波段光譜指數與葉片含水量的等勢圖進行敏感波段組合篩選如圖2所示,等勢圖中每個坐標x和y分別對應λ1和λ2波段,坐標值對應于與葉片含水量的相關系數。模型預測結果匯總于表2。
圖2和表2顯示,同一光譜變換處理后的數據所建立的高光譜指數等勢圖類似,相同敏感波段組合下,RSI與LWC的相關系數高于NDSI與LWC的相關系數。對比不同光譜處理類型可知,MSC處理后光譜所建模型的R2較為穩定。OS的敏感波段組合主要分布2180~2390nm;FD的敏感波段組合主要分布在2050~2390nm;SD的敏感波段組合主要分布在2050~2390nm以及900~1300nm;MSC的敏感波段組合主要分布在1420~1430nm。
由表2可知,拔節期中OS-DSI-PLSR模型預測精度最高,R2為0.7987,RMSE為1.7689%。
2.2 CARS法篩選特征波段組合
基于CARS算法提取冬小麥LWC反演模型的特征波段的運行過程如圖3所示。由于CARS隨著采樣次數的不同呈現不同的運算結果,所以本文通過設定不同的采樣次數后分別進行運算以選取相對較優的波段變量組合[14]。
如圖3所示,采樣次數較少時,由于衰減指數的作用,CARS法選取的波段變量數在較短時間內由總波段變量數快速下降到較低水平,隨著采樣次數增加,選取變量數的降低幅度減緩,交叉驗證均方根誤差呈現出下降與上升交替進行的趨勢,圖中“*”豎線標出最小RMSECV值對應的采樣次數,為欠擬合與過擬合的交匯點,故選取該點處的最優波段。“*”豎線之后RMSECV開始增大,是由于有效變量被刪除了。以OS為例,在OS-CARS中最終選取了1411、1412、1424、1425、1426、1427、1959、2020、2021、2064、2071、2176、2177、2190、2207、2208、2259、2260、2261、2306、2316、2317、2334、2335、2338、2351、2358、2377、2385、2391、2395、2400共32個特征波段用于LWC的預測。選取總量分別僅占全波段總數的1.77%。
結合表2、表3,對比不同方法可知,CARS與提取了有效波段,剔除了無效信息,降低了模型的復雜度,避免了高光譜數據建模中有效信息“丟失”問題,表明CARS在篩選與冬小麥葉片含水量相關的光譜波段組合方面較為適用。
3 結論
本研究對拔節期的冬小麥同步進行了高光譜數據采集和葉片含水量測定,對獲取的高光譜數據進行了光譜變換和特征波段提取,通過分析得出以下結論:
(1)與冬小麥葉片含水量相關的波段主要集中在900~1300nm、1420nm~1430nm和2050~2390nm。
(2)由雙波段指數和優選波段組合偏最小二乘構建的模型預測精度高于支持向量回歸和BP神經網絡回歸,其中拔節期冬小麥葉片含水量的最佳估測模型為FD-CARS-PLSR。
(3)CARS算法有效減少了建模所需變量數,提取的特征波段主要分布在1410~1430nm、1950~2400nm,使用低于總波段數2%的光譜數據獲得了很好的建模效果,極大降低了數據冗余度,所建拔節期冬小麥葉片含水量估算模型的預測決定系數達0.8441。
參考文獻:
〔1〕Peng Z, Lin S, Zhang B, et al. Winter Wheat Canopy Water Content Monitoring Based on Spectral Transforms and "Three-edge" Parameters[J]. Agricultural Water Management,2020, 240:106306.
〔2〕劉曉靜,陳國慶,王良,等.不同生育時期冬小麥葉片相對含水量高光譜監測[J].麥類作物學報,2018,38(07):854-862.
〔3〕王紀華,趙春江,郭曉維,等.用光譜反射率診斷小麥葉片水分狀況的研究[J].中國農業科學,2001, 40(01):104-107.
〔4〕王玉娜,李粉玲,王偉東,等.基于連續投影算法和光譜變換的冬小麥生物量高光譜遙感估算[J].麥類作物學報,2020,40(11):1389-1398.
〔5〕任怡,王成全,Bonah Ernest,等.高光譜成像技術預測香蔥貯藏品質研究[J/OL].食品工業科技:1-15[2021-04-03].
〔6〕陳秀青,楊琦,韓景曄,等.基于葉冠尺度高光譜的冬小麥葉片含水量估算[J].光譜學與光譜分析,2020,40(03):891-897.
〔7〕第五鵬瑤,卞希慧,王姿方,等.光譜預處理方法選擇研究[J].光譜學與光譜分析,2019,39(09):2800-2806.
〔8〕張東輝,趙英俊,秦凱,等.光譜變換方法對黑土養分含量高光譜遙感反演精度的影響[J].農業工程學報,2018,34(20):141-147.
〔9〕王偉東,常慶瑞,王玉娜.基于UHD185成像光譜儀的冬小麥葉綠素監測[J].干旱區研究,2020,37(05):1362-1369.
〔10〕Galv?觓o, R K Harrop, Araújo, et al. Cross-validation for the selection of spectral variables using the successive projections algorithm[J]. Journal of the Brazilian Chemical Society,2007,18(08).
〔11〕MCU Araújo, T C B Saldanha, R K H Galv?觓o, et al. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis[J].Chemometrics and Intelligent Laboratory Systems, 2001, 57(02).
〔12〕H D Li, Y Z Liang, Q S Xu, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta,2009,648(01).
〔13〕D Wu, D W Sun. Potential of time series-hyperspectral imaging (TS-HSI) for non-invasive determination of microbial spoilage of salmon flesh[J]. Talanta,2013,111.
〔14〕王海龍,楊國國,張瑜,等.競爭性自適應重加權算法和相關系數法提取特征波長檢測番茄葉片真菌病害[J].光譜學與光譜分析,2017,37(07):2115-2119.