王夢迪,何 莉,劉 潛,李志娟,王 冉,賈中甫,王敬哲,鄔國峰,石鐵柱
基于小麥冠層無人機高光譜影像的農田土壤含水率估算
王夢迪1,何 莉2,劉 潛1,李志娟3,王 冉3,賈中甫3,王敬哲4,鄔國峰1,石鐵柱1※
(1. 深圳大學自然資源部大灣區地理環境監測重點實驗室&廣東省城市空間信息工程重點實驗室&深圳市空間信息智能感知與服務重點實驗室,深圳 518060;2. 深圳大學機電與控制工程學院,深圳 518060;3. 內蒙古自治區測繪地理信息中心,呼和浩特 010020;4. 深圳職業技術學院人工智能學院,深圳 518055)
精準監測農田土壤含水率(soil moisture content,SMC)有助于提高中國水資源利用率以及農業可持續發展水平,為實現國家農業經濟的穩定發展及可持續發展目標打下堅實的基礎。為了探索基于無人機遙感數據進行準確、快速的土壤含水率監測的方法,該研究選取新疆阜康綠洲田塊為研究區,使用無人機(unmanned aerial vehicle,UAV)高光譜傳感器采集田塊尺度小麥冠層光譜信息,進行SMC定量估算和制圖。對小麥冠層光譜進行savitzky-golay(SG)平滑,利用7種不同的小波基函數(bior4.4、coif4、db4、fk14、haar、rbio3.9、sym4)對光譜信息進行連續小波變換(continuous wavelet transform,CWT)處理,并采用遺傳算法(genetic algorithm, GA)對小波系數進行特征提取,最后結合偏最小二乘回歸(partial least square regress,PLSR)、支持向量機(support vector machine,SVM)、人工神經網絡(artificial neural network,ANN)、隨機森林(radom forest,RF)以及極端梯度提升(extreme gradient boosting,XGBoost)估算SMC并實現其空間制圖。結果表明:基于GA的特征波段選擇方法可有效提高SMC的估算精度。使用全波段小波系數構建模型的決定系數2在0.20~0.44之間,而使用特征小波系數的2為0.25~0.82。與其他小波基函數相比,采用db4特征小波系數的估算精度最優,PLSR、SVM、ANN、RF和XGBoost模型估算SMC的2分別為0.82、0.72、0.79、0.76和0.45。基于PLSR和ANN最優模型進行SMC空間制圖,基于CWT和機器學習結合模型能夠有效估算小田塊尺度SMC。該研究基于無人機高光譜數據實現了SMC精確估算,為農田尺度SMC監測提供了有效手段。
土壤含水率;無人機;高光譜;連續小波變換;遺傳算法
作為農業監測的重要指標之一,土壤含水率(soil moisture content,SMC)對于評估土壤墑情、農作物生長狀況和產量具有指導性作用。在作物的生長過程中,SMC過低會導致土地硬化,進而影響農作物對水分以及養分的吸收[1]。同時,由于中國農業水資源利用率不高[2],尤其在中國西北部干旱區,精確獲取綠洲農田SMC信息對于加強綠洲生態環境的穩定性以及農業可持續發展具有重要意義。
傳統的SMC監測基于烘干法、中子儀測定法、γ射線法等[3],該類方法單點測定精度高,但需耗費大量的人力物力及時間資源,且無法提供連續的SMC空間表面信息。由于實時性、無損性以及非接觸性等特點,可見光近紅外遙感(visible and near-infrared,VIS-NIR)[4]和微波遙感[5]等為SMC監測提供了有效手段。微波輻射能夠穿透土壤達到與波長相關的深度,但其分辨率相對VIS-NIR傳感器較差[6],無法滿足數字土壤制圖日益精細化的需求。而高光譜傳感器能夠提供更高的光譜保真度,能夠有效解決SMC容易受到蒸發蒸騰影響帶來的監測誤差[7]。干旱地區特殊的地理環境導致SMC具有較強的空間異質性。而衛星遙感數據相對較低的空間分辨率無法實時動態精準監測田塊尺度SMC,提供精細化的空間尺度信息。相比衛星多光譜數據,無人機平臺具有更高的空間分辨率,且簡單高效、操作靈活,其可搭載高光譜傳感器獲取更為豐富的光譜信息,能夠提供比衛星遙感技術更加精細的空間分辨率和光譜分辨率[8],適合田塊尺度精細化監測,在精準獲取農業信息方面已被廣泛研究和應用[9],無人機高光譜已成為數字土壤制圖中重要的數據源。然而,無人機在數據采集過程中,易受飛行姿態、天氣條件的干擾,且在植被覆蓋時無法直接獲取到土壤表面光譜信息。而目前暫無一套適用于植被覆蓋條件下對SMC進行預測的無人機高光譜影像數據處理流程與方法。研究表明[10],高光譜成像的部分特征波段可用于根據脫水對葉片色素特征的影響間接評估植物的水分狀況。而僅有少量學者基于植被指數方法基于無人機植被冠層光譜數據進行土壤含水率的估算研究。因此,有必要進一步探索利用無人機高光譜獲取的植被冠層信息估算SMC的方法。
高光譜數據具有豐富的波段信息,能夠提供更為細致的光譜信息用來反映地物理化特性,但是同時也存在著噪聲、信息高度冗余、吸收特征重疊等問題。作為強力有效的信號處理工具,小波變換(wavelet transform,WT)被證明可用于特征增強與提取[11],已被廣泛應用于基于遙感數據的葉面積指數估算[12]、作物病蟲害監測[13]和土壤重金屬反演[14]等中,并表現出出色的增強光譜信息的能力。利用WT增強SMC光譜特征的微弱吸收峰,能夠在一定程度上分離重疊的吸收特征[15],對高光譜信息進行連續小波變換(continuous wavelet transformation,CWT)也能夠增強理化參數的特征信息[16]。
高光譜數據存在波段數眾多、信息冗余度高的問題,可通過特征波段提取解決此類問題。目前,常用的特征提取方法主要有相關系數法、主成分分析法和連續投影法等。與這些常用的方法相比,遺傳算法(genetic algorithm,GA)[17]提供了一種更為簡單高效的數據建模方法,且保留了原始光譜變量的物理意義。GA以種群為目標在全局尺度上進行特征波長的選取,在極大程度上保持目標光譜在全域波段的完整性,避免了在特征選取過程中由于部分過于敏感的特征波段的影響而忽視了全局優化的情況,能夠使模型更加穩定。遺傳算法結合最小二乘法進行光譜特征波段選取是近幾年的研究熱點。LIU等[18]驗證采用基于GA的反向傳播(back propagation,BP)神經網絡回歸進行SMC預測在準確率方面優于BP神經網絡回歸。NGUYEN等[19]在利用極端梯度提升模型(extreme gradient boosting,XGBoost)進行SMC預測時發現結合GA進行最佳波段選擇能夠表現出更高的預測精度。因此,WT與GA相結合的方法應用于無人機高光譜數據,可綜合二者的優勢,在提升SMC預測精度的同時降低計算復雜度,提高模型的魯棒性。而目前,幾乎沒有將WT與GA相結合的研究,故有必要探索WT與GA在SMC數字土壤制圖方面的潛力。
機器學習方法常被用于構建SMC估算模型。如ADAB等[20]利用可見光近紅外高光譜數據比較了支持向量機、隨機森林、人工神經網絡在預測SMC上的能力。但由于不同數據預處理方法以及土壤質地和氣候環境等外部因素的影響,不同的機器學習算法在各研究中呈現不同程度的精度結果。因此有必要基于無人機植被冠層高光譜影像數據,探討GA結合CWT在不同機器學習方法下估算SMC的效果。
綜上,為利用UAV遙感數據進行準確、快速的土壤含水率監測,該研究基于UAV高光譜影像,探討基于農作物冠層光譜反演SMC的可行性,旨在:1)建立一套適用于UAV高光譜影像的處理流程和方法;2)評估CWT結合GA算法提取適宜SMC反演的特征信息的效果;3)分析不同機器學習算法估算SMC的空間分布特征,以期為干旱區綠洲農田土壤水含量狀況監測以及農業生態平衡發展提供數據參考。
本研究選取的地塊位于中國新疆維吾爾族自治區阜康市的荒漠-綠洲過渡帶(87°51'15″E,44°21'14″N)。該田塊屬溫帶大陸性荒漠氣候區,北部為古爾班通古特沙漠。研究區全年降水主要集中于冬春季,普遍在150 mm以下,年蒸發量大于2 000 mm。研究區的主要土壤類型為灰棕漠土和風沙土,土壤有機質含量和含水率低。研究區內種植作物為一年一熟的冬小麥。該田塊長度為220 m,寬度為130 m,總面積為2.72 hm2(圖1)。

圖1 研究區采樣點分布
本研究使用DJI Matrice 600 Pro六旋翼無人機搭載Headwall公司Nano-Hyperspec高光譜成像儀獲取研究區的高光譜影像數據(圖2)。Nano-Hyperspec是集成光譜儀和數據存儲模塊的高光譜傳感器,同時集成了GPS/IMU(inertial measurement unit)慣導系統,可以同步獲取UAV的實時姿態信息。傳感器的波段范圍是紅外/近紅外波段(400~1 000 nm),包括270個光譜通道,光譜采樣間隔低于2.4 nm/像素,光譜分辨率在20 μm狹縫時低于6 nm。飛行器處于100 m航高下,Nano-Hyperspec高光譜傳感器焦距12 mm可獲取空間分辨率約為4 cm的高光譜影像,像素為640×480。為確保數據的真實客觀性,試驗組首先確認野外作業前5天內無降水與人工干擾,并于2018年4月17日(冬小麥返青期)北京時間15:00進行了UAV高光譜數據的采集工作。在無人機起飛前需要對傳感器進行暗電流校正和白板校正,飛行時天氣晴朗且無大風影響,具有良好視野。數據采集完成后使用HyperspecⅢ及Headwall Spectral View軟件進行幾何校正及正射校正數據預處理。為減少原始高光譜數據的噪聲,本研究采用savitzky-golay(SG)濾波平滑處理后的影像作為基礎影像,設SG濾波平滑為2階多項式及5點移動平均。本研究中的SG處理均在MATLAB R2016b中進行。

圖2 無人機飛行平臺搭載高光譜傳感器
在高光譜數據采集的同時,在目標田塊中均勻選取70個0.5 m×0.5 m的采樣單元,使用GPS(LT500T,CHC Navigation Technology Co. Ltd. Shanghai,China)記錄采樣點位置,精度約為1 m。以各個采樣單元中的小麥植株為中心點進行4點采樣,從表層去除植物殘留物和礫石等雜物,從植株中心樣方的4個角采集4個0~10 cm土壤樣品并徹底混合,并放置于鋁盒中密封保存。完成土壤樣本原始質量記錄后,對70份樣本進行熱重分析測量土壤樣本無水分質量,在105 ℃烘箱中進行48 h烘干,并計算SMC。
1.4.1 連續小波變換增強光譜特征信息


式中代表波長(400~1 000 nm),為縮放因子或稱膨脹因子,為平移因子。

式中()代表反射光譜,。在研究應用中,須以實際情況對和的值進行設置。本研究中,是波長從2 00 nm到1 000 nm的偏移量。
本研究選取7種小波基函數(bior4.4、coif4、db4、fk14、haar、rbio3.9和sym4)分別對冬小麥的冠層光譜數據進行連續小波變換。其中正交小波基函數coif4、db4、fk14、haar和sym4具有良好的局部化特征,能夠有效處理和分析微弱或突變的信號。雙正交小波基函數bior4.4和rbio3.9具有非線性相位及對偶性特征,能夠使生成的小波系數更加有規律,具有較好的平滑效果。除haar小波基函數外,其他正交小波基函數并不存在對稱性。本文對所得到的9層分解尺度小波系數與SMC實測數據進行相關性分析,并利用顯著性相關水平確定最優CWT尺度。
1.4.2 GA遺傳算法提取特征波段
采用遺傳算法對7種小波基函數最優CWT尺度的小波系數進一步提取特征波段。遺傳算法是基于達爾文自然進化學說中的自然選擇與遺傳學機理,模擬生物自然進化過程的計算模型[22]。它基于種群搜索算法,同時對群體目標中的多個個體進行篩選,通過多次更迭,極大程度地降低局部最優解的風險。研究設置GA的初步種群大小為64,窗口寬度為1,初始變量集為10%,突變率為0.5%。并采用隨機交叉驗證,以均方根誤差作為適應度函數來防止過擬合。當模型的適應度函數迭代達到一定次數時程序終止。在每次運行結束時,選定最佳染色體變量。為確保得到穩定可靠的結果,對數據重復執行 5 次,并對入選的波段及其頻率進行累計,根據累計頻率均值進行特征波段的提取。
1.4.3 基于機器學習方法的建模方法
基于遺傳算法提取的特征小波系數,采用以下5種機器學習算法構建SMC估算模型,并與基于全波段小波系數的模型結果進行對比分析:1)偏最小二乘回歸(partial least square regress,PLSR),該方法集主成分分析以及典型相關分析等傳統分析模型為一體,能夠在一定程度上解決數據非正態分布、因子結構不確定性等問題。在防止過擬合的前提下,本研究通過交叉驗證的均方根誤差來進行潛在變量最優數量選擇[23]。2)支持向量機(support vector machine,SVM),是DRUCKER[24]基于統計學習的理論基礎提出的,對神經網絡中的局部極小值問題有著較好的優勢。本研究中SVM的核函數使用高斯徑向基函數[25];epsilon設置為1.0、0.1、0.01以控制決策邊界的寬度;gamma設置為以對數均勻分布在10-6~10之間的15個值,其作用為用于定義高斯函數寬度的調優參數;cost則為每個支持向量的影響,設為以對數均勻分布在0.001~100之間的11個值[26]。3)人工神經網絡(artificial neural network,ANN),這是現階段廣泛使用的機器學習算法之一,并在眾多機器學習算法中有著相對較好的準確性、穩定性。本研究使用基于反向傳播BP(backpropagation)的前饋多層感知機(multilayer perceptron,MLP)[27],通過連續更新或訓練權值來減小估算誤差。設學習率為0.125,學習周期為20,學習周期首次訓練持續時間由學習率決定,后續每個學習周期的訓練持續時間為前一輪的2倍。4)隨機森林(radom forest,RF),它是一種基于回歸樹的集成學習算法,在2001年被BREIMAN等[28]提出,并被認為是現階段最準確的回歸預測方法之一。RF可以通過減少過度學習和過度擬合來提高性能,相較于傳統的單樹模型更加穩定[29]。本研究設置最大的弱學習器的個數為250,決策樹最大深度為100,并采用袋外樣本進行模型好壞的評估。5)極端梯度提升(extreme gradient boosting,XGBoost),該方法基于CHEN等[30]提出的梯度提升算法,通過使用更正則化的模型,形式化更好地控制過度擬合。XGBoost將弱分類器集成到強分類器中,并迭代生成新的樹以適應先前樹的殘差。本研究經過多次調參設置學習率為0.07,指定樹的最大深度為6,隨機數種子為45。
為了更好地提高驗證精度,充分使用樣本點數據,防止由于建模集或驗證集數量較少引起的偏差,在模型估算精度驗證階段采用留一法交叉驗證。本研究采用決定系數(2)和均方根誤差(MSE)進行模型精度評價,其計算式見文獻[31-32]。
本研究使用最小距離分類法對原始高光譜影像數據進行植被像素的掩膜提取,剔除裸土像素。選取最優估算模型實現SMC空間分布制圖。
研究區土壤樣本SMC分布如圖4所示,其平均值為25.15 g/kg,中位數為23.97 g/kg,最大值為37.63 g/kg,最小值為16.54 g/kg,標準偏差為4.81 g/kg,變異系數為19.14%。Shapiro-Wilk (SW)正態分布檢驗表明,SW=0.96,<0.01,表明SMC實測值整體呈非正態分布。

圖3 土壤含水率分布直方圖
為了直觀呈現樣本點SMC與冠層光譜響應特征之間的關系,本研究將樣本點SMC均分為4個不同梯度并選取各梯度中SMC中位值的樣本點進行小麥冠層反射率示例,圖4所示為4個不同梯度的小麥冠層反射率曲線。反射率曲線在綠波段(550 nm附近)有一個明細的反射峰,光譜曲線呈現明顯的植被光譜曲線特征。隨著含水率的增高,冠層光譜在400~750 nm可見光區域反射率也會隨著增高。在紅邊位置,含水率低于26 g/kg時,小麥冠層的反射率曲線則有著較大的斜率。

注:SMC是土壤含水率。
為了明確不同小波基函數的最優分解尺度,對不同基函數的小波系數與SMC實測值進行相關性分析。表1為不同分解尺度下小波系數與SMC間相關性通過0.01水平顯著性檢驗的波段數結果。隨著分解尺度的遞增,haar函數的小波系數在0.01水平上顯著的波段數也呈現遞增趨勢。其他小波基函數多數是在第4~6層分解尺度上呈顯著性相關的波段數目最少。根據0.01水平上顯著的波段數目,確定db4、coif4和fk14函數最優小波分解尺度為1尺度;sym4、bior4.4、haar和rbio3.9函數的最優小波分解尺度為9。

表1 通過小波系數與SMC相關分析顯著性檢驗的波段數
利用GA算法,基于最優小波分解尺度的7種小波系數,分別選擇出16(bior4.4)、 20(coif4)、19(db4)、24(fk14)、30(haar)、27(rbio3.9)、23(sym4)個特征小波系數(表 2)。rbio3.9、haar以及coif的特征信息主要集中在400~550,600~800 以及950~1 000 nm;fk14和bior4.4則是在450 nm以及600~800 nm集中,在其他波段并無明顯斷層式分布。db4函數在500~700 nm出現明顯的高頻段,其他波段相比之下分布比較均勻。7個小波基函數均在800~900 nm波段出現了明顯的斷層或者是稀疏分布,而在400~500 nm以及600~800 nm分布最為密集。總體而言,GA篩選得到的特征小波系數集中于藍色波段(420~490 nm)、紅色波段(680~780 nm)以及近紅外波段(890~1 000 nm)。

表2 遺傳算法提取的主要特征波段統計
基于GA選擇的特征小波系數,構建PLSR,SVM,ANN,RF和XGBoost模型,并與基于全波段小波系數的估算模型精度進行對比,留一法交叉驗證結果如表3所示。結果表明,使用全波段小波系數構建模型的精度2在0.20~0.44之間,而使用特征小波系數的2為0.25~0.82。基于全波段構建的SMC估算模型中,基于PLSR和ANN模型的估算精度決定系數2為0.20~0.42。SVM和XGBoost在db4、fk14和haar小波基函數下有著相對較好表現。RF則在db4和haar小波基函數上相比其他小波基函數精度明顯更好且精度高于其他機器學習模型。但基于全波段小波系數的估算結果整體較差。以經過GA算法篩選后得到的特征波段所對應的小波系數作為機器學習模型的輸入變量構建的模型精度有明顯提高,PLSR和ANN模型的2均在0.49及以上,基于db4小波基函數的2分別達到0.82和0.79,MSE分別達到2.28和2.54 g/kg。SVM、RF和XGBoost模型估算精度整體也明顯提高且更加平穩。SVM和RF基于db4小波基函數的2均達到0.72和0.76,MSE分別達到2.82和2.62 g/kg。相較于全波段的PLSR、SVM和ANN估算模型基于coif4小波基函數的2提升最為明顯,RF和XGBoost模型下的coif4小波基函數也有著明顯的精度提升,提升幅度分別僅次于fk14和rbio3.9。PLSR、SVM、ANN、RF和XGBoost分別提高了265.61%、131.39%、275.99%、40.62%和73.33%。其他小波系數通過GA篩選后精度均有所提高。由此可見,GA能夠在模型參與變量大幅減少的情況下,極大程度地提高模型精度。

表3 基于全波段和特征波段小波系數構建的SMC不同模型估算精度
注:PLSR、SVM、ANN、RF、XGBoost分別代表偏最小二乘回歸算法、支持向量機算法、人工神經網絡算法、隨機森林算法、極端梯度提升算法。2是決定系數;MSE是均方根誤差;下同。
Note: PLSR, SVM, ANN、RF、XGBoost represent partial least squares regression, support vector machine, artificial neural network, random forest, extreme gradient boosting.2is coefficient of determination;MSEis root mean square error; Same as below.
在使用GA篩選特征小波系數的SMC模型中,ANN在大多數小波基函數均有較好的估算精度,其他4種模型雖在部分小波基函數(例如db4)上有著較好的精度,但整體呈現較大的波動。5種模型均在db4小波基函數下具有最高的估算精度,而rbio3.9和bior4.4估算精度則相對較低。基于db4的PLSR和ANN模型的散點更接近于1∶1線,2分別為0.82和0.79,MSE分別為2.28和2.14 g/kg(圖5)。
使用PLSR和ANN的最優模型進行SMC空間制圖,結果表明(圖6和圖7),2種精度較高的模型估算SMC的空間分布整體一致。ANN模型估算的SMC結果離散程度較小,大多集中分布在30~40 g/kg,最大值為40.60 g/kg,最小值為10.70 g/kg。PLSR則分布離散程度較高,SMC最大值為52.39 g/kg,最小值為4.10 g/kg。對2種最優模型的估算結果與實測值進行絕對誤差計算如圖6所示,可見在整個研究區域內2種最優模型的SMC估算值與實測值偏差普遍存在,但大部分絕對誤差均在3.00 g/kg以內,大多數絕對誤差較大的區域集中在研究范圍東部及北部土壤含水率較高的區域。對于ANN模型的估算結果,在中部部分含水率較低區域也存在偏差值較大的情況。對2種最優模型的估算結果與實測值進行相對誤差計算如圖7所示,可見2種模型相對誤差分布基本一致,均在含水率較高區域存在較大相對誤差。PLSR模型相對誤差的離散程度明顯較大,2種模型的相對誤差大多均在10.0%以內。

圖5 基于最優模型估算SMC的散點圖

a. PLSR (db4)b. ANN (db4)

a. PLSR (db4)b. ANN (db4)
當前針對SMC定量估算的研究通常是基于裸土反射率光譜進行[33],但在農作物生長的關鍵階段,土壤被作物覆蓋,無法直接獲取土壤反射率。因此,本研究嘗試基于小麥冠層高光譜影像構建SMC監測模型,以期實現農田SMC監測。多種研究表明植被冠層的不同狀態及其光譜特征能夠直接反映SMC程度,為基于小麥冠層光譜監測SMC提供了基礎。狄艷等[34]認為SMC與植被冠層溫度有顯著關聯性,冠層溫度的變化直接對植被冠層的光譜曲線產生影響。DENNISON等[35]的研究表明,當SMC充足時,植被冠層反射率中紅邊信息明顯,短紅外波段隨著水分含量增加而反射率降低,而SMC缺乏時,由于葉片細胞的衰老導致冠層反射率紅邊藍移、短紅外波段的反射率顯著下降。另外,本研究認為基于小麥冠層光譜的SMC反演能夠更加直接反映農作物生長狀況與土壤環境協同情況,有助于掌握農作物生長狀態,調整土壤環境。
小波變換作為現階段高光譜數據處理的有效手段,已應用于大量研究并取得了較好的精度結果[36]。部分研究在進行小波基函數及分解尺度的選擇時利用大量且復雜的優化計算方法[37],或直接利用前人研究的經驗結果。PENG等[38]在土壤含水率反演中選用了13種小波基函數并基于6個不同的分解尺度生成78組數據,再對每組數據進行小波能力系數計算。SINGH等[39]根據先前研究中的經驗選用了Mexican hat(mexh)、Daubechies(db2)和Biorthogonal(bior1.3)3種小波基函數進行大豆葉片色素的測算。相比之下,本研究利用相關性分析方法進行小波基函數和分解尺度的選取,在確保估算精度的同時避免繁瑣復雜的優化計算試驗。
本研究結果顯示基于db4小波基函數構建的模型估算精度最佳,基于coif4、fk14、haar的估算模型也擁有較好表現。可能的原因是上述小波基函數均為正交小波基函數,在保留重要特征信息的同時,能夠較好地處理噪聲。同樣地,使用小波變換對光譜進行處理,PENG等[38]也發現選擇不同的小波基函數對SMC估算模型精度具有較大影響,其中 db4小波基函數效果最好。而由于bior4.4和rbio3.9雙正交特性可能在一定程度上對光譜信息進行了過度壓縮[40],因此,在本研究中相比較其他小波基函數,使用bior4.4和rbio3.9構建的模型估算SMC精度相對較差。以上表明,小波基函數的選擇能夠直接影響SMC模型的定量估測效果。
遺傳算法能夠搜索最佳特征波段以避免因波段選擇不當而導致的不穩定風險。KHELIL等[41]表明基于GA建立的小波濾波器進行風速預測模型,能夠優化CWT與機器學習相結合的問題。本研究結果顯示,采用GA篩選特征小波系數結合不同機器學習模型均能有效提高SMC模型精度。這一結論與陳紅艷等[42]的研究結果一致,他們結合小波變換和GA構建土壤堿解氮含量定量估算模型,顯著提高了估算精度。此外,本研究表明GA篩選出來的特征信息波段主要在藍光(420~490 nm)、紅光(680~780 nm)以及近紅外波段(890~1 000 nm),在植被紅邊波段(690~760 nm)尤為集中,以上波段與受到SMC影響的小麥葉片光譜特征波段吻合[15]。因此,本研究認為GA算法能夠有效選擇光譜特征,減少建模所變量數目,并去除高光譜數據中常存在的冗余信息,提高模型優化效率。
盡管機器學習在土壤學領域已被廣泛應用,但對于SMC估算建模及空間制圖方面的研究卻很少[43]。因此,本研究利用5種機器學習算法完成SMC估算模型并進行評估。結果顯示,最優PLSR模型精度2為0.82明顯優于其他4種機器學習模型,且均能夠實現較為準確地SMC估算和制圖。同樣地,HASSAN-ESFAHANI等[44]結合植被指數和ANN估算SMC精度2為0.77,表明利用機器學習算法建立SMC估算模型是可行的。de OLIVEIRA等[45]比較RF、SVM、ANN以及k最鄰近算法4種機器學習模型對大西洋森林的SMC估算精度,其中ANN表現優于SVM,與本研究結果一致。但RF和XGBoost在本研究中的表現卻沒有明顯優于ANN。以往研究表明[46],由于ANN和SVM具有很強的適應能力,可以通過學習到的復雜函數來擬合非線性關系,而RF和XGBoost算法則相對簡單,難以捕捉復雜的非線性關系。因此,ANN在處理具有復雜線性關系的數據時,表現往往優于RF和XGBoost。在對基于PLSR和ANN最優模型所得SMC估算空間分布結果進行進一步分析時,ANN對于實測值較高或較低的樣本點相比PLSR更加敏感。另外,ANN、RF和XGBoost回歸建模在大樣本時有優勢[20],而本研究的樣本點較少,可能也在一定程度導致以上模型結果相比PLSR精度略差。但在使用不同小波基函數時,ANN估算精度較為穩定,說明ANN能夠適用于對經過GA降維后的小波系數進行SMC反演。同時,數據的維度特征較高時會導致RF和XGBoost容易出現過擬合問題,針對此問題,本研究在利用GA完成高光譜數據降維后,不同模型精度均有大幅度提升。
由于植被品種、生育期以及土壤營養狀況等不同因素對植被光譜均有不同程度的影響,利用遙感手段完成基于植被冠層光譜的農田SMC估算尚未建立統一的研究范式。由于天氣和手段等原因的限制,本研究無法獲得多周期、多物侯的影像數據,因此所建立的SMC估算模型的泛化能力需要進一步驗證。后續的研究應在此基礎上建立大樣本植被光譜數據庫,深入探索植被冠層光譜與SMC之間的內在聯系。
本研究無人機(unmanned aerial vehicle,UAV)遙感平臺獲取高空間/光譜分辨率的影像數據結合連續小波變換(continuous wavelet transform,CWT)和遺傳算法(genetic algorithm,GA),基于農作物冠層高光譜光譜數據對農田土壤含水率(soil moisture content,SMC)進行反演,結論如下:
1)本研究考慮了不同的小波基函數對SMC估算精度的影響,選取7種小波基函數從9個分解尺度進行相關性對比,并有效選擇最優小波基函數(db4)和分解尺度(9)。并對小波系數進行了GA特征波段選取,進一步減少數據的冗余性,提高模型精度。
2)基于GA選取的特征小波系數使用機器學習模型對整個田塊SMC進行建模估算,所有機器學習模型結果精度均有提升,其中估算精度最佳模型為最小二乘回歸,2為0.82。支持向量機、人工神經網絡(以及隨機森林也表現出了較好的精度,2分別為0.79、0.72和0.76。結果表明無人機獲取得到的高光譜數據,進行CWT和GA特征提取后,結合機器學習能夠獲得理想的SMC的估算精度,制圖效果較好。本研究的結果能夠為中國干旱區農業用水規劃提供有效的技術支撐及決策輔助。
[1] GILLIES R R, KUSTAS W P, HUMES K S. A verification of the' triangle' method for obtaining surface soil water content and energy fluxes from remote measurements of the normalized difference vegetation index (NDVI) and surface e[J]. International journal of remote sensing, 1997, 18(15): 3145-3166.
[2] 操信春,劉喆,吳夢洋,等. 水足跡分析中國耕地水資源短缺時空格局及驅動機制[J]. 農業工程學報,2019,35(18):94-100. CAO Xinchun, LIU Zhe, WU Mengyang, et al. Temporal-spatial distribution and driving mechanism of arable land water scarcity index in China from water footprint perspective[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(18): 94-100. (in Chinese with English abstract)
[3] SU S L, SINGH D N, BAGHINI M S. A critical review of soil moisture measurement[J]. Measurement, 2014, 54: 92-105.
[4] Yuan J, Wang X, Yan C, et al. Soil moisture retrieval model for remote sensing using reflected hyperspectral information[J]. Remote Sensing, 2019, 11(3): 366.
[5] 王學,劉全明,屈忠義,等. 鹽漬化土壤水分微波雷達反演與驗證[J]. 農業工程學報,2017,33(11):108-114. WANG Xue, LIU Quanming, QU Zhongyi, et al. Inversion and verification of salinity soil moisture using microwave radar[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(11): 108-114. (in Chinese with English abstract)
[6] 李奎,張瑞,段金亮,等. 利用SAR影像與多光譜數據反演廣域土壤濕度[J]. 農業工程學報,2020,36(7):134-140. LI Kui, ZHANG Rui, DUAN Jinliang, et al. Wide-area soil moisture retrieval using SAR images and multispectral data[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(7): 134-140. (in Chinese with English abstract)
[7] MARTíNEZ-FERNáNDEZ J, GONZáLEZ-ZAMORA A, SáNCHEZ N, et al. Satellite soil moisture for agricultural drought monitoring: Assessment of the SMOS derived soil water deficit index[J]. Remote Sensing of Environment, 2016, 177: 277-286.
[8] 張超,劉佳佳,蘇偉,等. 基于小波包變換的農作物分類無人機遙感影像適宜尺度篩選[J]. 農業工程學報,2016,32(21):95-101. ZHANG Chao, LIU Jiajia, SU Wei, et al. Optimal scale of crop classification using unmanned aerial vehicle remote sensing imagery based on wavelet packet transform[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(21): 95-101. (in Chinese with English abstract)
[9] JIN X, LIU S, BARET F, et al. Estimates of plant density of wheat crops at emergence from very low altitude UAV imagery[J]. Remote Sensing of Environment, 2017, 198: 105-114.
[10] RAPAPORT T, HOCHBERG U, SHOSHANY M, et al. Combining leaf physiology, hyperspectral imaging and partial least squares-regression (PLS-R) for grapevine water status assessment[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 109: 88-97.
[11] TUNA S, KORKMAZ ?, TUNGA B, et al. An efficient feature extraction approach for hyperspectral images using wavelet high dimensional model representation[J]. International Journal of Remote Sensing, Taylor & Francis, 2022, 43(19/20/21/22/23/24): 6899-6920.
[12] ZHOU C, GONG Y, FANG S, et al. Combining spectral and wavelet texture features for UAV remote estimation of rice LAI[J]. Frontiers in Plant Science, 2022, 13: 957870.
[13] 黃林生,劉文靜,黃文江,等. 小波分析與支持向量機結合的冬小麥白粉病遙感監測[J]. 農業工程學報,2017,33(14):188-195. HUANG Linsheng, LIU Wenjing, HUANG Wenjiang, et al. Remote sensing monitoring of winter wheat powdery mildew based on wavelet analysis and support vector machine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(14): 188-195. (in Chinese with English abstract)
[14] 郭斌,白昊睿,張波,等. 基于RF和連續小波變換的露天煤礦土壤鋅含量高光譜遙感反演[J]. 農業工程學報,2022,38(10):138-147. GUO Bin, BAI Haorui, ZHANG Bo, et al. Inversion of soil zinc contents using hyperspectral remote sensing based on random forest and continuous wavelet transform in an opencast coal mine[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(10): 138-147. (in Chinese with English abstract)
[15] 褚小立,袁洪福,陸婉珍. 近紅外分析中光譜預處理及波長選擇方法進展與應用化學進展[J]. 化學進展,2004,16(4):528-542. CHU Xiaoli, YUAN Hongfu, LU Wanzhen. Progress and application of spectral data pretreatment and wavelength selection methods in NIR analytical technique[J]. Progress in Chemistry, 2004, 16(4): 528-542. (in Chinese with English abstract)
[16] ZHANG J, SUN H, GAO D, et al. Detection of canopy chlorophyll content of corn based on continuous wavelet transform analysis[J]. Remote Sensing, 2020, 12(17): 2741.
[17] 張霞,王一博,孫偉超,等. 基于鐵氧化物特征光譜和改進遺傳算法反演土壤Pb含量[J]. 農業工程學報,2020,36(16):103-109. ZHANG Xia, WANG Yibo, SUN Weichao, et al. Inversion of Pb content in soil based on iron oxide characteristic spectrum and improved genetic algorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(16): 103-109. (in Chinese with English abstract)
[18] LIU D, LIU C, TANG Y, et al. A GA-BP neural network regression model for predicting soil moisture in slope ecological protection[J]. Sustainability, 2022, 14(3): 1386.
[19] NGUYEN T T, NGO H H, GUO W, et al. A low-cost approach for soil moisture prediction using multi-sensor data and machine learning algorithm[J]. Science of the Total Environment, 2022, 833: 155066.
[20] ADAB H, MORBIDELLI R, SALTALIPPI C, et al. Machine learning to estimate surface soil moisture from remote sensing data[J]. Water, 2020, 12(11): 3223.
[21] GRAPS A. An introduction to wavelets[J]. IEEE Computational Science and Engineering, 1995, 2(2): 50-61.
[22] KATOCH S, CHAUHAN S S, KUMAR V. A review on genetic algorithm: Past, present, and future[J]. Multimedia Tools and Applications, 2021, 80(5): 8091-8126.
[23] AXELSSON C, SKIDMORE A K, SCHLERF M, et al. Hyperspectral analysis of mangrove foliar chemistry using PLSR and support vector regression[J]. International Journal of Remote Sensing, 2013, 34(5): 1724-1743.
[24] DRUCKER H, WU D, VAPNIK V N. Support vector machines for spam categorization[J]. IEEE Transactions on Neural Networks JF, 1999, 10(5): 1048-1054.
[25] ZHANG T, HUANG M, WANG Z. Estimation of chlorophyll-a concentration of lakes based on SVM algorithm and Landsat 8 OLI images[J]. Environmental Science and Pollution Research, 2020, 27(13): 14977-14990.
[26] LIE? M, SCHMIDT J, GLASER B. Improving the spatial prediction of soil organic carbon stocks in a complex tropical mountain landscape by methodological specifications in machine learning approaches[J]. Plos One, 2016, 11(4): e0153673.
[27] Shao W, Guan Q, Tan Z, et al. Application of BP - ANN model in evaluation of soil quality in the arid area, northwest China[J]. Soil and Tillage Research, 2021, 208: 104907.
[28] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45: 5-32.
[29] ZHANG Y, SUI B, SHEN H, et al. Mapping stocks of soil total nitrogen using remote sensing data: A comparison of random forest models with different predictors[J]. Computers and Electronics in Agriculture, 2019, 160: 23-30.
[30] CHEN T, GUESTRIN C. Xgboost: A scalable tree boosting system[C]//Proceedings of the 22nd Acm Sigkdd International Conference on Knowledge Discovery and Data Mining. San Francisco: ACM Sigspatial, 2016: 785-794.
[31] WRIGHT S. Correlation and causation[J]. 1921, 20: 557-585.
[32] NEVITT J, HANCOCK G R. Improving the root mean square error of approximation for nonnormal conditions in structural equation modeling[J]. The Journal of Experimental Education, 2000, 68(3): 251-268.
[33] 程琦,葉回春,董祥林,等. 采用探地雷達頻譜分析的復墾土壤含水率反演[J]. 農業工程學報,2021,37(6):108-116. CHENG Qi, YE Huichun, DONG Xianglin, et al. Inversion of reclaimed soil moisture based on spectrum analysis of ground penetrating radar[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2021, 37(6): 108-116. (in Chinese with English abstract)
[34] 狄艷,高懋芳,李強,等. 不同灌溉梯度下冬小麥冠層溫度與土壤水分關系研究[J]. 中國農業信息,2021,33(2):13-23. DI Yan, GAO Maofang, LI Qiang, et al. Study on the relationship between winter wheat canopy temperature and soil moisture under different irrigation gradients[J]. China Agricultural Information, 2021, 33(2): 13-23. (in Chinese with English abstract)
[35] DENNISON P E, ROBERTS D A. The effects of vegetation phenology on endmember selection and species mapping in southern California chaparral[J]. Remote Sensing of Environment, 2003, 87(2): 295-309.
[36] KOGER C H, BRUCE L M, SHAW D R, et al. Wavelet analysis of hyperspectral reflectance data for detecting pitted morningglory () in soybean ()[J]. Remote Sensing of Environment, 2003, 86(1): 108-119.
[37] Pothisarn C, Klomjit J, Ngaopitakkul A, et al. Comparison of various mother wavelets for fault classification in electrical systems[J]. Applied Sciences, 2020, 10(4): 1203.
[38] PENG J, SHEN H, HE S W, et al. Soil moisture retrieving using hyperspectral data with the application of wavelet analysis[J]. Environmental Earth Sciences, 2013, 69(1): 279-288.
[39] SINGH S K, HOYOS-VILLEGAS V, RAY J D, et al. Quantification of leaf pigments in soybean ((L. ) Merr. ) based on wavelet decomposition of hyperspectral features[J]. Field Crops Research, 2013, 149: 20-32.
[40] 童力,劉翰柔,胡松濤,等. 聽覺誘發電位信號分析中小波基函數的確定[J]. 科學技術與工程,2021,21(2):473-479. TONG Li, LIU Hanrou, HU Songtao, et al. Determination of wavelet basis function in auditory evoked potential signal analysis[J]. Science Technology and Engineering, 2021,21(2):473-479. (in Chinese with English abstract)
[41] KHELIL K, BERREZZEK F, BOUADJILA T. GA-based design of optimal discrete wavelet filters for efficient wind speed forecasting[J]. Neural Computing and Applications, 2021, 33(9): 4373-4386.
[42] 陳紅艷, 趙庚星, 李希燦, 等. 基于DWT-GA-PLS的土壤堿解氮含量高光譜估測方法[J]. 應用生態學報, 2013, 24(11):3185-3191. CHEN Hongyan, ZHAO Gengxing, LI Xican, et al. Hyper spectral estimation method for soil alkali hydrolysable nitrogen content based on discrete wavelet transform and genetic algorithm in combining with partial least squares (DWT-GA-PLS) [J]. Chinese Journal of Applied Ecology, 2013, 24(11): 3185-3191. (in Chinese with English abstract)
[43] PADARIAN J, MINASNY B, MCBRATNEY A B. Machine learning and soil sciences: A review aided by machine learning tools[J]. Soil, 2020, 6(1): 35-52.
[44] HASSAN-ESFAHANI L, TORRES-RUA A, JENSEN A, et al. Assessment of surface soil moisture using high-resolution multi-spectral imagery and artificial neural networks[J]. Remote Sensing, 2015, 7(3): 2627-2646.
[45] de OLIVEIRA V A, RODRIGUES A F, MORAIS M A V, et al. Spatiotemporal modelling of soil moisture in an atlantic forest through machine learning algorithms[J]. European Journal of Soil Science, 2021, 72(5): 1969-1987.
[46] AHMAD S, KALRA A, STEPHEN H. Estimating soil moisture using remote sensing data: A machine learning approach[J]. Advances in Water Resources, 2010, 33(1): 69-80.
Estimating soil moisture contents of farmland using UAV hyperspectral images of wheat canopy
WANG Mengdi1, HE Li2, LIU Qian1, LI Zhijuan3, WANG Ran3, JIA Zhongfu3, WANG Jingzhe4, WU Guofeng1, SHI Tiezhu1※
(1.-,,518060,;2.,,518060,;3.,,010020,; 4.,,518055,)
Accurate monitoring of soil moisture content (SMC) in agricultural fields can greatly contribute to the utilization of water resources and sustainable development. Low SMC can cause the soil to harden during crop growth, which in turn affects the absorption of the crops' water and nutrients. In this study, the field-scale wheat canopy spectra were gathered to quantitatively estimate and map the SMC using an unmanned aerial vehicle (UAV) hyperspectral sensor. The study area was selected as Fukang City, Xinjiang Uygur Autonomous Region, China (87°51'15′′E, 44°21'14′′N) at the transition zone between a desert and an oasis. The soil samples were also collected concurrently with the hyperspectral data. 70 sampling units of 0.5 m×0.5 m were evenly selected in the target field, where the GPS locations were recorded. The wheat canopy spectra were smoothed using the savitzky-golay (SG). The spectral data were then transformed using the continuous wavelet transform (CWT) with seven different wavelet functions (bior4.4, coif4, db4, fk14, haar, rbio3.9, and sym 4). The wavelet coefficients were extracted by the genetic algorithm (GA), and finally combined with partial least squares (PLSR), Support Vector Machine (SVM), artificial neural network (ANN), radom forest (RF), and extreme gradient boosting (XGBoost) to predict the SMC. A neural Network was used to predict the SMC, and then map the SMC at a spatial scale. The results demonstrate that the accuracy of SMC estimation greatly increased using the GA-based feature band selection. The determination coefficient (2) of the feature band was 0.35-0.82 with the wavelet coefficients, while the2of the complete wavelet band ranged from 0.20 to 0.44. Furthermore, the2of SMC reached 0.82, 0.72, 0.79, 0.76, and 0.46, respectively, using PLSR, SVM, ANN, RF, and XGBoost models. The best estimation accuracy was achieved in the feature band with the db4 wavelet coefficients, compared with the rest wavelet functions. The predicted and measured values were remarkably similar. The GA significantly reduced the number of variables to maximize the feature factors in the remote sensing bands. The majority of the feature bands were retained to remove the redundant bands that frequently presented in the hyperspectral data. The more stable ANN model was achieved in the small number of sample points on the big sample, even though the accuracy was lower than that of PLSR. Consequently, the perfect estimation accuracy of SMC with excellent mapping was obtained in the continuous wavelet transform and GA feature extraction of the hyperspectral data acquired by the UAV. The improved inversion can be expected to achieve accurate SMC prediction using crop growth period spectra at the field scale. The finding can provide a strong reference for high-precision SMC monitoring using remote sensing.
soil moisture; unmanned aerial vehicle; hyperspectral images; genetic algorithm; continuous wavelet transform
10.11975/j.issn.1002-6819.202207170
S159.3;S252
A
1002-6819(2023)-06-0120-10
王夢迪,何莉,劉潛,等. 基于小麥冠層無人機高光譜影像的農田土壤含水率估算[J]. 農業工程學報,2023,39(6):120-129.doi:10.11975/j.issn.1002-6819.202207170 http://www.tcsae.org
Wang Mengdi, He Li, Liu Qian, et al. Estimating soil moisture contents of farmland using UAV hyperspectral images of wheat canopy[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2023, 39(6): 120-129. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.202207170 http://www.tcsae.org
2022-07-18
2023-01-05
深圳市科創委基礎研究(重點項目)(No.20210324120209027);廣東省教育廳重點領域專項項目(2020ZDZX1052)
王夢迪,研究方向為農業定量遙感。Email:wangmengdi2020@email.szu.edu.cn
石鐵柱,博士,特聘研究員,研究方向為農業定量遙感。Email:tiezhushi@szu.edu.cn