許景輝 王 雷 王一琛 趙鐘聲 韓文霆
(1.西北農林科技大學旱區農業水土工程教育部重點實驗室, 陜西楊凌 712100;2.西北農林科技大學水利與建筑工程學院, 陜西楊凌 712100;3.西北農林科技大學中國旱區節水農業研究院, 陜西楊凌 712100)
基于無人機遙感反演的土壤含水率(Soil moisture content,SMC)監測能進行較大范圍的土壤含水率測量,但目前其準確性和精度都還較低[1]。土壤表層含水率是土壤侵蝕、蒸發蒸騰及作物耗水的重要影響因素,由于距地面較淺,無法應用各類介電傳感器,其自動監測一直是相關領域的難題[2]。近年來,無人機遙感技術發展迅速,基于無人機遙感的土壤含水率測量已成為國內外研究熱點[1,3-9]。李小昱等[10]采用近紅外光譜傅里葉變換特征提取方法檢測土壤含水率,并取得了一定成果。但由于近紅外光譜設備成本較高,土壤含水率相關研究的應用具有很大局限性。羅蔚然等[11]通過可見光遙感進行了土壤含水率監測,但光線的干擾使得可見光遙感精度較差。張榮標等[12]提出了中值濾波方法,但可見光影響因素眾多,不能簡單通過一種數學模型實現干擾信息過濾。數據挖掘技術能夠很好地描述非線性模型,因此研究基于數據挖掘技術的可見光遙感技術,可有效降低成本,為無人機廣域土壤含水率監測提供技術支持。
光譜的定量反演大多以線性回歸模型進行,但模型訓練及篩選均基于偏最小二乘回歸法[5]、光譜變換[13]等簡單方法。如何定量表達光譜特性和SMC的相關性、提高模型魯棒性、降低模型過程冗雜度,仍有待優化。數據挖掘能綜合考慮SMC光譜響應,降低干擾項影響,提高測量精度。數據挖掘技術中,LM神經網絡是基于LM(Levenberg-Marquardt)算法的一種神經網絡,其在解析非線性問題時表現能力較好,所構建模型具有很好的自適應性和魯棒性,在建模反演中被廣泛應用[14-15]。但在基于RGB顏色矩的土壤含水率監測研究應用還在探索。
本文以3種土壤(黃綿土、粘黃土、紅土)為研究對象,通過野外土壤采樣、室內理化分析、RGB真彩色圖像采集與處理等工作,嘗試采用LM神經網絡構建3種土壤的可見光SMC計算模型,并對模型進行精度評定。采用BP算法[16-20]和CART算法[21-22]與之對比,比較分析3種算法在SMC監測中的效果,以實現精度高、穩定性好的無人機機載SMC測量與監測。
選用不同類型的3 種土壤作為試驗用土,分別為我國延安地區的黃綿土、陜西楊凌地區的粘黃土和江西地區紅土。測得3種土壤干容重ρd為1.25、1.3、1.5 g/cm3。將3種土樣曬干、粉碎并過2 mm篩網制成試驗土樣。分別取330 g土樣裝入塑料密封袋中,配成土壤含水率θ分別為0、6%、10%、14%、18%、22%的土樣,密封放置24 h,使水分在土壤均勻擴散。隨后將配置好的土樣裝入預先準備好的樣品盒中(高度1.3 cm),每種土樣樣品共60個。配制好后用精度為0.01 g的LT3002T型電子天平稱取每一個樣本的質量,供后續測量土壤樣本真實含水率。
為了調控干擾因素,便于檢驗模型的抗干擾性,試驗在實驗室內進行,采用相機(Canon EOS 500D)拍照采樣,每幅圖像分辨率為2 304像素×3 456像素。用三腳架固定數碼相機,并調至合適高度,并保證土樣置于圖像中央。09:00—10:00對每種土樣進行自然光線拍攝,完畢后將土壤用密封袋保存,待15:00—16:00再次拍攝完畢后,立即將樣本放入干燥箱,在105℃恒溫條件下干燥10 h,以獲取其實際含水率。為減少偶然因素影響,每個樣品取樣3幅圖像。為了模擬不同工作時段自然光線的影響,利用Photoshop將采集的圖像進行處理,將上午樣本圖像亮度分別降低10%、增高15%、增高30%;下午樣本圖像亮度分別增高10%、降低15%、降低30%。由此,上午、下午樣本各720個,土樣圖像樣本總數為1 440個。
1.3.1圖像切割


圖1 土樣圖像Fig.1 Images of soil sample
1.3.2RGB顏色矩提取
顏色矩包含各個顏色通道的一階矩、二階矩和三階矩,對于一幅具有RGB顏色空間的圖像,具有R、G和B 3個顏色通道,則共有9個分量。各階顏色矩的計算公式如下[23]:
(1)一階顏色矩
一階顏色矩采用一階原點矩,反映了圖像的整體明暗程度,計算公式為
(1)
式中Ei——第i個顏色通道的一階顏色矩,對應于RGB顏色空間的圖像
pij——第j個像素的第i個顏色通道顏色值
(2)二階顏色矩
二階顏色矩采用二階中心矩的平方根,反映了圖像顏色的分布范圍,計算公式為
(2)
式中si——第i個顏色通道的二階顏色矩
(3)三階顏色矩
三階顏色矩采用三階中心矩的立方根,反映了圖像顏色分布的對稱性,計算公式為
(3)
式中ri——第i個顏色通道的三階顏色矩
對切割后的圖像提取顏色矩,以作為圖像的顏色特征。提取部分結果(紅土)如表1所示。
對提取特征值后的樣本進行抽樣,從各自總樣本中抽取80%作為訓練樣本,20%作為測試樣本,以檢驗模型的測量精度。

表1 土樣顏色特征與相應土樣實測含水率部分數據Tab.1 Partial data of soil color characteristics and measured soil moisture content of corresponding soil samples
LM算法屬于二階算法,當誤差曲面的梯度較小時,LM算法類似于最速梯度法;當誤差曲面的梯度較大時,LM算法類似于高斯-牛頓法[24-26]。由于LM算法能夠根據Hessian矩陣估計誤差曲面各個梯度方向上的學習率,與一階算法相比,LM算法是目前訓練神經網絡最有效的算法[27]。LM 算法理論如下[15,28-29]:
神經網絡的誤差指標函數為

(4)
式中Yi——預期的網絡輸出向量
ei——當前誤差
設xk為第k次迭代的網絡權值向量,維數為M,牛頓算法新的權值向量xk+1為
(5)

(6)
xk+1=xk-[JT(xk)J(xk)]-1JT(xk)e(xk)=xk-H-1(xi)JT(xk)e(xk)
H=JTJ
式中J——雅可比矩陣
H——Hessian矩陣
Hk——Hessian矩陣
gk——當前梯度
然而矩陣H不一定可逆,為了解決這個問題,考慮引入系數λk,更新權值的LM算法為
xk+1=xk-[JT(xk)J(xk)+λkI]-1JT(xk)e(xk)
(7)
當λk很大時,LM算法近似于梯度下降法;當λk很小時,則是高斯-牛頓算法。
其算法流程為:①給出訓練的允許誤差ε,初始化權值向量x,k=0。②計算網絡的輸出及誤差向量E(x)。③計算誤差向量對網絡權值的梯度值并形成雅可比矩陣。④訓練完成后,更新選擇。⑤如果網絡收斂則停止,否則返回步驟②。
為了量化基于LM神經網絡、BP神經網絡和CART決策樹的實測土壤含水率和回歸值的建模效果和性能,選用決定系數(R2)、均方根誤差(RMSE)和相對分析誤差(RPD)來進行模型的評價。R2越大,表明建模精度越高;RMSE越小,表明模型的預測精度越高。RPD已廣泛應用于度量評估土壤屬性回歸模型的準確性。當RPD≥2.5時,表明模型具有極好的回歸能力,當2.0≤RPD<2.5 時,表明模型具有很好的定量回歸能力; 當1.8≤RPD<2.0 時,表明模型具有較好的定量回歸能力;當1.4≤RPD<1.8時,表明模型具有定量回歸能力;當1.0≤RPD<1.4 時,表明模型具有區別高值和低值的能力;當RPD<1.0 時,表明模型不具備回歸能力[1]。
表2為上午樣本和下午樣本各土壤類型SMC的統計特征。其中黃綿土的建模集與驗證集所對應的均值分別是13.21%和13.12%,變異系數分別為56.18%和60.49%。而黃綿土全樣本的SMC的均值為13.19%,變異系數為57.02%。可見,全樣本的均值和變異系數均介于建模集和驗證集之間。其他兩種土樣具有相同試驗結果,全樣本的均值和變異系數均介于建模集和驗證集之間。為了驗證模型對自然環境影響的適應性,除了進行上午樣本和下午樣本訓練外,還將上午、下午樣本進行混合,通過混合樣本來驗證模型的適應性。表3為混合樣本的SMC統計特征。
根據各土壤實測含水率以及其相應的RGB顏色矩數據,構建基于LM神經網絡、BP神經網絡和CART決策樹的3種回歸SMC模型,分別簡稱為LM模型、BP模型和DT模型。各模型對于不同土壤的SMC回歸結果如表4所示。表4為上午樣本不同模型下土壤含水率的模型評價及回歸評價結果;表5為下午樣本不同模型下各土壤含水率的模型評價及回歸評價結果;表6為混合樣本不同模型下各土壤含水率的模型評價及回歸評價結果。
由表4可以看出,LM模型的RPD值均大于2.5,而BP模型和DT模型的RPD值相對較低,但都大于1.4,因此均適合3種土壤的SMC建模。在3種算法所構建的SMC模型中,LM神經網絡模型在3種土壤中均表現最佳,最佳表現土壤種類為黃綿土,模型評價參數R2為0.980、RMSE為1.0%、RPD為7.133,回歸評價參數R2為0.972、RMSE為1.3%、RPD為5.964。由此可見,3種算法構建的模型回歸能力由大到小為LM神經網絡、BP神經網絡、CART決策樹,各模型對于3種土壤的適應表現能力黃綿土最強,粘黃土和紅土相對較差。圖2為上午樣本各土壤LM模型SMC回歸值與實測值。

表2 被測土壤樣品SMC統計特征Tab.2 SMC statistical characteristics of sample soil samples

表3 混合樣本土壤樣品SMC統計特征Tab.3 SMC statistical characteristics of mixed sample soil samples

表4 上午樣本不同模型下各土壤含水率的模型 評價及回歸評價結果Tab.4 Model evaluation and prediction evaluation results of soil moisture content under different models for AM sample

表5 下午樣本不同模型下各土壤含水率的 模型評價及回歸評價結果Tab.5 Model evaluation and prediction evaluation results of soil moisture content under different models for PM sample

表6 混合樣本不同模型下各土壤含水率的 模型評價及回歸評價結果Tab.6 Model evaluation and prediction evaluation results of soil moisture content under different models of mixed samples
由表5可以看出,LM神經網絡和BP神經網絡模型RPD均大于2.5,適合3種土壤的SMC建模。而DT模型對于3種土壤其RPD小于2.5,尤其對于粘黃土和紅土其RPD小于1.8,因此DT模型對于紅土的SMC建模能力較低。同樣,在3種算法所構建的SMC模型中,LM神經網絡模型在3種土壤中的3個參數均表現最佳,最佳表現土壤種類為黃綿土,模型評價參數R2為0.982、RMSE為1.0%、RPD為7.402,回歸評價參數R2為0.977、RMSE為1.2%、RPD為6.576。由此可見,3種算法構建的模型回歸能力由大到小為LM神經網絡、BP神經網絡、CART決策樹,各模型對于3種土壤的適應表現能力黃綿土最強,粘黃土和紅土相對較差。圖3為下午樣本各土壤LM模型SMC回歸值與實測值。
由表6可以看出,LM神經網絡模型RPD大于2.5,適合3種土壤的SMC建模。而BP模型RPD值僅在黃綿土中略小于2.5,另兩種土中均大于2.5,表明BP模型適用于3種土壤的SMC建模。其DT模型RPD均小于1.8,因此DT模型在混合樣本中對于3種土壤的SMC建模能力較低。同樣,在3種算法所構建的SMC模型中,LM神經網絡模型在3種土壤中的3個參數均表現最佳,最佳表現土壤種類為黃綿土,模型評價參數R2為0.966、RMSE為1.4%、RPD為5.426,回歸評價參數R2為0.958、RMSE為1.6%、RPD為4.873。由此可見,3種算法構建的模型回歸能力由大到小為LM神經網絡、BP神經網絡、CART決策樹,各模型對于3種土壤的適應表現能力黃綿土最強,粘黃土和紅土相對較差。圖4為混合樣本各土壤LM模型SMC回歸值與實測值。

圖2 上午樣本LM模型SMC回歸值與實測值Fig.2 SMC predicted and measured values of LM model for AM sample

圖3 下午樣本LM模型SMC回歸值與實測值Fig.3 SMC predicted and measured values of LM model for PM sample

圖4 混合樣本LM模型SMC回歸值與實測值Fig.4 SMC predicted and measured values of LM model for mixed sample
綜上所述,在SMC回歸模型的建模效果和回歸效果中LM模型表現最佳,BP模型回歸能力相對較差,DT模型回歸能力最差,因此,3種模型中LM模型回歸能力和模型精度都高于其他兩者,即LM模型最優,適用于土壤表層(約1 cm)的土壤水分回歸。對比3種模型在各土壤的適應情況,可以看出,各模型均在黃綿土表現最佳,粘黃土和紅土相對較差,可見土壤自身的顏色對于模型的回歸有一定的影響。
研究結果表明,LM神經網絡能通過大量數據訓練,消除自然條件下的綜合影響因素,提高基于土壤RGB顏色矩的土壤含水率識別精度。土壤可見光-RGB顏色矩與土壤含水率之間存在較好的相關性,其建模集和回歸集的建?;貧w決定系數R2最高分別可達0.982和0.977。為通過遙感技術實現農田土壤墑情的快速檢測技術提供了一定的理論基礎。同時,通過對比3種算法在不同土壤類型的SMC建?;貧w的結果分析,得出LM神經網絡建立的SMC回歸模型最優,其模型決定系數R2均大于0.9。BP神經網絡回歸模型相對LM模型較差,DT模型相對前兩種模型表現最差,在下午樣本紅土中其決定系數R2為0.551,基本沒有回歸能力。由于紅土自身顏色較重,土壤含水率增加后其顏色變化敏感度較低,因此對于模型回歸有一定影響,而LM算法模型能夠較好地克服這一影響因素,表現了其算法的優越性。通過統計學理論分析可知,3種SMC模型在回歸不同土壤含水率時,LM模型的回歸效果具有較強的相關性。相較于傳統線性回歸模型,LM算法構建的神經網絡回歸模型具有顯著的優越性,它不僅訓練誤差較小,回歸能力更為精準,而且模型魯棒性強,具有很好的非線性解譯建模能力。
(1)基于LM算法的SMC回歸模型表現最優,其建模精度和回歸能力最好,在下午黃綿土樣本中,建模集R2為0.982、RMSE為1.0%、RPD為7.402,回歸集R2為0.977、RMSE為1.2%、RPD為6.576?;旌蠘颖静煌翗?黃綿土、粘黃土、紅土)回歸模型決定系數(R2)分別為0.958、0.943、0.949,均方根誤差(RMSE)分別為1.6%、2.0%、1.9%,相對分析誤差(RPD)分別為4.873、4.183、4.440。
(2)LM算法模型在黃綿土中均表現最佳,在粘黃土和紅土中相對較差。由此可見,土壤自身顏色對于本研究SMC回歸模型具有一定的影響。通過比較上午樣本、下午樣本和混合樣本可知,外界光線對于LM算法的建模影響很小,說明基于LM算法的SMC回歸模型具體較好的適應能力。
(3)通過分析LM模型算法建模集和回歸集評價參數可知,LM算法建立的回歸模型更為穩定,其回歸集和建模集的決定系數(R2)均穩定在0.9以上,說明基于LM算法的SMC回歸模型具有較好的穩定性。