孫波, 梁勇,*, 漢牟田, 楊磊, 荊麗麗, 俞永慶
(1. 山東農業大學信息科學與工程學院, 泰安 271019; 2. 北京航空航天大學電子信息工程學院, 北京 100083; 3. 中國石油化工股份有限公司勝利油田分公司海洋采油廠, 東營 257237)
土壤濕度是全球碳水循環的重要環節,是量化陸地及大氣能量交換的關鍵參數[1]。及時、準確地獲取農田土壤濕度數據對于在農業生產中進行合理灌溉、減少水資源浪費、降低生產成本和提高農作物產量都是非常重要的。
相比于傳統的烘干稱重法以及時域反射法(TDR)、頻域反射法(FDR)等接觸方式獲取土壤濕度的方法[2],利用全球衛星導航系統反射測量法(Global Navigation Satellite System Reflectometry, GNSS-R)技術進行土壤濕度探測是一種新興的技術手段,其具有非接觸、大面積、實時性、連續性的優點,近年來受到越來越多的關注。
1993年,歐洲航天局(ESA)的Martin-Neira[3]首次提出了利用GNSS-R信號可以進行海面測高的技術。隨后,科羅拉多大學與美國國家航空航天局(NASA)合作研制了GNSS-R接收處理設備,并開展了一系列機載實驗,探索該技術用于土壤濕度探測的可行性。近年來,Rodriguez-Alvarez等[4]在GNSS-R技術的基礎上提出可以利用衛星直射信號和多徑信號的干涉現象進行土壤濕度探測的方法,稱為干涉圖技術(Interference Pattern Technique,IPT),也稱為全球衛星導航系統干涉測量法(Global Navigation Satellite System Interferometry and Reflectometry,GNSS-IR)。Larson等[5]指出GNSS接收機記錄的信噪比(Signal to Noise Ratio,SNR)數據受多徑信號的影響呈現出衰減振蕩特征,該特征是干涉現象的表現,其通過實驗證明信噪比數據的振蕩振幅和相位與土壤濕度有關。Chew等[6]在此基礎上建立了信噪比相位和土壤濕度的經驗模型,可以用來反演裸土表層的土壤濕度。2018年,李飛等[7]對鏡面反射點、空間分辨率和土壤探測深度進行了理論分析和公式推導。2018年,嚴頌華等[8]探討了基于信號強度指示器(SSI)數據的土壤水分估算的可行性,并進行了SSI相位估算和原位土壤水分數據記錄的實驗比較。在植被影響研究方面,張思勃等[9]考慮小麥不同生長階段的影響,建立了土壤濕度與信噪比振蕩頻率和相位的經驗模型。
然而,上述經驗反演模型的建立均假設土壤濕度與信噪比幅度、相位等觀測量呈線性關系,因此模型建立過程多采用傳統的一元統計回歸方法,其反演結果的相關系數介于0.76~0.90之間[10-12],反演精度不高。而機器學習等人工智能算法的興起,使得復雜回歸模型的建立成為可能。楊磊等[13]探索了機器學習方法在GNSS-R土壤濕度技術中的應用,取得了較好的結果。機器學習方法具有黑箱特征,不用指定回歸函數的形式,可以進行任意的線性或非線性回歸,并且隱含實現了特征提取的環節,可以對土壤粗糙度等引起的噪聲進行抑制,在不出現過擬合的情況下,其效果是傳統的統計回歸方法不可及的。
本文提出使用支持向量機(Support Vector Machine,SVM)這一機器學習方法,進行GNSS-IR土壤濕度反演模型建立,特別地,采用遺傳算法(Genetic Algorithm,GA)解決SVM的參數自動優選問題,并通過實測數據處理,證明該方法可取得較好的結果。進一步與統計回歸及其他機器學習方法進行比較,證明了GA-SVM方法在同等條件下效果更優。
相比于傳統的GNSS-R反演模式,GNSS-IR模式只采用一根右旋圓極化(Right Hand Circular Polarization,RHCP)天線同時接收GNSS的直反射衛星信號,GNSS發射的信號為RHCP信號,根據電磁波反射理論,當地面為不含磁性成分的土壤介質時,在衛星高度角θ較低的情況下,反射信號極性仍以RHCP為主[14],其場景如圖1所示。

圖1 干涉場景Fig.1 Scenario of interference
在傳統的衛星信號接收中,通常把多徑反射信號當作干擾進行抑制,但實際上反射信號與反射面的物理特征如土壤濕度具有相關性。由于地基情況下直射跟反射信號頻率近似相同,只是傳播路徑長度不同,因此2個信號可在接收天線處發生較為穩定的干涉現象,形成干涉信號,如圖2(a)所示。可以看出,在低高度角時,干涉波動現象十分明顯。該信號經接收機接收處理后以信噪比數據的形式呈現出來。信噪比的數學模型[15]為
(1)
式中:Ad、Am分別為直射、反射信號的幅度;ψ為直射信號和反射信號的相位差。
則有
(2)
式中:φ1為直反射路徑差導致的相位差;φ0為干涉初始相位;H為接收機天線的等效高度,其隨著電磁波的穿透深度和反射面的介電特性的變化而變化;λ為GNSS衛星信號的波長。
通過式(2),可以得到多徑振蕩的頻率為
(3)

考慮在每天信噪比觀測的幾小時時間內,天線等效高度的變化率可以忽略不計,并進一步令x=sinθ,式(3)可簡化為
(4)
式(4)說明H與f成線性關系,天線越高,振蕩頻率越高。結合式(1)~式(4),將直射信號剔除,只保留與反射面參數有關的多徑信號,如圖2(a)、(b)所示。該多徑信號SNRm可以表示為
SNRm=Amcos(4πHλ-1sinθ+φ)
(5)
式中:φ為多徑信號的初始相位。
通過對SNRm信號進行譜分析,可以獲得多徑信號的振蕩頻率f和天線等效高度H,如圖2(c)所示。由于SNRm信號是非均勻采樣信號,常規的傅里葉分析并不適用,引入Lomb-Scargle方法[16]對SNRm進行譜分析, Lomb-Scargle方法能夠提供一種針對不均勻采樣時間序列的譜幅值計算方法,可以處理非均勻采樣的信號。

圖2 上升段信噪比分析Fig.2 Ascending SNR analysis
此后通過最小二乘法對SNRm進行擬合,可以得到多徑信號的幅度Am和初始相位φ,如圖2(b)所示,并分別建立振蕩頻率、幅度、相位和土壤濕度之間的經驗模型。
文獻[10-12]提出建立一元線性回歸模型進行土壤濕度的反演,然而考慮到振蕩頻率、幅度、相位與土壤濕度的相關性,采用多元回歸模型可以有效利用特征信息,充分利用它們之間的相關性,提高擬合精度,本文采用非線性SVM模型進行土壤濕度的反演研究。
SVM是20世紀90年代由Vapnik[17]提出來的一種研究小樣本、小概率事件的神經網絡模型,可以根據有限的樣本信息在模型復雜性和學習能力之間尋找最優解, 以獲得最好的預測精度, 其在解決小樣本、非線性和高維學習中表現出許多特有的優勢,而土壤濕度反演本質上是一個回歸問題,適合選用SVM算法進行回歸分析。
SVM利用核函數映射的方法,通過非線性映 射將已知空間變換到高維空間,從而利用解線性問題的方法求解非線性問題。本文中采用徑向基(Radial Basis Function,RBF)核函數來建立非線性 SVM模型。RBF核函數相比于線性核能夠處理分類標注和屬性的非線性關系,相比于多項式核有更少的參數,同時具有簡單實用、普適性好的優點[18]。并且根據實踐證明,SVM的性能與核函數的參數g以及懲罰因子C有很大關系,人為規定和調整參數的話,既耗費時間又不能確保預測結果的準確性,因此,本文引入了GA對SVM回歸模型的參數進行自動尋找最優解。
遺傳算法是 Holland[19]于1975年提出的一種基于生物遺傳和進化機制的、適用于復雜系統優化的自適應概率優化技術。該算法是借鑒進化生物學中遺傳、突變、自然選擇、雜交等現象而探索出的一種搜索最優解方法,主要包括編碼、初始種群、計算適應度以及選擇、交叉、變異3個基本運算。與傳統優化算法相比,GA尋優具有以下特點:①搜索效率高,以群體為單位,對自變量中所有個體進行并行搜索;②可進行全局最優解搜索,避免陷入局部最優解;③不受目標函數影響,適應性強。
基于GA-SVM的GNSS-IR土壤濕度反演模型建立過程如圖3所示。

圖3 基于GA-SVM的GNSS-IR土壤濕度反演模型Fig.3 GNSS-IR soil moisture inversion model based on GA-SVM
實驗場地位于法國圖盧茲(Toulouse)市拉馬斯克雷(Lamasquere)鎮的一處農場(北緯 43°29′14.45″,東經1°13′44.11″),實驗田種植作物為大豆。2014年2月3日—2014年3月21日進行了為期47 d的土壤濕度探測實驗。實驗期間該地區正處于冬季,日平均降雨量僅為1.19 mm,地表植被稀少,可以視為裸土,且場地四周無遮蔽。土壤表面均方根高度約為0.02 m,反射區域2~5 cm深度的土壤成分為:沙土18%,粉土41%,黏土41%。使用Leica GR25接收機和AR10基準站天線,同時接收GPS的直射、反射信號,天線的架設高度為1.69~1.70 m,相位中心指向天頂。距離天線相位中心在地表投影約2 m的位置采用填埋方式布置2枚ML3 Theta Probe土壤濕度傳感器采集土壤濕度同比數據,2枚傳感器深度分別為2 cm和5 cm,精度為±1%,取樣間隔時間為2 min。本文選取干涉現象明顯的2°~30°低高度角的L1波段S1C SNR信號進行土壤濕度反演。
3.2.1 樣本數據的選取
選取觀測效果較好的GPS PRN 12的SNR數據按照第1節的原理進行處理,得到47組與土壤濕度具有相關性的多徑信號的初始相位φ、振蕩頻率f、幅度Am,結合衛星高度角θ,與實測的2 cm與5 cm深度的土壤濕度日平均值形成SVM數據集,這47組數據對應的傳感器土壤濕度實測平均值范圍為23.24 ~29.45 cm3/cm3。為了消除各影響因素因類型及量綱不同帶來的影響,對輸入變量均做歸一化處理。將這47組數據按照約3∶1的比例劃分成訓練集與測試集,訓練集與測試集互斥,沒有交集,將傳感器測量的日平均土壤濕度作為SVM的輸出。
3.2.2 GA-SVM模型訓練
本文SVM模型選用普適度較好的RBF核函數,并采用GA對其進行參數尋優。為了提高反演模型的精度及泛化能力,對核函數參數g和懲罰因子C進行優選是關鍵。GA的相關設置如下:最大進化代數為200,種群數量為20,懲罰因子C的取值范圍為[0,100],核函數參數g的取值范圍為[0,1 000],交叉驗證次數V=5。尋優過程的適應度曲線如圖4所示。可以看出,經過30次進化迭代后,種群最佳適應度基本保持穩 定,可以認為近似達到最優解。最終尋優結果為:C=3.23,g=0.08,適應度MSE=0.045。

圖4 GA-SVM進化代數曲線Fig.4 Evolution algebra curves of GA-SVM
將最佳參數C和g代入SVM模型,選取GPS PRN 12衛星的前35 d數據和土壤濕度真值作為訓練集,對后12 d的土壤濕度進行預測反演,所得結果如圖5所示。
圖5(a)~(c)顯示訓練樣本預測值與土壤濕度實測值具有很好的相關性,誤差控制在±0.5 cm3/cm3之內,決定系數R2達到了0.882 7。圖5(d)~(f)表明利用訓練后的GA-SVM模型可以對測試樣本進行較好的反演,反演結果接近實測值,反演誤差控制在±0.3 cm3/cm3之內,沒有出現偏態分布,反演值與實測值的線性回歸方程決定系數R2達到了0.956 9。在圖5(d)~(f)中,還進行了GA-SVM方法與傳統的利用SNR頻率、幅度、相位的一元線性回歸方法的對比,結果表明,本文方法的反演結果更接近實測值,誤差較小,相比于單變量反演效果最好的相位反演(R2=0.874 7),決定系數R2提高了約9.40%,說明GA-SVM優化模型反演精度高,泛化能力較強。
為了進一步驗證GA-SVM模型的優越性,在使用同一數據樣本的條件下,本文還與粒子群優化的SVM模型(PSO-SVM)、反向傳播(BP)神經網絡這2種機器學習方法進行了對比,表1給出了對比結果。


圖5 GA-SVM土壤濕度反演模型結果分析Fig.5 Result analysis of GA-SVM soil moisture inversion model

日期實測值/(cm3·cm-3)GA-SVMPSO-SVMBP神經網絡反演值/(cm3·cm-3)絕對誤差/(cm3·cm-3)相對誤差/%反演值/(cm3·cm-3)絕對誤差/(cm3·cm-3)相對誤差/%反演值/(cm3·cm-3)絕對誤差/(cm3·cm-3)相對誤差/%2014-03-1025.8325.76-0.070.2726.140.311.2026.520.692.672014-03-1125.5525.41-0.140.5526.180.632.4726.951.405.482014-03-1225.2125.10-0.110.4425.300.090.3627.091.887.462014-03-1324.5524.850.301.2225.721.174.7724.950.401.632014-03-1424.4524.640.190.7825.380.933.8024.990.542.212014-03-1524.2724.480.210.8724.870.602.4724.440.170.702014-03-1624.0724.240.170.7124.240.170.7125.231.164.822014-03-1723.9724.180.210.8823.990.020.0825.471.506.262014-03-1823.8323.990.160.6723.940.110.4624.100.271.132014-03-1923.8823.71-0.170.7124.620.743.1024.660.783.272014-03-2023.6223.58-0.040.1724.060.441.8625.551.938.172014-03-2123.2423.490.251.0823.620.381.6424.361.124.82

表2 土壤濕度反演結果評價比較
本文提出了基于GA-SVM優化模型的GNSS-IR土壤濕度反演方法,給出了數據處理的相關流程,并通過實測數據進行了理論驗證,結果表明:
1) 在土壤濕度介于23.24~29.45 cm3/cm3范圍內,反演值與高精度土壤濕度計測得的實測值的相關度較好,線性回歸方程決定系數達到了0.956 9,反演誤差控制在±0.3 cm3/cm3之內。
2) 與傳統利用相位等進行一元線性回歸的方法相比,決定系數提高了約9.40%,進一步驗證了GA-SVM優化模型的有效性。
3) 在相同數據集下,與PSO-SVM、BP神經網絡的對比結果表明,本文模型各項誤差較小,說明其更適用于小樣本條件下GNSS單天線的土壤濕度反演,具有較好的普適性。
本文為土壤濕度的遙感監測提供了一種新的思路和方法。由于季節所限,本次實驗及數據分析都是基于裸土的土壤濕度分析,地表植被和農作物對土壤濕度的影響并未進行修正,這也是后續實驗研究的主要內容。
致謝感謝法國CESBIO實驗室的Baup和Boniface博士收集的氣象數據,感謝法國圖盧茲第三大學的Roussel和Frappart博士提供的GNSS觀測數據,同時感謝金華職業技術學院阮宏梁老師在實驗中提供的支持。