熊靜玲 朱西存? 高華光 于瑞陽 溫 新
(1 山東農業(yè)大學資源與環(huán)境學院,山東泰安 271018)
(2 中國國家博物館,北京 100006)
夯土齊長城由泥土夯筑而成,土壤水分對夯土結構具有重要影響,土壤含水率過高會造成夯土穩(wěn)定性降低,進而引起墻體局部坍塌等問題[1-4]。因此,對夯土齊長城進行土壤含水率估測研究,對齊長城遺址的保護具有重要意義。傳統(tǒng)的稱重法、中子法和張力計法等土壤含水率測定方法,雖然精度較高,但工作量大、耗費時間長,要求條件較為苛刻[5-7]。高光譜技術具有數(shù)據(jù)信息豐富、高效無損等特點,彌補了傳統(tǒng)測定方法上的不足。近年來國內外學者將其廣泛應用于土壤理化性質估測研究中,因此,它已經逐漸成為高效獲取土壤含水率的重要手段之一。
在利用高光譜數(shù)據(jù)估測土壤含水率的研究過程中,學者們發(fā)現(xiàn)土壤含水率光譜的響應波段是建立反演模型估算土壤含水率的關鍵[8-10]。已有研究表明,通過對土壤高光譜數(shù)據(jù)進行微分、對數(shù)、倒數(shù)、包絡線去除等變換,可以增強光譜數(shù)據(jù)與土壤含水率之間的相關性,能有效地對比和篩選出敏感波段。劉偉東等[11]使用相對反射率法、一階微分法、差分法等對土壤水分進行預測,結果發(fā)現(xiàn)反射率對數(shù)的一階微分預測效果較好;尹業(yè)彪等[12]采用包絡線且一階微分法對土壤原始光譜反射率進行處理,提高了土壤含水率估測模型的預測精度;姚艷敏等[13]對土壤原始光譜反射率進行對數(shù)、倒數(shù)、一階微分以及反射率倒數(shù)的一階微分、對數(shù)的一階微分變換,對比不同預處理后光譜反射率與土壤含水率之間的相關系數(shù),發(fā)現(xiàn)對數(shù)的一階微分變換后其相關系數(shù)最大;史舟等[14]采用多種方法對光譜數(shù)據(jù)進行預處理,通過對后期預測效果的比較發(fā)現(xiàn)SG平滑加一階微分數(shù)據(jù)轉換方法最佳;鄧孺孺等[15-16]提出了土壤樣品粒度對土壤反射率具有較大影響,申艷等[17]通過研究證明利用多元散射校正可以消除該影響。近年來,國內外學者發(fā)現(xiàn)多元散射校正方法可以消除樣品粒度不同產生的散射影響,進而消除不同光譜之間的物理散射信息差異[18-19],但關于利用MSC方法校正過的光譜是否可以更加準確地進行波長優(yōu)選的比較研究卻很少。因此,本研究以夯土齊長城遺址土壤為研究對象,對原始反射率進行Lg(R)′和MSC +Lg(R)′兩次預處理,進而對兩次預處理之后的光譜數(shù)據(jù)和土壤含水率進行相關分析,對比兩者之間的差異,篩選出土壤含水率的敏感波段。最終建立土壤含水率SVM估測模型,實現(xiàn)對齊長城土壤含水率的快速無損監(jiān)測。
研究區(qū)為青島市黃島區(qū)夯土齊長城遺址,其地理坐標為35°35′~36°08′N,119°30′~120°11′E,夯土齊長城由多種類型泥土夯筑而成。
于2017年8月24—27日進行土樣采集。首先,在齊長城中心線上每隔50 m選定一個點,然后,垂直于該點在齊長城遺跡兩側每隔20 m選定一個采樣點,最終確定24個采樣點,如圖1所示。每個樣點取1 kg左右的新鮮土樣裝入采樣袋中密封編號,每個采樣點取兩份樣品。

圖1 夯土齊長城土壤樣點分布圖Fig. 1 Soil sampling site Great Wall Dynasty Great Wall distribution map of the Qi Dynasty
常規(guī)的光譜測量是先將土壤進行研磨、自然風干等一系列處理,然后設計不同含水量的土壤樣品,這樣的測量方法存在一些問題,土壤經過處理后破壞了土壤結構,并且最終建立的模型預測精度也存在較大的差異[20-21]。因此,為避免這些問題,本研究在采集土樣的同時采用烘干法來獲取原始土樣的含水量。首先將干燥干凈的鋁盒稱重,記為W1;然后將50 g左右土樣置于鋁盒中,蓋后稱重,記為W2,去蓋放入烘箱中,105℃條件下烘至恒重;最后取出放干燥器冷卻至恒溫,立即稱重,記為W3。計算公式為:

利用地物波譜儀對土壤樣本進行光譜測定,測定儀器為美國ASD FieldSpec4便攜式地物波譜儀,波譜儀波段范圍為350~2 500 nm,350~1 000 nm波段范圍內光譜采樣間隔為1.4 nm,光譜分辨率為3 nm;1 000~2 500 nm波段范圍內為2 nm,光譜分辨率為8 nm。重采樣間隔為1 nm,輸出波段數(shù)為2 151個。在一個能控制光照條件的暗室內,將土壤樣本放于半徑為5 cm、深為2 cm的器皿中,裝滿之后用直尺將土壤樣本表面刮平。儀器的光源采用功率為50 W的鹵素燈,光源距離土樣中心30 cm。將光纖探頭固定于三腳架上,探頭的視場角為25°,距離土壤表面15 cm。測試之前先進行白板校正。測定時每個樣品按90°旋轉3次,每次采集5個土樣光譜值,最后取20次平均值作為該土樣的反射光譜數(shù)據(jù)。
為驗證MSC對優(yōu)選敏感波長的作用,采用Lg(R)′和MSC+Lg(R)′對原始光譜數(shù)據(jù)進行兩次預處理。MSC算法如下:

式中,i = 1,2,…,n;n為樣本數(shù);j表示第j個波長。
支持向量機算法最早是由Vladimir N.Vapnik和Alexey Ya.Chervonenkis在1963年提出,在90年代得到迅速發(fā)展和完善,目前的版本是Corinna Cortes和Vapnik在1995年發(fā)表。支持向量機的基本思想是求解能夠正確劃分訓練數(shù)據(jù)集并且?guī)缀伍g隔最大的最佳超平面[22-23]。在解決小樣本、非線性及高維模式識別問題中表現(xiàn)出許多特有的優(yōu)勢。通過多次訓練進行參數(shù)優(yōu)選,利用DPS數(shù)據(jù)處理軟件確定該模型的參數(shù),核函數(shù)類型為RBF,Gamma設置為2,其余各項均為默認值。
采用決定系數(shù)(R2)、相對誤差(RE)、均方根誤差(RMSE)和相對分析誤差(RPD)對模型進行檢驗,以驗證預測模型的精度。R2越大、RE和RMSE越小,表明模型估測精度越高;當1.5≤RPD<2.0時表明模型只能對樣品含量高低進行粗略估測,當2.0≤RPD<2.5時表明模型具有較好的定量預測能力。
土壤是多種成分的復雜綜合體,其高光譜反射率是由土壤組分及其結構的內在性質決定的[24-26]。為研究土壤含水率對土壤光譜特征的影響,分別選取含水率為6.16%、8.94%、10.27%、14.10%、18.03%、24.29%的土壤樣本,其高光譜反射率曲線如圖2所示。由圖2可見,不同土壤含水率光譜曲線總體變化相似,但是隨著含水率的增加,土壤高光譜反射率呈現(xiàn)逐漸下降趨勢。對于具體波段而言,不同波段區(qū)間土壤含水率的響應特性也會不同。當土壤含水率較低時,隨著土壤含水率的增加,短波紅外波段反射率的變化幅度較大。

圖2 不同含水率的土壤光譜曲線Fig. 2 Soil spectral curve relative to soil moisture content
原始光譜曲線如圖3所示,各樣本光譜反射率明顯差異較大,光譜間存在基線平移、傾斜等現(xiàn)象,這可能是由土壤顆粒以及土壤樣品裝填密度不同產生的散射影響造成的[27-30]。多元散射校正處理后的光譜曲線如圖4所示,與原始光譜反射率相比,各樣本光譜反射率差異顯著減小,光譜更集中,光譜曲線特點更一致,這說明各樣品的光譜偏移得到了一定的控制。如圖3和圖4所示,校正前后的光譜均保留了土壤樣品的基本光譜特征,在393~790 nm曲線斜率較陡,790~1 350 nm曲線坡度較緩;在1 260 nm、1 686 nm以及2 125 nm附近具有明顯的反射峰,在1 408 nm以及1 910 nm附近具有特征吸收帶。

圖3 土壤原始光譜反射率Fig. 3 Original spectral reflectance of the soil

圖4 MSC預處理后土壤光譜反射率Fig. 4 Soil spectral reflectance after MSC-pretreatment
為研究MSC處理后的光譜是否可以更加準確地篩選敏感波長,分別對Lg(R)′和MSC+Lg(R)′處理后的光譜反射率與土壤含水率進行相關分析,如圖5和圖6。經對比可看出,經過MSC處理后,土壤光譜反射率與土壤含水率的相關性得到了明顯增強。如圖6所示,1 450~1 500 nm、1 850~1 900 nm和2 050~2 100 nm波段范圍內,土壤含水率與光譜反射率的相關性均達顯著水平。如表1所示,對原始光譜數(shù)據(jù)進行MSC+Lg(R)′處理得到7個相關性較高的波長,并且其相關系數(shù)明顯提高,分別為-0.72、-0.71、0.7、-0.7、-0.69、-0.69、0.69;而對原始光譜數(shù)據(jù)進行對數(shù)一階微分處理后,僅得到4個相關性較高的波長。因此,說明MSC可以對土壤光譜中的非化學信息進行校正,增強與土壤含水率相關的光譜吸收信息,有利于更加準確地選取敏感波長。最終選擇1 861 nm、1 866 nm、1 549 nm、1 885 nm、1 871 nm、1 895 nm和2 095 nm作為土壤含水率的敏感波長。

圖5 Lg(R) ′光譜反射率與土壤含水率相關系數(shù)Fig. 5 Correlation efficient between Lg(R)′spectral reflectance and soil moisture content

圖6 MSC+ Lg(R) ′光譜反射率與土壤含水率相關系數(shù)Fig. 6 Correlation efficient between MSC+Lg(R)′ spectral reflectance and soil moisture content
將本實驗的48組數(shù)據(jù)按照含水率從小到大的順序排列,按4∶1的比例進行抽取,即每隔4個樣本抽取1個樣本,選取校正集36個,驗證集12個。

表1 土壤含水率與敏感波長的相關性Table 1 Correlativity between soil moisture content and sensitive wavelength
為進一步探討MSC處理是否能有效提取光譜信息中的微妙信號,更好地選取與土壤含水率有關的特征波段,分別利用Lg(R)′預處理后篩選出的波長和MSC+Lg(R)′ 預處理后篩選出的波長建立SVM回歸模型,對比其模型精度。
利用Lg(R)′預處理后篩選出的波長1 860 nm、1 872 nm、1 884 nm和2 083 nm建立SVM回歸模型,模型對校正集和驗證集的預測效果如圖7所示。

圖7 基于Lg(R)′預處理建立的SVM回歸模型Fig. 7 SVM regression model based on Lg(R)′pretreatment
利用MSC+ Lg(R)′預處理后篩選出的敏感波長1 861 nm、1 866 nm、1 549 nm、1 885 nm、1 871 nm、1 895 nm和2 095 nm建立SVM回歸模型,模型對校正集和驗證集的預測效果如圖8所示,SVM回歸模型的決定系數(shù)Rc2為0.811,RE為0.001,RMSEP為0.019;檢驗的決定系數(shù)R2v為0.764,RE為0.062,RMSEP為0.159,RPD為2.671。

圖8 基于MSC+ Lg(R)′預處理建立的SVM回歸模型Fig. 8 SVM regression model based on MSC+Lg(R)′pretreatment
根據(jù)圖7和圖8,對兩個模型做對比分析,分別計算出決定系數(shù)(R2)、相對誤差(RE)、均方根誤差(RMSE)、相對分析誤差(RPD),對模型進行檢驗,以驗證預測模型的精度。如表2所示。

表2 SVM回歸模型檢驗精度對比Table 2 Comparative analysis of SVM regression models in prediction precision
從表2可以看出,基于不同預處理篩選出的敏感波段建立SVM回歸模型,預測效果有所差異。利用Lg(R)′ 預處理后的數(shù)據(jù)建立的模型檢驗的決定系數(shù)Rv2為0.679,RE為0.143,RMSEP為0.431,RPD為1.765;而經過MSC處理后,建立的模型檢驗的決定系數(shù)Rv2為0.764,RE為0.062,RMSEP為0.159,RPD達到2.671,較Lg(R)′ 預處理后建立的模型預測效果更好,說明MSC方法校正過的光譜可以更加準確地建立土壤含水率估測模型。
經過Lg(R)′以及MSC+Lg(R)′處理后的夯土齊長城土壤光譜反射率的敏感波段主要集中在1 450~1 500 nm、1 850~1 900 nm和2 050~2 100nm范圍內,其中1 861 nm、1 866 nm、1 549 nm、1 885 nm、1 871 nm、1 895 nm和2 095 nm處與土壤含水率的相關系數(shù)最高。將土壤光譜數(shù)據(jù)進行MSC預處理,可以剔除各樣品間由于散射影響造成的基線變化問題,更加準確地揭示土壤含水率與土壤光譜之間的相關性,提高敏感波長篩選的準確度。經對比發(fā)現(xiàn),基于MSC+Lg(R)′ 預處理建立的SVM回歸模型具有較高的精確度,其檢驗模型的RE為0.062,RMSEP為0.159,RPD為2.671,這進一步說明MSC處理可以增強光譜與土壤含水率相關的吸收信息,可更加準確地篩選敏感波長。