王德彩+張俊輝


摘 要:為快速、準確地獲取土壤質地信息,提出了應用Vis-NIR光譜結合BP神經網絡的建模方法。以河南封丘縣的86個土壤樣本為研究對象,以原始光譜和微分光譜主成分為輸入變量,建立土壤粘粒和砂粒的BP神經網絡預測模型,并將其預測結果與多元線性逐步回歸模型進行比較。結果表明:基于原始光譜主成分的BP人工神經網絡預測結果最好,優于多元逐步回歸模型,預測粘粒和砂粒的RMSE分別為1.62和6.52。BP神經網絡所建模型訓練時間短、準確度也較高,能實現對土壤質地的高效預測。
關鍵詞:Vis-NIR光譜; BP神經網絡;主成分分析;土壤質地
中圖分類號:S153 文獻標識碼:A DOI 編碼:10.3969/j.issn.1006-6500.2015.08.002
土壤質地是影響土壤肥力的一個重要因素,同時土壤質地影響一系列陸面及大氣過程,如土壤—植物—大氣相互作用、土壤侵蝕過程、土壤溶質遷移過程等[1-2]。快速獲取土壤質地信息,對現代農業管理和生態環境治理具有重要意義。土壤反射光譜特性與土壤的理化性質有著密切的關系,土壤組成物質的多樣性以及土壤中每種組成物質的獨特光譜特性,使各類土壤的光譜曲線都具有自己的特征[3]。隨著光譜技術的發展,為土壤屬性的快速獲取提供了新的途徑。近紅外光譜和可見光近紅外(Vis-NIR)光譜被廣泛用于快速測試土壤質地、有機質等[4-9]。目前,基于土壤光譜的土壤屬性預測,大多采用偏最小二乘回歸、多元逐步回歸等線性預測方法,而土壤質地與反射光譜之間的關系復雜,存在隨機性和非線性。簡單的線性回歸模型難以模擬土壤質地和反射光譜信息間存在的復雜關系,一定程度上會限制預測精度的提高。
人工神經網絡是由大量的神經元連接而成的非線性系統, 具有并行分布處理、 自組織、自適應、 自學習的特點, 適于處理動態的、隨機性、 非線性數據[10],將神經網絡應用于Vis-NIR光譜土壤質地預測模型建立的研究尚不多見。本研究采用人工神經網絡方法,建立土壤質地數據的Vis-NIR光譜預測模型,同時探討不同光譜預處理形式對預測結果的影響,可為土壤質地數據的快速獲取提供方法參考。
1 材料和方法
1.1 研究區與采樣分析
封丘縣處于北緯34°53′ ~ 35°14′、東經114°14′ ~ 114°46′之間,暖溫帶大陸性季風氣候,年平均氣溫16.0 ℃,年平均降水量615.1 mm。封丘地勢平坦,海拔65~72.5 m。主要土壤類型有風沙土、兩合土和淤土等。在研究區,按照3 km × 3 km正交網格布設樣點,采樣深度為0~20 cm,共采集樣品101個。土壤質地采用激光衍射法 (Beckman Coulter LS230,USA,測試粒徑范圍0.04~2 000 μm測定[11], 按美國制進行分級:砂粒 (2~0.05 mm),粉粒 (0.05~0.002 mm),粘粒 (< 0.002 mm)。
1.2 土壤光譜測量及預處理
運用美國ASD 公司的FieldSpec 3地物高光譜儀測量土壤樣品的反射光譜數據,操作過程在黑暗環境的實驗室進行,每個樣品旋轉4次,每個角度掃描5次,共20次,取平均值作為樣本光譜。每次測量前進行標準白板校正。因為350~380 nm、2 400~2 500 nm之間的數據信噪比比較低[12],所以本研究只對380~2 400 nm波段的反射光譜進行分析。本研究光譜變換形式包括一階微分和二階微分。微分變換均采用Savitzky-Golay 多項式,在Unscrambler 軟件中完成。對原始光譜和經一階微分和二階微分處理后的數據,提取主成分,選取分析后的多個主成分作為初始輸入變量,進行建模以及模型驗證,主成分分析在SPSS19.0中完成。
1.3 模型建立
采用分層機械取樣法,樣本數據分成光譜建模數據集和光譜模型預測數據集。研究區共有101個樣本點,將其分為2個數據集,其中建模樣品數占2/3,驗證樣品數占1/3。對于質地數據,根據3倍標準差法去除質地數據中的異常數據。砂粒、粘粒含量具體建模樣點見表1。
1.3.1 BP人工神經網絡 BP人工神經網絡的建立在Matlab軟件中實現,采用人工神經網絡工具箱中的3層BP神經網絡,該網絡有輸入層、隱含層、輸出層組成,隱含層采用“S”型logsig函數,輸出層采用線性傳遞函數。對所建模型進行訓練,以確定模型的權值矩陣和閾值矩陣。為確定適宜的模型結構,取不同的隱含層神經元數和訓練迭代次數進行訓練。
1.3.2 多元逐步回歸模型 借助SPSS軟件,采用多元線性逐步回歸分析(MLSR)方法,建立土壤質地含量高光譜預測模型。多元逐步回歸模型主要用于與神經網絡預測模型進行精度比較。
1.4 模型評價指標
評價所采用的指標有平均誤差(Mean Error, ME),平均絕對誤差(Mean absolute error, MAE),均方根誤差(Root mean of squared error, RMSE),測定值標準偏差與標準預測誤差的比值RPD(Ratio of standard deviation to standard error of prediction)為模型評價參數。當RPD>2時,表明模型具有極好的預測能力;當1.4 2 結果與分析 2.1 土壤粘粒含量和砂粒含量統計特征分析 如表1所示,粘粒含量和砂粒含量全部樣本平均值分別為10.95%,21.52%。粘粒含量和砂粒含量建模樣本均包含了全部樣本的數據分布范圍,代表性好。這6組樣本偏度和峰度均在0~1.18之間,樣本土壤粘粒含量和砂粒含量數據接近正態分布。
2.2 BP神經網絡建模結果
用BP人工神經網絡的方法,輸入層分別為原始光譜、光譜一階微分、光譜二階微分的主成分,對每個模型經過多次訓練,3種光譜形式的神經網絡模型中,除“PCS”砂粒原始光譜模型的隱層數為2,其余模型隱層數均為1。各自最佳模型如表2。
由表2可知,粘粒模型中,RPD均大于1.40,其中原始光譜模型RPD最大,為2.21,原始光譜模型RMSE最低,為1.62;砂粒模型中,砂粒的3個模型RPD均小于2,原始光譜模型RPD最大,其中砂粒二階微分模型的相對分析誤差為1.35,(小于1.40)表明模型無法對樣品進行預測,原始光譜模型RMSE最小,為6.52,遠低于光譜二階微分模型的9.24。綜合RMSE、RPD、ME、MAE這些指標來看,粘粒和砂粒原始光譜模型效果較佳。圖1給出了最佳模型對應的粘粒含量和砂粒含量預測值與實測值1∶1線散點圖,實測值和預測值沿1∶1線具有較好的分布規律,顯示了較好的預測精度。土壤質地之所以能影響土壤的光譜反射率,一方面是因為土壤顆粒大小本身對土壤光譜的影響,另一方面是由于粘粒礦物的波譜差異[14]。在微分處理過程中,可能消除掉了原始光譜所獲取的因土壤顆粒大小引起的細微特征差異,因此并不能提升質地預測精度,適應于土壤質地預測的新的光譜預處理方式有待進一步研究。
2.3 PLSR建模及預測結果
以原始光譜的主成分為輸入變量,采用多元逐步回歸的方法,建立模型并獲得模型預測結果,如表3所示。
粘粒含量和砂粒含量多元逐步回歸模型中粘粒模型R2均較高(大于0.60),但粘粒含量和砂粒含量預測誤差指標,RMSE、ME、MAE均高于基于原始光譜主成分的BP人工神經網絡模型,尤其粘粒含量預測RMSE為3.31,遠高于1.62(BP人工神經網絡模型預測RMSE),且RPD小于1.4,表明模型不適于預測粘粒含量。因此,BP人工神經網絡在土壤高光譜土壤質地預測中優于多元逐步回歸。
3 結 論
通過實測得到封丘縣101個土壤樣本的高光譜反射率和土壤質地,運用人工神經網絡和多元逐步回歸方法建立粘粒、砂粒含量的反演模型。BP神經網絡模型優于多元逐步回歸,是一種高效的預測方法;研究還表明,相比一階微分和二階微分光譜,原始光譜保存了更豐富的信息,更適于預測土壤質地。
參考文獻:
[1] 吳龍剛, 王愛慧, 盛炎平. 土壤質地對中國區域陸面過程模擬的影響[J]. 氣候與環境研究, 2014, 19(5):559-571.
[2] 朱衛紅, 鐵雙貴, 孫建軍,等. 不同土壤質地及播種深度對甜玉米出苗潛勢的影響[J]. 河南農業科學, 2005(11):35-36.
[3] Ben-Dor E. Quantitative remote sensing of soil properties [J]. Advances in Agronomy, 2002, 75:173-243.
[4] 曾慶猛, 孫宇瑞, 嚴紅兵. 土壤質地分類的近紅外光譜分析方法研究[J]. 光譜學與光譜分析, 2009, 29(7): 1 759- 1 763.
[5] 白燕英,魏占民,劉全明,等. 基于高光譜的河套灌區農田表層土壤質地反演研究[J].地理與地理信息科學,2013,29(5):68-71.
[6] 王德彩,鄔登巍, 趙明松,等. 平原區土壤質地的反射光譜預測與地統計制圖[J].土壤通報,2012,43(2):257-262.
[7] 何緒生.近紅外反射光譜分析在土壤學的應用及前景[J].中國農業科技導報,2004,6(4):71-76.
[8] 徐永明,藺啟忠,王璐, 等.基于高分辨率反射光譜的土壤營養元素估算模型[J].土壤學報,2006,43(5):709-716.
[9] 郭斗斗,黃紹敏,張水清,等.多種潮土有機質高光譜預測模型的對比分析[J].農業工程學報,2014(21):192-200.
[10] 朱大奇. 人工神經網絡研究現狀及其展望[J].江南大學學報:自然科學版, 2004, 3(1):103-110.
[11] 李學林, 李福春, 陳國巖,等. 用沉降法和激光法測定土壤粒度的對比研究[J].土壤,2011,43 (1):130-134.
[12] 何挺,王靜,林宗堅,等. 土壤有機質光譜特征研究[J].武漢大學學報:信息科學版, 2006(11): 975-980.
[13] Chang C W, Laird D A, Mausbach M J, et al. Near-infrared reflectance spectroscopy-principal components regression analyses of soil properties[J].Soil Science Society of America Journal,2001,65 (2):480-490.
[14] Waiser T H, Morgan C L S, Brown D J, et al. In situ characterization of soil clay content with visible near-Infrared diffuse reflectance spectroscopy [J]. Soil Science Society of America Journal, 2007, 71 (2):389-396.