于 浕,樊貴盛
(太原理工大學水利科學與工程學院,太原 030024)
凋萎系數通常被視為作物有效含水量的下限,是作物開始發(fā)生永久凋萎時的土壤含水率[1],也是進行作物水分調控和田間用水管理的重要參數。準確確定土壤凋萎含水率對于制定合理的灌溉制度,實現節(jié)水增產具有重要的指導意義。目前,測定土壤凋萎系數的常用方法分為直接法和間接法。直接法就是在實驗室中用生物方法測定;間接法是先測出土壤的吸濕系數,再乘以1.5(或2)[2]。兩種方法測定土壤凋萎系數費時費力,而且由于土壤空間變異性大和缺乏精密儀器,使得在農業(yè)生產中的應用受到限制。近年來,國內外眾多學者致力于利用土壤常規(guī)理化參數對土壤凋萎系數預測的研究,取得了顯著成果。Pidgeon[3]在分析土壤中微粒級分布的基礎上得到了凋萎系數與黏粒含量的線性擬合模型。趙廣建、樊貴盛[4]通過對不同有機質含量條件下土壤凋萎系數的試驗研究,得到了土壤凋萎系數與有機質的定量函數關系。李任敏[5]等實現了利用土壤機械組成對9種闊葉喬灌樹苗期凋萎系數的初步預報。李小剛[6]建立了利用土壤黏粒含量、電導率、全鹽量對土壤凋萎系數的線性預報模型,但未考慮有機質等其他重要因素的影響,并且所建模型預測精度尚需進一步提高。
因此,本文在前人研究的基礎上,從土壤理化參數與凋萎系數存在非線性關系出發(fā),采用主成分分析法,提取影響因子的特征數據以降低輸入變量維數,減少輸入層神經元個數,并運用BP神經網絡模型在表達非線性、不確定性和模糊關系等方面的強大優(yōu)勢,實現了利用土壤常規(guī)理化參數對土壤凋萎系數的多因子預測,在優(yōu)化神經網絡結構和提高預測精度的同時,為黃土高原區(qū)作物水分調控和田間用水管理提供了科學依據。
試驗土壤選自山西省中南部多個典型試驗田,土壤樣本特征明顯,質地類型豐富,涵蓋多種地形地貌單元,是山西省黃土高原區(qū)農田耕作土壤的典型代表。試驗點土壤樣本數據取值范圍如表1所示。

表1 樣本數據取值范圍表
為了實現本文的研究目的,需要對樣本土壤進行基本理化參數和凋萎系數的測定。測定的土壤基本理化參數有土壤質地、土壤有機質含量、土壤無機鹽含量。利用激光粒度分析儀測定樣本土壤黏粒、粉粒、沙粒的百分比含量,由此確定土壤質地類型。測定土壤有機質含量采用重鉻酸鉀滴定法,利用濃硫酸和重鉻酸鉀迅速混合時產生的熱來氧化土壤中的有機質,過剩的重鉻酸鉀溶液用硫酸亞鐵標液滴定,進而依據消耗的重鉻酸鉀量計算土壤中有機質的含量,通過測定土壤中八大主要離子的質量,累加后得到土壤全鹽量[2]。
測定土壤樣本吸濕系數采用10%硫酸溶液水氣平衡吸附法[2]。將風干土樣過 1 mm篩后稱量10 g平鋪在鋁盒底部,分別進行稱重并編號。將鋁盒放置于盛有10%硫酸干燥器的白瓷板上, 加蓋密閉并放在溫度恒定的地方。每隔24 h用精度為 0.000 1 g 的電子天平稱重,控制前后兩次稱量質量差值在0.05 g范圍內,然后進行烘干稱重測得土壤的含水量,得到土壤吸濕系數,乘以1.5后得到土壤樣本的凋萎含水率。
隨機選取的10組取自不同試驗田的土樣,測得的凋萎含水率(體積含水率)數據和對應樣本下土壤的物理性黏粒含量、有機質質量分數、全鹽量和電導率等基本理化參數如表2所示,在全部試驗數據資料中選取100組具有代表性的土壤樣本數據來建立預測模型,并隨機預留10組數據用以檢驗模型精度。
主成分分析是一種常用的多元統(tǒng)計分析法。該方法將多個相關變量進行線性組合后形成新的正交變量,使這些不相關的新變量盡可能多地反映原變量的數據信息[7]。原始變量的數據信息主要體現在方差上,并通過累積方差貢獻率衡量。

表2 10組試驗點樣本數據
影響土壤凋萎系數的因素有密度、黏粒含量、粉粒含量、沙粒含量、有機質含量、全鹽量和電導率等基本理化參數[6,8-10],從全部試驗數據中選取10組典型試驗站測得的數據進行主成分分析。按照先標準化處理得到相關系數矩陣R,再求解R的特征值、特征向量以及方差貢獻率等步驟進行計算,并依據累積方差貢獻率提取主成分,當累積方差貢獻率大于等于85%時,便認為對應的前n個主成分便包含全部全部原始數據的絕大部分信息。表3為特征值及方差貢獻率按大小排列的數據表。

表3 特征值及方差貢獻率數據表
根據主成分分析得到的結果確定預報模型的輸入因子。因此,選定土壤黏粒含量、有機質含量、全鹽量和粉粒含量作為預報模型的輸入因子。
當土壤顆粒表面的薄膜水受土壤介質吸著力達到155 m水柱高時,土壤中的水分便不能被植物根系所利用,所以土壤凋萎含水率與土壤比表面積關系密切。分析認為,土壤的物理性黏粒和粉粒含量越多,其比表面積就越大,土壤的凋萎系數也就越大。土壤有機質含量和全鹽量對凋萎系數的大小影響顯著且影響機理類似,隨著土壤中有機質和無機鹽含量的增加,土粒表面的土壤水勢降低, 土壤顆粒對水的吸附作用顯著增強,則在土粒表面吸著的水膜厚度增大,土壤的凋萎系數也隨之增大。
選定農田耕作土壤凋萎系數的預測值作為預報模型的輸出因子,通過比較預測值與實測值的誤差來檢驗所建模型的預測精度。
(1)BP神經網絡的設計層數。BP神經網絡是目前人工神經網絡中較為成熟且應用最為廣泛的神經網絡模型,一般具有3層或3層以上的神經網絡結構[11]。本文所建立的BP神經網絡系統(tǒng)由輸入層、中間隱含層和輸出層3部分構成。
(2)BP神經網絡各層中的神經元個數。預報模型有4個輸入參數,1個輸出參數,即輸入層有4個神經元,輸出層有1個神經元;中間隱含層神經元的數目需要多次迭代計算才能確定,通過逐漸增加隱含層節(jié)點數,反復訓練樣本,直到達到模型的目標精度時訓練停止[12]。依據既滿足精度要求又減少訓練次數的原則,在多次迭代計算后得出,當模型隱含層的神經元個數等于15時訓練精度滿足要求,故建立比例為4∶15∶1的網絡拓撲結構。
(3)BP神經網絡訓練參數設置?;贛atlab7.0神經網絡工具箱中newff函數,在分析所要處理的數據后,選擇trainlm函數為模型的訓練函數,并利用歸一化函數premnmx和還原函數postmam來實現對輸入和輸出樣本的歸一化處理,以加快樣本的收斂速度?;跉w一化處理后數據的特性,選擇正切函數tansig作為隱含層的激活函數,線性purelin函數作為輸出層的激活函數[13]。本文所訓練的模型參數設定為:最大學習迭代次數1 500次,學習率為1%,訓練精度為0.05%。
(4)BP神經網絡的工作原理。BP神經網絡模型又稱多層前饋神經網絡,由前向傳播和后向傳播構成。信息經過輸入層輸入神經網絡后,通過中間隱含層神經元的逐層傳遞,最終在輸出層得出輸出變量,比較輸出變量值與期望輸出值,若兩者滿足允許的誤差,則計算結束,若兩者誤差超過允許誤差,則將誤差進行反向逐層傳回輸入層,同時調整各層權值,在不斷迭代計算中,使得誤差滿足目標允許的范圍,最后得到準確的輸出值[14]。
本文建立的BP網絡模型結構如式(1)所示。
net=newff(min max (trainput),[15,1],
{‘tansig’, ‘purelin’}, ‘trainlm’)
(1)
式中:net為本文所創(chuàng)建的BP神經網絡模型;newff為在Matlab7.0中生成的BP神經網絡函數;min max( )為向量矩陣,用以決定輸入參數的取值范圍;15表示隱含層有15個神經元,1表示輸出值有1個,即農田土壤凋萎系數;{‘tansig’, ‘purelin’}分別為隱含層和輸出層的激活函數形式;‘trainlm’為網絡的訓練函數形式。
BP神經網絡的訓練結果如式(2)所示。
θ=purelin(iw2(tansig(iw1p+b1))+b2)
(2)
p=[γ,δ,β,φ]
(3)
式中:θ表示凋萎含水率;iw1是模型輸入層到隱含層的權值;iw2是模型隱含層到輸出層的權值;b1是模型輸入層到隱含層的閾值;b2是模型隱含層到輸出層的閾值;γ為物理性黏粒含量;δ為粉粒含量;β為土壤有機質含量;φ為土壤全鹽量。
表4為農田耕作土壤凋萎含水率的預測模型矩陣數值表。

表4 BP預報模型矩陣數值表
基于Matlab7.0中得到的BP模型對100組耕作土壤凋萎系數的預測值,計算預測值與實測值的絕對誤差和相對誤差,結果如表5所示。

表5 凋萎系數預測值與實測值的誤差分析表 %
根據Matlab7.0中BP預測模型程序運行的結果得出:當訓練步數為354步時,訓練精度達到0.000 498 991,滿足訓練目標精度0.000 5的要求,說明建模所用100組數據的預測值與實測值基本吻合,其絕對誤差平均值為0.166%,絕對誤差最大值為0.681%,絕對誤差最小值為0.000 4%;其相對誤差平均值為2.837%,相對誤差最大值為12.549%,相對誤差最小值為0.007%。通過比較100組土壤凋萎系數實測值與預測值的誤差,我們得出,本文選擇土壤黏粒含量、粉粒含量、有機質含量和全鹽量作為輸入參數建立預測模型是合理的,所建模型誤差小,預測結果可信度高,可以作為農田耕作土壤凋萎系數的預報模型。用隨機預留的10組數據檢驗模型的預測精度,檢測結果如表6所示。

表6 土壤凋萎系數預測精度檢驗表 %
用隨機預留的10組數據檢驗模型的預報精度,可以看出,絕對誤差最大值為0.373 6%,最小值為0.003 8%,平均值為0.196 7%;相對誤差最大值為8.344%,最小值為0.046%,平均值為3.508 7%,在可接受的范圍,結果表明利用土壤基本理化參數預報農田耕作土壤的凋萎系數是可行的,可以為農業(yè)生產提供強有力的理論與技術支撐。
(1)利用土壤常規(guī)理化參數對農田耕作土壤凋萎系數的預測是可行的。將土壤物理性黏粒含量、粉粒含量、有機質含量和全鹽量作為BP模型的輸入變量來預測土壤凋萎系數是合理的。比較100組耕作土壤凋萎系數的實測值與預測值,其絕對誤差和相對誤差的平均值分別為0.166%和2.837%,預留10組檢驗樣本的絕對誤差和相對誤差平均值分別為0.196 7%和3.508 7%,誤差較小,預測精度較高。這實現了利用土壤常規(guī)理化參數對土壤凋萎系數的有效預測,為作物水分調控和田間用水管理提供了重要的理論依據。
(2)本文所建立的基于主成分分析的BP神經網絡預報模型達到了預期成效。通過對原始輸入因子的主成分提取,有效降低了輸入樣本的維數,減少了輸入層神經元個數,優(yōu)化了模型結構,加快了迭代速率,提高了預測精度,在豐富土壤理化參數預測理論的同時,也為今后預測、聚類回歸等方面的研究提供了一種新方法。
[1] 雷志棟,楊詩秀,謝傳森.土壤水動力學[M].北京:清華大學出版社,1988.
[2] 張明炷.土壤學與農作學[M].北京:中國水利水電出版社,1994.
[3] Pidgeon J D. The measurement and prediction of available water capacity of ferrallitic soils in Uganda[J].Journal of Soil Science,1972,23(4):431-441.
[4] 趙廣建,樊貴盛.凋萎系數與土壤有機質含量的定量關系研究[J].山西水土保持科技,2008,3(1):12-13.
[5] 李任敏,呂 皎,李蓮枝.土壤機械組成對苗木凋萎系數的影響初報[J]. 山西林業(yè)科技,1990,(3):29-31.
[6] 李小剛.甘肅景電灌區(qū)鹽化土壤的吸濕系數與凋萎濕度及其預報模型[J]. 土壤學報,2001,38(4):498-505.
[7] 王 華,王連華,葛嶺梅.主成分分析與BP神經網絡在煤耗氧速度預測中的應用[J].煤炭學報,2008,33(8):920-925.
[8] 喬照華.土壤凋萎系數的影響因素研究[J].水資源與水工程學報,2008,19(2):82-85.
[9] Petersen G W, R L Cunningham, R P Matelski.Moisture characteristics of Pennsylvania soils, I. moisture retention as related to texture[J].Soil Science Society America Journal,1968,32(2):271-275.
[10] Lund Z F. Available water-holding capacity of alluvial soil in Louisiana[J].Soil Sci. Soc. Am. Proc.,1959,23:1-3.
[11] 趙西寧,王萬忠,吳普特,等.坡面入滲的人工神經網絡模型研究[J].農業(yè)工程學報,2004,20(3):48-50.
[12] 伍春香,劉 琳,王葆元.三層BP網隱層節(jié)點數確定方法的研究[J].武漢測繪科技大學學報,1999,(2):85-87.
[13] 尹京川,馬孝義,孫永勝,等.基于BP神經網絡與GIS可視化的作物需水量預測[J].中國農村水利水電,2012,(2):13-15,18.
[14] 何 勇,宋海燕.基于神經網絡的作物營養(yǎng)診斷專家系統(tǒng)[J].農業(yè)工程學報,2005,21(1):110-113.