摘 要:根據煙臺市氣象局2005年的氣象數據,利用偏相關分析方法分析了表層土壤溫度與相對濕度、絕對濕度、大氣溫度、平均風速、日照時數、降水量6個氣象因子之間的相關性,進而建立了基于相對濕度、日照時數、大氣溫度、絕對濕度4氣象因子的多元線性回歸模型和BP人工神經網絡模型。結果表明:在6個氣象因子中,相對濕度、日照時數、大氣溫度、絕對濕度與土壤溫度存在極顯著相關關系,平均風速、降雨量與土壤溫度相關關系不顯著;晴天時,BP神經網絡模型的決定系數R2為0.9740,多元線性回歸模型的決定系數R2為0.9739;陰天時,BP神經網絡模型的決定系數R2為0.9881,多元線性回歸模型的決定系數R2為0.9877,因此建立的神經網絡模型具有很高的精度,能很好地滿足土壤溫度的預測要求。
關鍵詞:土壤溫度; 偏相關分析;氣象因子; 預測模型
中圖分類號:S152.8文獻標識號:A文章編號:1001-4942(2010)01-0018-04
Influencing Factors and Prediction Models of Soil Temperature
in Yantai Based on Partial Correlation Analysis
CUI Su-fang ,ZHANG Zhen-hua,YAO Fu-qi,ZHANG Yan, REN Shang-gang
(College of Geography and Designment of Lu-dong University, Yantai 264025, China)
Abstract Based on the meteorological data in 2005 from Yantai Bureau of Meteorology, the correlation between the soil surface temperature and relative humidity, absolute humidity, air temperature, average wind speed, sunshine hours, rainfall was analyzed using partial correlation analysis method. The multivariate linear regression model and BP artificial neural network model were established based on relative humidity, sunshine hours, air temperature, absolute humidity. The results showed that there was significant correlation between soil temperature and relative humidity, sunshine hours, air temperature, absolute humidity, while the correlations between soil temperature and average wind speed and rainfall were not significant. In sunny day, the determination coefficient R2 of BP neural network model was 0.9740, and that of multiple linear regression model was 0.9739. In cloudy day, the determination coefficient R2 of BP neural network model was 0.9881, and that of multiple linear regression model was 0.9877. So the neural network model had a higher accuracy, which could well meet the forecast requirements of soil temperature.
Key words Soil temperature; Partial correlation analysis; Meteorological factor; Prediction model
土壤溫度,是太陽輻射平衡、土壤熱平衡和土壤熱學性質共同作用的結果。土壤溫度主要取決于太陽能輻射,同時也與土壤質地、地表覆蓋、耕作條件等因素有關。土壤溫度是氣象觀測的重要項目,是影響土壤水鹽運動和肥力的重要因子,是植物生長的基本條件之一[1]。土壤溫度對作物生長的影響是多方面的,如種子發芽、生長、開花結果、養分的釋放和吸收都需要一定的溫度,土壤溫度過高或過低都不利于作物的生長發育。土壤溫度高,化學反應速度快,有效養分釋放多。土壤中有益微生物在高溫季節活動旺盛,從而促進有機質礦化作用的進行,使土壤有效養分增多,加快土壤空氣的更新和水分運動;相反,土溫下降,水分移動緩慢,甚至凍結[2]。可見,土壤溫度可直接或間接地影響土壤肥力各因素作用的發揮,是影響土壤肥力因素之一。煙臺地區不僅是全國著名的果品生產基地,也是我國農業較發達的地區之一。目前,煙臺市已成為全國最大的小麥、玉米育種基地,冬小麥單產創全國北方紀錄,夏玉米單產創世界紀錄,建立了全國最大的無毒苗木繁育基地。因此,精確預測土壤溫度對煙臺市農業發展至關重要。本研究利用線性回歸和BP人工神經網絡兩種方法建立預測模型,并比較了兩種方法建立土壤溫度預測模型的優劣,以期準確地預測土壤溫度,為制定合理的農業發展措施提供參考依據。
1 土壤溫度與氣象因子偏相關性分析
地理系統是一個多要素系統,在研究多變量的情況下,一個要素的變化往往影響到其它要素的變化, 因此它們之間存在著不同的相關關系。簡單相關分析在計算兩個變量間的相關系數,分析兩個變量間線性關系程度,往往因為第三個變量的作用,使相關系數不能真正反映兩個變量間的線性程度。偏相關分析可以在研究兩個變量之間的線性相關關系時,控制可能對其產生影響的變量,能真正反映兩個變量間的線性程度。偏相關系數是度量偏相關程度和方向的指標,較簡單直線相關系數更能真實反映兩變量間的聯系。對于兩個要素x與y,控制了變量z,則變量x、y之間的偏相關系數被定義為
rxy,z=rxy-rxzryz(1-r2xz)(1-r2yz)(1)
式中, rxy,z是在控制了z的條件下,x、y之間的偏相關系數。它表示兩要素之間的相關程度的統計指標,其值介于[-1,1]區間,rxy,z的絕對值越接近于1,表示兩要素的關系越密切。當要素之間的相關系數求出之后,還需要對所求的相關系數進行檢驗。由于抽樣誤差的存在,樣本中控制了其它變量的影響,兩個變量間偏相關系數不為0,不能說明在總體中這兩個變量間的偏相關系數不是0,因此必須進行檢驗。一般使用t檢驗方法,公式如下:
t=n-k-21-r2#8226;r(2)
式中:r是相應的偏相關系數,n是觀測量數,k是控制變量的數目,n-k-2是自由度。當t> t0.05(n-k-2)時,P<0.05拒絕原假設,否則不足以在這個檢驗中拒絕變量間偏相關系數為0的零假設。
應用偏相關分析方法對各個氣象因子與土壤溫度進行相關分析,從表1可以看出,這6個氣象因子都對土壤溫度有影響,其中大氣溫度、日照時數、絕對濕度、降水量和土壤溫度有正相關關系;平均風速、相對濕度和土壤溫度有負相關關系。根據偏相關關系和顯著水平原理,偏相關系數的絕對值越大,該因子對土壤溫度的影響越大。從表1可知:土壤溫度與大氣溫度關系最密切,相關系數為0.713,顯著性水平在1‰以下;其次是相對濕度,相關系數為-0.178,顯著性水平在1‰以下;日照時數相關系數為0.163,不相關的概率為0.2%。 絕對濕度相關系數0.099,不相關的概率為6.1%。平均風速相關系數-0.046,不相關的概率為38.8%。降水量相關系數0.048,不相關的概率為36.8%。因此,除了平均風速、降水量,其余4個氣象因子與土壤溫度呈極顯著相關關系。這同時說明了前人只通過大氣溫度這一個氣象因子作為因變量建立模型預測土壤溫度有不足之處,其它氣象因子對土壤溫度的影響也非常大,所以我們應用多個對土壤溫度有顯著影響的氣象因子作為因變量建立模型預測土壤溫度[3]。
表1 土壤溫度與6個氣象因素的
偏相關分析綜合結果
項 目氣溫(℃)相對濕度(%) 日照時數絕對濕度平均風速(m/s)降水量
(mm)
偏相關系數0.713-0.1780.1630.099-0.0460.048
自由度358358358358358358
顯著水平(P)0.0000.0010.0020.0610.3880.368
2 土壤溫度預測模型
2.1 基于多元線性回歸方法的預測模型
由于地理現象的復雜性及多變性,經常遇到諸多因素共同影響的問題,這就需要對多個指標的觀測數據進行有效地分析研究,揭示出相關變量間的內在規律,找出變量間相關關系的近似數學表達式。多元線性回歸分析是多元回歸分析中最為簡單而又最常用的一種分析方法。其基本原理是通過對多個變量之間變動關系的分析,建立一定的數學模型,并根據自變量給定的值預測因變量的值,從而進一步揭示地理要素之間的相互關系,并對因變量的未來變化趨勢進行預測。
DPS系統采用參數的最小二乘估計對參數進行評估,得出多元線性回歸方程,從而確定回歸值,通過回歸值與實際值之間的差值來描述實際值與回歸直線的偏離程度。對于自變量而言,回歸值與實際值偏離越小,則認為直線與所有的試驗點的擬合度越好。
從表1可以看出,平均風速、降水量對土壤溫度的影響非常小,可以忽略不計,所以選擇大氣溫度(X1)、相對濕度(X2)、絕對濕度(X3)、日照時數(X4)4個氣象因子與土壤溫度(Y)進行多元線性回歸。得到回歸方程及決定系數。
=4.9450+0.9645X1-0.0695X2+0.1359 X3+0.1816X4(3)
R2=0.940533
表2 微氣象因子與土壤溫度多元線性回歸方程
系數及其顯著性檢驗
變量回歸系數標準系數偏相關標準誤t值顯著水平
b04.94501.30493.78960.0002
b10.96450.87980.71200.050219.21400.0001
b2-0.0695-0.0871-0.16890.0214-3.24590.0013
b30.13590.09960.09860.07231.87780.0612
b40.18160.05550.15880.05963.04830.0025
注:b0為常數項,b1、b2、b3、b4分別為自變量X1、X2、X3、X4的系數。
根據表2對自變量的回歸系數進行t檢驗,在0.05的置信水平下,常數項b0和大氣溫度、相對濕度、絕對濕度、日照時數的系數b1、b2、b3 、b4都達到了極顯著水平。
通過偏相關分析發現,自變量即大氣溫度、相對濕度、絕對濕度、日照時數對土壤溫度的貢獻較大,對因變量具有相對重要性。用多元線性回歸分別對晴天和陰天土壤溫度進行分析,擬合值與觀測值之間建立關系圖(圖1),由圖可知,擬合值與觀測值的決定系數R2分別為0.9739和0.9877,無論是晴天還是陰天,擬合效果都很好,擬合值與觀測值之間存在共線性,可用其建立模型。
圖1 晴天和陰天情況下多元線性回歸擬合結果
2.3 基于BP人工神經網絡方法的預測模型
前面的分析已知每個氣象因子對土壤溫度都有影響,且各個氣象因子之間也存在相互影響,因此氣象因子與土壤溫度呈線性關系,利用多元線性回歸構建二者關系雖然決定系數很高,但脫離了二者存在非線性關系的實際,為了實現更精確的預測應當嘗試用非線性的方法。
由于神經網絡具有學習逼近任意非線性映射的能力,所以神經網絡在處理非線性系統預測問題時顯示出了明顯的優越性。BP-人工神經網絡是目前發展最成熟、應用范圍最廣泛的一種神經網絡模型。它是由輸入層、一個或多個隱含層和輸出層連接而成,其每一層又由許多人工神經元(節點)組成,BP網絡間連接權在網絡的學習過程中不斷得到修正,使輸入層與隱含層之間、隱含層與輸出層之間的兩組權所構成的網絡能實現學習樣本中輸入矢量與輸出矢量間特定的映射關系,按減小預測輸出與實際輸出誤差的方向,從輸出層經中間層逐層修正各連接權,最后回到輸入層。各個連接權的調整按標準誤差逆傳播算法或累積誤差逆傳播算法進行。通過修改各層神經網絡的權值,使得誤差不斷減小,當誤差達到預定要求時,網絡學習訓練過程就結束。三層的BP網絡可以逼近任意的非線性映射,因此采用三層的BP網絡。在DPS5.02數據處理軟件中,土壤溫度BP-人工神經網絡模型的輸入神經元為氣象因子,輸出神經元土壤溫度,BP網絡的輸入和輸出層的神經元數目,是由輸入和輸出向量的維數確定的。輸入向量的維數也就是影響因素的個數,在這里,影響土壤溫度的因素為大氣溫度、絕對濕度、日照時數和相對濕度4個氣象因子,所以輸入層的神經元個數為4。由于原始數據量綱不同和數值存在數量級的明顯差異,首先要對原始數據進行標準化處理。不同的天氣(晴天和陰天)情況下土壤溫度與氣象因子間的定量關系是不同的,因此需要對晴天和陰天下的氣象因子和土壤溫度的定量關系分別進行BP-人工神經網絡模型分析,分別經過970和966次迭代,模型確定隱含網絡層次數為1層,模型的擬合殘差分別達到0.001和0.002,擬合精度較高。
建立了晴天與陰天情況下土壤溫度與氣象因子間的定量關系,得到土壤溫度擬合值與觀測值的關系如圖2。由圖2可知,晴天和陰天時土壤
圖2 晴天和陰天BP神經網絡模型擬合結果
溫度擬合值與觀測值的決定系數R2分別為0.9740和0.9881,達到極顯著水平,擬合效果非常好,達到共線性。
3 結論
土壤溫度是大氣與陸地表面能量與物質交換的綜合結果,對土壤物理、生物、微生物過程等具有重要的作用,能夠很好地指示氣候變化。土壤溫度與氣象因子之間并不是簡單的線性關系,而是非常復雜的非線性關系。各個氣象因子對土壤溫度有著不同程度的影響,而且各個氣象因子本身之間也存在著相互影響。通過土壤溫度與氣象因子之間的偏相關分析發現,在6個常規氣象因子中,大氣溫度、相對濕度、絕對濕度、日照時數與土壤溫度存在極顯著相關關系,平均風速、降水量與土壤溫度相關關系不顯著。
從上述多元線性回歸和BP神經網絡模型分析可以看出:晴天時,BP神經網絡模型的決定系數R2為0.9740,多元線性回歸模型的決定系數R2為0.9739;陰天時,BP神經網絡模型的決定系數R2為0.9881,多元線性回歸模型的決定系數R2為0.9877,說明BP神經網絡模型擬合的效果更好,它所建立的模型可靠性更高,更適合于土壤溫度的預測。
參 考 文 獻:
[1] 徐建華.現代地理學中的數學方法[M].北京:高等教育出版社, 2002.
[2] 王 風,宋春雨,韓曉增.東北黑土區土壤溫度變化特征[J].黑龍江農業科學, 2006, 6:31-33.
[3] 杜堯東,劉錦鑾,何 健.廣州地區蔬菜田土壤溫度變化特征及其預報模型研究[J].生態學雜志, 2005, 24 (9):1021-1024.
[4] 姚付啟,張振華,錢為君.煙臺果園土壤溫度影響因素及其預測模型研究[J].農業系統科學與綜合研究,2008,5:202-204.
[5] 盧紋岱.SPSS for Windows統計分析[M].北京:電子工業出版社,2003.
[6] 肖 明,鐘俊平,趙 黎,等,棉田土壤溫度與氣溫的關系及地膜增溫效應對有效氣積溫的補償作用的研究[J].新疆農業大學學報, 1998, 21 (4): 257-261.
[7] 周利鋒,高爾生,金王煥,神經網絡與多元線性回歸的比較[J].現代預防醫學,1998, 3:272-274.
[8] 楊玉建,仝雪芹.精準尺度下麥田土壤特性參數的模型研究[J].山東農業科學,2009,2:8-11.