摘要:為了建立較為精確的作物騰發量預測模型,降低常規利用彭曼公式計算繁瑣及參數估計的難度,應用偏最小二乘回歸算法來建立作物騰發量預測模型,采用多維氣象數據(太陽輻射、空氣溫度、相對濕度和平均風速)與作物騰發量的相關性來確定模型方程。結果表明,該模型能很好地解決作物騰發量與多個影響因素之間的不確定性和非線性關系,預測精度較高,完全能夠滿足灌溉的精度要求。
關鍵詞:偏最小二乘回歸;作物騰發量;彭曼公式;預測模型
中圖分類號:S161.4 文獻標識碼:A 文章編號:0439-8114(2013)22-5596-03
我國是一個水資源不豐富的國家,進入21世紀,工農業生產用水矛盾更加突出,水資源緊缺的狀況日益嚴峻,在各個用水部門中,灌溉用水最多,約占全國總用水量的80%,這就迫使農業灌溉排水領域要不斷更新觀念,其中研究和推廣高效的節水灌溉理論與技術,是我國發展節水農業、設施農業,實現高產、高效、優質農業的重要途徑,對緩解我國日益突出的水資源供需矛盾具有十分重要的戰略意義[1,2]。
作物騰發量包括植株蒸騰與棵間蒸發,是農業用水的主要組成部分,是農田水分消耗的主要途徑。作物騰發量的研究與估算,一直是灌溉排水領域中重要的研究課題之一[3,4]。實測方法是獲取作物騰發量最可靠的途徑,但實測資料的地區分布和時間序列十分有限。計算作物騰發量有助于作物騰發量在空間上的插補和時間序列上的延長[5]。但是常規彭曼公式計算法需要大量的氣候、作物等數據,而且要對大量數據進行估算,計算非常繁瑣。因此隨著其他學科的發展,出現許多作物騰發量預測方法及預測模型,本試驗是對特定作物和土壤條件下,通過偏最小二乘回歸算法利用天氣環境參數來預測作物騰發量(ET)[6-8]。
1 多重共線性分析
1.1 試驗條件
本試驗數據來自于項目試驗基地,天氣環境數據通過小型自動采集氣象站采集,作物騰發量通過高精度蒸滲儀來測量。2012年5-6月選取典型氣候測量50組試驗數據,利用得到的試驗數據來建立作物騰發量預測模型。試驗田長18.0 m,寬6.2 m,土質為沙質土壤,試驗所用的作物為玉米,這一階段玉米處于拔節、抽雄發育期。在測量過程中太陽輻射(RS)取1 d的累計值,相對濕度(RH)、空氣溫度(TA)和平均風速(WS)取1 d的平均值。試驗數據如表1所示。
1.2 多重共線性診斷
在多元回歸建模中,變量多重相關的現象經常出現,而偏最小二乘回歸方法可以有效解決普通最小二乘法在多重共線性存在的多元回歸模型中估計參數失效的問題,因此在建模前有必要診斷數據的多重相關性。自變量間的皮爾遜相關系數矩陣如表2所示。從表2可知,作物騰發量與太陽輻射、相對濕度的相關性較大,分別為0.953和-0.705,其次線性相關性較強的是太陽輻射和相對濕度,相關系數為-0.712,相對濕度與空氣溫度間的相關性略強,為0.442,從相關系數矩陣中可以初步判斷除了因變量和自變量間有線性相關性之外,自變量間也可能存在共線性問題。
特征根和條件指數是診斷多重共線性的方法,如果相當多維度的特征根等于0,則可能有比較嚴重的共線性,條件指數由Stewart等提出,當某些維度的該指標數值大于30時,則可能存在共線性。表3的自變量多重共線性診斷顯示數據間存在一定的多重共線性。
2 模型原理及其構建
2.1 偏最小二乘回歸建模思路
首先,對數據進行標準化處理,消除量綱影響。然后,分別在自變量組與因變量組中提取出t和u,滿足條件:① t和u最大程度攜帶各自數據的變異信息;② t與u的相關度達最大。當第一個成分被提取后,偏最小二乘回歸分別實施自變量對t的回歸和因變量對t的回歸。如果回歸方程已經達到滿意的精度,則算法終止;否則,將利用自變量被t解釋后的殘余信息以及因變量被t解釋后的殘余信息進行第二輪的成分提取。如此往復,直到能達到一個較滿意的精度為止。判斷是否繼續提取成分的方法是檢驗交叉有效性Q2h,滿足條件Q2h≤0.097 5時,停止計算。
2.2 作物騰發量的偏最小二乘回歸模型
根據以上建模過程,結合作物騰發量與相關因素的關系,建立如下標準化模型:
在表4中,符號RdX表示成分th對X的解釋能力,符號RdY表示成分th對Y的解釋能力。符號Q2表示交叉有效性,臨界值0.097 5,前3個成分的交叉有效性均大于臨界值,系統默認提取3個有效成分th,h=1,2,3。第一個成分對X的解釋能力為0.429 0,第二個成分對X的解釋能力為0.378 0,第三個成分對X的解釋能力為0.140 0。3個成分對X的信息利用率為0.946 0,基本提取了所有信息。第一個成分對Y的解釋能力為0.871 0,解釋能力較強,3個有效成分能夠解釋0.939 0的因變量中的變異,而且累計交叉有效性Q2(cum)=0.923 0,也接近于1,可以說模型非常完美。
3.2 回歸方程系數分析
圖1是變量投影重要性指標(VIP)圖,用來描述X在解釋Y的重要程度,它的平均值為1,大于1表示變量非常重要。從圖1可以看出,反映作物騰發量最顯著的指標是太陽輻射和相對濕度,太陽輻射的VIP值是均值的1.5倍,相對濕度的VIP值也超過了1,為1.16。
標準化回歸系數直方圖如圖2所示。
3.3 擬合效果分析
圖3為觀測值與預測值的對比圖,圖3顯示樣本點均勻分布在斜率為1的直線附近,判定系數為0.938 7,均方誤差根為0.33,相對誤差的均值為0.10,擬合效果較好。
4 模型預測
為了驗證所建模型的有效性,選取一組非建模樣本試驗數據,用建立的模型預測作物的騰發量,通過與試驗數據對比來進一步分析所建模型的合理性(表5)。
5 結論
本研究采用多元回歸建模方法建立了較為精確的作物騰發量預測模型,降低了常規利用彭曼公式計算繁瑣及參數估計的難度,通過診斷數據的多重相關性來避免變量多重相關的現象,有效解決了普通最小二乘法在多重共線性存在的多元回歸模型中估計參數失效的問題。用多維氣象數據(太陽輻射、空氣溫度、相對濕度和平均風速)與作物騰發量的相關性來確定模型方程,結果表明,該模型能很好地解決作物騰發量與多個影響因素之間的不確定性和非線性關系,預測精度較高,完全能夠滿足灌溉的精度要求。
參考文獻:
[1] 羅金耀.節水灌溉理論與技術[M].武漢:武漢大學出版社,2003.
[2] 付 強,王立坤,王兆菡.井灌水稻需水量預測的人工神經網絡模型研究[J].灌溉排水,2002(1):29-32.
[3] 張 兵,袁壽其,成 立,等.基于L-M優化算法的BP神經網絡的作物需水量預測模型[J].農業工程學報,2004,20(6):73-76.
[4] 魏占民,陳亞新,史海濱,等.BP神經網絡的春小麥作物-水模型的初步研究[J].灌溉排水,2002,21(2):12-16.
[5] 康紹忠,熊運章,劉曉明.用彭曼-蒙特斯模式估算作物蒸騰量的研究[J].西北農林科技大學學報(自然科學版),1991(1):13-19.
[6] 周金龍,董新光.內陸干旱區潛在蒸發量的計算[J].灌溉排水,2002,21(2):21-24.
[7] 霍再林,史海濱,陳亞新,等.參考作物潛在蒸散量的人工神經網絡模型研究[J].農業工程學報,2004,20(1):40-43.
[8] 史海濱,何京麗,郭克貞,等.參考作物蒸散量計算方法及適用性評判[J].灌溉排水,1997,16(2):50-54.
(責任編輯 昌炎新)