許鑫,馬兆務,熊淑萍,馬新明*,程濤,李海洋,趙錦鵬
(1.河南農業大學信息與管理科學學院,鄭州 450002;2.河南農業大學農學院,鄭州 450002)
小麥是三大糧食作物之一,產量占我國糧食總產量的 1/3[1?2]。河南作為中原糧倉,科學準確地判定小麥產量規律進而預測產量對保障國家糧食安全具有重大意義。
氣候年型是指農作物全生育期內農業氣象要素的不同組合類型,且氣象因子是影響一個區域種植業發展的重要因素,科學的劃分氣候年型可以為農業生產提供針對性的指導[3]。戚超等[4]分析了不同降水年型對黃土高原撂荒草地水分收支特征的影響;高艷梅等[5]、胡雨彤等[6]和裴雪霞等[7]分別研究了不同降水年型下覆蓋、施磷水平和播期對小麥產量和水分利用率的影響;侯賢清等[8]和趙彥茜等[9]模擬了不同降水年型和種植模式下作物的產量和耗水情況的關系。蔣菊芳等[10]分析了不同氣候年型對荒漠植物物候期、生長高度、生物量及植物覆蓋率的影響;潘小艷等[11]劃分出了重慶市不同氣候年型下玉米耕地的適宜等級,用于指導玉米的種植生產。目前研究考慮氣象因素比較單一,缺乏地區適應。
作物產量預測方法主要有遙感技術法[12?14]、統計動力學法[15?16]、氣象產量法[17?18]、農學模型預測法[19?20]、數學統計法[21?22]、機器學習法[23?25]等。目前,關于農作物產量預測的研究主要集中在預測方法的改進或影響產量因子的選擇上,缺乏氣候變化規律的歸納。因此,本研究嘗試在系統分析氣候年型的基礎上,將產量分離為趨勢產量和氣象產量分別進行預測,疊加實現小麥產量的預測。
基于氣候年型對小麥產量預測的關鍵是準確分離。從區域尺度上看,影響小麥產量的因素分為經濟社會因素和氣候因素[26]。因此,將小麥的產量分為趨勢產量和氣象產量,其中趨勢產量是經濟社會發展、科技進步影響的結果,氣象產量是氣象因素影響的結果。目前比較成熟的農作物產量分離方法主要有滑動平均法、HP濾波法、Logistic擬合法等[27?28]。本研究通過分析氣候年型和產量的規律,利用HP濾波法分離出氣象產量和趨勢產量,在劃分河南省5個麥區基礎上,通過BP神經網絡和一元線性回歸函數分別建模來預測小麥的氣象產量和趨勢產量,從而預測小麥的實際產量,以期為區域小麥估產提供科學依據。
河南省位于 N31°23′—36°22′,E110°21′—116°39′,大部分地處暖溫帶,南部跨亞熱帶,屬亞熱帶向暖溫帶過渡的大陸性季風氣候,全省由南向北年平均氣溫為10.5~16.7℃,年均降水量407.7~1 295.8 mm,年均日照1 285.7~2 292.9 h,全年無霜期201~285 d。充足的光、熱、水資源和肥沃的土地,為小麥生產奠定了良好的基礎。
1984—2018年氣象數據來源于國家氣象中心“中國地面氣候資料日值數據集”[29]中河南省15個分布均勻的氣象站點(圖1),對于缺失和異常數據,利用5 d滑動平均法[30]進行補充和處理,并結合大田物聯網(http://www.zy12396.com/navPic/nywlw.html)氣象數據進行驗證[31]。小麥產量數據來源于中國統計局出版社出版的《河南省統計年鑒1984—2018》中各氣象站點所在市(縣)小麥單位面積產量。

圖1 河南省氣象站點分布Fig.1 Distribution of meteorological stations in Henan Province
基于農作物氣候年型劃分標準[32]劃分氣候年型,結合河南省地形氣候水文特征進行調整。其中,小麥全生育期是指從播種到次年成熟的日期,具體日期通過人工調查結合專家意見得出,如表1所示。積溫是大于0℃的日平均氣溫之和。

表1 河南各地小麥各生育期時間表Table 1 Schedule of wheat growth stages in Henan Province (m/d)
積溫年型的劃分主要是通過小麥全生育期內積溫的異常度來實現,降雨年型的劃分主要是通過小麥全生育期內降雨的距平百分率來實現,計算公式如下。

式中,C為異常度,Y為農作物生育期內的積溫,Yp為相應時段內積溫的平均值,S為標準差。

式中,ΔR為距平百分率,X為農作物生育期內的降雨量,Xp為相應時段內降雨量的平均值。
積溫、降雨、產量年型的劃分如表2所示。

表2 積溫、降雨、產量年型劃分等級Table 2 Annual classification of accumulated temperature,rainfall and yield
小麥的生長發育與地理環境、土壤類型、氣候因素等密切相關,不同的生態區域形成了不同的小麥生態類型[33]。為科學準確地建立預測模型,綜合考慮地理地形、土壤、氣候等因素,把河南省劃分為5個小麥種植區:豫北麥區、豫中東麥區、豫西麥區、豫南麥區和南陽盆地麥區[34?35],如表3所示。

表3 河南小麥種植生態類型區劃分Table 3 Division of wheat planting ecological types in Henan Province
利用HP濾波法[36]分離產量,其假設{Yt}(t=1,2...,n。n為樣本容量)是一個包含長期趨勢成分(趨勢產量)和短期波動成分(氣象產量)的長時間序列。HP濾波法使得小麥產量序列在長時間尺度上的趨勢成分和實際單產序列間偏差的平方和最小,即gt被定義為公式(3)最小化問題的解。研究表明,根據選擇的年度、季度、月度數據的不同,λ 分別取值為 100、1 600、14 400[37]。將小麥的單產(Yt)分解為趨勢產量、氣象產量和隨機誤差3部分(式4),其中,趨勢產量gt反映了歷史時期生產力發展水平,氣象產量ct反映了短期氣象因子變化引起的短期波動成分,隨機誤差Δy對產量影響較小,一般忽略不計[38]。

式中,gt為長期趨勢成分,ct為短期波動成分,參數λ值根據年度選擇100。
利用BP神經網絡構建機器學習模型,其基本原理是通過誤差逆向傳播實現梯度下降,結合梯度搜索技術,可以實現實際輸出值和期望輸出值的誤差均方差最小[39?40],適合預測波動規律不明顯的氣象產量。模型構建流程如圖2所示,通過實際輸出和期望輸出的對比來不斷調整連接點權值,經過反復學習訓練,找出和最小誤差相對應的權值與閾值[41]。

圖2 BP神經網絡模型構建流程Fig.2 Construction process of BP neural network mode
選擇BP神經網絡作為訓練模型,以播種-越冬期、拔節-抽穗期、開花-成熟期積溫,全生育期的降雨量數據為輸入,以HP濾波法得出的氣象產量為輸出做模型訓練,建立3層的BP神經網絡,輸入節點為4,輸出節點為1,輸出層神經元個數為5,迭代次數3 000,學習速率為0.01。
2.1.1 不同氣候年型下小麥產量規律 在確定河南省15個市(縣)小麥各生育期的具體時間后,根據前期數據處理得出的35年積溫和降雨量數據資料,結合農作物氣候年型劃分標準[32],劃分積溫年型為暖溫年、平溫年、冷溫年;降雨年型為濕年、平水年、干年;進而組合成暖濕年、暖年、暖干年、濕年、正常年、干年、冷濕年、冷年、冷干年9種氣候年型,共得出525個氣候年型樣本,各氣候年型出現頻率及各氣候年型下的豐產、平產、低產頻率如圖3所示,豐產和平產年型多與正常和暖年相關,而冷年多是低產年,說明溫度是影響小麥產量的重要因素;而干年小麥平產和豐產的頻率也高,說明降水對小麥產量的影響不大。

圖3 不同氣候年型下產量年型頻率Fig.3 Frenquency of yield year in different climate year
2.1.2 積溫年型規律 積溫年型中,河南各地積溫年型以平溫年為主,占積溫年型的59.8%,且積溫年型分布不均勻;平溫年出現頻次最多的是固始縣,有24年,冷溫年出現次數最少的是安陽市,只有4年。河南各地的降雨年型分布相對均勻。組合氣候年型中,河南氣候年型以干年和正常年為主,排在前3位的依次是干年、正常年、濕年。干年氣候年型出現頻率最高,占全部氣候年型的24.9%,冷干年出現頻率最低,占3.6%。
2.1.3 產量年型規律 產量年型中,假設影響小麥產量的其他因素都在正常水平下,積溫年型下暖溫年和平溫年小麥的豐產概率最高,冷年年型小麥的低產率最高。降雨年型中,小麥的豐產、平產、低產率分布相對均勻,因此,積溫是影響小麥產量的主要因素;氣候年型中,暖濕年型下小麥豐產率最高,為76.9%;冷濕年小麥豐產頻率最低,為1.7%;冷濕年型下小麥低產率最高,為67.9%。
在前文分析的基礎上,本文利用Eviews 10軟件的HP濾波法進行氣象產量和趨勢產量分離,所選15個地區產量分離的方式一樣,圖4以安陽地區為例(其他地區方法相同)展示分離結果。

圖4 小麥產量分離Fig.4 Wheat yield separation
氣象產量中正數表示相比上一年是增產,負數是減產。從圖4可以看出,氣象產量隨著年份的不同呈上下波動,其波動趨勢和小麥的實際產量基本一致,說明氣候因子的變化是引起產量波動的主要因素,趨勢產量隨著年份的變化呈線性增長,因此利用BP神經網絡預測氣象產量,趨勢產量的預測選擇線性回歸模型來實現。
由于不同地區小麥生產條件、地形地勢、土壤類型、氣候條件等差別很大,為了提高預測精度,對五大麥區分別建模,結果如圖5所示。

圖5 河南小麥種植區趨勢產量Fig.5 Trend yield of wheat areas in Henan Province
從圖5可以看出,河南5個小麥種植區的趨勢產量隨著年份呈現明顯的線性增長,故趨勢產量選擇一元線性回歸模型來預測。

式中,Y為趨勢產量,X為對應年份,a為相關參數,b為常數項。80%數據為訓練集,剩下20%數據為測試集。
利用構建的BP神經網絡模型來預測氣象產量,同樣利用80%數據來做訓練,20%數據檢驗組合模型的預測效果。如圖6所示,豫西、豫北、豫中東部、豫南和南陽盆地麥區5個模型下R2分別為0.98、0.96、0.99、0.93、0.98,模型的平均相對誤差(mean relative error,MRE)分別為0.58%、0.31%、0.36%、0.48%、0.38%,其中豫中東部預測效果最好,豫南地區預測效果稍差。從總體預測效果來看,預測產量略高于真實產量,這可能是由于趨勢產量逐年遞增受經濟社會發展、科技進步影響,存在一定的不確定性,而模型模擬的是理想情況。

圖6 各麥區預測產量和實際產量對比Fig.6 Comparison of predicted and actual output in each wheat area
本研究在系統分析河南省15個氣象站點(市、縣)1984—2018年的氣象數據和產量數據的基礎上,結合河南各地域氣象水文特征,依據氣候年型劃分標準,將積溫年型和降雨年型劃分并組合出9種氣候年型,再結合產量數據分析氣候年型和產量的關系,然后結合地形土壤、氣象等因素把河南劃分為五大麥區。在此基礎上,利用HP濾波法分離出氣象產量和趨勢產量,并分別使用BP神經網絡和一元線性回歸模型來預測小麥的實際產量。
研究結果表明,不同年型的小麥產量受溫度影響最大,這與胡雨彤等[6]研究結果不同,主要與河南的氣候環境有關。河南各地積溫年型以平溫年為主,占積溫年型的59.8%;暖溫年小麥豐產概率最高,概率為52%,冷溫年小麥低產概率最高,概率為62.1%。降雨年型和產量分布相對均勻。因此氣象因素中,積溫是影響小麥產量的主要因素,河南各地氣候年型排在前三的依次是干年、正常年、濕年;暖濕年小麥豐產概率最高,冷濕年小麥豐產概率最低;冷干年小麥低產概率最大,故為保證小麥產量的穩定高產,在冷干年年型下,要更加注意科學管理,增加灌溉設施,通過灌溉進行水分的調控管理,從而實現水分供需平衡,達到保產穩產的目的。
本研究把小麥產量分離為趨勢產量和氣象產量,再利用BP神經網絡和一元線性回歸模型分別建模預測其相應產量,最終將預測的趨勢產量和氣象產量相加實現小麥產量的預測,預測精度較高,豫北、豫中東、豫西、豫南和南陽盆地五大麥區各預測模型的平均相對誤差分別為0.31%、0.36%、0.58%、0.48%、0.38%。本研究不同于目前產量分離的研究主要集中在分離方法精確度的對比上[27,28,37?38],同時結合產量不同預測方法的組合[24,39?40],將產量分離和產量預測整體考慮,為農作物產量預測提供了新思路。
本研究結合了氣候年型、產量分離和產量預測,嘗試在區域尺度間,以氣候年型分析為基礎,以趨勢產量和氣象產量的分離為紐帶,通過分別考慮趨勢產量和氣象產量的影響因素并建模預測其相應產量,從而實現小麥產量的預測。結果表明,利用HP濾波和BP神經網絡技術預測小麥產量是可行的。在以后的研究中,可以結合機器學習、遙感和作物模型等現有的技術提高模型和算法的準確性。