時 雷,孫佳佳,孫嘉玥,郭三黨,鄭 光,席 磊,張娟娟
(1.河南農業大學信息與管理科學學院,河南鄭州 450046;2.農田環境監測與控制技術河南省工程實驗室,河南鄭州 450046;3.河南糧食作物協同創新中心,河南鄭州 450046)
晚霜凍害是一種短時間突發性的低溫農業氣象災害,是黃淮海平原春季常見的氣象災害之一,冬小麥受其影響較深。晚霜凍嚴重影響冬小麥幼穗分化進程時可造成60%以上的減產,使冬小麥生產遭受巨大損失[1]。受全球氣候變化和極端氣象頻發的影響,淮河流域終霜日提前[2],冬小麥的物候期提前,拔節孕穗期抗寒能力衰減[3],晚霜凍害的發生趨于頻繁,危害趨于嚴重,因此,準確地對晚霜凍害進行預測意義重大。
近年來,“3S”技術[1]和各種預測模型[4-6]被廣泛應用于晚霜凍害的監測和預警中。其中,預測模型有灰色預測模型[7-8]、回歸預測模型[9-10]、神經網絡模型[11-12]、支持向量機模型[13]和馬爾可夫模型[14]等[15]。晚霜凍害發生的規律性不強,因此其數據收集難度較大。使用傳統的數據統計、時間序列分析和線性回歸方法雖然簡單易實現,但是其對數據的完整性和連續性要求較高,且預測結果精度一般。灰色預測模型[16]的數據可以是“貧信息和小樣本”[17],對于噪聲數據、少信息數據更具有魯棒性,具有計算過程簡便、預測精度高的優點[18]。使用GM(1,1)模型對霜凍特征值超過設定閾值的異常值出現時期進行預測,以實現晚霜凍的災變預測。
灰色BP神經網絡是灰色模型和BP神經網絡模型的結合,實現了2個模型的優勢互補,在農業的產量預測、災害預測上都有良好應用。Li等使用灰色BP神經網絡分別預測河南省的災害發生和糧食產量,取得良好結果[19-20];王安等針對產量預測問題研究單變量預測模型中灰色神經網絡模型的應用情況,證明在單變量預測模型中灰色神經網絡模型比GM(1,1)、恩格爾GM(1,1)和離散GM(1,1)模型預測結果更好[21]。灰色預測模型和神經網絡模型的結合方式也逐漸多元化,對灰色模型的預測結果進行殘差修正不僅效果好而且易實現。支持向量機因擅長預測不規則數據常被應用在殘差修正問題中,耿立艷等使用支持向量機修正差分整合移動平均自回歸模型預測的殘差[22];杜文然等使用支持向量回歸機對改進后的GM(1,1)預測殘差進行修正,模型的精度均得到顯著提升[23-24]。殘差修正方法被較多運用在單一模型的殘差修正中,在組合模型中使用較少。
本研究基于河南省商丘市1980—2019年的終霜日數據,實現數據的預處理,篩選不同的灰色模型作為BP神經網絡的輸入,使用支持向量機對 GM(1,1)和離散GM(1,1)模型的預測結果進行殘差修正,利用BP神經網絡將殘差修正后的灰色模型和等維遞補離散GM(1,1)的預測結果加入神經網絡上進行訓練、建模,以期為實現冬小麥晚霜凍害的預測及防災減災提供有效的技術支持。
在霜凍災害中,通常使用日最低氣溫0 ℃作為閾值,認為低于這個閾值將會引起霜凍災害發生[25-27]。有關終霜日參照農業氣象學[28-29]定義:取每年春季最后1次出現每日最低溫度在0 ℃以下,記這一日為該年的終霜日。氣象數據來源于中國氣象數據網(http://data.cma.cn/),包括河南省商丘市氣象站點1980—2019年3—5月的逐日最低氣溫數據記錄。篩選每日最低溫度低于0 ℃的日期數據,得到商丘1980—2019年的終霜日數據。
在全球氣候變暖背景下,淮河流域氣溫上升速率顯著[2,30],終霜日穩定性降低[30]。冬小麥晚霜凍害的發生與終霜日期密切相關,隨著冬小麥生育期進入拔節期,抗寒能力減弱,終霜日發生時間越晚,對冬小麥的生產威脅越大。冬小麥的拔節期和終霜日受不同地域影響呈現趨勢變化。河南省商丘市位于114°49′~116°39′E、33°43′~34°52′N之間,其拔節期主要出現在3月9—17日[31],所以本研究認定終霜日晚于3月17日會引起晚霜凍害。
1.2.1 原始災變序列的建立和GM(1,1)模型的建立 整理后的終霜日數據,在不考慮年份的情況下按照日期先后排序,記最早的終霜日期為零點,其后各終霜日期與零點的間隔天數記為相對日期,得到1980—2019年終霜日相對日期序列。確定最早災變日期,并以此為基準作災變折線圖,得到原始災變序列I(0),即
I(0)={x(0)(1),x(0)(2),…,x(0)(n)}。
(1)
式中:x(0)為原始災變數據;n為研究區域年份總計數。
對I(0)進行累加生成處理得到序列I(1):
I(1)={x(1)(1),x(1)(2),…,x(1)(n)}。
(2)
相應的微分方程為

(3)
式中:a是反映系統發展態勢的發展系數;b是作用量,反映數據的變化關系。

(4)

則式(3)可以表示為
Yn=Bα。
(5)
則GM(1,1)模型的時間響應函數為
(6)
1.2.2 離散GM(1,1)和等維遞補離散GM(1,1)模型的建立 離散GM(1,1)模型的定義。假設I(0)={x(0)(1),x(0)(2),…,x(0)(n)}為非負序列,累加生成序列為I(1)={x(1)(1),x(1)(2),…,x(1)(n)},則稱:
x(1)(K+1)=β1x(1)(K)+β2。
(7)
為離散GM(1,1)模型,該模型的解為
(8)
離散GM(1,1)模型的時間響應函數為
(9)
等維遞補思想在預測問題上也稱為滾動式預測[32-33],在傳統灰色預測模型的過程中,利用灰色預測模型預測結果越靠后精度逐漸降低的特點,通過不斷加入新信息,同時去掉舊信息,保持數據序列與原序列的數據等維,依次遞補預測,實現灰色模型的動態預測,可以有效降低由于灰色預測結果隨時間外推灰度逐漸上升造成的誤差。等維遞補離散GM(1,1)模型吸收了等維遞補思想和離散 GM(1,1)模型的優點,預測精度有效提升,在試驗中被證明更適用于冬小麥晚霜凍害的預測。
支持向量機回歸模型[34]是用來解決小樣本、非線性回歸問題的算法,該算法將已知空間映射到高維空間,實現樣本由非線性到線性的轉變。設低維空間中的非線性樣本集為{xj,yj},其中:xj=[xj1,xj2,…,xji]為輸入向量,yj為對應輸出值,j為樣本數,i為輸出向量個數,則SVM回歸模型為
f(x)=WTφ(x)+b。
(10)
式中:WT為估計函數的自變系數;φ(x)是非線性映射函數;b為偏置量。
支持向量機回歸模型可以實現對殘差序列的回歸預測,以支持向量機為理論基礎建立的回歸模型在準確度上有很好的性能[35]。
區別于支持向量機模型,BP神經網絡模型利用非線性基函數的線性組合實現從輸入空間到輸出空間的非線性轉換[37],在非線性問題預測上適應良好。BP神經網絡是典型的3層網狀結構,具體結構見圖1。
輸入層到隱藏層的連接權值為wij,i=1,2,…,n,j=1,2,…,隱藏層到輸出層的連接權值為wjm,m=1,2,…,j=1,2,…,隱藏層閾值為bi,輸出層閾值為bm。經試驗,本研究設置輸入層節點為3,訓練函數為Sigmoid函數,隱藏層節點為8,輸出層節點為1,訓練函數為線性傳遞函數,模型的訓練函數為標度共軛梯度算法。

將殘差修正后的GM(1,1)模型、離散GM(1,1)模型和等維遞補離散GM(1,1)模型的預測結果作為BP神經網絡的輸入,真實值作為輸出。
基于支持向量機殘差修正的灰色BP神經網絡模型的結構見圖2,建模步驟具體如下:
步驟一:將處理好的數據序列分別進行GM(1,1)、離散GM(1,1)和等維遞補離散GM(1,1)模型預測。
步驟二:使用支持向量機回歸模型對GM(1,1)和離散GM(1,1)的預測結果進行殘差修正,分別得到殘差修正后的GM(1,1)和離散GM(1,1)模型,等維遞補離散GM(1,1)的預測結果不作處理。
步驟三:分別將殘差修正后的GM(1,1)、離散GM(1,1)和等維遞補離散GM(1,1)3個模型的預測結果輸入到BP神經網絡,作為輸入層,將實際值放到網絡的輸出層,最終訓練得到BP模型。

各個模型建立后,采用平均相對誤差、平均絕對百分比誤差和均方差比值對模型進行檢驗,精度等級的評判標準見表1。

表1 精度檢驗等級參照
表1中平均相對誤差的計算公式為

(11)
平均絕對百分比誤差可以用公式表現為

(12)

均方差比值指用殘差數據序列的均方差除以原始災變序列的均方差,即

(13)
(14)
(15)

對終霜日數據進行整理后可知,商丘市在1980—2019年的40年間,春季終霜日出現日期最早為3月1日,最晚為3月31日。以3月1日為0點,按照“1.2.1”節的步驟將終霜日序列轉換為終霜日相對日期序列,具體結果見表2。
數據(表2)顯示,商丘市1980—2019年間的終霜日均發生在3月,當終霜日發生日期晚于3月17日,會發生晚霜凍害,確定3月17日為災變日期,記相對排序閾值為14。

表2 商丘市1980—2019年終霜日相對排序
根據相對排序序列繪制折線圖,加入閾值繪制等值水平線,得到商丘市1980—2019年終霜日相對排序及閾值線的交點見圖3。
從圖3中得到終霜日相對排序與閾值線的交點集,共計17個交點。取第1個交點為0點,計算其余16個交點到0點的距離。由于交點并不統一落入整數點,將橫坐標的1個單位再進行10等分,最終記錄16個間隔數據,得到商丘晚霜凍害發生間隔柱狀圖(圖4)。
由相對距離數據建立原始災變間隔時間序列集,即


I(0)={x(0)(1),x(0)(2),…,x(0)(16)}。
(16)
當數據序列呈現指數增長時,在灰色模型中應用良好。為保證模型的預測準確性,需要對數據進行必要的檢驗處理。對原始數據I(0)進行級比檢驗:
(1)求級比λ(t)。
(17)
λ=[λ(2),λ(3),…,λ(16)]=(0.201 9,0.969 4,0.716 9,0.734 9,0.740 0,0.843 0,0.919 0,0.937 9,0.952 6,0.746 6,0.972 7,0.924 6,0.982 3,0.913 6,0.917 0)。
(18)

(19)
(3)平移變換處理。取適當的常數c=363,對I(0)(t=1,2,…,16)進行平移變換處理:
y(0)(t)=x(0)(t)+c,t=1,2,…,n-1。
(20)
得到:
y(0)={x(0)(1),x(0)(2),…,x(0)(16)}=(374.153 8,418.244 8,419.987 2,442.487 2,471.153 8,509.153 8,536.376 1,551.653 8,564.153 8,574.153 8,645.820 5,653.769 2,677.487 2,683.153 8,713.439 6,745.153 8)。
(21)
得到相應的級別值為

(22)

在試驗過程中,選取序列的前11位作為試驗數據,后5位數據作為試驗的真實值。
2.3.1 分別建立灰色模型 對序列y(0)進行以此累加得到:
y(1)={x(1)(1),x(1)(2),…,x(1)(11)={374.153 8,792.398 6,1 212.385 8,1 654.873 0,2 126.026 8,2 635.180 6,3 171.556 7,3 723.210 5,4 287.364 3,4 861.518 1,5 507.338 6}。
(23)
GM(1,1)建模后得到發展系數a=-0.047 4,灰色作用量b=383.500 4,相應的白化解為:
(24)
根據等維遞補思想,依次遞補預測,得到等維遞補的GM(1,1)模型的5步預測值。
離散GM(1,1)建模后得到β1=1.048 5,β2=392.909 7,相應的白化解為:
根據等維遞補思想,逐步獲得5個預測值。
經過以上4個灰色模型預測過程,得到 GM(1,1)、離散GM(1,1)、等維遞補GM(1,1)和等維遞補離散GM(1,1)模型的預測結果(表4)。

表4 灰色模型的預測值及誤差
使用平均相對誤差對以上4種灰色模型進行評價,發現GM(1,1)、離散GM(1,1)和等維遞補離散GM(1,1)模型的預測精度較高,平均相對誤差較低,其中等維遞補離散GM(1,1)模型的預測精度最高;等維遞補GM(1,1)模型的預測精度下降,平均相對誤差和殘差數值較大。因此,選擇GM(1,1)、離散GM(1,1)和等維遞補離散GM(1,1)模型的5步預測結果作為灰色BP神經網絡的輸入。
2.3.2 使用支持向量機回歸模型分別對GM(1,1)和離散GM(1,1)的預測結果進行殘差修正 根據灰色模型的白化方程可以得到序列y(0)前11位的模擬值z0={x(0)(1),x(0)(2),…,x(0)(11)}和后5位預測值z0={x(0)(12),x(0)(13),…,x(0)(16)},將它們和y(0)={x(0)(1),x(0)(2),…,x(0)(16)}對應作差,得到對應的殘差序列:
δ0={x(0)(1),x(0)(2),…,x(0)(11)};δ0={x(0)(12),x(0)(13),…,x(0)(16)}。
(25)

對殘差修正前后的灰色模型預測結果進行評價,結果見表5。由表5可知,相較原始的GM(1,1)和離散 GM(1,1)模型,殘差修正后的灰色模型精度提升明顯,其中殘差修正后的GM(1,1)模型預測結果最佳,其方差比達到一級,平均相對誤差、平均絕對誤差均達到二級標準。

表5 支持向量機殘差修正前后灰色模型預測結果評價
2.3.3 對殘差修正后的灰色預測結果進行BP神經網絡預測 經過支持向量機模型殘差修正后得到等維遞補離散GM(1,1)、殘差修正GM(1,1)和殘差修正離散GM(1,1)模型的5步預測結果見表6。

表6 灰色模型的預測結果
將以上數據作為BP神經網絡的3個輸入,真實值作為BP神經網絡的輸出,進行BP神經網絡建模,相關參數參考“1.4”節,得到灰色模型和基于支持向量機殘差修正后的灰色BP神經網絡模型的預測結果對比(圖5)。

由圖5可知,本研究提出的支持向量機殘差修正的灰色BP神經網絡模型的預測結果與真實值最接近,模型的預測性能更好。
2.4.1 對比模型預測 為了更客觀全面對模型精度進行檢驗,本研究將滾動式BP神經網絡預測模型、原始差分GM(1,1)預測模型和均值差分 GM(1,1)預測模型加入預測結果精度檢驗。滾動式BP神經網絡預測模型是在40年終霜日災變間隔序列數據的基礎上進行滾動式處理,將前4步數據作為輸入、第5步數據作為輸出,從而建立BP神經網絡模型。差分GM(1,1)預測模型是GM(1,1)模型的一種經典改進模型,其在灰色模型中引入了差分模型,最終得到對比模型的預測結果(表7)。

表7 對比模型的5步預測結果
2.4.2 對模型的預測結果進行誤差評價 根據表1的精度檢驗等級對模型的結果進行分級對比,分別從平均相對誤差、平均絕對百分比誤差和均方差比值3個方面對模型的結果進行分析,分別得到精度級別對比結果(圖6至圖8)。
由圖6可知,使用單一數據進行滾動式BP神經網絡預測精度較差,平均相對誤差精度等級達到三級;灰色模型包含GM(1,1)、原始差分GM(1,1)和均值差分GM(1,1)的平均相對誤差精度均處于二級,結果較為穩定;本研究提出的模型基于支持向量機殘差修正的灰色BP神經網絡模型的平均相對誤差精度達到一級標準。
由圖7可知,滾動式BP神經網絡預測精度最低,處于三級;灰色模型精度比較接近,均為二級,本研究提出的模型精度較高,平均絕對百分比誤差達到一級精度。
由圖8可知,滾動式BP神經網絡模型的預測結果最差,遠低于圖中其他模型;幾個灰色模型的均方差比值剛達到一級,本研究提出模型的均方差比值高于一級,結果比灰色模型的預測結果更好。



由以上分析可知,經過支持向量機殘差修正后的灰色BP模型的預測結果性能最優,且符合精度標準要求,可以用來預測晚霜凍。在實際的應用過程中,考慮到模型預測值的實際意義為霜凍發生年份的間隔,需要對數據進行預處理和還原過程。
分別將級別處理后的第12步到第16步數據放入經支持向量機殘差修正的灰色BP神經網絡模型中,得到預測結果(表8)。

表8 霜凍預測年份還原表
由圖4可知,商丘最后一次發生晚霜凍的時間為2018年,經過預測后本研究預測未來發生霜凍的年份為2020、2021、2022年,得到商丘1980年以來的晚霜凍災害年份分布(圖9)。
根據商丘氣象站公布的數據,2020年商丘終霜日為3月30日,3月26—28日商丘全市出現寒潮大風降溫天氣,大部分地區出現晚霜凍,與本研究模型預測結果相符。2021年商丘各市區終霜日出現日期均為4月4日,較往年較晚,遠超本研究設定的災變閾值3月17日,符合本研究預測結果。
對圖9進行分析。發現未來晚霜凍發生年份規律與1999—2001年的災害發生情況相似,均為連續發生,相鄰10年晚霜凍災害發生頻率約為2~4年出現1次。根據這個規律,本研究認為2022年后晚霜凍發生的頻率會降低到2~4年1次。

為提高冬小麥晚霜凍害預測的準確性,本研究提出了一種基于支持向量機殘差修正的灰色BP神經網絡模型,該模型在符合自身數據特點的基礎上結合神經網絡模型、支持向量機模型和等維遞補思想等模型優化方法,有效提升了灰色模型的預測精度。在河南省商丘氣象站1980—2019年的終霜日數據上的試驗表明:使用支持向量機殘差修正后的灰色BP神經網絡模型可以實現冬小麥晚霜凍的預測,根據本模型預測結果,2020、2021年會發生晚霜凍,與當地氣象站公布數據相符,未來預測2022年有可能出現霜凍。
本研究在宏觀方面實現了冬小麥晚霜凍害的災變年份預測,未來可以考慮加入更多影響因素,構建多維的灰色BP神經網絡模型,以實現對冬小麥晚霜凍害更加精確、全面的預測。