陳燦虎 陳英偉
(河北經貿大學數學與統計學學院,河北 石家莊 050061)
我國自古以來就是農業大國?!懊褚允碁樘臁保Z食安全與糧食生產是國民經濟安全的戰略性問題,是農業經濟工作的根本重心,關系到國計民生,因此精準預測糧食產量及變化趨勢是非常有必要的。由于氣候、自然災害以及其它不可控因素的影響,糧食產量預測往往具有較大難度和不確定性。
糧食產量預測是一個復雜性極高的重大現實問題,學者對糧食產量的預測主要體現在3個方面。從投入占用產出、遙感技術、氣象學等角度入手,這類方法關注的是農作物的生長過程;依靠糧食產量歷史數據挖掘內生規律,常見的方法有灰色預測模型、時間序列模型等,此類方法所需數據量小,預測簡單;以糧食產量相關影響因素建模并預測,常見的方法有支持向量機、神經網絡等模型,這類方法所需數據量適中,由于數據的易獲得性和科學性,預測結果更加合理,預測精確更高。
近年來,智能算法成為糧食預測領域研究的寵兒。2002年王啟平采用BP神經網絡模型預測糧食產量[1],對比發現,BP神經網絡對于單輸入單輸出的時間序列預測具有一定的優越性,且泛化能力強;李武鵬提出以自適應遺傳算法優化BP神經網絡建立模型預測糧食產量[2];郭慶春等以非線性最小二乘法優化BP神經網絡,拓寬了糧食產量預測的途徑[3];2017年戎陸慶等把灰色關聯分析和BP神經網絡相結合預測糧食產量[4];2020年Saleh I A等提出以一種反向傳播的神經網絡改進薩爾普群算法(SSA)預測糧食產量[5];2021年胡程磊等以改進的粒子群算法優化BP神經網絡,大幅度提高了糧食產量預測精度[6];2021年黃琦蘭等提出使用改進的差分進化算法優化最小二乘SVM參數,建立了ADE-LSSVM糧食產量預測模型[7]。綜上所述,近年來糧食產量預測主要通過對各種算法加以組合和優化,預測精度不斷提高。
新形勢下,我國糧食安全面臨需求增長與土地勞動力消耗的雙重挑戰。因此本文提出以差分進化改進灰狼算法優化的BP神經網絡模型對糧食產量進行預測[8],該算法具有結構簡單、通俗易懂的特點,通過實證對比,驗證了該模型預測具有精度高、預測結果穩定性高的優點。
本文研究數據來自于《中國統計年鑒》,圖1為1981—2021年全國糧食產量時序圖[9]??偟膩碚f,1981—2021年間,糧食產量由32000萬t上漲到約68000萬t,實現了總量上的“翻番”,整體呈現波動中增長的趨勢。具體來說,有11個年份較前一年出現了糧食減產的現象。在1985—1997年這段時間,每間隔2a就會出現1次糧食減產,而減產的原因都是受災面積的猛增。在1999—2003年期間,只有2002年糧食產量較前一年有增加,其余年份都在減少,累計下降超過8000萬t,主要原因是糧食播種面積出現大幅度下降[10]。此外,只有2016年、2018年出現小幅度減產現象,原因是機械總動力下降和受災面積的增加。目前,全國糧食產量呈連續3a增加趨勢。
1.2.1 指標選取
為了對糧食產量進行精準有效預測,本文研究了影響全國糧食產量的眾多指標及相關數據[9]。結合前人研究從中選取第一產業從業人數、上一年糧食商品零售價格指數等8個指標作為輸入變量[11,12],糧食產量作為輸出變量。指標選擇具體見表1。

表1 糧食產量預測相關指標
1.2.2 數據預處理
由于各指標的單位不全相同,在進行糧食產量預測前,需要進行數據的歸一化來消除量綱,本文采用最小—最大規范化:

(1)
式中,x′i代表已處理的數據;xi代表待處理的數據;xmax、xmin分別代表指標x的最大值、最小值。
關于指標x2,從中國統計年鑒中只能獲取以前一年為基期的糧食零售價格指數,而指標x2要求以1980年的糧食零售價格指數為基期(1980=100),因此需要進行累乘來獲取1981—2021年的指標x2數據。數據中2021年的用電量是缺失的,利用時間序列預測的方法對該數據進行了插補,預測結果為9883.6億kWh。
1.2.3 探索性分析
對插補得到的數據集進行相關系數分析和描述性統計分析,得到表2。

表2 糧食產量影響因素相關性及描述統計表
根據表2可知,x1、x8這2個指標與指標y之間呈負相關關系。指標x1、x8的增大會導致糧食產量的降低。x2、x3、x4、x5、x6、x7這6個指標與指標y之間呈正相關關系,要想增加糧食產量,理論上可以從加大這6個指標的投入入手。其中,導致x7與y之間關聯度不高(只有0.52)的原因很明顯——可供種糧的土地有限,而糧食產量卻發生了翻天覆地的改變。在1981—2021年這41a中糧食產量由32000萬t上漲至68000萬t,而糧食播種面積卻始終在112000千hn2上下小范圍內浮動。有學者證明糧食作物播種面積對糧食產量的影響是顯著的[13]。由此可見,以上指標的選取還是很可行的。
由各指標的最大值、最小值和區間長度了解到,糧食播種面積的波動范圍最小,其區間長度僅為該指標最小值的1/5。農村用電量的波動范圍最大,由最初的370億kWh增加到了9884億kWh,增長超25倍;漲幅第2大的指標為上一年糧食零售價格指數,漲幅超11倍,由基期的100%增長到了1227%。結合標準差和平均數來看,各指標的變異系數由大到小依次為x4、x2、x5、x6、x8、x1、x3、x7,同樣是農村用電量的變異系數最大,達到0.84,說明其離散程度最大;糧食播種面積的變異系數僅為0.04,其離散程度最小。
在農業領域上逐漸采用人工智能方法。其中在糧食預測方面,BP神經網絡發揮著巨大的作用。
BP神經網絡中,假設輸入層、隱含層以及輸出層節點數依次為l、m、n。隱藏層節點數可由經驗式(2)確定,其中p∈[1,10]。
(2)
記輸入層、隱藏層、輸出層分別為Xi、Yj、Zk;wij表示輸入層第i節點到隱藏層中第j節點的權重;wjk表示隱藏層第j節點到輸出層中第k節點的權重;bj表示隱藏層中第j節點的閾值;bk表示輸出層中第k節點的閾值。信號激活函數用f(x)表示。信息的正向傳播可用公式表示如下:
Yj=f(∑wijXi+bj)
(3)
Zk=f(∑wjkYj+bk)
(4)

(5)
在BP神經網絡中,參數的選取對預測精度影響特大,大量參數的選取也必將導致迭代時間久、效率低,故通常先利用粒子群優化或差分進化等其它智能方法來優化權值和閾值初始值,再進行神經網絡建模預測。
本文建立了差分進化改進灰狼優化的BP神經網絡模型。差分進化算法(DE)具有如下特點:結構簡單,利于使用;性能優越;自適應性;算法通用;具有利用個體局部信息和群體全局信息指導算法進一步搜索的能力?;依莾灮惴?GWO)脫胎于灰狼捕食獵物的過程,其優點是能夠有效避免陷入局部最優?;依欠N群內遵循嚴格的社會等級制度,可表示為α、β、δ和ω狼。其中α狼為頭狼,在種群內有著絕對的領導地位,其位置始終是最優位置,β狼次之,δ狼更次,β、δ狼起輔助決策的作用,ω狼僅服從命令。
然而灰狼優化用來確定最優的權值和閾值中,變異的單位是一頭狼(個體),或者是多頭狼的線性組合,無法明顯體現單個屬性的變異,變異的程度不夠大。并且也無法體現出α、β、δ狼在領導性上的先后順序。而差分進化變異的單位(屬性)更小,因此借助差分進化算法來對灰狼優化算法進行改進,從而增加了種群多樣性,避免早熟狀況的出現。實踐表明,采用差分進化改進灰狼算法來確定BP神經網絡的權重和閾值的最優初始值是可行的,效率更高。
以1981—2021年中國糧食產量作為輸出數據,對應年份的第一產業從業人數、農村用電量等8個指標為輸入數據,其中2019—2021年數據作為測試集。本文采用Matlab 2016b軟件,DE-GWO-BP模型的參數設定如表3所示。

表3 DE-GWO-BP模型參數
根據DE-GWO-BP神經網絡模型對2019—2021年糧食產量進行預測。由于每次預測的精度并不完全相同,因此進行5次仿真實驗,見圖2。

圖2 DE-GWO-BP神經網絡模型5次預測結果
從圖2可以發現,DE-GWO-BP模型5次預測中,仿真3的預測最精準,對2019年、2020年、2021年的預測都是5次仿真的最優值,分別為0.04萬t、14.25萬t和172.23萬t;仿真1和仿真2的預測效果較差,但5次仿真綜合來看,該模型預測效果還是很好的。從預測值與實際值的平均絕對誤差來看,3a預測結果中2021年的預測效果最差。平均絕對誤差為577.16萬t,平均相對誤差不到1%,預測效果同樣不錯。
DE-GWO-BP模型與其它模型的預測結果對比,本文選擇的對照模型是粒子群PSO-BP、BP模型,見表4,其中PSO-BP、BP模型用到的參數盡可能與DE-GWO-BP模型保持一致。實驗結果顯示了該模型的優越性。

表4 3種模型5次預測結果的均值比較
取5次仿真的最大誤差MaxEr(億t)、平均相對誤差MRE(%)和均方根誤差RMSE(億t)作為評價指標[6,7]。從均方根誤差RMSE來看,DE-GWO-BP模型的RMSE遠小于PSO-BP模型和BP模型。實驗表明,GWO-BP模型預測的穩定性最好,多次預測之間的差異最?。粡淖畲笳`差MaxEr來看,DE-GWO-BP模型的最大誤差同樣遠小于另外兩模型,僅為2019年的0.04億t、2020年的0.06億t和2021年的0.11億t,這說明DE-GWO-BP糧食產量預測模型有效地減小了預測誤差;從平均相對誤差MRE來看,在2019—2021年糧食產量預測中,DE-GWO-BP模型的平均相對誤差分別為0.36%、0.42%、0.85%,顯著地降低了預測誤差,提高了預測精度。綜合來看,均方根誤差、最大誤差和平均相對誤差3個指標的結果都體現了DE-GWO-BP模型的優越性。
由于該模型具有較高的預測精度,對2022—2026年全國的糧食產量進行預測。首先根據ARIMA模型對2022—2026年的全國糧食產量及其影響因素進行預測,以獲取DE-GWO-BP模型這5a所需數據。
在預測的過程中,始終秉持多次預測取平均以減小誤差的原則。利用DE-GWO-BP模型成功預測出了2022—2026年我國的糧食產量,取5次預測平均值作為最后的結果,見表5。

表5 2022—2026年我國糧食產量DE-GWO-BP預測結果
在DE-GWO-BP模型的預測結果中,2022年、2023年糧食產量連續減產,于2024年有了一定的恢復,在2024—2026年連續增產,最終在2026年全國糧食產量達到69679.02萬t。預測結果呈現波動結果的原因是利用ARIMA模型獲取的未來5a所需數據存在一定的誤差,在預測中,指標x1、x5、x8在2022年和2023年上的數值與周圍年份存在較大差距,受災面積和第一產業從業人數有大幅度的增加,而機械總動力出現大幅度降低。
糧食產量預測對于國家糧食安全政策制定具有重要的意義。本文通過實際數據,驗證了DE-GWO-BP糧食預測模型的優越性。并應用該模型對未來5a(2022—2026年)的全國糧食產量進行預測,得出以下3條結論。
掌握近年我國糧食產量變化規律。通過觀察1981—2021年全國糧食產量時間序列圖,發現我國糧食產量在41a間整體呈上升趨勢,由1981年的32502萬t上漲至2021年的68284.75萬t,實現了“翻番”。在1999—2003年全國糧食產量出現大幅度下降,累計下降超8000萬t。全國糧食產量呈連續3a增加趨勢。
構建DE-GWO-BP糧食產量預測新模型。DE-GWO算法提高了BP神經網絡算法的全局搜索能力,降低了陷入局部最優的可能性。在2019—2021年糧食產量預測上,DE-GWO-BP模型的預測值與實際值的平均相對誤差MRE分別為0.36%、0.42%、0.85%。相對PSO-BP和BP模型,最大誤差和平均相對誤差的縮小說明了DE-GWO-BP模型的準確性,均方根誤差的減小證明了DE-GWO-BP模型的穩定性??偟膩碚f,DE-GWO-BP糧食產量預測模型的準確性和有效性均得到了驗證,具有較大應用價值。
短期預測了未來5a的全國糧食產量。利用DE-GWO-BP模型預測2022—2026年的全國糧食產量,分別為67362.16萬t、67095.97萬t、67886.80萬t、68995.71萬t和69679.02萬t。準確預測我國的糧食產量,可對政府政策制定和計劃實施提供一定程度上的數據支持。