摘要 山東省是我國傳統農業大省,糧食產量對我國糧食總產量的影響較大,因此對山東省糧食產量進行預測具有重大意義。分別利用多元線性回歸方法和BP神經網絡兩種預測方法對山東糧食產量進行預測,并對兩種方法的預測結果進行分析比較,實驗證明,BP神經網絡平均預測精度高于多元線性回歸模型,且各期預測精度較多元線性回歸模型更穩定,但隨時間推移,誤差增大,因此BP神經網絡預測模型較適用于近期糧食產量預測。
關鍵詞 線性回歸;BP神經網絡;糧食產量預測
中圖分類號S126文獻標識碼A文章編號0517-6611(2014)30-10780-04
基金項目山東省自主創新專項(2012CX90204)。
作者簡介高亮亮(1990- ),男,山東濰坊人,碩士研究生,研究方向:農業信息化。
糧食是人類賴以生存的必要條件,是從事其他社會事務的前條件,也是關系到社會穩定、國家經濟發展的重大戰略問題,被視為當前世界面臨的重大問題之一[1]。由于極端氣候變化頻發、耕地面積減少、從事農業的勞動人員減少等因素對糧食生產的影響,我國糧食產量波動頻繁且幅度較大,因此科學準確的糧食產量預測對我國糧食安全有著重大意義。山東省是我國農業大省,2013年糧食產量僅次于黑龍江省,位居全國糧食產量第2名[2],因此,筆者以山東省糧食產量為例進行預測方法比較研究。
糧食產量預測一般選擇與糧食產量相關聯的影響因素,依據特定方法理論確定相關關系,從而進行產量預測。目前,常用的方法包括傳統的統計學預測方法、灰色系統預測方法以及支持向量機、神經網絡等人工智能預測方法等[3-10]。為此,筆者選擇了兩類常用的預測方法,線性回歸方法和BP(Back Propagation)神經網絡,對山東省糧食產量進行預測,并分析評價兩種方法的預測結果,確定適用于山東省糧食產量預測的方法。
1研究區域與數據選擇
1.1山東省地區概況山東省位于我國東部沿海的東北段,面積15.71萬km2,東鄰黃海,北接渤海,內陸與河北、河南、安徽和江蘇接壤。海拔較低,地形多樣,平原占550%,山地占150%,丘陵占200%,湖泊占0.8%,其余占9.3%。氣候為典型的溫帶大陸性季風氣候,降水集中,雨熱同期,春季較短,氣候多變,降水量較少;夏季炎熱,多降雨;秋天余量較少,秋高氣爽;冬季容易受到北方寒流的影響,寒冷干燥。
山東是我國農業大省,農業歷史悠久,傳統糧食作物有小麥、玉米、紅薯、大豆、水稻、粳稻等,2013年糧食產量達到4 528.2萬t,位居全國糧食產量第2。
1.2數據來源影響糧食產量的因素很多,主要分為自然因素、勞動力因素、農用水利設施因素、化肥施用因素和農機電因素等。該研究以中華人民共和國國家統計局1978~2011年山東省糧食產量及糧食作物播種面積、有效灌溉面積、農用化肥施用折純量、農村用電量、受災面積、成災面積、農業機械總動力、農林牧漁業從業人員8個影響因素的年度數據為例進行研究分析,詳情如表1所示,糧食產量變化趨勢如圖1所示??梢?,隨著時間變化,糧食產量呈上下波動,并存在整體上升的趨勢。
1.3影響因素選擇為分析各影響因素與糧食產量的相關性,確定相關性較大的影響因素,避免相關性較小因素對預測結果的干擾,對影響因素進行了關聯度分析。由于各個變量之間量綱不統一,需要進行歸一化處理,設上述自變量中糧食作物播種面積為X1 、有效灌溉面積為X2 、農用化肥施用折純量為X3 、農村用電量為X4 、受災面積為X5 、成災面積為X6 、農業機械總動力為X7 、農林牧漁業從業人員為X8,糧食產量為因變量Y。歸一化公式為:
式中,i為歸一化之后的值;xi為自變量Xi當前值;maxXi、minXi為該列中最大數值和最小數值。因變量Y也用同樣方法進行歸一化處理。歸一化處理之后,根據灰色關聯度進行自變量的關聯度分析,公式為:
2糧食產量預測模型應用與對比
采用傳統方法多元線性回歸和人工智能方法BP神經網絡對山東省糧食產量進行預測,并對其結果進行比較分析。
2.1多元線性回歸預測多元線性回歸方法是一種根據現有數據發掘變量之間相互關系的統計學方法, 是根據現有的數據構建線性回歸模型,達到對未來趨勢作出預測的目的。多元回歸方程如下:
式中,因變量Y是糧食產量;c0是誤差項;X1、X2、…、X8分別為糧食作物播種面積、有效灌溉面積、農用化肥施用折純量、農村用電量、受災面積、成災面積、農業機械總動力、農林牧漁業從業人員;c1、…、c8為對應回歸系數。以1978~2006年8個因素232個樣本為訓練集,以2007~2011年數據作為檢驗集,利用軟件SPSS 12.0進行數據統計分析,采用Enter進行分析,由表3可知,Sig.=0<0.005,因此該模型具有顯著統計學意義。
2.2BP神經網絡BP神經網絡于1986年由Rumelhart和McCelland為首的科學家小組提出,是一種按誤差逆傳播算法訓練的多層前饋網絡,是目前應用最廣泛的神經網絡模型之一。BP神經網絡分為3層:輸入層、隱藏層和輸出層。輸入層為數據作為變量輸入網絡中,輸出層為輸出結果,包含1個或多個神經元,兩者之間為隱藏層,隱藏層可以為1個或多個。
BP神經網絡的學習訓練過程由網絡輸入信號正向傳播和誤差信號反向傳播兩部分組成。在正向傳播中,輸入信息從輸入層經隱含層逐層計算傳向輸出層,輸出層的各神經元輸出對應輸入模式的網絡響應;如果輸出層得不到期望輸出,則誤差轉入反向傳播,按減小期望輸出與實際輸出的誤差原則,從輸出層經中間各層,最后回到輸入,層層修正各個連接權值。隨著這種誤差逆傳播訓練不斷進行,網絡對輸入模式響應的正確率也不斷提高,如此循環直到誤差信號達到允許的范圍之內或訓練次數達到預先設計的次數為止。
BP神經網絡學習規則是對網絡權值和閾值的修正。
要沿著表現函數下降最快的方向——負梯度方向:
式中,xk為當前的權值和閾值矩陣;gk為當前表現函數的梯度;ak為學習速率。
對3層BP網絡,輸入節點為xi,隱層節點為yj,輸出節點為zl,輸入節點與隱層節點的網絡權值為wji,隱層節點與輸出節點的網路權值為wji,當輸出節點的期望為tl時,模型的計算公式如下。
隱層節點的輸出:
3結論
山東省作為我國糧食產量大省,糧食產量對我國糧食安全有著重要的影響,所以對山東省糧食產量預測有著重要意義。為此該研究利用多元線性回歸和BP神經網絡兩種方法對山東省糧食產量進行了預測,并對預測結果進行對比分析,結果表明:BP神經網絡平均預測精度高于多元線性回歸模型,且各期預測精度較多元線性回歸模型更穩定,但隨時間推移,誤差增大,因此BP神經網絡預測模型較適用于近期糧食產量預測,例如近兩年產量預測,若需對多期未來糧食產量進行預測,則需對BP神經網絡算法進改進,或對參數設置進行改進進一步研究。
參考文獻
[1] 李曉東.基于灰色關聯支持向量機的中國糧食產量預測模型[J].河北理工大學學報:自然科學版,2008(4):76-80,103.
[2] 國家統計局.國家統計局關于2013年糧食產量的公告[EB/OL].(2013-11-29)http://www.stats.gov.cn/tjsj/zxfb/201311/t20131129_475486.html.
[3] 周永生,肖玉歡,黃潤生.基于多元線性回歸的廣西糧食產量預測[J].南方農業學報,2011(9):1165-1167.
[4] 林芳.灰色神經網絡在糧食產量預測中的應用[J].計算機仿真,2012(4):225-228,267.
[5] 宰松梅,溫季,仵峰,等.基于灰色關聯分析的遼寧省糧食產量預測模型[J].節水灌溉,2011(5):64-66.
[6] 曠嶺.RBF神經網絡的糧食產量預測[J].計算機仿真,2011(11):189-191,200.
[7] 向昌盛,張林峰.灰色理論和馬爾可夫相融合的糧食產量預測模型[J].計算機科學,2013(2):245-248.
[8] 孫東升,梁仕瑩.我國糧食產量預測的時間序列模型與應用研究[J].農業技術經濟,2010(3):97-106.
[9] 向昌盛,周子英,武麗娜.糧食產量預測的支持向量機模型研究[J].湖南農業大學學報:社會科學版,2010(1):6-10.
[10] 李濤.基于遺傳神經網絡的糧食產量預測方法研究[D].哈爾濱:哈爾濱工程大學,2008.