摘要 山東省是我國傳統(tǒng)農(nóng)業(yè)大省,糧食產(chǎn)量對(duì)我國糧食總產(chǎn)量的影響較大,因此對(duì)山東省糧食產(chǎn)量進(jìn)行預(yù)測具有重大意義。分別利用多元線性回歸方法和BP神經(jīng)網(wǎng)絡(luò)兩種預(yù)測方法對(duì)山東糧食產(chǎn)量進(jìn)行預(yù)測,并對(duì)兩種方法的預(yù)測結(jié)果進(jìn)行分析比較,實(shí)驗(yàn)證明,BP神經(jīng)網(wǎng)絡(luò)平均預(yù)測精度高于多元線性回歸模型,且各期預(yù)測精度較多元線性回歸模型更穩(wěn)定,但隨時(shí)間推移,誤差增大,因此BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型較適用于近期糧食產(chǎn)量預(yù)測。
關(guān)鍵詞 線性回歸;BP神經(jīng)網(wǎng)絡(luò);糧食產(chǎn)量預(yù)測
中圖分類號(hào)S126文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào)0517-6611(2014)30-10780-04
基金項(xiàng)目山東省自主創(chuàng)新專項(xiàng)(2012CX90204)。
作者簡介高亮亮(1990- ),男,山東濰坊人,碩士研究生,研究方向:農(nóng)業(yè)信息化。
糧食是人類賴以生存的必要條件,是從事其他社會(huì)事務(wù)的前條件,也是關(guān)系到社會(huì)穩(wěn)定、國家經(jīng)濟(jì)發(fā)展的重大戰(zhàn)略問題,被視為當(dāng)前世界面臨的重大問題之一[1]。由于極端氣候變化頻發(fā)、耕地面積減少、從事農(nóng)業(yè)的勞動(dòng)人員減少等因素對(duì)糧食生產(chǎn)的影響,我國糧食產(chǎn)量波動(dòng)頻繁且幅度較大,因此科學(xué)準(zhǔn)確的糧食產(chǎn)量預(yù)測對(duì)我國糧食安全有著重大意義。山東省是我國農(nóng)業(yè)大省,2013年糧食產(chǎn)量僅次于黑龍江省,位居全國糧食產(chǎn)量第2名[2],因此,筆者以山東省糧食產(chǎn)量為例進(jìn)行預(yù)測方法比較研究。
糧食產(chǎn)量預(yù)測一般選擇與糧食產(chǎn)量相關(guān)聯(lián)的影響因素,依據(jù)特定方法理論確定相關(guān)關(guān)系,從而進(jìn)行產(chǎn)量預(yù)測。目前,常用的方法包括傳統(tǒng)的統(tǒng)計(jì)學(xué)預(yù)測方法、灰色系統(tǒng)預(yù)測方法以及支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等人工智能預(yù)測方法等[3-10]。為此,筆者選擇了兩類常用的預(yù)測方法,線性回歸方法和BP(Back Propagation)神經(jīng)網(wǎng)絡(luò),對(duì)山東省糧食產(chǎn)量進(jìn)行預(yù)測,并分析評(píng)價(jià)兩種方法的預(yù)測結(jié)果,確定適用于山東省糧食產(chǎn)量預(yù)測的方法。
1研究區(qū)域與數(shù)據(jù)選擇
1.1山東省地區(qū)概況山東省位于我國東部沿海的東北段,面積15.71萬km2,東鄰黃海,北接渤海,內(nèi)陸與河北、河南、安徽和江蘇接壤。海拔較低,地形多樣,平原占550%,山地占150%,丘陵占200%,湖泊占0.8%,其余占9.3%。氣候?yàn)榈湫偷臏貛Т箨懶约撅L(fēng)氣候,降水集中,雨熱同期,春季較短,氣候多變,降水量較少;夏季炎熱,多降雨;秋天余量較少,秋高氣爽;冬季容易受到北方寒流的影響,寒冷干燥。
山東是我國農(nóng)業(yè)大省,農(nóng)業(yè)歷史悠久,傳統(tǒng)糧食作物有小麥、玉米、紅薯、大豆、水稻、粳稻等,2013年糧食產(chǎn)量達(dá)到4 528.2萬t,位居全國糧食產(chǎn)量第2。
1.2數(shù)據(jù)來源影響糧食產(chǎn)量的因素很多,主要分為自然因素、勞動(dòng)力因素、農(nóng)用水利設(shè)施因素、化肥施用因素和農(nóng)機(jī)電因素等。該研究以中華人民共和國國家統(tǒng)計(jì)局1978~2011年山東省糧食產(chǎn)量及糧食作物播種面積、有效灌溉面積、農(nóng)用化肥施用折純量、農(nóng)村用電量、受災(zāi)面積、成災(zāi)面積、農(nóng)業(yè)機(jī)械總動(dòng)力、農(nóng)林牧漁業(yè)從業(yè)人員8個(gè)影響因素的年度數(shù)據(jù)為例進(jìn)行研究分析,詳情如表1所示,糧食產(chǎn)量變化趨勢(shì)如圖1所示??梢姡S著時(shí)間變化,糧食產(chǎn)量呈上下波動(dòng),并存在整體上升的趨勢(shì)。
1.3影響因素選擇為分析各影響因素與糧食產(chǎn)量的相關(guān)性,確定相關(guān)性較大的影響因素,避免相關(guān)性較小因素對(duì)預(yù)測結(jié)果的干擾,對(duì)影響因素進(jìn)行了關(guān)聯(lián)度分析。由于各個(gè)變量之間量綱不統(tǒng)一,需要進(jìn)行歸一化處理,設(shè)上述自變量中糧食作物播種面積為X1 、有效灌溉面積為X2 、農(nóng)用化肥施用折純量為X3 、農(nóng)村用電量為X4 、受災(zāi)面積為X5 、成災(zāi)面積為X6 、農(nóng)業(yè)機(jī)械總動(dòng)力為X7 、農(nóng)林牧漁業(yè)從業(yè)人員為X8,糧食產(chǎn)量為因變量Y。歸一化公式為:
式中,i為歸一化之后的值;xi為自變量Xi當(dāng)前值;maxXi、minXi為該列中最大數(shù)值和最小數(shù)值。因變量Y也用同樣方法進(jìn)行歸一化處理。歸一化處理之后,根據(jù)灰色關(guān)聯(lián)度進(jìn)行自變量的關(guān)聯(lián)度分析,公式為:
2糧食產(chǎn)量預(yù)測模型應(yīng)用與對(duì)比
采用傳統(tǒng)方法多元線性回歸和人工智能方法BP神經(jīng)網(wǎng)絡(luò)對(duì)山東省糧食產(chǎn)量進(jìn)行預(yù)測,并對(duì)其結(jié)果進(jìn)行比較分析。
2.1多元線性回歸預(yù)測多元線性回歸方法是一種根據(jù)現(xiàn)有數(shù)據(jù)發(fā)掘變量之間相互關(guān)系的統(tǒng)計(jì)學(xué)方法, 是根據(jù)現(xiàn)有的數(shù)據(jù)構(gòu)建線性回歸模型,達(dá)到對(duì)未來趨勢(shì)作出預(yù)測的目的。多元回歸方程如下:
式中,因變量Y是糧食產(chǎn)量;c0是誤差項(xiàng);X1、X2、…、X8分別為糧食作物播種面積、有效灌溉面積、農(nóng)用化肥施用折純量、農(nóng)村用電量、受災(zāi)面積、成災(zāi)面積、農(nóng)業(yè)機(jī)械總動(dòng)力、農(nóng)林牧漁業(yè)從業(yè)人員;c1、…、c8為對(duì)應(yīng)回歸系數(shù)。以1978~2006年8個(gè)因素232個(gè)樣本為訓(xùn)練集,以2007~2011年數(shù)據(jù)作為檢驗(yàn)集,利用軟件SPSS 12.0進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,采用Enter進(jìn)行分析,由表3可知,Sig.=0<0.005,因此該模型具有顯著統(tǒng)計(jì)學(xué)意義。
2.2BP神經(jīng)網(wǎng)絡(luò)BP神經(jīng)網(wǎng)絡(luò)于1986年由Rumelhart和McCelland為首的科學(xué)家小組提出,是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。BP神經(jīng)網(wǎng)絡(luò)分為3層:輸入層、隱藏層和輸出層。輸入層為數(shù)據(jù)作為變量輸入網(wǎng)絡(luò)中,輸出層為輸出結(jié)果,包含1個(gè)或多個(gè)神經(jīng)元,兩者之間為隱藏層,隱藏層可以為1個(gè)或多個(gè)。
BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練過程由網(wǎng)絡(luò)輸入信號(hào)正向傳播和誤差信號(hào)反向傳播兩部分組成。在正向傳播中,輸入信息從輸入層經(jīng)隱含層逐層計(jì)算傳向輸出層,輸出層的各神經(jīng)元輸出對(duì)應(yīng)輸入模式的網(wǎng)絡(luò)響應(yīng);如果輸出層得不到期望輸出,則誤差轉(zhuǎn)入反向傳播,按減小期望輸出與實(shí)際輸出的誤差原則,從輸出層經(jīng)中間各層,最后回到輸入,層層修正各個(gè)連接權(quán)值。隨著這種誤差逆?zhèn)鞑ビ?xùn)練不斷進(jìn)行,網(wǎng)絡(luò)對(duì)輸入模式響應(yīng)的正確率也不斷提高,如此循環(huán)直到誤差信號(hào)達(dá)到允許的范圍之內(nèi)或訓(xùn)練次數(shù)達(dá)到預(yù)先設(shè)計(jì)的次數(shù)為止。
BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)規(guī)則是對(duì)網(wǎng)絡(luò)權(quán)值和閾值的修正。
要沿著表現(xiàn)函數(shù)下降最快的方向——負(fù)梯度方向:
式中,xk為當(dāng)前的權(quán)值和閾值矩陣;gk為當(dāng)前表現(xiàn)函數(shù)的梯度;ak為學(xué)習(xí)速率。
對(duì)3層BP網(wǎng)絡(luò),輸入節(jié)點(diǎn)為xi,隱層節(jié)點(diǎn)為yj,輸出節(jié)點(diǎn)為zl,輸入節(jié)點(diǎn)與隱層節(jié)點(diǎn)的網(wǎng)絡(luò)權(quán)值為wji,隱層節(jié)點(diǎn)與輸出節(jié)點(diǎn)的網(wǎng)路權(quán)值為wji,當(dāng)輸出節(jié)點(diǎn)的期望為tl時(shí),模型的計(jì)算公式如下。
隱層節(jié)點(diǎn)的輸出:
3結(jié)論
山東省作為我國糧食產(chǎn)量大省,糧食產(chǎn)量對(duì)我國糧食安全有著重要的影響,所以對(duì)山東省糧食產(chǎn)量預(yù)測有著重要意義。為此該研究利用多元線性回歸和BP神經(jīng)網(wǎng)絡(luò)兩種方法對(duì)山東省糧食產(chǎn)量進(jìn)行了預(yù)測,并對(duì)預(yù)測結(jié)果進(jìn)行對(duì)比分析,結(jié)果表明:BP神經(jīng)網(wǎng)絡(luò)平均預(yù)測精度高于多元線性回歸模型,且各期預(yù)測精度較多元線性回歸模型更穩(wěn)定,但隨時(shí)間推移,誤差增大,因此BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型較適用于近期糧食產(chǎn)量預(yù)測,例如近兩年產(chǎn)量預(yù)測,若需對(duì)多期未來糧食產(chǎn)量進(jìn)行預(yù)測,則需對(duì)BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)改進(jìn),或?qū)?shù)設(shè)置進(jìn)行改進(jìn)進(jìn)一步研究。
參考文獻(xiàn)
[1] 李曉東.基于灰色關(guān)聯(lián)支持向量機(jī)的中國糧食產(chǎn)量預(yù)測模型[J].河北理工大學(xué)學(xué)報(bào):自然科學(xué)版,2008(4):76-80,103.
[2] 國家統(tǒng)計(jì)局.國家統(tǒng)計(jì)局關(guān)于2013年糧食產(chǎn)量的公告[EB/OL].(2013-11-29)http://www.stats.gov.cn/tjsj/zxfb/201311/t20131129_475486.html.
[3] 周永生,肖玉歡,黃潤生.基于多元線性回歸的廣西糧食產(chǎn)量預(yù)測[J].南方農(nóng)業(yè)學(xué)報(bào),2011(9):1165-1167.
[4] 林芳.灰色神經(jīng)網(wǎng)絡(luò)在糧食產(chǎn)量預(yù)測中的應(yīng)用[J].計(jì)算機(jī)仿真,2012(4):225-228,267.
[5] 宰松梅,溫季,仵峰,等.基于灰色關(guān)聯(lián)分析的遼寧省糧食產(chǎn)量預(yù)測模型[J].節(jié)水灌溉,2011(5):64-66.
[6] 曠嶺.RBF神經(jīng)網(wǎng)絡(luò)的糧食產(chǎn)量預(yù)測[J].計(jì)算機(jī)仿真,2011(11):189-191,200.
[7] 向昌盛,張林峰.灰色理論和馬爾可夫相融合的糧食產(chǎn)量預(yù)測模型[J].計(jì)算機(jī)科學(xué),2013(2):245-248.
[8] 孫東升,梁仕瑩.我國糧食產(chǎn)量預(yù)測的時(shí)間序列模型與應(yīng)用研究[J].農(nóng)業(yè)技術(shù)經(jīng)濟(jì),2010(3):97-106.
[9] 向昌盛,周子英,武麗娜.糧食產(chǎn)量預(yù)測的支持向量機(jī)模型研究[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2010(1):6-10.
[10] 李濤.基于遺傳神經(jīng)網(wǎng)絡(luò)的糧食產(chǎn)量預(yù)測方法研究[D].哈爾濱:哈爾濱工程大學(xué),2008.