雷凱棟,張淑娟
精準扶貧指標
——農機總動力基于BP神經網絡SAS分析預測
雷凱棟,*張淑娟
(山西農業大學工學院,山西太谷030800)
主要研究了農業機械總動力預測分析,創新思路,從容易忽視的年齡結構因子進行數學建模,分析預測農業機械總動力,并基于BP神經網絡和SAS數據分析進行預測。結果顯示,農機總動力維持不變,但會優化農機總配備結構模式。
BP神經網絡;SAS數據分析;農業機械總動力
我國是農業大國,擁有世界最多的農村人口數量。而在“十三五”規劃時期我國將大力推進農業機械化進程[1-2]。為此,研究從人們容易忽略的影響因子(如年齡結構、播種面積、農民人口數量等)對農機總動力的關聯影響著手,與發達國家進行對比,隨著年齡結構的日益老齡化、農民比例對一個國家的現代化、機械化、智能化有較強相關,制定相關執行方案,并提供了一些參考信息,將會對未來趨勢科學合理的把握,以及政策制定、優化資源配備等發揮積極作用。在生產實際中,任意的某些因子在一個層面里看似毫無關系,但是當進入第2層或者更深層次時都存在間接的影響。研究所收集了7個因子數據,數據背后往往隱藏著事物發展的趨勢和事實的真相。采用科學的數學建模理論和SAS數據分析預測組合分析預測農機總動力,來驗證這一趨勢。
1.1 問題描述
在實際農業生產中,有很多因素影響著農業機械總動力的增長。以下將研究農用大中型拖拉機數量、年末總人口、0~14歲人口、15~64歲人口、64歲以上人口、農作物總播種面積、農民人口數量等7個因子對農機總動力未來趨勢的影響。
影響農業機械總動力增長的趨勢有很多因素,經濟發展、國內生產總值、受教育程度、農民人數、年齡結構、作物播種面積等因子影響[3-5]。在數據統計處理分析中,經常用到時間序列模型和回歸模型,而時間序列不能很好地利用影響大的因子和其他因子,導致數據分析不準確。本研究創新思路,從人們容易忽視的因素(年齡結構對農機總動力的影響)進行挖掘數據背后的意義。同時,構建BP神經網絡、SAS數據分析進行組合預測,從而挖掘數據背后的趨勢。
1.2 數據分析
前期收集的數據來源為2002—2016年中國統計年鑒,列出7個預測因子和實際農業機械總動力(Y)作為輸入和目標向量。預測因子為農用大中型拖拉機數量(臺)(X1)、年末總人口(萬人)(X2)、0~14歲人口(萬人)(X3)、15~64歲人口(萬人)(X4)、65歲及以上人口(萬人)(X5)、農作物總播種面積(千公頃)(X6)、農民人口數量(萬人)(X7),一共收集15個學習樣本。
1.3 BP神經網絡建模及SAS數據分析預測
BP神經網絡由輸入層、隱含層和輸出層及各層神經元之間連接組成,其中隱含層可以為單層,也可以是多層。一個3層網絡由輸入層、隱含層和輸出層組成,輸入層與隱含層、隱含層與輸出層之間連接權值的大小體現神經元之間的連接強度。BP神經網絡是系統預測中應用特別廣泛的一種網絡形式,根據BP網絡的設計網絡,可以通過單隱層的BP網絡實現。輸入向量有7個因子,網絡的輸入向量有7個因素,網絡的中間層神經元經過經驗公式和后期網絡訓練試驗值為11時,效果最好。
1.4 BP網絡訓練與測試
訓練回歸見圖1,訓練最優、訓練、目標關于均方誤差見圖2。

圖1 訓練回歸

圖2 訓練最優、訓練、目標關于均方誤差
由圖1可知,所得圖為運用MATLAB編程進行訓練所得訓練圖。訓練結果:R=0.805 19,訓練結果很穩定。圖1中橫坐標為訓練對象,縱坐標為輸出結果;圖2為此次訓練過程最優、訓練、目標關于均方誤差圖(均由MATLAB編程得出)。
BP網絡預測誤差見表1。

表1 BP網絡預測誤差
基于表1誤差結果分析,該誤差在生產實踐中是可以接受的。基于BP網絡模型預測下一年為111 662.348 5 WKW,總動力有所下降,經查閱資料分析可能以下原因導致:①所建模型誤差所致;②國家政策指導優勢機械總動力優化配備結構;③城鎮化加速;④農業生產模式向農場轉變等很多因素。
2.1 SAS設計數據處理及分析預測
此次收集的相關數據為隨機變量,稱之為隨機型多元樣本,并對試驗研究進行多元回歸設計(Multiple regression designs),即具有2個以上自變量(因子)的回歸試驗設計。回歸模型未知時,可采用線性模型和多項式模型進行設計。
2.2 多元回歸設計及分析
自變量因子為7個,分別以X1,X2,X3,X4,X5,X6,X7表示,效應總數為8,試驗方案至少需要9個處理。表2為1.2中1996—2015年農業機械總動力(Y)與7個因子的回歸方差分析。
回歸方差分析見表2。

表2 回歸方差分析
將表2所示數據樣本創建為SAS數據表sasuser. nongjiyuce01.,利用reg過程在進行回歸分析時作回歸診斷,語句modle選項p指定輸出回歸診斷的條件指數,語句Plot residual.*X1residual.*X2residual.*X3residual.*X4residual.*X5residual.*X6residual.*X7residual.*predicted。
由表2中分析可知,此設計p<0.000 1,決定系數達0.999 6,模型極其顯著且擬合精度較高。7個因子自變量的方差膨脹系數因子VIF均遠大于10,是強相關;條件指數CIN大于100,為強相關。此模型的決定系數達0.996,p<0.000 1,回歸模型極其顯著并具有較高的擬合精度。
回歸參數的估計和檢驗見表3。
分析其參數可知,X2,X3,X6對Y不顯著。
多重共線性診斷見表4。
由表4共線性診斷結論得出,復相關數0.999 40據分析得出回歸方程。

表3 回歸參數的估計和檢驗

回歸診斷:回歸診斷的方法之一是殘差分析,可診斷樣本的正態性和方差齊性。
輸出的統計數據分析見表5。
預測分析:經SAS建模處理分析預測,存在一定的誤差,也還在接受范圍,農業機械總動力為106 982.79 WKW。

表4 多重共線性診斷

表5 輸出的統計數據分析
經研究分析,最后得出結論,年齡結構也是一項重要因素。看似毫無關系的因素在實際生產中起著微小的作用,但所有微小的作用聚集,將會產生很大的波動。經過SAS建模處理和BP神經網絡進行組合預測分析,決定系數達0.999 6,作擬合預測非常可靠,2種模型互補。據估計參數顯示,年末總人口、0~14歲人口對農業機械總動力影響不是很顯著,但是農用大中型拖拉機數量、農民人口數量、15~64歲人口及農作物總播種面積等影響很大,說明隨著社會年齡結構的變化和老齡化的加劇,農業機械化關系到國家的發展。對比發達國家,年齡結構也是農業機械化加快的趨勢;而國家大力推進農用大中型拖拉機的惠民政策也是一個顯著因子。
經研究分析預測,未來我國農業機械總動力不會有大幅的增加,而是保持在一定的農機總動力的范圍,完善優化各類先進農業機械,淘汰低效率、單一作業,轉而向智能化、信息化、遠程遙感的高精端農業機械配備,實現全程自動化。以科學的數學模型和統計分析佐證這一預測,數據背后的趨勢正是時代的趨勢,此預測將對政策進一步執行、農機總動力優化配備提供一項可靠的參考信息。
[1]葛哲學.神經網絡理論與MATLAB R2007實現[M].北京:電子工業出版社出版,2007:73-86.
[2]姜啟源.數學模型[M].北京:高等教育出版社,1998:54-57.
[3]徐國祥.統計預測和決策[M].上海:上海財經大學出版社,2005:100-120.
[4]涂志強,楊敏麗.關于我國農業機械化發展趨勢的思考[J].中國農機化,2005(5):3-7
[5]韓磊,李銳,朱會利.基于BP神經網絡的土壤養分綜合評價模[J].農業機械學報,2011,42(7):109-115.◇
Precise Poverty Alleviation Index:Analysis of the Total Power of Agricultural Machinery Based on BP Neural Network SAS
LEI Kaidong,*ZHANG Shujuan
(Institute of Technology,Shanxi Agricultural University,Taigu,Shanxi 030800,China)
In this paper,we study forecast analysis of total power of agricultural machinery.Innovation mentality,from the easy to overlook the age structure of the factor for mathematical modeling,analysis of forecast agricultural machinery total power.Will be based on the BP neural network and SAS date analysis,make a prediction.The conclusion of agricultural machinery total power remain unchanged,but always in optimization of agricultural machinery equipped with structural patterns.
BP neural network;SAS data analysis;total power of agricultural machinery
F224
A
10.16693/j.cnki.1671-9646(X).2017.03.049
1671-9646(2017)03b-0074-03
2017-03-13
國家自然科學基金(31271973);山西省自然科學基金(2012011030-3)。
雷凱棟(1992—),男,在讀碩士,研究方向為農業機械化。
*通訊作者:張淑娟(1963—),女,博士,教授,研究方向為農業機械裝備。