周玲+韓朝怡


【摘要】糧食,不僅是人們日常生活的必需食品,還是保證國家糧食供給安全的重要前提。為了綜合度量各種因素對糧食總值面積的影響程度,本文建立影響糧食種植面積的指標體系,通過多種建模方法實證分析發現,影響我國糧食種植面積的主要因素有農業勞動力比重、農業機械總動力、農用化肥施用量等,糧食最低收購價格雖然會影響糧食種植面積,但發揮的作用很小。
【關鍵詞】糧食 種植面積 指標體系
一、引言
糧食種植面積是保證國家糧食供給安全的重要前提,研究糧食種植面積是十分有意義的。國家糧價收購政策、農業從業人員、糧食進出口貿易、農民受教育程度、城鄉收入差距等因素都影響著糧食種植面積,為綜合度量各因素對糧食種植面積的影響程度,下文將建立指標體系進一步分析。考慮到數據的可得性,再參考現有文獻研究成果的基礎上,本文選取投入、產出及可持續發展三個方面的指標建立有關糧食種植面積的指標體系。為了更好的研究它們之間的關系,決定采用多元線性回歸模型、Bagging、m-Boosting回歸模型、支持向量機回歸、決策樹、神經網絡等方法分別對其進行分析,以期得到最有效的結論。
二、方法介紹
在研究變量對變量的影響或變量之間的關系時,人們最先想到的是回歸,而線性回歸模型的前提假設較多且要求較高,所以現實數據是很難滿足這些條件,即使是滿足,還要受到其他因素的影響,近年來,隨著專家學者們對建模認識的逐漸深入,再加上計算機技術的快速發展,出現了諸如決策樹、m-boosting等機器學習算法,這些算法模型在建模之前對數據沒有做出任何假定,使用的是諸如一致性、無偏性等概念進行建模,能夠很好的解決多元線性回歸的不足,預測精度高,所以本文在建模中引入機器學習方法對糧食種植面積進行研究。
決策樹(Decision Tree)是在已知概率的基礎上,通過計算預期的凈現值大于或者等于零的概率來評價某一項目運行的風險。隨機森林是用隨機的方式建立一個“森林”,森林里面有很多的決策樹組成。Bagging與m-Boosting算法類似,區別在于Bagging訓練集的選擇是隨機的,各輪訓練集之間相互獨立,而m-Boosting訓練集的選擇不是獨立的,各輪訓練集的選擇與前面各輪的學習結果有關。神經網絡本質上是人腦處理信息方式的簡化模型。支持向量機(SVM,Support Vector Machines)有兩種功能,一是對數據進行分類,二是對數據進行回歸,目前主要用于對小樣本、非線性及高維數據進行分類和回歸。
三、實證分析
糧食種植面積指標體系的建立是從投入、產出及可持續發展三個角度出發的,投入是指種植糧食的成本,產出是指通過種植糧食獲得的收入,可持續發展是綜合考慮影響糧食種植面積的其他因素。具體的指標選擇如下表:
其中:自然災害成災率=成災面積/受災面積;人力資本:受教育程度初中及以上勞動力
比重;農業勞動力比重:鄉村就業人數占鄉村總人口的比重;農業增加值比重=農業增
加值/國內生產總值。
數據來源于《中國統計年鑒2015》與《中國農村統計年鑒2015》,時間維度為1990~2014年。糧食最低收購價格用稻谷、小麥和玉米的平均價格計算。由于我國糧食最低收購價格政策是從2005年開始實施的,故糧食的最低收購價格只有2005年之后數據,2004年及之前的糧食最低收購價格用當年糧食的最低收購價格代替。
在建模之前為了消除數量級和單位對模型精確性的影響,對數據進行標準化處理,利用標準化之后的數據進行建模,可以得出各種機器學習回歸方法關于訓練集和測試集的錯判率,具體如下表2:
由上表可知,利用隨機森林建模所得的訓練集與測試集的錯判率最低,分別為0.084與0.729,故選擇隨機森林回歸模型作為最終回歸模型。通過隨機森林回歸模型可以得到每個變量的對糧食種植面積的重要性排名,結果顯示農業勞動力比重、農業機械總動力、農用化肥施用量、農村居民家庭人均純收入和農業增加值比重對糧食種植面積的影響排在前五位,其中前三名分別為勞動力投入、機械投入和資本投入,可以看到糧食種植的投入對種植面積的影響很大,排名第四和第五的指標屬于地區經濟發展水平,顯然地區經濟發展水平對種植面積的影響也是非常大的。
四、研究結論
為了保障糧食安全,我國需要將增加農民收入放在糧食保護政策的第一位。本文從投入、產出及可持續發展三個角度出發建立了糧食種植面積的指標體系,并利用多元線性、Bagging、m-Boosting回歸模型、支持向量機、決策樹、隨機森林、神經網絡等回歸模型分別對糧食種植面積的影響因素進行了分析,分析表明,使用隨機森林建模方法隨機森林準確度最高。對影響因素的重要性進行度量可以發現,排名前五位的為農業勞動力比重、農業機械總動力、農用化肥施用量、農村居民家庭人均純收入和農業增加值比重,可以得到糧食最低收購價對糧食種植面積有一定的影響,但其影響力低于農業勞動力比重與農村居民家庭人均純收入。
參考文獻
[1]王雙英,王群偉,曹澤.多指標面板數據聚類方法及應用——以行業一次能源消費面板數據為例[J].數理統計與管理,2014,01:42-49.
[2]蘭錄平.中國糧食最低收購價政策研究[D].湖南農業大學,2013.
[3]李劍,宋長鳴,項朝陽.中國糧食價格波動特征研究——基于X-12-ARIMA模型和ARCH類模型[J].統計與信息論壇,2013,06:16-21.
作者簡介:周玲(1993-),女,漢族,山西晉中人,單位:山西財經大學統計學院;韓朝怡(1994-),女,漢族,山西呂梁人,單位:山西財經大學統計學院。