張文政 孫德山 王玥 張蕾



摘?要?隨著中國經濟的不斷發展,城市化進程不斷推進,總人口逐年增加;農村人口逐年減少,糧食的需求量逐年增加,某些貧困地區已經出現糧食短缺的狀況.本文選取了1986年-2016年遼寧省年糧食總產量、有效灌溉面積、農業化肥施用量、農業機械總動力、播種面積以及受災面積等相關數據.利用支持向量機回歸、線性回歸,隨機森林三種方法,對遼寧省糧食產量進行了預測,并比較了三種方法預測的精準度.
關鍵詞?支持向量機;線性回歸;隨機森林;核函數
中圖分類號 ?O212.4?文獻標識碼?A
Abstract?With the continuous development of China's economy, the process of urbanization is advancing, and ?the total population is increasing year by year, but the population of rural areas is decreasing year after year. As time goes on ,the demand for grain has increased , and some poor areas have already appeared in the condition of grain shortage. In this paper, the total annual grain output, the effective irrigation area, the amount of agricultural fertilizer application, the total power of agricultural machinery, the sown area and the affected area of ?Liaoning province from 1986 to 2016 were selected. By using three methods of support vector machine regression, linear regression and random forest, the grain yield of Liaoning province was predicted, and the accuracy of the three methods was compared.
Key words?support vector machine; linear regression; random forest; kernel function
1?引?言
糧食問題一直以來都是世界關注的焦點,糧食不僅關乎國計民生的問題,也關乎著社會安定以及經濟能否持續發展.我國從古至今都非常重視糧食問題,一直將糧食的生產放在國民經濟的首位[1].隨著城市化進程不斷推進,總人口不斷增加,農村人口不斷減少的背景下,對糧食的需求將進一步擴大.如果糧食的產量得不到提高,糧食的供給與需求的缺口便會越來越大.那么如何提高糧食產量,就必須分析影響糧食產量的因素以及糧食產量的變化趨勢.
影響糧食產量的因素千絲萬縷,這些因素對糧食產量作用機制又很難用數學語言來表示,這就使數學預測模型難以建立.傳統的預測方法有:線性回歸法、時間序列法、灰色理論法等,后來也發展出許多其他預測的方法,如神經網絡法、混沌理論法等.國內外專家學者對糧食產量的研究眾多,在國內的研究中,由于我國地域遼闊,氣候多樣,糧食品種繁多,因此我國專家學者的研究主要分為全國糧食的研究和區域糧食研究兩大類[2].在全國糧食的研究中,劉杰[3]構建了一種加權的馬爾科夫預測模型,與傳統的馬爾科夫鏈相比,加權的馬爾科夫鏈方法的誤差更小精度更高.陳錫康等人[4]探討了農業復雜巨系統的特點,提出了預測全國糧食產量的系統綜合因素預測法.在區域糧食研究中:周永生等人[5]利用多元線性回歸方法對影響糧食產量的各種因素進行分析,構建廣西糧食產量預測模型.龔波等人[6]運用灰色相對關聯分析,以糧食產量作為系統特征序列數據,構建糧食產量的灰色GM(1,N)模型,對湖南省2015年糧食產量進行擬合和預測.ZHOU等人[7]以單期植被指數(VIS)和多光譜遙感(MS)和數字圖像為基礎,對水稻產量進行了預測,并確定了水稻產量預測的最佳時期和最優VIS.國外對于糧食產量的研究主要依據氣候,然后基于氣候的影響對糧食產量作出短期預測[2].然而結合遼寧省氣候多變這一情況,只是基于氣候很難作出精準預測,而且短期預測也很難對政府提出有效建議. 本文運用了支持向量機的方法對遼寧糧食產量進行分析,建立了遼寧糧食產量預測模型,該模型的優勢在于綜合考慮了遼寧省糧食產量的主要影響因素.支持向量機的擬合和泛化能力是最好的,這是因為糧食數據屬于小樣本數據,支持向量機基于結構風險最小,較好地解決了小樣本、非線性、過擬合,維數災難等問題.
遼寧省欲打造振興東北重要增長極,糧食問題在全省經濟社會發展中始終處于重要位置.因此提前預測遼寧省糧食產量,對有關部門及時進行糧食的調入調出和安排庫存具有重要參考價值.
由表4可知,利用支持向量模型預測遼寧省玉米、稻谷、大豆的產量依然精準,故利用支持向量機分析遼寧省糧食產量問題具有一定的可行性.
4?結?論
本文在運用了支持向量機的方法對遼寧糧食產量進行分析的基礎上,綜合運用了線性回歸,隨機森林等方法,建立了遼寧糧食產量預測模型,該模型的優勢在于綜合考慮了遼寧省糧食產量的主要影響因素. 由表2可知,支持向量回歸的相對誤差均小于10%,而線性回歸模型的預測精度不高,主要是不能捕捉到糧食數據的非線性特征.而相比于隨機森林,支持向量機的擬合和泛化能力是最好的,這是因為糧食數據屬于小樣本數據,支持向量機基于結構風險最小,較好地解決了小樣本、非線性、過擬合和維數災難等問題.表明SVR在糧食產量的預測中具有一定的可行性.
參考文獻
[1]?田秀芹. 基于多元線性回歸的糧食產量預測[J].科技創新與應用,2017(16):3-4.
[2]?鄒璀,劉秀麗.山東省糧食產量預測研究[J].系統科學與數學, 2013,33 (1) :97-109.
[3]?劉杰.基于加權馬氏鏈的全國糧食產量預測研究[J].廊坊師范學院學報:自然科學版,2015,15 (1) :56-59.
[4]?陳錫康,楊翠紅.農業復雜巨系統的特點與全國糧食產量預測研究[J].系統工程理論與實踐 ,2002,22 (6) :108-112.
[5]?周永生,肖玉歡,黃潤生.基于多元線性回歸的廣西糧食產量預測[J].南方農業學報,2011,42(9) :1165-1167.
[6]?龔波,肖國安,張四梅. 基于灰色系統理論的湖南糧食產量預測研究[J].湖南科技大學學報:社會科學版, 2012 , 15 (5) :62-65.
[7]?ZHOU X, ZHENG H B, XU X Q, et ?al.Predicting grain yield in rice using multi-temporal vegetation indices from UAV-based multispectral and digital imagery[J],ISPRS Journal of Photogrammetry& Remote Sensing, 2017 , 130 :246-255.
[8]?鄭建安. 主成分和BP神經網絡在糧食產量預測中的組合應用[J].計算機系統與應用, 2016,25 (11) :274-278.
[9]CORTESC,VAPNIKV.Support-vector networks[J].Machine Learning.1995.20(3): 273-297.
[10]向昌盛,周子英,武力娜.糧食產量預測的支持向量機模型研究[J].湖南農業大學學報:社會科學版, 2010 , 11 (1) :6-10.