和 文 超,師 學 義,景 明,孫 靜 靜,劉 偉 瑋
晉城市糧食產量預測方法比較研究
和 文 超,師 學 義*,景 明,孫 靜 靜,劉 偉 瑋
(中國地質大學(北京),北京 100083)
提高糧食產量預測精度是科學編制土地利用總體規劃的重要課題。該文首先運用灰色關聯分析方法對影響糧食產量的因素做出關聯因子排序,分析表明糧食單產對糧食總產量的影響最大,糧食作物播種面積次之。其次在灰色關聯分析的基礎上選取主要影響因子,通過比較線性回歸模型、灰色GM(1,1)模型和灰色多元線性回歸組合模型的預測結果,得到灰色多元線性回歸組合模型預測結果最佳。
灰色關聯分析;多元線性回歸;糧食產量預測;GM(1,1)
科學、準確地預測糧食產量是政府制定人口和資源利用政策的重要依據,也是科學編制土地利用總體規劃并確定耕地保有量的重要課題。許多學者利用不同的方法對糧食需求量進行了預測,其中回歸分析模型和灰色GM(1,1)模型是常用的兩種方法。回歸分析模型對樣本中的異常數據非常敏感,會直接影響預測精度;灰色預測模型對于波動性和隨機性較大的曲線進行擬合時誤差較小[1,2]。使用單一的預測方法會漏掉一些關鍵信息,從而降低糧食產量的預測精度,組合模型能有效集合更多的重要信息。李林等利用多元線性回歸與GM(1,1)模型耦合預測城市用水量[3],丁倩等討論了灰色多元線性回歸方法在房地產中的應用[4]。為了克服單獨使用回歸分析模型和灰色GM(1,1)模型的缺點,并提高糧食產量的預測精度,本文嘗試將灰色模型與多元線性回歸模型耦合,建立灰色多元線性回歸組合模型并應用于晉城市糧食產量的預測。
根據X、Y的現有數據,將X、Y作為已知數,依據回歸方程Y=aX+b尋求合理的a、b,確定回歸曲線,再將a、b作為已知數,確定X、Y的未來演變。1)確定回歸直線。一元線性回歸方程:Y=aX+b,通常用最小二乘法確定參數,a=ˉY-bˉx,b=Lxy/Lxx。2)相關性檢驗。近1,說明線性相關性越高。
本研究所用數據來源于《1988-2005年晉城市統計年鑒》。為了便于預測和比較,采用分段預測的方法,分別以1988-2002年和1993-2002年的糧食總產量預測2003-2005年的糧食總產量。預測結果如表1、表2所示。

表1 基于1988-2002年數據預測2003-2005年的糧食產量及其誤差Table 1 Grain yield prediction value and residue error of 2003-2005 based on the data of 1988-2002 萬hm2

表2 基于1993-2002年數據預測2003-2005年的糧食產量及其誤差Table 2 Grain yield prediction value and residue error of 2003-2005 based on the data of 1993-2002 萬hm2
利用SPSS軟件建立晉城市糧食總產量時間序列模型。以顯著性水平α=0.05檢驗證明Y(糧食總產量)與X(年份)間有線性關系,說明該模型可用來預測晉城市糧食總產量。
GM(1,1)模型的實質是對原始序列作一次累加,使生成的序列呈一定規律,然后建立一階線性微分方程模型,求得擬合曲線對系統進行預測[6,7]。灰色GM(1,1)模型通過累加生成灰色模型,濾去原始數據中的隨機量或其他噪聲,從上下波動的時間數列中尋找某種隱含規律。
根據晉城市糧食產量數據,按照時間順序,每6年為一個單元,每單元的前5年用作建模計算。由SPSS及MATLAB軟件計算得出晉城市糧食產量的灰色預測模型。表1、表2中,后驗差比值C、小誤差概率P均滿足一級要求,即C≤0.35,P≥0.95,說明模型擬合精度較好。
該模型的主要步驟是:1)在灰色關聯分析的基礎上利用灰色GM(1,1)模型得到影響糧食產量的主要因素的預測值;2)利用原始樣本數據建立多元線性回歸模型;3)將灰色GM(1,1)模型的預測結果作為多元線性回歸預測方程的輸入值,在較全面考慮各影響因素的基礎上,實現灰色預測模型與多元線性回歸方程的有機結合,得到灰色多元線性回歸組合模型。
根據研究區具體的自然條件和社會經濟條件,選取對糧食生產有直接影響的5類因素[8]:自然因素、勞動力因素、農用水利設施因素、化肥施用因素和農機電因素。根據對晉城市糧食產量影響因素的定性分析及現有糧食生產資料情況,采用1988-2005年序列資料作為研究基礎,從中選取10個影響糧食總產量的主要因子,用其年數據作為樣本,根據灰色關聯度的分析方法[9-12],得出影響晉城市糧食總產量的10個主要因素的動態關聯度結果(表3)。按關聯度的大小進行排序:糧食單產>糧食作物播種面積>化肥施用量>農業總投入>農業勞動力>有效灌溉面積>降雨量>耕地面積>農村用電量>農業機械總動力。由此可知,對晉城市糧食總產量影響最大的因素是糧食單產,其關聯度高達0. 9241;其次是糧食作物播種面積和化肥施用量。

表3 糧食總產量影響因素灰色關聯系數Table 3 Grey incidence coefficient of grain yield factors
在晉城市糧食產量影響因素灰色關聯分析的基礎上,考慮到關聯度的大小,本文引入糧食單產、糧食作物播種面積兩個主要因素預測晉城市糧食總產量。首先根據1988-2002年和1993-2002年的糧食單產和糧食作物播種面積數據,利用灰色GM(1,1)模型預測2003-2005年的糧食單產和糧食作物播種面積。其次以糧食單產、糧食作物播種面積這兩個主要因素作為自變量,糧食總產量作為因變量,用SPSS軟件分別對晉城市1988-2002年和1993-2002年糧食總產量、糧食單產和糧食作物播種面積建立多元線性回歸模型。表1中R2為0.898,調整后R2為0.943,模型擬合較好;表2中R2為0.852,調整后R2為0.912,模型擬合較好。用sig=0.05進行顯著性檢驗,模型可以用來預測晉城市糧食總產量。再將2003-2005年糧食單產和糧食作物播種面積的預測結果分別代入多元回歸模型中,得到2003-2005年糧食總產量的預測值。

(1)線性回歸模型。由表1、表2可知,線性回歸模型預測糧食總產量的誤差在3種方法中相對最大。雖然模型的擬合度較高,但預測結果精度較低(表4)。結合R2和數據的長度分析可知,R2值越大,已知數據的線性關系越好,預測誤差越低;歷史數據越充分(表4),預測結果越準確。由于線性回歸方法適用于線性關系較好且歷史數據較充分的數據,而本文數據在1998年和2001年發生突變,使得整段數據的直線型關系降低,從而影響了模型預測精度。由此得出,在使用線性回歸法時,原始數據具有良好的直線線性關系,才能保證預測結果具有較高的準確性。

表4 3種預測方法的比較Table 4 Comparative analysis of prediction methods
(2)灰色 GM(1,1)模型。由表1、表2、表4可知,灰色GM(1,1)模型預測值的精度較高,擬合一致性較好。這是由于GM(1,1)模型是根據隨機誤差原理建立的,并從數據的上下波動中尋找隱含的規律,本文數據波動性及隨機性較大,模型的優勢得以發揮,使得灰色GM(1,1)模型的預測結果比線性回歸模型的預測結果更準確。由此可知,當已有數據波動性及隨機性較大且數據量不多時,使用GM(1,1)模型的預測結果較為準確。
(3)灰色多元線性回歸組合模型。由表1、表2可知,灰色多元線性回歸組合模型的預測誤差在3種方法中最小,預測精度也最高(表4)。這是因為,利用灰色多元線性回歸組合模型有效地利用了各種信息,充分結合了數據波動性和直線性的特點,比單純利用灰色GM(1,1)模型或線性回歸模型預測結果的精度更高。
實踐中應結合數據本身的特點選擇不同的預測模型。線性回歸模型適用于直線關系較好的數據,灰色GM(1,1)模型適用于數據波動性和隨機性較大的數據。灰色多元線性回歸組合模型既充分體現了灰色系統能及時跟蹤響應變量的動態變化的特點,又綜合了多元線性回歸模型充分考慮影響因素作用的優點,從而可以更好地指導晉城市糧食產量的預測,進而更好地促進土地利用總體規劃的科學編制。這種糧食產量預測方法也可以推廣到全國各地的糧食產量預測,具有廣泛的應用前景。
當然,由于糧食生產是一個復雜的系統過程,糧食產量還受各種自然因素和政策因素等方面的影響,同時,糧食生產的影響因素隨著時間的變化也在不斷發生變化,這就決定了由過去的糧食產量預測未來的產量難免存在偏差。只有根據諸多因素的變化對糧食產量的預測模型不斷進行調整,才能減小預測誤差,以實現更準確的預測。
[1]巫錫柱,晏路明.糧食生產灰色關聯動態分析和預測[J].農業系統科學與綜合研究,2005,11(4):244-251.
[2]劉亞,崔春紅.糧食產量灰色模型預測[J].安徽農業科學,2008,36(9):3485-3490.
[3]李林,劉坤.多元線性回歸與GM(1,1)模型耦合預測城市用水量[J].水資源與水工程學報,2008,2(3):63-64.
[4]丁倩,干曉蓉.灰色多元線性回歸分析及其在房地產中的應用[J].云南師范大學學報(自然科學版),2009,5(3):21-29.
[5]湯江龍,趙小敏.土地利用規劃中人口預測模型的比較研究[J].中國土地科學,2005,19(2):14-20.
[6]韓中庚.數學建模方法及其應用[M].北京:高等教育出版社,2005.143-153.
[7]李軍成,陳國華,石小芳.基于灰色多元線性回歸的糧食產量預測[J].安徽農業科學,2010,38(16):8281-8282.
[8]王渝陵.影響糧食綜合生產能力的相關要素[J].渝州大學學報(社會科學版),1999(4):22-25.
[9]徐建華.現代地理學中的數學方法(第二版)[M].北京:高等教育出版社,2004.47-68.
[10]何曉群.現代統計分析方法與應用[M].北京:中國人民大學出版社,2001.102-129.
[11]周介銘,彭文甫.影響四川省糧食生產因素的灰色分析與糧食產量預測[J].四川師范大學學報,2005,28(3):350-351.
[12]王學萌,張繼忠,王榮.灰色系統分析及實用計算程序[M].武漢:華中科技大學出版社,2001.
A Comparison on the Grain Yield Prediction Methods for Jincheng City
HE Wen-chao,SHI Xue-yi,JING Ming,SUN Jing-jing,LIU Wei-wei
(ChinaUniversityofGeosciences,Beijing100083,China)
Improving the forecast accuracy of grain yield is the important subject of compiling general land use planning.In this paper,grey correlativity analysis is used to analyze key factors of grain production.The result shows that the production of per land area has the greatest influence on grain,followed by cultivated area.Then based on the grey correlativity analysis,the author selects the main factors.The result shows that grey-multiple linear regression model has the highest prediction accuracy by comparing the linear regression model,grey GM(1,1)model and grey-multiple linear regression model.
grey incidence analysis;multiple linear regression;forecast of grain yield;GM(1,1)
F301
A
1672-0504(2011)05-0079-03
2011-05- 11;
2011-07-17
國家自然科學基金項目(70673055)
和文超(1986-),女,碩士研究生,研究方向為土地利用規劃。*通訊作者E-mail:shixueyi60@163.com