文/梁后軍 謝睿 馮宜強 周萬懷 常郝 李浩 劉從九 徐守東
灰色系統理論是由華中理工大學鄧聚龍教授于1982年提出并加以發展的。二十幾年來,引起了不少國內外學者的關注,得到了長足的發展。目前,在我國已經成為社會、經濟、科學技術等諸多領域進行預測、決策、評估、規劃控制、系統分析與建模的重要方法之一。特別是它對時間序列短、統計數據少、信息不完全系統的分析與建模,具有獨特的功效,因此得到了廣泛應用。
在棉花產量預測方面,李鵬程、董合林[1]根據聯合國模擬世界纖維市場的預測,認為2020年世界棉花產量預計將增加到3200萬噸,其中發展中國家(地區)將繼續占世界棉花產量的大部分份額。張聞、韓金等[2]通過多項式擬合的方法,針對2016年新疆棉花產量進行了預測,并基于預測對棉花加工工作提出了建議。本研究以2007—2017年全國棉花產量為基礎,基于灰色系統建模方法逐步建立GM(1,1)模型,并外推預測2018、2019年的全國棉花產量,以期為棉花產業的生產、加工提供依據。
研究基于2007—2017年我國棉花總產量數據(數據來源:國家統計局網站),運用灰色模型GM(1,1)預測2018、2019年全國棉花總產量。灰色預測模型(Gray Forecast Model)是通過少量、不完全的信息,建立數學模型并做出預測的一種預測方法。目前常用的一些預測方法(如回歸分析等),需要較大的樣本。若樣本較小,常造成較大誤差,使預測目標失效。灰色預測模型所需建模信息少、運算方便、建模精度高,在各種預測領域都有著廣泛的應用,是處理小樣本預測問題的有效工具。只要待分析變量隨著時間發展呈現有一定變化趨勢,就可以嘗試使用該方法進行建模,而無需考慮該變量的其他相關影響因素及狀態;只要建模過程中每個步驟都符合模型的約束、檢驗準則,則可以認為模型合理、預測結果基本有效。運用GM(1,1)模型的預測步驟為:首先,對2007—2017年我國棉花產量統計數據進行預處理,降低其波動性,若處理后的數據的一階累加和大致符合指數分布,則可以考慮建模;其次,建立、檢驗相應GM(1,1)模型擬合2007—2017年我國棉花產量,判斷模型擬合效果;最后,運用GM(1,1)模型預測分析2018、2019年全國棉花產量。
灰色模型是利用離散隨機數經過生成變為隨機性被顯著削弱而且較有規律的生成數,建立起微分方程形式的模型。設n個元素的數列X(0)={x(0)(1), x(0)(2), …,x(0)(n)},其中x(0)(k)≥0,k=1,2,…,n;X(1)={x(1)(1),x(1)(2), …,x(1)(n)}稱為X(0)的一階累加序列(1-AGO),其中、k=1,2,…,n;灰微分方程為:

式(1)中a稱為發展系數,b稱為灰作用量,參數向量可以運用最小二乘法估計

其中Y,B分別為:

稱 為GM(1,1)的白化型,對應的解為:

當k≥n時,所求得的x(1)(k+1)就是x(1) 序列的預測值。由于

因此求得k≥n時的序列的值就可以利用(5)式求出X(0)序列的預測值。
由于灰色預測模型可以通過少量的、不完全的信息建模并預測。我們選擇最近10年的全國棉花產量數據做建模基礎。考慮到原始數據(為方便起見稱其為X)存在較大波動,如圖1所示,先對其進行最緊鄰兩兩求均值處理,所得結果稱為序列X(0),即:

由圖1可見X(0)比原始數據序列X波動稍小一些,以下以X(0)作為基礎數據建立GM(1,1)模型。結合表1可以看出,從2008年開始,全國棉花產量總體呈下降趨勢,特別是2016年棉花產量創下了近12年以來新低,宏觀層面可能是受到了2008年開始的經濟危機的影響,微觀層面生產成本提高、種棉花不賺錢,棉農種棉積極性降低。

表1 數據預處理
計算數列的級比若所有級比都在可容覆蓋內,則數列可以作為模型GM(1,1)的數據進行灰色預測。否則,對數列進行變換處理,使其落入可容覆蓋內。
本文中X(0)共10個數,即n=10,從而級比區間為(0.834, 1.199)。由于所有λ(k)ε(0.834,1.199),故X(0)可以用作為GM(1,1)的數據。

表2 級比檢驗
由于GM(1,1)模型本質是建立指數模型,在建模前先要對X(0)序列求一階累加和,得到X(1)序列,即對X(1)中每個元素,有 x(1)(k)=∑ki=1x(0)(i),k=1,2,…,n;k=1,2,…,n;結果列于表3中。

表3 X(0)的一階累加X(1)及X(1)的模型擬合值
根據X(0),X(1)構造矩陣Y、B,根據最小二乘法解得參數向量a=[a,b]T=[0.0254,718.7760]T,從而可得模型

解得

由公式(8)可以得到X(1)的模型擬合值,如表3所示。圖1直觀展示了X(1)及其模型擬合值的差異,由圖中可見兩條線高度重合,擬合效果較好。

圖1 一階累加序列X(1)及其模型擬合值
根據公式(9)可以求得X(0)序列的模型擬合值,結果列于表4中。

圖2直觀展示了X(0)序列及其模型擬合值,除第三個數外總體而言擬合較好。

圖2 序列X(0)及其模型擬合值
一個模型能否用于預測,由有效性檢驗決定,只有符合檢驗標準的模型才能被用于進行預測。灰色模型檢驗主要包括平均相對誤差檢驗、級比偏差值檢驗、絕對關聯度檢驗及均方差比值檢驗。
1)相對誤差檢驗:首先計算殘差

相對誤差序列為

對于k≤n,稱為k點模擬相對誤差,稱為平均相對誤差。本文中模型的平均相對誤差為0.0375,對照表5可知模型精度為二級。
2)級比偏差值檢驗:首先計算級比,再利用發展系數a求出相應的級比偏差

若ρ(k)<0.2,則認為達到一般要求;若ρ(k)<0.1,則認為達到較高要求。本文中絕對值最大的級比是0.0958,小于0.1,說明模型達到了較高要求。
3)均方差比值檢驗:均方差比值為C=S2/S1,其中S2是由公式(10)計算得到的殘差序列的標準差,S1是X(0)序列的標準差。由表4可知本文均方差比值C= 0.439,參照表5可知模型精度為二級。
綜合以上3個指標可得本文的模型精度是二級。
根據上面的檢驗可知,模型精度為二級,說明模型擬合精度較好。為預測未來兩年的棉花產量,需要根據公式(8)計算X(1)序列的未來兩點的值,如表6所示,X(1)序列的未來兩點的值分別是6932.6053及7468.2283。再根據公式(9)可求得X(0)序列的未來兩點值分別是549.4199及535.6230。
X(0)序列尚不是真實棉花產量,還需要根據公式(6)求多領域進行預測、決策、評估、規劃控制、系統分析與建模的重要方法之一,對時間序列短、統計數據少、信息不完全系統的分析與建模,具有獨特的功效,得到了廣泛的出X序列未來兩點的值,結果見表7,2018、2019年的預測產量分別為550.2398萬噸及521.0062萬噸。
可見未來兩年,我國棉花總產量總體保持穩定,與2017年全國棉花總產量548.6萬噸相比,2018年比2017年增長1.6萬噸,2019年比2018年減少約29萬噸。

表4 模型檢驗

表5 灰色模型精度檢驗等級

表6 X(0)與X(1)序列數據預測
灰色系統理論已經成為社會、經濟、科學技術等諸應用。該法無需考慮客觀事物之間的關系及影響預測對象因素的多少,僅依據連續收集預測對象過去的統計數據,即可找到其隨時間變化的規律,建立時序模型,對未來進行預測。整個建模過程步驟清晰,操作簡便,短期預測結果可靠。本文利用2007年至2017年全國棉花總產量資料進行分析,通過中值化運算、模型擬合與檢驗等過程建立GM(1, 1)模型,探討未來兩年棉花產量的預測值。模型精度達二級標準,準確度較高。誠然,灰色模型僅作為一種數學預測工具,所依據資料的樣本含量有限,得到的也僅是理論值,難免會帶有局限性,為達到有效預測的目的,在使用時應結合動態監測,不斷更新數據對模型動態擬合,從而保持較高的預測精度,更加有效指導我國棉花種植與交易工作。

表7 實際年產量X序列數據預測
[1] 李鵬程,董合林.2020年世界棉花形勢預測[J].中國棉花,2017,44(05):44-45.
[2] 張聞,韓金,單旭. 2016年度新疆棉花產量預測分析[J].中國棉麻產業經濟研究,2016(06):41-43.