【摘要】 本文選取2003—2012年吉林省長春市公路客運總量數據,運用灰色預測模型對長春市的客運總量進行分析,建立灰色預測GM(1,1)模型,并進行一系列檢驗:殘差檢驗、關聯度檢驗、后驗差檢驗及誤差分析. 同時,預測未來兩年長春市的客運總量.
【關鍵詞】 殘差檢驗;關聯度檢驗;后驗差檢驗;誤差分析
【項目來源】 吉林省教育廳“十二五”科學技術研究項目,吉教科合字[2013]第142號.
公路客運量是一個受多層次、多因素影響的復雜關系量,為了準確預測它,必須考慮各種影響因素,需要收集大量信息,由此帶來的問題是建模困難,計算量大. 有時,即使模型能夠建立,往往又因缺少足夠的信息不能確定模型的參數,導致無法實現預測. 灰色系統理論所提出的灰色系統模型預測方法,避開了這些復雜的相互關系,它不要求那么多的信息,而只是著眼于系統本身的灰色信息,尋找系統本身的內在規律,達到使灰色系統白化的目的.
灰色系統預測模型是基于灰色系統的理論思想,將離散變量連續化,用微分方程代替差分方程,用生成數序列代替原始時間序列,弱化原始時間序列的隨機性,再通過一定的步驟建立生成數的數學模型,此模型只適用于短期和中期預測,不適于長期預測.
一、灰色GM(1,1)模型
灰色預測模型直接使用的不是原始數據,而是原始數據產生的生成數. 生成分為累加生成和累減生成,分別記為AGO和IAGO.
設原始數據為X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),由它產生的r次累加生成r - AGO為X(r)=(x(r)(1),x(r)(2),…,x(r)(n)),其中x(r)(k)=■x(r-1)(i)=x(r)(k-1)+x(r-1)(k),x0(1)=x0(2) = … = 0,k = 1,2,…,n,r = 1,2,….
令Z(1)為X(1)的緊鄰均值(MEAN)生成序列Z(1) = (z(1)(2),z(1)(3),…,z(1)(n)),其中z(1)(k) = 0.5x(1)(k) + 0.5x(1)(k - 1).
則GM(1,1)的灰微分方程模型為
x(0)(k) + az(1)(k) = b.(1)
式中a稱為發展系數,b為灰色作用量. 設■為待估參數向量,即■ = (a,b)T,則灰微分方程(1)的最小二乘估計參數列滿足■ = (BTB)-1BTYn,其中
B=-z(1)(2) -z(1)(3) … -z(1)(n) 1 1 … 1T,
Y=[x(0)(2) x(0)(3) … x(0)(n)]T.
稱方程■+ax(1) = b為方程(1)的白化方程. 其解■(1)(t)=x(1)(0) - ■e-at + ■也稱為時間響應函數,時間響應序列
■(1)(k + 1) = x(1)(1) - ■e-ak + ■,k = 1,2,…,n
即為預測方程. 還原值
■(0)(k + 1) = ■(1)(k + 1) - ■(1)(k).
二、 模型檢驗
GM(1,1)模型的檢驗分為三個方面:殘差檢驗、關聯度檢驗、后驗差檢驗.
(一)殘差檢驗
即對模型值和實際值的殘差進行逐點檢驗. 首先按模型計算■(1)(i + 1),將■(1)(i + 1)累減生成■(0)(i),最后計算原始序列x(0)(i)與■(0)(i)的絕對殘差序列
Δ(0)={Δ(0)(i),i = 1,2,…,n},Δ(0)(i) = |x(0)(i) - ■(0)(i)|
及相對殘差序列
?準 = {?準i,i = 1,2,…,n},?準i = ■%
并計算平均相對殘差■ = ■■?準i . 給定α,當■ < α,且?準i < α(i = 1,2,…,n)成立時,稱模型為殘差合格模型.
(二)關聯系數與關聯度檢驗
關聯系數:設數據列
■(0)(k) = {■(0)(1),■(0)(2),…,■(0)(n)}
X(0)(k) = {X(0)(1),X(0)(2),…,X(0)(n)}
關聯系數定義為:
η(k) =
■
其中ρ稱為分辨率,0 < ρ < 1,一般取ρ = 0.5.
關聯度:各類關聯系數的平均值r = ■■η(k),稱為■(0)(k)序列與X(0)(k)序列的關聯度. 關聯度檢驗,即通過考察模型值曲線和建模序列曲線的相似程度進行檢驗. 根據經驗,關聯度大于0.6便是滿意的.
(三)后驗差檢驗
后驗差檢驗,即對殘差分布的統計特性進行檢驗.
設原始序列X(0)的均方差和殘差的均方差分別為:
S1 = ■,
S2 = ■.
令S0 = 0.6745S1,ei = |Δ(0)(i) - ■|,則小殘差概率
p = P{|Δ(0)(i) - ■| < 0.6745S1} = P{ei < S0}.
記方差比C = S1/S2,若對于給定的C0 > 0,當C < C0時,稱模型為均方差比合格模型;如對給定的P0 > 0,當P > P0時,稱模型為小殘差概率合格模型.
若相對殘差、關聯度、后驗差檢驗在允許的范圍內,則可以用所建的模型進行預測,否則應進行殘差修正.
三、誤差分析
評價預測方法好壞的標準用平均絕對百分誤差MAPE來衡量:
MAPE ≤ 10% 高精度預測
10% < MAPE ≤ 20%良好預測
20% < MAPE ≤ 50%可行預測
MAPE > 50% 錯誤預測
四、歷史數據的收集、分析與處理
收集了長春市2003—2012年各季度公路客運量,見附錄1. 畫出散點圖(如圖1). 從圖中可以看出,總體來說,長春市的客運量逐年上升,2007年2月,客運量明顯大于其他月份,如在預測時不作任何數據處理,會影響預測精度,但如果將異常數據剔除掉,又會因為樣本數的減少而影響預測的準確度,本文對異常值做了簡單的處理.
理論上,正常的序列{Xt}是平滑的,則應有■t - kSt < Xt+1 < ■t + kSt,其中
■t = ■■Xj,St2 = ■ - ■t2,■ = ■■Xj2,k ∈ [3,9],這里k = 4.
用上面的公式對異常值點的進行檢驗,由數據可得:(■ - 4St,■+ 4St)=(96.6763,545,7827). 易見559.07?埸(■ - 4St,■ + 4St),其他點都落在(■ - 4St,■ + 4St)中,故559.07為異常值,需要進行修正:
如果Xt+1是一個異常點,我們可以用■t = 2Xt - Xt-1來修正. 本文中,Xt為2007年1月的客流量,算得■t = 2 × 115.98 - 76.95 = 155.01,把2007年2月的客運量修正為155.01萬人次. 再次畫散點圖(如圖2):
所以,將2007年2月的客運量修正為155.01萬人次,2007年第一個季度的總客運量為360.24萬人次.
五、實證分析
(一)灰色模型的建立
設原始數列為:
X(0)(k) = {968.77,1082.78,1217.62,1291.02,1299.32,
1391.19,1314.23,1365.13,1373.62,1346.65}.
經軟件S-PLUS計算,得
■ = ab = (BTB)-1BTYn = -0.02103791158.4025951.
得出預測模型
■(1)(k + 1)=56031.4234e0.0210379k - 55062.6534.
(二)灰色模型的檢驗
殘差檢驗 根據預測公式,計算■ (1)(k):
■ (1)(k) = {968.77,2160.04,3376.638,4619.102,5887.981,
7183.838,8507.245,9858.789,11239.07,12648.69} (k = 0,1, … ,9).
累減生成序列■ (0)(k):
■ (0)(k) = {968.77,1191.27,1216.598,1242.464,1268.879,
1295.857,1323.407,1351.544,1380.281,1409.62},k = 1,2, … ,10 .
絕對殘差和相對殘差序列分別是:
Δ(0) = {0,108.49,1.02,48.56,30.44,95.33,9.18,13.59,6.66,
62.97},
?準 = {0,10.02%,0.08%,3.76%,2.34%,6.85%,0.70%,1.00%,0.48%,4.68%}.
可見,相對殘差不超過10.02%,模型精確度高.
關聯度檢驗 由絕對殘差序列Δ(0)(k),可得
min{Δ(0)(k)} = 0,max{Δ(0)(k) } = 108.49,
算得關聯系數
η(k) ={1,0.33,0.98,0.53,0.64,0.36,0.86,0.80,0.89,
0.46},
關聯度ri = ■■ηi(k) = 0.685 > 0.6,滿足P = 0.5時的檢驗準則.
后驗差檢驗 算得序列X(0)的均方差及殘差的均方差分別是:
S1= 138.2405,S2 = 39.8141,
C = ■ = 0.2880,S0 = 0.6745S1 = 93.2432,
ek = |Δ(k) - ■| = {37.624,70.866,36.604,10.936,7.184,
57.706,28.444,24.034,30.964,25.346}.
所有ei都小于S0,故小殘差概率P{ei < S0} = 1 > 0.95,同時C = 0.2880 < 0.35,故模型x(1)(k + 1)= 56031.4234e0.021037912- 55062.6534預測精度優.
作出客運量實際值與預測值的對比圖如下,由圖3可見,兩者吻合得很好.
取k = 10,11時,分別得2013年、2014年長春市公路客運總量預測值:
x(0)(11) = 1439.742(萬人),x(0)(12)= 1470.355(萬人).
即2013年、2014年長春市客運總量預計達1439.742萬人和1470.355萬人次.
(三)誤差分析
平均絕對百分誤差MAPE = ■■■ × 100% = ■ × 0.2991 × 100% = 2.99%,根據平均絕對百分誤差MAPE對預測的衡量標準,上述結果表明用該模型進行預測,效果為高精度預測(MAPE≤10%).
【參考文獻】
[1]侯文超. 經濟預測——理論、方法及應用[M].北京:商務印書館,1993.
[2]徐國祥.統計預測和決策·第三版.上海:上海財經大學出版社,2008.
[3]肖枝洪,郭明月. 時間序列分析與SAS應用[J]. 武漢:武漢大學出版社,2009.
附錄
2003—2012年各季度長春市公路客運量(單位:萬人)