西南交通大學交通運輸與物流學院 四川成都 611756
摘要:本文根據1998-2012年北京市居民人均年收入與該市私人汽車保有量統計數據,分別建立了二次指數平滑預測模型和灰色預測模型,分析比較得出在數據量較小、預測時期較短的情況下,灰色預測更有優勢的結論。
關鍵詞:二次指數平滑;灰色預測;分析比較
根據1998-2012年北京市居民人均年收入與該市私人汽車保有量統計數據,假設搜集到的數據均準確可靠,現用其來對北京市2013年私人汽車保有量進行預測,并檢驗預測的誤差。
一、二次指數平滑預測
指數平滑法是對時間序列由近及遠采取具有逐步衰減性質的加權處理,是移動平均法的改進型。根據平滑次數的不同,可分為一次、二次、三次指數平滑法。一次指數平滑法適用于平穩時間序列,二次指數平滑法(也稱為雙重指數平滑[1]或線性二次指數平滑)是對一次指數平滑值再進行一次平滑,適用于具有線性趨勢的時間序列。三次指數平滑法適用于時間序列的變化呈現二次曲線趨勢時的預測。
(1)數據分析
將1998-2012年北京市私人汽車保有量的數據輸入EXCEL內,畫出北京市私人汽車保有量隨時間變化的折線圖,分析可知,北京市私人汽車保有量隨時間大致呈現線性增長趨勢,故這里選取二次指數平滑法進行預測。
(2)二次指數平滑模型
二次指數平滑法是對一次指數平滑序列再進行一次指數平滑。設時間序列{yt},一次指數平滑計算公式為:
(1.1)
式中:
——第期的一次指數平滑值;
——第期的觀測值;
——加權系數,。
二次指數平滑法的計算公式為:
(1.2)
式中:
——第期的二次指數平滑值。
二次指數平滑法的預測步驟為:
①確定加權系數和初始值;
②對時間序列計算和;
③利用和估計線性趨勢模型的截距和斜率:(1.3)
④建立線性趨勢預測模型,并進行預測: (1.4)
(3)確定加權系數和初始值
因數列發展趨勢較明顯,故應取大值,這里不妨取,以跟蹤近期數據的變化。
又因為時間序列的樣本容量,初始值對預測結果影響較大,應選取最初幾期觀測值的均值作為初始值,這里選取前3期的觀測值作為初始值,則。
令,對預測結果影響不大。
(4)分別計算和
(5)建立線性趨勢預測模型
由公式(1.3)計算參數和:
于是,得到時的線性趨勢預測模型為:
(6)預測2013年的北京市私人汽車保有量
(7)計算追溯預測值,并求平均絕對百分比誤差
將式(1.3)代入預測模型(1.4)中,并令,得到追溯預測值計算公式:
(1.5)
本題中
令,由上式可求出各期的追溯預測值,則
分析數據及平均絕對百分比誤差可知,預測效果較好。
二、灰色預測
灰色預測[2]是指利用GM模型對既含有已知信息又含有不確定信息的灰色系統進行預測,就是對在一定范圍內變化的、與時間有關的灰色過程進行預測。
灰色預測的主要特點是模型使用的不是原始數據序列,而是生成的數據序列。其核心體系是灰色模型[3](Grey Model,GM),即對原始數據作累加生成(或其他方法生成)得到近似的指數規律再進行建模的方法。優點是不需要很多的數據(一般只需要4個數據)就能解決歷史數據少、序列的完整性及可靠性低的問題;能利用微分方程來充分挖掘系統的本質,精度高;能將無規律的原始數據進行生成得到規律性較強的生成序列,運算簡便,易于檢驗,不考慮分布規律,不考慮變化趨勢。缺點是只適用于中短期的預測,只適合指數增長的預測。
(1)數據的檢驗與處理
首先,為了保證此模型的可行性,需要對已知數據數列做必要的檢驗處理,設參考數據為,計算數列的級比
(2.1)
如果所有的級比都落在可容覆蓋內,則數列可以作為模型GM(1,1)和進行數據灰色預測。
結合本題數據,這里采取就近原則,根據已知的2003-2012這最近10年的數據來預測2013年的數據,則這里。用求解得到2003-2012這10年的級比。
本題要求的區間是[0.8338,1.1994],由此可以看到所計算得出的級比是符合要求的。故經檢驗,本題數據所有級比均落在可容覆蓋內,滿足要求。
(2)灰色預測模型GM(1,1)的建立
給出按2003-2012這10年的時間序列數據:
(2.2)
對進行一次累加,即
,,
則生成的新序列:
(2.3)
取的加權均值,其中。
令為臨緊均值(mean)數列,有
(2.4)
式(6.3.3)中為確定參數,一般取,即
(2.5)
則
(2.6)
建立GM(1,1)灰微分方程為:
(2.7)
式(6.3.6)中,稱為灰導數,稱為發展系數,稱為白化背景值,稱為灰作用量。
則GM(1,1)灰微分方程對應的白化微分方程為
(2.8)
引入矩陣向量記號:
u = , Y = ,
B =
于是GM(1,1)模型可表示為
Y = Bu (2.9)
用最小二乘法求得參數的估計值為
(BTB)-1BTY(2.10)
由此得到的響應方程為:
,
(2.11)
則預測值為:
(2.12)
(3)模型求解
根據上述模型,利用軟件求解得到,,于是求解方程(2.8)得時間響應函數
(2.13)
令,由式(2.13)的時間響應函數可算得,其中取,由,
取,得
。
(4)預測值的檢驗
為判斷此模型的預測值是否達到要求,還需對其進行如下檢驗:
1)相對誤差檢驗:令相對誤差為,計算
(2.14)
如果,則認為該預測模型可以達到一般要求;如果,則認為達到較高要求。
2)級比偏差值檢驗:首先由參考數據,計算出級比,再用發展系數求出相應的級比偏差
(2.15)
如果,則可認為達到一般要求;如果,則認為達到較高的要求。
本題中,,。經多次檢驗, 求解得到北京市私人汽車保有量的預測值、殘差值、相對誤差和級比偏差。
可以看出:
1)2003-2012年這10年所有的相對誤差均小于0.1,說明對于北京市私人汽車保有量的預測達到較高要求。
2)2003-2012年這10年所有的級比偏差值均小于0.1,說明對于北京市私人汽車保有量的預測達到較高要求。
綜上,上述模型對于北京市私人汽車保有量的預測達到較高要求,及北京市2013年私人汽車保有量的預測值是比較科學合理的。
三、結論
以上兩種預測方法各有優缺點,總體比較看來,在數據量較小,預測時期較短的情況下,灰色預測更有優勢。因為二次指數平滑預測需要對加權系數的取值進行估算與試算;而灰色預測可以在數據量很少、數據序列完整性及可靠性較低的情況下利用微分方程來充分挖掘系統的本質,能將無規律的原始數據進行生成得到規律性較強的生成序列,運算簡便,易于檢驗,且精度較高,是此類中短期指數增長預測的首選方法。
參考文獻:
[1]徐國祥.統計預測和決策(第三版).上海:上海財經大學出版社,2008,104.
[2]卓金武.MATLAB在數學建模中的應用.北京:北京航空航天大學出版社,2011,30-32.
[3]韓中庚.數學建模方法及其應用(第二版).北京:高等教育出版社,2009,371.