苑成艷

摘要:時間序列建模過程中,確定了時間序列適合的模型類型之后,對模型階數(shù)的確定是必不可少的。常見的模型定階的的方法有:殘差平方和法,自相關(guān)和偏相關(guān)函數(shù)法,F(xiàn)檢驗法,AIC準則和BIC準則。在實際模型定階時,采用自相關(guān)函數(shù)和偏自相關(guān)函數(shù)拖尾或結(jié)尾來確定模型階數(shù),計算得到的自相關(guān)函數(shù)或偏自相關(guān)函數(shù)都是估計值,與理論上的真值之間存在一定誤差;而且自相關(guān)和偏自相關(guān)函數(shù)法只適用于AR(p)和MA(q)模型定階,對用ARMA模型來說,這種方法是不可行的。F檢驗法的前提是兩個模型中有一個是適用的,若兩個模型適用性都未知,則F檢驗法來檢驗低階模型是毫無意義的。為了給模型更準確定階,采用AIC準則、BIC準則定階,利用似然函數(shù)估計值的最大原則來確定合適的模型階數(shù)。但AIC準則定階可能會出現(xiàn)高估真實階數(shù)的情況,下面我們針對AR模型通過AIC定階與BIC定階對比來討論是否AIC定階真的高于真實階數(shù)。
關(guān)鍵詞:AIC準則;BIC準則;AR模型;時間序列
1 AP(p)模型的定階
1.1 AIC定階
1973年日本學(xué)者赤池(Akaike)提出了AIC準則,適用于ARMA(包括AR和MA)模型的定階問題。設(shè)觀測數(shù)據(jù)序列
為零均值平穩(wěn)序列,其中一組樣本數(shù)據(jù)為
,設(shè)L為擬合模型的最高階數(shù),AR模型階數(shù)為k,下面是AIC模型AIC定階步驟:(1)計算樣本的自協(xié)方差函數(shù)
和樣本的自相關(guān)函數(shù)
;(2)利用遞推算法計算相關(guān)函數(shù)
;(3)
是AR(k)的白噪聲方差。
所以AIC準則函數(shù)為:
。AIC(k)最小值點
成為AR(k)模型的AIC定階。
1.2 BIC定階
針對AR(p)模型可以證明出當(dāng)樣本數(shù)據(jù)N充分大時,用AIC定階往往并不是相合的,就是說,當(dāng)數(shù)據(jù)來自AP(p)模型時,
并不依概率收斂到真實的階數(shù)。有研究指出AIC定階通常會對階數(shù)略有高估。為了克服這一問題,舒瓦茲(Schwarz)提出另一個與AIC準則類似的準則函數(shù)BIC準則。BIC準則函數(shù)定義如下:
我們稱BIC(k)中第一個最小值點
成為AP(p)模型的BIC定階。已知AR(k)模型
是白噪聲方差,可證明BIC定階是強相合的。
2 AIC定階和BIC定階準確性對比
針對平穩(wěn)的AR模型分別用AIC準則和BIC準則定階。我們將確定的AR模型進行AIC和BIC定階,通過兩個準則定階的正確率以及高估率和低估率探究,從而得到AIC準則定階是否高于真實階數(shù)的真正結(jié)果。這里我們假設(shè)用AR(2)模型進行試驗討論,討論結(jié)果如下,AR(2)模型:
其中
是白噪聲序列。
首先利用SAS軟件循環(huán)程序生成500個數(shù)據(jù),再用SAS程序?qū)@些觀測數(shù)據(jù)模擬計算獨立重復(fù)1000次,每次生成的數(shù)據(jù)是不同的,即每次使用不同的500個觀測值。得到AIC和BIC階數(shù)情況如下:
表1:500個觀測值A(chǔ)IC、BIC定階所定階數(shù)的次數(shù)
1
2
3
4
5
6
7
8
9
10
AIC定階
97
675
54
108
24
21
8
5
6
1
BIC定階
550
447
7
4
2
0
0
0
0
0
上表數(shù)據(jù)表示,用某一種定階方式(AIC或BIC),在1000次模擬計算中階數(shù)定為
(
=1,2,…,10)的有多少次,其中675表示在1000次模擬計算中AIC將階數(shù)定為4的由675次,447表示在1000次模擬計算中BIC將階數(shù)定為4的由447次。通過得到的階數(shù)情況分析,AIC定階對階數(shù)低估的比率是9.7%,對階數(shù)高估的比率是22.7%;BIC定階對階數(shù)低估的比率是55%,對階數(shù)高估的比率是1.4%。AIC定的平均階數(shù)是2.447,高于BIC定的階數(shù)1.497。
我們再次利用SAS程序生成更多數(shù)據(jù),這里我們生成了2000個數(shù)據(jù),在對模型進行1000次模擬計算。得到如下結(jié)果:
表2:1000個觀測值A(chǔ)IC、BIC定階所定階數(shù)的次數(shù)
1
2
3
4
5
6
7
8
9
10
AIC定階
0
739
114
42
32
25
12
18
11
7
BIC定階
7
991
2
1
0
0
0
0
0
0
通過表格的階數(shù)情況分析,AIC定階對階數(shù)低估的比率是0%,對階數(shù)高估的比率是26.1%;BIC定階對階數(shù)低估的比率是0.7%,對階數(shù)高估的比率是0.3%。AIC定的平均階數(shù)是2.695,高于BIC定的階數(shù)1.999。
由上面計算實驗,確實存在AIC定階高于BIC現(xiàn)象,但是我們看到,當(dāng)樣本數(shù)據(jù)不是很大時,BIC 定階會出現(xiàn)低估階數(shù)的現(xiàn)象,造成模型較大失真。而AIC定階更接近真實階數(shù)。在N很大的情況下,BIC對模型的定階會更準確。因此,我們在進行模型定階時,要根據(jù)實際觀測數(shù)據(jù)多少來判斷用AIC準則還是BIC準則。
參考文獻:
[1]王振龍,胡永宏.應(yīng)用時間序列分析[M].科學(xué)出版社
[2]王燕.應(yīng)用時間序列分析[M].中國人民大學(xué)出版社
[3]肖枝洪,郭明月.時間序列分析與SAS應(yīng)用[M].武漢大學(xué)出版社
[4]吳懷宇.時間序列分析與綜合[M].武漢大學(xué)出版社
[5]何書元.應(yīng)用時間序列分析[M].北京大學(xué)出版社