[摘 要] 本文通過研究一個具體的經濟時間序列數據,首先運用Box-Jenkins方法進行建模并給出結論,但通過模擬發現系數并不滿足通常的大樣本理論下的漸進正態的結論,從而得出相應結果不可信的結論,然后采用bootstrap方法進行估計,得出可信的結論,并對于廣大科技工作者給出建議。本文的計算均由R軟件編程實現。
[關鍵詞] 時間序列 MA過程 R軟件 Bootstrap
數據為1952年~2005年我們歷年第三產業從業人數(百分比)數據。(數據來自國家統計局網站)
一、時間序列建模、估計和診斷
首先繪制原始的散點圖,顯然原數據不平穩,我們再繪制其增長率的時序圖:
可以看到,不平穩的情況得到了很大的改善,因此,下面我們對我國第三產業從業人數的增長率進行研究。我們考察其自相關和偏自相關圖:
我們可以看到,這個序列是一個MA(1)過程。進行參數估計,我們用兩種估計方法,條件似然法CSS和精確似然法ML。結果見表1。
我們再對這兩個模型作殘差的自相關圖診斷。
我們可以看到,CSS和ML方法建立的模型的殘差均未顯示序列相關,說明這兩個模型擬合的很好經受住了檢驗。因此得到最終擬合的模型:Xt為第三產業從業人數增長率:Xt=εt+0.4465εt-1,t=1,2,…,(CSS);Xt=ε+0.4645εt-1,t=1,2,…,(ML)。但是我們看到,兩個估計方法估計系數的置信區間均含0,這意味系數似乎應顯著為0。那么這個結果可信嗎?需注意,時間序列的理論只是論證大樣本情形下,ARMA類模系數會漸進正態,但樣本量要大到何種程度時,才會漸進正態,這是不得而知的,也正因為如此,我們通常估計的系數的標準誤未必是可信的,況且,我們的樣本量不大(僅32個),因此,上面的結果是值得懷疑的。其實,bootstrap方法的另一個吸引人之處是可幫助我們不必糾纏理論上的困惑而用大量的模擬得到我們的所需。
二、對時序數據模型標準誤的Bootstrap估計
對時序進行bootstrap模擬前我們應先檢驗殘差的序列相關性。上面通過殘差的自相關圖已得知無序列相關存在。下面再對兩個模型殘差作Ljung-Box檢驗,以診斷是否殘差為白噪聲即是否存在序列相關。
可看到,模型擬合的很好,未拒絕殘差序列是白噪聲的原假設,同自相關圖得出的結論一致。因此可以對這組數據進行bootstrap。
下面采用采用參數bootstrap方法。首先有以下結論:定理:對于序列MA(1):Xt=εt+bεt-1,t=1,2,…,其中,當N→∞時,時依分布收斂于正態分布。據此,構造下述bootstrap算法:
1.從原始樣本中有放回抽樣若干次,這些樣本稱為bootstrap樣本;
2.用這些bootstrap樣本建立時序模型,并每次算出的標準誤;
3.計算所有的標準誤作為bootstrap估計的的標準誤
分別模擬1000,5000,10000次的結果列于下表并與理論值相比較:
注:筆者的電腦配置為Intel CPU1.73GHz,1G內存,bootstrap10000次記錄的系統所需時間為31.86秒。
最后,再畫出基于CSS方法bootstrap10000次系數估計的QQ圖,此圖能準確揭示系數分布的真實情形。可以看到,在現有的樣本量下系數并不漸進服從正態分布,因此基于大樣本正態的推斷顯然不可信,而基于bootstrap方法估計的系數的標準誤和其置信區間才是我們的所選。