摘要:本論文對時間序列進行分類:按線性性分,時間序列可以分為線性時間序列和非線性時間序列;非線性時間序列模型又可分為參數非線性模型和非參數非線性模型。并簡單的介紹了重要的幾個模型,分析它們的優點和缺點。闡述了處理不同類型的時間序列數據,要用不同的模型。
關鍵詞:時間序列;AR模型;MA模型;ARMA模型;ARCH模型;門限模型
一、引言
時間序列模型在經濟預測過程中既考慮了經濟現象在時間序列上的依存性,又考慮了隨機波動的干擾性,對于經濟運行趨勢的預測準確率較高,是應用比較廣泛的方法之一。
以往的經濟預測,往往依靠傳統的經驗分析預測法或簡單的計量經濟分析預測法,如相關分析、回歸分析等。這些方法的優點是:簡便,易實現;但是缺點也比較明顯,那就是精確度不高。為了提高預測精度,人們引進線性時間序列分析方法對經濟數據進行預測。而且信息技術以及計算機工業的發展無疑給統計學家帶來更多的機遇和挑戰。
本文主要介紹線性時間序列模型和非線性時間序列模型,下面簡略介紹這幾種模型:
二、線性時間序列模型
時間序列是按照時間順序取得的一系列觀察值。很多數據是以時間序列的形式出現的:一個工廠裝船貨物的周度序列,謀化工過程產出的按小時觀測,等等。時間序列典型的一個本質特征就是相鄰觀察值的依賴性。若把時間序列的當前觀察值看作過去時刻觀察值和當前沖擊值與過去沖擊值的線性函數,就是所謂的混合的自回歸和滑動平均模型:
yt-φt-1yt-1-…-φt-p=at-θt-1at-1-…-θt-qat-q(1)
使用后移算子記號,則上式可寫成
(1-φ1B-…-φpBp)yt=(1-θ1B-…-θqBq)at
其中Bmyt=yt-m,令φ(B)=1-φ1B-…-φpBp,θ(B)=1-θ1B-…-θqBq,at獨立同分布于期望為0,方差為σ2的正態分布(高斯分布),簡記為at~iidN(o,σ2)下面的記法雷同。
則(1)式可以寫成
φ(B)yt=θ(B)at(2)
上述模型(1)簡稱為線性平穩模型ARMA(p,q)模型。
若(1)式中的q=0,則模型變為
yt-φ1(yt-1-…-φpyt-p=at(3)
該模型稱為p階自回歸模型,簡稱AR(p)模型。
若(1)式中的p=0,則模型變成
yt=at-θqat-1-…-θq(at-q(4)
該模型稱為q階的滑動平均模型,簡稱MA(q)模型。不難看出,AR(p)和MA(q)模型是ARMA(p,q)模型的特例。
利用上述模型進行預測,需要滿足平穩性條件,若不滿足,要對序列進行差分。當序列滿足平穩性條件后,就可以對序列進行模型識別,然后是確定階數,接著就是在某個準則下求出參數的估計值,把參數的估計值求出來后,還要對模型進行檢驗,若模型通過了檢驗,我們就可以利用該模型進行預測了。
從Yule(1927)關于太陽黑子數的AR建模的開拓性工作到Box和Jenkins(1970)標志著ARMA建模的理論和方法成熟的工作,線性高斯時間序列模型研究得到極大的發展,支配著理論探索和實際應用。雖然最初的ARMA框架已經被推廣到包括具有結合分式的ARMA的長范圍相依(Granger和Joyeux1980以及Hosking1981),多變量VARMA和VARMAX模型(Hannan和Deistler1988),利用協整(co-integration)所得的隨機游動非平穩性(Engle和Granger1987),但是,ARMA建模長達四十年的持續普及足以說明這一點。毫不夸張地說,由于其簡單性、可行性和靈活性,ARMA模型及其變種在將來仍將在分析時間序列中繼續發揮積極的作用。
然而,早在上世紀50年代,P.A.P.Moran在對加拿大山貓數據進行建模的經典文章(Moran1953)中就暗示了線性模型的局限性。他注意到了數據中的“怪異”特征,即大于均值的樣本點的殘差顯著地小于那些小于均值的樣本點的殘差。正如現在知道的那樣,這正好能夠解釋為在種群波動的不同階段有所謂的“控制效應”(Tong1990的§7.2;Stenseth等1990).建模控制效應或者含別的非標準特征的模型超出了高斯時間序列模型的范圍。由此,統計學家想用非線性模型代替線性模型。
三、非線性時間序列模型
線性范圍之外,尚有無窮多的非線性形式有待挖掘。非線性時間序列分析的早期發展的重點是在各種非線性參數模型。成功的例子包括金融數據的波動波幅性的ARCH模型和生態及經濟數據的門限模型。另一方面,非參數回歸方法的最新發展為建模非線性時間序列提供了另一種手段。這種方法的一個既得的優點是對模型結構的先驗信息要求很少,而且為進一步的參數擬合提供有用的感性認識。此外,近幾年來隨著計算能力的增強,存取和試圖分析海量的和復雜的時間序列數據已變成平凡之事。隨著這些變化而來的是對那些能夠識別內在結構和按照新的精度標準預報將來的非參數和半參數分析工具的需求日益增大。對時間分布過長的大的實際數據集合,參數模型的有效性總是值得懷疑的。所有這些因素導致了通過探索局部低維結構來識別復雜數據結構的計算機輔助方法的迅速發展。下面簡單介紹幾個非線性時間序列模型:
1.ARCH模型
自回歸條件異方差(ARCH)模型定義如下
Xt=σtεt,和α2t=a0+b1X2t-1+…+bqX2t-q(5)
其中a0≥0,bj≥0,{εt}~iidN(0,1)
ARCH模型由Engle(1982)為建模英國的通貨膨脹的預報方差而引進。從此這個模型被廣泛地用來建模金融和經濟時間序列的波動率,或者用于建模一般時間序列變化的(條件)方差或波動性。時間序列較大的值可能導致較大的不穩定性(即大的方差),這一現象經常在經濟和金融中發現。這種現象稱為(條件)異方差性。
Bollerslev(1986)通過下式代替(5)的第二個方差而引進了廣義自回歸條件異方差(GARCH)模型
σ2t=a0+a1σ2t-1+…+apσ2t-p+b1X2t-1+…+bqX2t-q(6)
其中aj≥0,bj≥0。
2.門限模型
由H.Tong提出的門限自回歸(Tar)模型假定在狀態空間的不同區域,模型有不同的線性形式。狀態空間的劃分通常由一個門限變量來描述,比如,對某個d≥1,Xt-d就是一個門限變量。模型具有如下的形式
d≥1,Xt=b(i)0+b(i)1Xt-1+…+b(i)pXt-p+ε(i)t,若Xt-d∈Ωi(7)
對i=1,2,…,k,其中{Ωi}構成理論實直線的一個(不重疊的)分割,{ε(i)t}~iidN(0,σ2i)。
最簡單的門限模型是Ω1={Xt-d≤τ}的兩段(即k=2)TAR模型,其中門限τ是未知的。
該模型的成功部分地在于它的模型擬合,也許更重要的是在模型解釋這兩方面的簡單性。通過分割狀態空間建模非線性,平穩性可以被保持。這明顯地不同于變點模型,后者的控制開關按時間發生,其結果導致非平穩過程。TAR模型的缺點是,關于該模型的知識仍處于發展中,我們還沒有像線性ARMA模型那樣的全面的理論和方法。
3.非參數自回歸模型
非線性時間序列有無窮多的可能形式。我們不能抱有一個特殊模型族將會很好地適合我們數據的想法。一個自然的替代想法是采用非參數的方法。一般地,我們可以假定
Xt=f(Xt-1,…,Xt-p)+σ(Xt-1,…,Xt-p)εt(8)
其中f(·)和σ(·)是未知函數,{εt}~iidN(0,1)。對于函數f和σ,我們不規定具體形式,而僅作一些定性的假定,比如假定f和σ是平滑的。模型(8)稱為非參數自回歸條件異方差(NARCH)模型,如果σ(·)是常數,則稱為非參數自回歸(NAR)模型。
顯然,模型(8)是非常一般的,且對如何生成數據所做的假定非常之少。它允許異方差性。然而,僅當p=1或2時,這個模型是有用的。對適當大的p,這樣一個有“飽滿”的非參數形式的函數很難估計,除非樣本容量是天文數字。困難是“本質的”,在非參數回歸中常稱為“維數禍根”。
四、總結
自從1970年Box和Jenkins在ARMA框架內系統建立時間序列分析后,線性高斯時間序列模型研究得到極大的發展,支配著理論探索和實際應用。由于其簡單性、可行性和靈活性,ARMA模型及其變種在將來仍將在分析時間序列中繼續發揮積極的作用。然而,自然界的很多現象是以非線性的狀態存在的,若用線性模型描述非線性現象,則會產生很大的誤差,這個就是線性模型的局限性。因此,提出非線性模型成為必要。
與重點在于給條件一階矩建模的傳統時間序列分析不同的是,ARCH和GARCH模型主要是考慮條件二階矩的相依性的建模。這很有希望適應解釋和建模兼容時間序列的風險和不確定性方面日益增長的要求。
對于TAR模型,雖然還沒有全面的理論和方法,但是該模型在模型擬合和模型解釋這兩方面的簡單性,也使得該模型在時間序列預測領域,特別是經濟時間序列預測領域中起到重要作用。
至于非參數模型,雖然它的理論方法更不完善,但是因為非參數方法對如何生成數據所做的假定非常少,而且還允許異方差性。因此,該方法具有很大的應用潛力。
本文簡單介紹了幾個重要的時間序列模型,而這些模型都是基于隨機假設前提下的,事實上,還有基于混沌假設前提下的時間序列預報,由于篇幅關系在本論文沒有作詳細介紹。
參考文獻:
[1]博克斯等著,顧嵐主譯.時間序列分析:預測與控制.中國統計出版社,1997.
[2]范劍青,姚琦偉著,陳敏譯.非線性時間序列-建模、預報及其應用.高等教育出版社,2005.
[3]王振龍等.應用時間序列分析.科學出版社,2007.
[4]馮文權主編.經濟預測與決策技術.武漢大學出版社,2002.
[5]菲利普.費朗西斯.商業和經濟預測中的時間序列模型.中國人民大學出版社,2002.
[6]張軍峰,胡壽松.基于多重核學習支持向量回歸的混沌時間序列預測.物理學報,2008.5.
(作者單位:華南農業大學理學院)
“本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文”