莫達隆,宋立新
(1.賀州學院,廣西 賀州542800;2.大連理工大學,遼寧大連 116024)
門限自回歸模型TAR是Tong.H于1978年提出來的,此后Tong和Lim(1980年)又給出了自激發門限自回歸模型SETAR。由于SETAR模型能根據自變量的變化,選擇不同的線性模型,這種選擇轉換被稱之為機制轉換。正是這種機制轉換特征恰好描述了現實生活的大量現象,如經濟、金融、氣候等領域的現象,這些領域的數據受多種因素影響,觀測值序列呈現跳躍性的變化,使得SETAR模型在這些領域的數據分析中得到廣泛應用。
正如SETAR模型應用者的研究發現,SETAR模型是利用門限空間來改進線性逼近,現實生活的各種系統卻充滿著時變性,要提高預測的準確性,預測系統模型的回歸系數也應該時常得到更新。本文提出隨機系數SETAR模型及其應用,并假設其回歸系數是一個隨機時間變化的隨機系數,給出了回歸系數的估計方法.實證研究證明,所建立的模型能更準確地擬合現實數據序列,為拓展SETAR模型的應用提供了一種新的方法。
設



把(3)式寫成向量形式:

其中,Y是觀測值xt,t=p+1,p+2,…,n,

設xt,t=1,…,n是依時間順序排列的n個觀測值,現要估計參數A,d,確定階數p和分割{ }Rj.具體步驟如下:
步驟一,假設階數p和分割{ }Rj已知.根據觀測值xt,t=1,…,n給出A的條件最小二乘估計(CLSE),即極小化如下的殘差平方和:

記A的CLSE值為,則

但由(3)式可知,模型(4)是一個異方差模型,宜用加權最小二乘法對模型(4)的系數A進行估計,加權最小二乘估計為

其中,D=diag(dp+1,dp+2,…,dn)是權矩陣

具體計算權矩陣D時,可用模型(4)的CLSE估計的殘差估計量作為對角線元素來構造權矩陣D的初步估計。dt是隨時間變化的,經過權矩陣D的作用有可能尚未把異方差的因素去掉,可重復地對模型(4)進行加權最小二乘法估計,迭代到模型的殘差平方和穩定為止。
步驟二,估計Ri.固定d,關于R極小化,可先根據數據序列直觀分析,預先確定一些門限候選值,在這些值處比較最優殘差平方和Qn(A)的大小,取使得Qn(A)最小的候選值作為。例如,先將數據序列從小到大重新排列,以位于數據量0.25,0.35,0.45,0.55,0.65和0.75分位數處的xt的取值作為門限候選值。
步驟三,關于d極小化,估計d.對每個固定d,先對j=1,2,…,l,極小化(4)式,然后選擇使得(5)式達到最小。

隨機系數SETAR的統計檢驗包括三個方面:
(1)殘差的常規檢驗.如殘差的獨立性、正態性和等方差性檢驗。
(2)非線性檢驗。這里應用廣義似然比檢驗方法,該方法假設檢驗問題是:
H0:a1i=a2i=…=ali,i=0,1,2,...,p
H1:a1i,a2i,…ali,.i=0,1,2,…,p不全相等。
構造其統計量為:

取廣西外經貿2005年1月-2010年4月的出口數據為例分析之(見表1,數據來源:廣西商務之窗http://guangxi.mofcom.gov.cn/.統計數據中的進出口數據,單位:萬美元)。其中,取2005年1月~2009年12月的出口數據作為分析數據,2010年1月~4月為預測用的數據。(所用統計軟件為eviws和R語言,自行編程)
為初步觀察數據的平穩性,作廣西累計出口月金額數據序列圖和相關函數圖。由此可以判斷:廣西累計出口月金額數據序列有明顯長期趨勢,因是月度數據,很有可能存在季節趨勢。可計算其季節指數,若存在季節趨勢可先剔除季節趨勢,再通過單位根(ADF)檢驗其平穩性,并確定長期趨勢是確定性趨勢還是隨機性趨勢,從而選擇適當方法剔除長期趨勢即可得到一平穩序列。

表1
剔除季節趨勢的方法有季節差分、計算季節指數再消除季節因素等方法,因為該原始序列的容量較少(n=64),如果用季節差分消除季節因素,勢必會缺失相當多的數據。所以通過計算季節指數消除季節因素的方法剔除季節變動。用移動平均法,得廣西累計出口月金額數據的季節指數表(見表2):
根據季節指數發現,原序列有季節趨勢,在上半年和下半年稍有變化.可剔除季節趨勢,設剔除原序列中的季節因素后的序列為{Zt}。
經嘗試,有如下結果:(見圖1,見圖2)
圖1、圖2顯示:檢驗t統計量值是-0.491272,大于顯著水平為5%和10%的臨界值,同時時間項T的t統計量小于臨界值,可斷定序列{Zt}存在單位根,是具有隨機性趨勢的時間序列,對其零均值化,得到的新序列設為{Yt}。因序列{Yt}是具有隨機性趨勢的時間序列,要通過差分的方法來消除隨機性趨勢。

表2

圖1

圖2
經嘗試,對{Yt}兩階差分(仍設為序列{Yt})后進行ADF檢驗,檢驗t統計量值是-8.906645,小于顯著水平為5%和10%的臨界值,時間項T的t統計量也小于臨界值,表明序列{Yt}是平穩的,滯后項m=2,可初步估計序列{Yt}有滯后項為3的自回歸模型。
利用Pandit-Wu建模方法對序列{Yt}擬合AR(1)、ARMA(3,1)、ARMA(5,3)、ARMA(4,3)、ARMA(2,1)等模型進行對比選擇。
擬合相關結果如下(見表3):

表3
綜合表3的各項因素,ARMA(5,4)是一個最佳的模型,模型形式如下:

根據上文的單位根檢驗可初步確定階數為p=3,序列有季節趨勢且在上半年和下半年稍有變化,可暫取第18個序列數據Y18=-78作為門限值r,d=2(1≤d≤p),由式(6)得到系數A的初步估計

現要進行異方差檢驗,作模型的殘差圖和標準殘差圖,從這兩個殘差圖可明顯看出殘差呈異方差分布,可利用加權最小二乘法估計模型(4)的系數A。先抽取模型(4)的殘差估計量,定義權矩陣D為再由式(6)得系數A的加權最小二乘估計D-1Y。經迭代,A最佳的結果是:

先固定d=2,因數據序列是月度數據,且根據3.1節分析發現數據有兩個季度的季節趨勢,便取第18、24、36、42個數據作為門限候選值,分別極小化(5)式,發現當r=2872時,式(5)最小,故暫取r=2872.固定r=2872,分別對d=1、2、3時極小化式(5),發現當d=2時,式(5)最小,故取d=2。上述過程用表4來表示:

表4
從表4中可看出,r=2872,d=2時殘差平方和最小。因此可建立如下模型

首先,做殘差的常規檢驗.模型解決了異方差問題,現對殘差的獨立性和正態性進行檢驗,結果有:W=0.9776,P-Value=0.4043。滿足正態性檢驗。
然后,進行非線性檢驗.采用廣義似然比檢驗,有如下結果:

該值遠遠大于水平0.1%的臨界值27.20[4],拒絕H0假設,即線性模型的假設不成立.
最后,對系數進行顯著性檢驗。
R語言編程計算結果如下:


上述結果表明,除了當r>2872時,xt-3的系數不顯著外,其他系數的P值均小于0.05,所以應該是非常顯著的。相關系數的平方為0.9651,關于F分布的P值也大大小于0.05,也非常顯著。因此可以認為模型通過了檢驗。
用ARMA(5,4)模型和隨機系數SETAR模型預測2010年第一季度的廣西出口金額數據的對比,如下表:

表6

表7
從表6、表7可看出:隨機系數SETAR模型無論是擬合程度還是預測結果都要比ARMA(5,4)模型好。
本文提出了隨機系數SETAR模型回歸系數估計的方法,并利用隨機系數SETAR模型對一個月度數據進行建模,拓展了SETAR模型的應用范疇,同時還建立了ARMA模型進行比較研究.結果證明隨機系數SETAR模型在具有非線性性質的數據序列建模中有較大優勢。
[1] 范劍青,姚琦偉.陳敏譯.非線性時間序列-建模、預報及應用[M].北京:高等教育出版社,2005.
[2] 安鴻志,陳敏.非線性時間序列[M].上海:上海科學技術出版社,1998.
[3] 袁軍.SETAR模型在GDP預測中的應用[J].統計與決策,2007,(5).
[4] 王黎明等.應用時間序列分析[M].上海:復旦大學出版社,2009.
[5] 王振龍等.應用時間序列分析[M].北京:科學出版社,2007.
[6] 趙松山.關于時變參數建模的研究[J].東北財經大學學報,2002,(9).
[7] 李書進,李文華.基于自適應卡爾曼濾波的時變結構參數估計[J].廣西大學學報(自然科學版),2004,(6).
[8] 胡琨.基于時變參數模型的創新環境影響研究[J].科技管理研究,2010,(1).
[9] 王宏禹,邱天爽.線性離散系統[M].北京:國防工業出版社,2008.
[10] 韓志剛.多層進階方法及其應用[M].北京:科學出版社,1989.