韓姣,夏志明
(西北大學數學學院,陜西 西安 710127)
面板數據中存在公共變點的現象發生在社會生產的方方面面,例如一種商品價格的漲跌影響周邊多種相關商品的銷量,儲蓄利率調整會導致各大銀行貨幣存儲量變化等.面板數據中變點估計問題的研究有利于及時發現社會生產中的異常經濟現象以避免不必要的損失.實際上,同一事物往往受多因素影響且某些因素之間不存在相關關系,當某些因素發生突變時存在另一些因素不發生變化,表現在變點模型中稱為部分結構突變,即存在參數不受變點的影響.一方面,部分結構突變的變點模型在應用上更為廣泛.另一方面,同樣精度要求下面板數據相對于單序列在變點估計問題上需要更少的數據,即意味著更節省時間成本.因此部分結構突變的線性面板模型中變點估計問題的研究對于經濟社會發展意義重大.
統計學和經濟學現存文獻中有大量關于線性模型變點問題的文章.文獻[1]對于變點估計問題的研究做出了巨大的貢獻,考慮了線性過程中具有未知變點的均值漂移模型,通過最小二乘法估計未知變點,相對于文獻[2-4]采用的最大似然估計方法縮減了計算復雜度,證明了變點估計量的相合性,得到了收斂速度及躍度較小時變點估計量的漸近分布.文獻[5]考慮帶有單個變點的部分結構突變的多元回歸模型中的變點估計問題,允許滯后因變量,趨勢回歸,誤差序列的相關性及異質性,同樣得到了變點估計量的大樣本性質.文獻[6]研究了部分結構突變的多變點線性模型的變點估計與檢驗問題并提出了多變點的序貫估計策略.然而他們都只得到了變點分數估計量的T相合性,變點估計量與真值的差是隨機有界的,在樣本量給定的情形,這樣的結論沒有任何意義.對于面板數據中變點問題的研究始于文獻[7-8],他們引入了面板數據模型的均值項上可能存在變點的問題.文獻[9]對早期的研究進行了一般化的處理,考慮簡單均值漂移模型,在各面板間相互獨立的假設前提下允許每個面板中誤差存在序列相關性,且不要求每一項的觀測值數量與樣本量成正比,得到了變點估計量的相合性.然而在復雜的經濟關系中,簡單均值漂移模型并不能很好地描述和解釋經濟規律.近期,文獻[10]考慮具有固定效應的非線性和不可分離面板數據模型的半參數估計,在正則條件下得到估計量的相合性及漸近正態性,但對線性情形未作考慮.
本文討論部分結構突變的線性面板模型中單個公共變點的估計問題.首先對部分結構突變的模型進行重參數化,再通過最小二乘法得到線性參數估計量的矩陣表達,由最小化殘差平方和準則估計變點,證明了變點估計量的相合性.最后蒙特卡羅模擬結果顯示理論是正確的.
考慮如下的帶有同一個給定變點k0的部分結構變化的線性面板模型:

其中yit是可觀測的因變量,xit(p×1)和zit(q×1)是可觀測的協變量向量,是相應的系數向量且?it是誤差項.注意不受變點的影響但不同序列可能有不同值.模型(1)可被表示為

模型(1)和模型(2)可被等價地表達為矩陣形式

其中


得到.將上述的最小二乘估計量代入目標函數得到殘差平方和函數ST(k),則變點估計量為

考慮參數的可識別性,有k∈{p+q,···,T?p?q}且變點估計量是目標函數的全局最小值.

則模型(3)等價于

由最小二乘方法可得參數αj,j=1,2的最小二乘估計量為其中Wj=diag(W1j,···,WNj),j=1,2.由可得,則

假設1存在δ>0,K<∞使得
假設2令,則 (a){?it}是一個關于的鞅差序列且存在c>0使得E|?it|4+c<∞;(b)?it關于i相互獨立.
假設 3
根據假設1-假設2,再由文獻[11]及弱大數定律可得

假設 4當T→∞,k1,k2∈{p+q,···,T?p?q},令

其中Gi(τ0),Gi(τ)和Gi(1)為有限對稱正定矩陣,Gi(τ)關于τ連續且嚴格單調遞增,

且存在某一正常數Q,使得λmax{Gi(τ)}≤Q,i=1,···,N,j=1,2.令


假設 5存在0 假設 2要求對于固定的i,wit中不存在滯后相依的回歸量,此時要求誤差序列{?it}存在序列相關性.假設3是發展漸近理論的基本假設,要求變點兩側的觀測值數量隨著樣本容量的增加而成比例增加.假設4是多元線性回歸的標準假設.假設5要求躍度不為零且二階矩有限. 對于帶有單個公共變點的部分結構突變的線性面板模型(3),可得到如下的變點估計量的大樣本性質. 定理3.1在假設1-假設5條件下,有 證明考慮類似于文獻 [12]命題 1中的重參數化方法,令W=W1+W2且則模型(4)可被重參數化為 定義M=I?P,其中投影矩陣P=diag(P1,···,PN), 由標準代數得殘差平方和函數(5)可寫為ST(k)=Y′MY且MW=0,則 M是對稱冪等矩陣且列滿秩,因此有M半正定, R∞(τ)連續且在τ0達到唯一最小值 0.由文獻 [13]的定理 2.1知,當T→∞且,再由假設3和假設4可得 由模型(1)生成數據以驗證理論的正確性.令樣本量N=1,5,10,15,20,30,70,100,T=30,80,150,,p=2,q=2,的元素服從的元素分別服從U(2,2.5),U(2.5,3),xit,zit的元素服從N(1,1),?i1~N(0,1),ηi1=0,ηit~N(0,1),?it=?0.6ei(t?1)+ηit,i=1,···,N,t=1,···,T,估計 1000 次得到估計準確率及變點估計量均值與真值的距離,見表1. 表1 基于1000次模擬所得估計準確率,變點估計量均值與真值的距離及相應的標準誤 由表1可知,在所考慮的情形中當N=1時,變點估計的準確率隨著T增大而增大,但總體上準確率偏低,低于 25%.這表明此時單序列變點估計效果差強人意.當T及N同時增大時,估計的準確率逐漸趨近于1,1000次估計所得變點估計量均值與真值的距離及相應的標準誤都趨于0,即變點估計值收斂于真值. 本文研究了部分結構突變的帶有單個公共變點的線性面板模型中變點估計量的大樣本性質,在面板數及樣本量同時趨于無窮的情形證明了變點估計量的相合性,并通過蒙特卡羅模擬驗證了理論的正確性.
3 變點估計量的大樣本性質






4 蒙特卡羅模擬

5 結論