劉 燕, 肖玉山
(長春大學 理學院, 長春 130022)
整數值時間序列由于其應用廣泛而備受關注, 例如: Steutal等[1]提出了二項稀疏算子“°”; Al-Osh等[2]利用“°”提出了一階整數值自回歸(INAR(1))模型; Liu等[3]研究了邊緣分布為零截斷Poisson分布的INAR(1)過程; Li等[4]研究了門限INAR(1)過程; Yu等[5]研究了帶有隨機系數的INAR(1)過程; Li等[6]給出了基于整數值門限自回歸時間序列模型對腦膜炎病人數的非參數Bayes分析. 在實際應用中, 存在多組自相關計數數據, 因此Pedeli等[7]建立了二維一階整數值自回歸(BINAR(1))模型:

(1)
其中A為二階對角陣且對角線元素獨立, “°”運算與常規矩陣乘法運算相同, 且具有二項稀疏算子的運算性質,α1∈[0,1),α2∈[0,1), {εt}為獨立同分布的非負整數值隨機序列, 且其分量與“°”中的求和序列及{Xt-l}(l≥1)均獨立.若{Xt}滿足Latour[8]給出的分布, 則可推出過程(1)為嚴平穩過程.基于此, 本文將經驗似然(EL)方法應用于BINAR(1)過程, 建立經驗似然比(ELR)統計量, 并尋找其極限分布, 以構造參數的置信域, 解決參數的假設檢驗問題.
令E(εj,t)=λj(j=1,2), Cov(ε1,t,ε2,t)=φ, 且均有限, 則有
E(Xj,t|Xj,t-1)=αjXj,t-1+λj(j=1,2), Cov(X1,t,X2,t|X1,t-1,X2,t-1)=φ.
為利用EL方法對過程(1)的參數進行置信域推斷, 需假設該過程滿足下列條件:
(i) {Xt}是嚴平穩遍歷過程; (ii)‖Xt‖6<∞.
根據條件最小二乘(CLS)估計方法, 令

模型(1)的截面ELR函數為

(2)
利用Lagrange乘子法, 令
其中γ與b∈5為Lagrange乘子.由可得


(3)
為證明L(θ)的極限分布, 先引入如下引理.

對于非主對角元, 有
證明: 根據文獻[9]中引理2.1, 有
同理, 令
Fn=σ(X1,0,X1,1,…,X1,n,X2,0,X2,1,…,X2,n),
則
所以{Mn,Fn,n≥0}是鞅, 又由E|X1,tX2,t|<∞可知,
{[(X1,t-α1X1,t-1-λ1)(X2,t-α2X2,t-1-λ2)-φ],n≥1}
是均勻可積的.由文獻[10]中定理1.1可知,
因此, 由文獻[11]中推論3.2和鞅中心極限定理, 可得
同理, 對任意的c=(c1,c2,c3,c4,c5)T∈5(0,0,0,0,0)T, 當n→∞時, 有
其中
根據Cramer-Wold技巧, 結論得證.

證明: 記Dt(θ)為Dt,b(θ)為b.

2) 由文獻[10]中定理1.1可知,

(4)
其中Ω(θ)由引理1定義.因此


又根據式(4)知,σ1+op(1)≤βTΩnβ≤σp+op(1), 其中σp≥σ1≥0是Ω(θ)的最大和最小特征根.因此‖b‖(βTΩnβ+op(1))=Op(n-1/2), 即‖b‖=Op(n-1/2).

證明: 令Dt,b,Zt均由引理2定義.由Taylor公式可將式(3)展開為如下形式:

(5)


因此

(6)

(7)
將式(6)和式(7)代入式(5), 可得
其中
根據引理1及式(4), 可得
證畢.
由定理1直接可得:

由定理2直接可得:

下面基于定理1的EL方法, 通過數值模擬計算過程(1)參數置信域的覆蓋率. 為表明EL方法的有效性, 同時基于引理2的正態逼近(normal approximation, NA)法構造參數置信域并計算覆蓋率, 其中用式(4)中的Ωn估計漸近方差中的Ω.
將過程(1)的擾動項{εt}分別定義為二維Poisson分布(BP(λ1,λ2,φ))[12]和二維負二項分布(BVNB(λ1,λ2,β))[13], 分別記為模型Ⅰ和模型Ⅱ.針對模型Ⅰ, 選取8組參數真值: (0.1,0.1,2,2,1),(0.1,0.1,2,4,1),(0.3,0.3,2,2,1),(0.3,0.3,2,4,1),(0.1,0.3,2,2,1),(0.1,0.3,2,4,1),(0.2,0.4,3,3,1),(0.2,0.4,3,5,1); 針對模型Ⅱ, 選取8組參數真值: (0.1,0.1,2,2,1/4),(0.1,0.1,2,4,1/8),(0.3,0.3,2,2,1/4),(0.3,0.3,2,4,1/8),(0.1,0.3,2,2,1/4),(0.1,0.3,2,4,1/8),(0.2,0.4,3,3,1/9),(0.2,0.4,3,5,1/15).樣本容量n分別取100,300和500.圖1給出了當n=100時模型Ⅰ和模型Ⅱ在給定參數情形下模擬產生的樣本路徑, 其中Xt兩個分量的樣本路徑分別用實線和虛線表示.令置信度(1-δ)分別取0.95 和0.90, 利用引理2和定理1, 分別基于NA方法和EL方法計算參數θ置信域的覆蓋率.所有模擬結果均重復試驗1 000次.兩個模型得到的覆蓋率結果分別列于表1和表2.

圖1 模型Ⅰ和模型Ⅱ的樣本路徑

表1 模型Ⅰ中參數θ的覆蓋率

表2 模型Ⅱ中參數θ的覆蓋率
由表1和表2可見: 隨著樣本容量n的增加, 基于EL方法和NA方法得到的參數置信域的覆蓋率逐漸增大, 并趨于置信度(1-δ), 因此用兩種方法得到過程(1)的參數置信域均可行; 對于相同模型和相同樣本量, EL方法略大于NA方法的覆蓋率, 因此對于該過程, EL方法略優于NA方法; 對于不同模型和相同樣本容量, 模型Ⅱ基于NA方法得到的覆蓋率略大于模型Ⅰ的覆蓋率, 因此NA方法對于模型Ⅱ表現更好, 兩個模型基于EL方法得到的覆蓋率無明顯差別. 對模擬結果進行多次重復試驗, 結果均與表1和表2的結論一致.