賀天宇,王金山
(陸軍軍官學院,合肥 230031)
整值時間序列數據在現實生活中是普遍存在的,如醫院等待就醫的人數、保險公司每月索賠次數、商場中購買某種商品的顧客數等。關于整值時間序列模型的研究成果大多是在經典的“thinning”算子[1]模型的基礎上取得的。然而,Ristic[2]提出了一種基于負二項稀疏算子的一階幾何整值自回歸過程(NGINAR(1)),為整值時間序列模型注入了新元素。
擬似然(quasi-likelihood)法是一種非參數估計方法,由Wedderburn[3]于1974提出的,是廣義最小二乘估計的推廣,有著廣泛的應用[4-5]。近幾年,有部分學者開始嘗試利用該方法對整值時間序列模型的參數估計問題進行研究。Zheng[6]研究了p階隨機系數整值自回歸過程的擬似然估計;Zheng[7]在提出了一階隨機系數整值自回歸過程的同時也研究了其參數的擬似然估計;薄海玲[8]針對INARS(p)模型給出了參數的擬似然估計。但對于NGINAR(1)模型的擬似然估計研究尚屬空白。
本文介紹了NGINAR(1)模型的定義以及一些統計性質,利用擬似然估計法給出了模型參數修正的擬似然估計因子的表達式,并證明了其極限分布的正態性;通過數值實驗,將MQL估計與Yule-Walker估計和CLS估計進行比較。結果顯示,MQL估計在一定程度上較Yule-Walker估計和CLS估計更優。
定義1[2]由過程

對于NGINAR(1)過程,Ristic[2]得出了一些統計特性,為了行文方便,本文以命題的形式列出部分結論:
為了得到模型參數的擬似然估計,首先假設:[H1]{Xt}為NGINAR(1)模型的嚴平穩遍歷解;
設(X1,X2,…,XT)是定義1給出的NGINAR(1)模型的T個樣本值,記λ=α(1+α),則根據命題2有 Vθ(Xt|Xt-1)=Var(Xt|Xt-1)= α(1+ α)Xt-1+= λXt-1+。
下面對參數β=(α,με)'用擬似然法進行估計。記θ=(λ),由命題1有擬似然估計法的標準估計方程:


其中:


其中:

證明 假設 θ已知,令Ft=σ(X0,X1,…,Xt),則對方程組

有:


由鞅差中心極限定理[10]知,當T→∞時類似地有

同理,?k=(k1,k2)∈R2(0,0),有

由Gramner-Wold方法可得,當T→∞時,

其中 T3(θ)=E((X1|X0))。


由Markov不等式,有

其中0<c<∞為常數。

因此,當T→∞時,

對于θ的相合估計,可以通過條件最小二乘法(CLS)[2]得出。
首先,計算出τ=(α,με)的CLS估計。令則=arg minτ(Q(τ))。

考慮模型 Xt=α*Xt-1+εt,圖1給出了當樣本個數 T=500,初值 X0=1時的樣本路徑,其中:(a)α =0.3,με=1;(b)α =0.6,με=0.95。
為了比較不同估計方法的優劣,先借助于Matlab產生相應參數值的樣本隨機數,再分別對產生的樣本值計算參數的CLS估計、Yule-Walker估計和MQL估計,每次模擬均重復500次,并計算出每種估計的經驗偏差(Bias)和標準誤差(SE)。
表1和表2 分別記錄了在選取 α =0.3,με=1 和α =0.6,με=0.95,樣本個數 T=100,200,500,800,1000時不同估計的Bias和SE,并以格式(Bias,SE)記錄。
由表1和表2可見,不同估計方法的Bias和SE均隨著樣本個數的增加而減小,在相同條件下MQL估計較CLS估計和Yule-Walker估計更優。

圖1 樣本路徑

表1 參數估計結果對比I

表2 參數估計結果對比II
本文在分析了NGINAR(1)模型統計特性的基礎上,利用擬似然方法對模型的參數進行了估計,在給出了參數修正的擬似然估計因子的同時也證明了其極限分布的正態性。通過數值仿真實驗證實了參數修正的擬似然估計因子法在參數估計的精度上明顯優于Yule-Walker估計和CLS估計。因此,該方法對提高NGINAR(1)模型參數估計有一定參考價值。
[1]Steutel F,Van Harn K.Discrete analogues of self-decomposability and stability[J].Ann.Probab.1979(7):893-899.
[2]Ristic M M.A new geometric first-order integer-valued autoregressive(NGINAR(1))process[J].Journal of Statistical Planning and Inference,2009,139:2218-2226.
[3]Wedderburn R.Quasi-Likelihood Functions,Generalized Linear Models,and the Gauss-Newton Method[J].Biometrika,1974,61(3):439-447.
[4]Lu J,CHEN Di,ZHOU Wei-xing.Quasi-Likelihood Estimation for GLM with Random Scales[J].Journal of Statistical Planning and Inference,2006,136(2):401-429.
[5]Lin Peisheng.Efficiency of Quasi-Likelihood Estimation for Spatially Correlate Binary Data on LpSpaces[J].Journal of Statistical Planning and Inference,2008,138(6):1528-1541.
[6]Zheng Haitao,Basawa I V,Datta S.First Order Random Coefficient Integer-Valued Autoregressive Processes[J].Journal of Statistical Planning and Inference,2007,137(1):212-229.
[7]Zheng Haitao,Basawa I V,Datta S.Inference for Pth-Order Random Coefficient Integer-Valued Autoregressive Processes[J].Journal of Time Series Analysis,2006,27(3):411-440.
[8]薄海玲,張海祥,張哲.INARS(p)模型的擬似然統計推斷[J].吉林大學學報,2010,48(2):219-225.
[9]Billingsley P.Statistical Inference for Markov Processes[M].Chicago:University of Chicago Press,1961:3-6.
[10]Hall P,Heyde C C.Martingale Limit Theory and Its Application[M].NewYork:Academic Press,1980.
[11]Klimiko L A,Nelson P I.On Conditional Least Squares Estimation for Stochastic Processes[J].The Annals of Statistics,1978,6(3):629-642.