劉子健, 桂尚珂, 陳 碩, 楊 凱, 金虹橋
(長春工業大學 數學與統計學院, 長春 130012)
整數值時間序列廣泛應用于通信保障、醫療衛生、保險精算等領域. Al-Osh等[1]提出了一階整數值自回歸模型; 對于取值范圍無上限的相依計數數據, Du等[2]提出了p階整數值自回歸模型, 即INAR(p)模型; Neal等[3]和張哲等[4]先后研究了該類模型的估計問題; 對于有上限的整數值時間序列, 例如某個城市的失業人口數等, McKenzie[5]提出了一階整數值二項自回歸模型, 即BAR(1)模型; Weiβ[6]研究了BAR(1)模型的性質并將其推廣到高階情形.

定義1設{Xt}是非負整數集上的時間序列, 若

(1)

設{Dt}是一個隨機變量, 且與{Xt-l}l≥1獨立, 滿足P(Dt=1)=1-P(Dt=0)=p, 即Dt~B(1,p), 則MBAR(1)模型可等價表示為
Xt=Dt·(α1°Xt-1+β1°(n-Xt-1))+(1-Dt)·(α2°Xt-1+β2°(n-Xt-1)).
(2)
由式(2)可知, MBAR(1)過程的轉移概率為

(3)

命題1模型(1)定義的MBAR(1)過程是遍歷的, 且有唯一的平穩分布.
證明: 由模型(1)可知, MBAR(1)過程{Xt}是狀態空間I={0,1,…,n}上的Markov鏈. 由式(3)可知, MBAR(1)過程的轉移概率pk|l恒大于0, 即{Xt}是一個不可約且非周期的Markov鏈. 又因為I是一個有限集合, 故模型(1)是正常返的. 從而MBAR(1)過程是遍歷的, 且存在唯一的平穩分布.
命題2設{Xt}是模型(1)的平穩解, 則對于t≥1, 有:
證明: 只需證明式(7),(8). 首先證明式(7). 由條件方差公式可知,
在平穩意義下, 有Var(Xt)=Var(Xt-1), 于是
其次證明式(8). 直接計算可得
本文采用極大似然法進行參數估計. 設{X1,X2,…,XT}為來自MBAR(1)過程的一組樣本, 令θ=(α1,α2,β1,β2,p)T為待估參數. 則樣本的對數似然函數為

(9)


(10)


(11)
其中θ0為參數真值,I(θ)為Fisher信息陣.
證明: 首先, 需驗證文獻[11]中的條件5.1是否成立:
1) 令(k,l)∈D, 使得pk|l(θ)>0且不依賴于參數θ, 其中D∶=I×I;
2) 每個轉移概率pk|l(θ)在參數空間Θ上都有連續的三階偏導數;

4) 對任意θ∈Θ, 只存在一個遍歷集, 且不存在瞬態.
由于MBAR(1)過程的狀態空間I是一個有限集, 因此對?k,l∈I, 恒有轉移概率pk|l>0, 取D=I, 則條件1)和4)成立; 又由于pk|l是關于θ的多項式, 因此關于參數的偏導到任意階都存在且連續, 則條件2)成立. 此外, 轉移矩陣為不可約的. 不失一般性, 下面假設n>4. 由條件3)可知, 只需找到一個w×w階方陣, 證明其滿秩即可. 通過計算可知, 矩陣
的行列式不為零, 即該矩陣是可逆的, 則條件3)成立. 其中
綜上可知, 文獻[11]中條件5.1成立. 證畢.
本文選取如下兩組不同的參數進行數值模擬, 并取樣本量T=100,300,500,n=50:
(Ⅰ)α1=0.4,α2=0.3,β1=0.3,β2=0.2,p=0.6;
(Ⅱ)α1=0.3,α2=0.2,β1=0.6,β2=0.4,p=0.8.
MBAR(1)模型在(Ⅰ),(Ⅱ)兩種不同參數下樣本量T=100時的樣本路徑分別如圖1(A),(B)所示. 由圖1可見, 兩個序列均為平穩序列. 對于每組參數, 在R軟件環境下進行500次重復實驗, 分別計算其均值、偏差和均方誤差, 模擬結果列于表1. 由表1可見, 在不同參數組合下, 估計的效果都較理想, 且隨著樣本量增大, 估計效果越來越好, 驗證了極大似然估計的相合性.

圖1 兩組參數的樣本路徑Fig.1 Sample paths for two sets of parameters

表1 兩組參數的估計結果
在歐盟成員國中, 歐元價格穩定是根據消費者價格協調指數(HICP)衡量的, 即通貨膨脹率應低于2%. 2009年, 歐盟成員國家數量為n=17. 因此, 應選用一個有上限的整數值模型分析這些歐元區價格穩定國家的數量. 本文選取歐盟統計局發布的17個國家2000—2006年每月的通貨膨脹率(https://appsso.eurostat.ec.europa.eu/nui/show.do?dataset=prc_hicp_manr)作為實驗數據. 對于每個月份t,Xt表示17個國家中通貨膨脹率低于2%的國家數量. 數據的樣本路徑和自相關函數(ACF)如圖2所示. 由圖2可見, 所分析的數據是一個平穩的時間序列. 結合數據實際背景, 分別用BAR(1)模型和MBAR(1)模型對數據進行擬合, 利用極大似然估計法得到BAR(1)模型和MBAR(1)模型的參數估計值, 計算其相應的標準差, 并基于AIC(Akaike information criterion)[12]對兩種模型進行比較, 其中AIC=2k-2ln(L), 這里k為參數個數,L為模型的極大似然函數值, 結果列于表2. 由表2可見, MBAR(1)模型比BAR(1)模型有更小的AIC值, 表明MBAR(1)模型的擬合效果優于BAR(1)模型. 實驗結果表明, 本文提出的模型有一定的應用價值.

圖2 價格穩定國家數量的樣本路徑和自相關函數Fig.2 Sample paths and ACF of number of countries with stable prices

表2 兩類模型擬合結果的比較