中圖分類號:O212.1 文獻標志碼:A 文章編號:1671-5489(2025)04-1039-12
Z -Valued Taylor-Schwert GARCH Model Based on Poisson Distribution
LIU Sibo,YANG Kai,DONG Xiaogang,XU Yue (Schoolof Mathematics and Statistics,Changchun University of Technology,Changchun 130ol2,China)
Abstract: Aiming at the modeling problem of Z -valued time series data with volatility,we proposed a Z -valued Taylor-Schwert generalized autoregressive conditional heteroscedasticity model based on Poisson distribution. Firstly,some statistical properties of the model were derived. Secondly,the unknown parameters in the model were estimated by using the condition maximum likelihood estimation method,and the asymptotic properties of estimators were proved. Thirdly, numerical simulations were conducted to demonstrate the performance of the estimation method. Finally,a real daily stock return data was considered,and the superiority of the proposed model over existing models was proved through analysis of the fitting results of the data.
Keywords: Z -valued time series; GARCH model; condition maximum likelihood estimation; heteroscedasticity
0引言
時間序列是指將同一統計指標的數值按其發生的時間先后順序排列而成的數列,時間序列分析的主要目的是根據已有的歷史數據對未來進行預測.時間序列在氣象學、股票市場和交通運輸等領域應用廣泛.但在金融市場的時間序列應用中,存在無法直接觀測到的波動率,即金融時間序列呈現出異方差性,這種現象在外匯匯率、股票收益率及期貨價格等數據中尤其顯著.為利用統計學原理對具有異方差性的時間序列進行描述、分析和預測,目前已提出了多種時間序列模型.Engle[1]通過引入自回歸條件異方差(ARCH)模型解釋了收益與波動率之間的關系.Bollerslev[2在此基礎上提出了廣義自回歸條件異方差(GARCH)模型,并對ARCH模型的條件進行了進一步拓展.Ferland等[3提出了整數值廣義自回歸條件異方差(INGARCH)模型,定義為
其中: α0gt;0 , αi?0 , βj?0 ,i=1,2,…,p, j=1,2,…,q , p?1 , q?0 ; Ft-1 是由 {Xt-1,Xt-2,…} 生成的σ 域.當INGARCH模型中 q=0 時,即為整數值自回歸條件異方差(INARCH)模型.Neumann[4驗證了INGARCH模型的遍歷性質.在上述研究的基礎上,文獻[5-1O]對 INGARCH模型進行了拓展.
在針對金融時間序列的基礎研究中,除序列的異方差性,Black[11]研究表明,金融時間序列存在著杠桿效應,即股票的條件波動率對正負沖擊的反應是不對稱的,即波動率更傾向于在負沖擊下上升.Ding 等[12]研究了股票市場收益的長記憶性,并構造了一類通用的一般模型,即非對稱冪次自回歸條件異方差(APARCH)模型,定義為
其中: α0gt;0 , αi?0 , βj?0 , |γi|?1 ,i=1,2,…,p, j=1,2,…,q : δ?0 .這類模型表明絕對收益之間的相關性遠大于收益本身,且絕對收益的冪變換對長期滯后也具有很高的自相關性.Ding 等[13]討論了絕對收益的一些性質.He等[14]對 APARCH模型的性質進行了全面分析.在上述研究的基礎上,文獻[15-16]對APARCH模型進行了拓展.
上述整數值時間序列模型都是針對非負數據提出的,但在實際應用中,還存在同時包含正負值的整數值時間序列,這類整數值時間序列稱為 Z 值時間序列.文獻[17-18]提出了多種形式的SkellamGARCH模型建模這類數據,SkellamGARCH模型是通過將兩個隨機變量序列相減構造Z值時間序列模型.考慮到在實際數據分析中,許多Z值時間序列的正負概率出現比例接近0.5,即在這些序列中,正值和負值的出現頻率大致相等.為更好地捕捉這種特性, Hu[19] 提出了Poisson Z 值GJR(Glosten-Jagannathan-Runkle)-GARCH(PZG)模型,定義為
其中: ωgt;0 ; |γ|?1 : αi?0 , βj?0 , i=1,2,…,P,j=1,2,…,q , p?1 , q?0 .該模型在 Z 值時間序列的構造上與 SkellamGARCH模型不同,在PZG模型中,通過將一個等概率0.5取值在1和-1上的獨立同分布的二項隨機變量序列 Zt 與一個以Poisson分布作為條件分布的隨機變量序列 ?Yt 相乘,進而構造出 Z 值時間序列模型.在此基礎上, Xu 等[2°將PZG模型的條件分布推廣至幾何分布,提出了幾何Z值GJR-GARCH(GZG)模型,由于幾何分布比 Poisson 分布更靈活,因此該模型在實際應用中比 PZG 模型性能更好.注意到GZG 模型中用到的GJR-GARCH 模型實際上是 APARCH 模型[12]當δ=2 時的情形.
本文考慮APARCH模型當 δ=1 且 γi=0 時的情形,即Taylor-Schwert廣義自回歸條件異方差(TS-GARCH)模型[21-22],定義為
其中 α0gt;0 , αi?0 , βj?0 , i=1,2,…,P ,j=1,2,…,q, p?1 , q?0 .首先,以等概率0.5在1和—1上取值,采用通過乘積構造 Z 值時間序列的方法,將Poisson分布作為條件分布,提出基于Poisson分布的 Z 值TS-GARCH模型,并且給出一些基本概率性質.其次,利用條件極大似然估計(CMLE)方法估計參數,討論其漸近正態性,并進一步給出相應的數值模擬以說明CMLE的優良性能.最后,應用新模型擬合一組實際數據,并將其與已有模型進行對比,以說明新模型的優越性.
1Poisson Z值 Taylor-Schwert GARCH 模型
1. 1 模型建立
定義1若Z值時間序列 {Xt , t∈Z} 滿足以下方程:
則 {Xt , t∈Z} 稱為Poisson Z 值Taylor-Schwert廣義自回歸條件異方差模型,記為PZTSG 模型,其中: {Zt , t∈Z} 是一個獨立同分布的隨機變量序列,分布函數為 {Yt , t∈Z} 是一列服從Poisson分布的隨機變量,取值為 0,1,2,…;P(λt) 是參數為 λt 的Poisson分布; {Xt , t∈Z} 是一列 Z 值時間序列,且 Ft-1 為 {Xt-1,Xt-2,…} 生成的 σ 域; ωgt;0 , α?0 , β?0 ;{Zt} 獨立于 {Yt}
1. 2 模型的概率統計性質
對于 Yt|Ft-1~P(λt) , {Yt} 的概率分布列為
則可得 {Xt} 的條件概率分布列為
由于 是獨立同分布序列且 {Zt} 獨立于 Ft-1 ,因此可得 {X,} 的條件均值和條件方差分別為
Var(Xι∣Ft-1)=E(Xι2∣Ft-1)=E(Zι2)E(Yι2∣Ft-1)=E(Yι2∣Ft-1)=λι2+λι.
顯然
且
注意到PZTSG 模型可以描述一個取值關于O對稱的 Z 值時間序列,因此 {Xt} 的協方差函數為
根據式(1)可知過程 {Xt} 是一階平穩的.
定理1過程 {Xt} 二階平穩的充分必要條件為 0?α+β?1
證明:由
E(Xt2∣Ft-1)=E(Zt2Yt2∣Ft-1)=E(Zt2)E(Yt2∣Ft-1)=E(Yt2∣Ft-1),
根據重期望公式,有
故該證明等價于找到 {Yt , t∈Z} 的二階平穩條件.此時,
Yι∣Ft-1~P(λι),λι=ω+α∣Xt-1∣+βλt-1=ω+αYt-1+βλt-1,
從而由文獻[3]中命題1可知,當 0?α+βlt;1 時,有 E(Yt2)lt;∞ ,即 E(Xt2)lt;∞ ,證畢
2參數估計
首先,討論PZTSG模型參數的CMLE.令參數向量 θ=(ω,α,β)T .定義 Θ 為參數空間, ΘCM= [M1,M2]×[0,1)2 ,這里 M1 和 M2 是兩個正的常數.參數真值未知,記作 θ0=(ω0,α0,β0)?T .假設有一列樣本量為 n 的觀測值 X1,X2,…,Xn ,根據文獻[23]中注1.1,初始值的選擇不會影響CMLE的漸近性質,所以可以預設初始值
對 θ∈Θ 且 t=1,2,…,n ,可將 定義為
其條件對數似然函數為
這里忽略了常數項 !).參數 θ 的條件極大似然估計
可通過極大化式(2)得到,即
為建立參數估計量的大樣本性質,用 λt(θ) 近似 ,所以
的近似為
條件對數似然函數的一階導數為
二階導數為
對于 θ=(ω,α,β)T ,由定義 λt=ω+α∣Xt-1∣+βλt-1 ,對 t∈Z ,有
對式(3)兩端取條件均值,則有
同理有
所以
下面給出估計量 的強相合性和漸近正態性.
假設1 PZTSG 模型的解是嚴平穩遍歷的
假設2 Θ 是緊的,且 ,其中
表示 Θ 的內點構成的集合.
假設3令 Aθ(z)=αz , Bθ(z)=1-βz : Aθ0(z) 和 Bθ0(z) 沒有公共根,此外,對所有在 Θ 中的 θ ,Bθ(z) 的根在單位圓外,即 βlt;1 :
假設4 存在某個 εgt;0 ,使得 Eθ0[∣Xt∣4+ε]lt;∞
定理2在假設 1~ 假設4下,當 n∞ 時, 幾乎處處收斂于 θ0 ·
證明:證明方法主要基于文獻[23],同時參照文獻[20]中定理3的證明過程和思路.將 λt(θ) 重新寫成向量的形式:
其中
令 ξ 和 K 是常數且在不同之處取不同值, 0lt;ξlt;1 , Kgt;0
下面逐一驗證以下結果:
(i) =Oa.s.;(ii) E(lt(θ)) 在 θ 上是連續的;(iii)存在 t∈Z ,使得 λt(θ)=λt(θ0) a. ∴?θ=θ0 ;(iv)對任何
均有一個鄰域 V(θ) ,使得
首先,證明(i).通過 λt(θ) 的向量形式,有
令 是一個通過用
代替 λι-i(θ) 中的 λt-i(θ) 得到的向量,
是用初始值代替 Xo 得到的向量,則有
從而對所有的 Ψt ,可得幾乎處處有
所以
由 ,當 n∞ 時,有
由Cesaro引理可知極限幾乎處處成立,此外觀測值 a.s.[23].
其次,證明(ii).對任意的 θ∈Θ ,令 Vη(θ)=B(θ,η) 是一個中心在 θ 、半徑為 η 的開球
則當 η-0 時,有
再次,證明(ii).利用Jensen不等式,有
當在 σ 域 Ft-1 中有 (0)e2=1a.s.時,上述不等式成立,即0=00。
最后,(iv)的證明與文獻[23]類似,故略.證畢.
定理3 在假設 1~ 假設4下,當 n∞ 時,有
其中
且 H 和 是正定的.
定理3的證明可參見文獻[20]的附錄A.6和A.7.
3 數值模擬
下面考察CMLE在有限樣本下的性能.選取如下3組不同的參數真值進行數值模擬,在R軟件環境下進行1000次重復實驗,分別取樣本量 n 為200,500,800.
第一組參數: (ω0,α0,β0)T=(0,2,0.5,0.4)T :
第二組參數: (ω0,α0,β0)T=(1,0,2,0.6)T :
第三組參數: (ω0,α0,β0)T=(4,0,3,0,15)T
模型在上述3組參數下的樣本路徑和自相關函數(ACF)分別如圖 1~ 圖3所示,其中樣本量(204 n=200
Fig.1Sample path diagram and ACF diagram under the first set of parameters
Fig.2Sample path diagram and ACF diagram under the second set of parameters
由圖1~圖3可見,3個序列均為平穩序列.對于每個參數組合,分別計算其偏差 和均方誤差(MSE)
,其中 Ψm 是重復次數.模擬結果列于表1.由表1可見,隨著樣本量的增大,估計值的偏差和均方誤差均逐漸減小,且估計值逐漸收斂于真實值,表明估計的效果越來越好,同時驗證了條件極大似然估計的相合性.
4實例分析
下面用模型擬合實際數據.考慮中證500ETF從2022年3月15日到2023年6月7日的每日股票收益率,共有310個觀測值,其中正負值各有150個,零值有10個.正負值出現的概率約為0.48,接近于0.5,且該數據均值為-0.3290接近于零,大致符合PZTSG 模型所刻畫的正負值出現概率接近0.5這一數據特征.為保證數據是一系列整數值數據,本文未對收益取對數,而是將這些收益除以10美分.圖4給出了該數據集的整數值收益序列圖和ACF圖.由圖4(A)可見,收益率的整數值序列是一個平穩時間序列;由圖4(B)可知收益率是相關的,如圖4(C)和(D)所示.由于絕對收益和平方收益在小滯后階數時具有顯著的樣本相關性,因此這些收益序列以波動率聚類的形式存在依賴關系.
本文將 PZTSG 模型與 PZG(1,1)模型[19]和 Skellam GARCH類模型中的一階對稱 Skellam 整數值廣義自回歸條件異方差(SS-INGARCH(1,1))模型[17-18]進行比較,分別用這3個模型擬合數據.表2列出了上述3個模型的參數估計結果以及赤池信息量準則(AIC)和 Bayes信息量準則(BIC)的值.由表2可見, α 的估計值明顯小于 β :在PZTSG模型中,過去收益的影響取決于參數 α ,過去波動率的影響取決于參數 β. ,參數估計結果表明,目前的波動率更多取決于過去的波動率而非過去的收益.根據
3個模型的AIC 值和BIC值可見,PZTSG 模型的AIC 和BIC均較小,因此PZTSG模型擬合效果相對較好.
下面對3個模型進行診斷,即考慮Pearson殘差:
圖5為3個擬合模型下Pearson殘差的路徑圖、ACF圖和偏自相關函數(PACF)圖.其中, {et} 是根據
Fig.5Path diagrams, ACF diagrams and PACF diagrams of Pearson residuals based on three fiting mo條件極大似然估計結果按照式(3)計算得出的.根據文獻「24-26]可知,殘差序列 et 無顯著的自相關性,是一個充分模型的重要指標.由圖5的時序圖可見,殘差序列都沒有顯著的趨勢,說明殘差序列是平穩的,并且ACF和PACF圖也均無顯著的自相關,說明3個擬合模型的殘差序列均為白噪聲.對于PZTSG模型,將LB(Ljung-Box)檢驗應用于時間滯后 1~12 階的殘差序列,對每個滯后階數,計算LB統計量和相應的 p 值,結果列于表3.由表3可見,所有的 p 值都大于0.O5,證實PZTSG 模型擬合后的殘差序列為白噪聲.
圖6為基于3個擬合模型的Pearson殘差直方圖、核密度圖和正態Q-Q圖.由圖6可見,PZTSG模型對數據擬合后殘差序列的分布情況更接近正態分布,說明 PZTSG 模型對數據擬合的效果更好.進一步,計算3個殘差序列的均值和方差,結果列于表4.由表4可見,PZTSG模型殘差序列的均值
).0339更接近0,方差1.1730更接近1,表明相較于其他兩個模型,PZTSG模型擬合效果更女
綜上所述,本文提出了一個基于Poisson 分布的Z值Taylor-Schwert廣義自回歸條件異方差模型,用于分析Z值時間序列數據,給出了該模型的一些統計性質,并利用CMLE估計參數給出了其漸近性質.通過數值模擬研究,驗證了CMLE在參數估計中的優越性能.此外,還通過一個真實案例展示了PZTSG 模型在描述收益序列中所反映的波動性聚集方面的能力,比較了PZTSG 模型、PZG(1,1)模型和 SS-INGARCH(1,1)模型的擬合效果,AIC和BIC值的比較以及殘差序列的分析結果表明,PZTSG 模型擬合效果更好.本文使用了ACF、PACF、LB檢驗、直方圖、核密度圖和正態Q-Q圖等統計方法評估模型的擬合度和殘差序列的正態性,結果表明,PZTSG 模型的殘差序列均值更接近O,方差更接近1,說明其擬合效果優于PZG(1,1)模型和SS-INGARCH(1,1)模型.
對于PZTSG模型,本文使用Poisson分布作為條件分布,也可以嘗試將幾何分布或二項分布作為條件分布,可能會比PZTSG模型性能更好.此外,本文在構造Z值時間序列時,等概率取正負值.但考慮到存在其他類型的數據,其正負值的比例并不一定為0.5,因此在后續研究中,可嘗試引入一般化的正負值比例,將使模型能更好地適應多種數據類型,從而增強其普遍性和適用性.
參考文獻
[1]ENGLERF.Autoregressve Conditional Heteroscedasticitywith Estimates of the Variance of United Kingdom Inflation[J]. Econometrica,1982,50(4): 987-1007.
[2] BOLLERSLEV T. Generalized Autoregressive Conditional Heteroscedasticity [J]. Journal of Econometrics, 1986,31(3):307-327.
[3] FERLAND R,LATOUR A,ORAICHI D. Integer-Valued GARCH Process [J]. Journal of Time Series Analysis,2006,27(6):923-942.
[4]NEUMANN M H. Absolute Regularity and Ergodicity of Poisson Count Processs [J]. Bernouli, 2011,17(4): 1268-1284.
[5]LIU Z W,LIQ,ZHUFK. Random Environment Binomial Thinning Integer-Valued Autoregressive Process with Poisson or Geometric Marginal[J].Brazilian Journal of Probability and Statistics,2020,34(2):251-272.
[6] XIONG L Y,ZHU FK.Robust Quasi-likelihood Estimation for the Negative Binomial Integer-Valued GARCH(1,1) Model with an Application to Transaction Counts [J]. Journalof Statistical Planning and Inference, 2019,203:178-198.
[7]XIONG L Y,ZHU F K. Minimum Density Power Divergence Estimator for Negative Binomial Integer-Valued GARCH Models [J]. Communications in Mathematics and Statistics,2022,10(2): 233-261.
[8] ZHU F K. Zero-Inflated Poisson and Negative Binomial Integer-Valued GARCH Models[J].Journal of Statistical Planning and Inference,2012,142(4):826-839.
[9] GONCALVES E,MENDES-LOPES N, SILVA F. Zero-Inflated Compound Poisson Distributions in IntegerValued GARCH Models [J]. Statistics,2016,50(3): 558-578.
[10]LEE S,LEE Y,CHEN C W S. Parameter Change Test for Zero-Inflated Generalized Poisson Autoregressive Models [J]. Statistics,2016,50(3):540-557.
[11] BLACK F. Studies of Stock Price Volatility Changes [C]/Proceedings of the 1976 Meeting of the Business and Economic Statistics Section. Washington D.C.: American Statistical Association,1976:177-181.
[12] DING Z X, GRANGER C W J, ENGLE R F. A Long Memory Property of Stock Market Returns and a New Model[J]. Journalof Empirical Finance,1993,1(1):83-106.
[13]DING Z X, GRANGER C W J. Modeling Volatility Persistence of Speculative Returns: A New Approach [J]. Journal of Econometrics,1996,73(1):185-215.
[14] HEC L,TERASVIRTA T. Properties of Moments of a Family of GARCH Processes [J]. Journal of Econometrics,1999,92(1):173-192.
[15] DIAMANDIS P F,DRAKOS A A,KOURETAS G P,et al. Value-at-Risk for Long and Short Trading Positions:Evidence from Developed and Emerging Equity Markets [J]. International Review of Financial Analysis,2011,20(3):165-176.
[16]CARVALHO M M, SAFADI T. Risk Analysis in the Brazilian Stock Market: Copula-APARCH Modeling for Value-at-Risk [J]. Journal of Applied Statistics,2022,49(6):1598-1610.
[17] ALOMANI G A, ALZAID A A, OMAIR M A. A Skellam INGARCH Model [J]. Brazilian Journal of Probability and Statistics,2018,32(1):200-214.
[18] CUI Y,LI Q, ZHU F K. Modeling Z-Valued Time Series Based on New Versions of the Skellm INGARCH Model [J]. Brazilian Journal of Probability and Statistics,2O21,35(2): 293-314.
[19] HU XF.Volatility Estimation for Integer-Valued Financial Time Series [D]. Evanston,IL,USA: Northwestern University,2016.
[20] XU Y,ZHU F K. A New GJR-GARCH Model for Z-Valued Time Series [J]. Journal of Time Series Analysis, 2022,43(3):490-500.
[21] TAYLOR S. Modelling Financial Time Series [M]. New York:John Wiley amp; Sons,1986:1-264.
[22] SCHWERT G W. Stock Volatility and the Crash of'87 [J]. The Review of Financial Studies,1990,3(1): 77-102.
[23] FRANCQ C, ZAKOiAN J M. Maximum Likelihood Estimation of Pure GARCH and ARMA-GARCH Processes [J].Bernoulli,2004,10(4):605-637.
[24]JUNG R C,TREMAYNE A R. Useful Models for Time Series of Counts or Simply Wrong Ones?[J]. AStA Advances in Statistical Analysis,2011,95(1):59-91.
[25]KANG Y,WANG D H,YANG K. A New INAR(1) Process with Bounded Support for Counts Showing Equidispersion, Underdispersion and Overdispersion [J]. Statistical Papers,2019,62(2): 745-767.
[26] YANG K,LI H,WANG D H,et al. Random Coefcients Integer-Valued Threshold Autoregressve Processes Driven by Logistic Regression [J]. AStA Advances in Statistical Analysis,2021,105(4): 533-557.
(責任編輯:趙立芹)