朱恩文 李偲 李今平 朱安麒 譚薇
(1.長沙理工大學 數學與統計學院,湖南 長沙,410114;2.海南大學 理學院,海南 海口,570228)
我國期貨市場發展較晚,上海燃料油期貨市場21世紀初才出現.然而,隨著改革開放和我國工業的迅速發展,對石油進口的需求日益增加.從地域角度來看,世界兩大基準油價不能體現亞太地區的需求變化,全球原油市場需要一個能夠代表亞洲的期貨基準價來指導當地的原油銷售.此外,燃料油作為石油的一個下游產品,其期貨價格走勢預計會和石油期貨市場價格趨同,這也就意味著我們對燃料油期貨市場風險的計量,在某種程度上可以為石油期貨市場提供一個回避損失的金融工具以做參考.
國外主要石油期貨市場發展很成熟,石油波動率擬合模型多種多樣,風險規避工具也很多[1-11].而我國石油期貨品種很少,燃料油期貨市場推出較晚,缺少相應的風險規避工具.國內學者在捕捉燃料油期貨波動序列特征上,未考慮到燃料油的長記憶性.此外,在度量風險時,他們假定尾部服從正態分布或者t分布或者廣義誤差分布來計算VaR,沒有考慮極端情況的發生,導致與實際情況不符[12-15].
因此,本文將考慮波動率序列中存在的異方差性、尖峰厚尾效應以及長記憶性,并結合極值理論模型,對上海燃料油期貨市場風險進行度量實證研究.
在實踐中我們發現有些金融序列過去的觀測值對未來很長一段時間的觀測值仍具有相依性.雖然這種相依性很小,但仍不能忽略,而且觀察得到波動率序列的自相關函數呈現雙曲線衰減.為了捕捉過去沖擊對于波動序列長期的影響,Bollerslev和Baillie(1996)[16]提出將GARCH模型的差分階數由正整數發展到分數階次的FIGARCH模型:
化簡后得

極值理論方法只對收益序列尾部進行建模,而風險價值的估計只與分布序列的尾部有關.利用高于某個高閾值的極值行為進行建模,檢驗時間序列的極值通常利用POT模型.設X1,X2,…,Xn表示風險或損失的獨立同分布隨機變量序列且具有未知累積分布函數F,令Mn=max{X1,X2,…,Xn}.對極端事件的自然量度是:設定一個閾值u,計算超過閾值u的超出量X-u的分布函數:
根據Pickands的極限定理[17],對于足夠大的閾值u,存在一個正函數β(u),使得上述超出量的分布可以很好地近似于如下的廣義帕累托分布GPD(generalized Pareto distribution):

對于足夠高的閾值u,Fu(y)≈Gξ,β(u)(y).設x=u+y,當x>u時,尾部的損失分布F(x)近似于如下形式:
F(x)=(1-F(u))Gξ,β(u)(y)+F(u).
F(u)的分布函數由經驗分布函數的非參數方法估計:
其中k表示超過閾值u的超出次數.整理得出下面的估計值:

風險價值(VaR)是目前資本市場上最主流的風險測度方法,是在一定的概率水平下,測度某個金融資產組合在特定時間段內最大可能的損失,其表達式為:
Pr(Δp>VaR)=1-α,
其中,Δp為持有期內資產的實際損失,α為給定的置信水平,VaR為給定置信水平下相應的風險價值.
本文把金融市場極端事件考慮其中,認為燃料油期貨的日收益率序列建立GARCH族模型后的標準殘差序列服從極值理論中的廣義帕累托分布(GPD).我們計算得到殘差序列極值理論模型對應的分位數Zα,再結合原始序列擬合GARCH族模型得到的條件標準差σt,可計算持有期內相應的VaR,如下公式所示:
VaR=Pt-1Zασt,
其中Pt-1是前一天期貨的收盤價.
本文選取2004年8月25日到2018年11月2日間中國上海燃料油期貨市場每日收盤價數據,對收集到的期貨市場日收盤價進行處理,得到日對數收益率.令rt=100·ln(pt/pt-1),其中pt為第t天的收盤價數據,pt-1為第t-1天的收盤價數據,則rt即為我們的研究對象日對數收益率.除去閉市期,交易天數共3264天,總共3263個數據.我們選取2018年11月3日到2019年4月1日共100天的數據來做風險回溯檢驗.所有數據均來自東方財富金融choice終端.
我們先了解下期貨收盤價日對數收益率序列有何特征.
從燃料油日對數收益率的時序圖(圖1)可觀察到,日對數收益率序列在某一段時間內波動小(例如從第1300個觀測值到第2000個觀測值之間),某段時間內波動大(例如從第2300個觀測值到第3000個觀測值之間),具有明顯的波動集群性.此外波動序列還存在極端值現象.

圖1 燃料油日對數收益率時序圖
描述性統計分析是對所收集的數據分析其內在規律的一種分析方法,主要包括數據集中趨勢分析、離散程度分析等.為了對數據特征有一個大致的了解,我們對其進行描述性統計分析.
根據數據描述性統計分析表(表1)可知,序列的均值、中位數、最大值、最小值分別為0.0136,0,18.897,-29.79,其中最大值和最小值差距較大,且都不接近均值和中位數.從這幾個統計量的特征看來,序列可能有極端值出現.偏度為-0.940,小于0,該序列是左偏分布.峰度值為26.108,遠大于正態分布的峰度,比正態分布的峰更尖.從上述結果來看,燃料油日對數收益率序列存在極端值,且序列不服從高斯正態分布.

表1 描述性統計分析表
長記憶性通俗來講就是今天發生的事會對將來一直產生影響.如果序列存在長期記憶性,那么認為相距較遠的觀測值對現在仍然產生作用,因此對金融市場收益率序列存在的長記憶性檢驗具有重要意義.傳統的識別長記憶性方法有R/S檢驗法.
從長記憶檢驗結果來看(表2),R/S檢驗顯示原序列具有長記憶特征,因此我們認為原序列存在長期記憶性,即相距很遠的觀測值之間也會存在相關性.

表2 長記憶性檢驗
通過對原始序列建立FIGARCH模型,我們過濾出近似獨立同分布的殘差序列,然后應用極值理論知識對提取的殘差序列擬合POT模型,對其進行風險測度.
上述均值超越函數圖(圖2)斜率正負符號發生改變的點是我們所關注的地方.圖形有向上傾斜表明序列存在厚尾現象,尤其是超過u0并且有正斜率的直線是尾部帕累托行為的標志.

圖2 均值超越函數圖
從圖3可知,當閾值在2以下時,選取不同的閾值對分位數的計算沒有很大影響,在一定范圍內,閾值的選取與分位數的值具有較好的穩定性.而傳統的極值理論BMM模型,其分位數值的計算與樣本子區間的劃分有很大關系,這也進一步說明了POT模型的優勢.

圖3 閾值與分位數關系圖
本小節選取FIGARCH和GARCH模型來擬合燃料油波動序列,并提取擬合模型的殘差序列,對其進行極值理論分析,得到相應擬合參數估計結果.
上小節我們知道極值理論POT模型在一定區間范圍內,選取不同閾值對分位數影響不太大.這里我們對兩個模型選取一樣的閾值.

表3 參數估計結果
運用極值理論計算分位數時,是用經驗分布去估計總體分布,從而不需要對總體分布做出任何假設,這也是極值理論的一大優勢.如果假定的總體分布有誤,會影響模型擬合精度.在這一小節我們將基于給定模型來預測樣本外100天的VaR值,將計算得到的樣本外100個觀測值的每日VaR值與實際損益進行比較,然后通過Kupiec(1995)風險回溯檢驗方法[18],來對各模型預測風險的準確性做一個評估,看哪一個模型在度量燃料油期貨市場的風險價值方面表現更好.
Kupiec回溯檢驗的主要思想是估計觀測到的損失大于VaR值的概率, 這可用來檢驗基于模型的VaR估計的準確性.我們對以下兩種模型進行失敗率回溯檢驗.
從Kupiec回溯檢驗結果可知,FIGARCH-EVT比GARCH-EVT模型在5%,1%的置信水平更接近于實際失敗天數,且失敗天數更少.故能捕捉長記憶性的FIGARCH-EVT模型在度量上海然燃料油期貨市場的風險上表現更佳.

表4 失敗率檢驗
本文就上海燃料油期貨市場的價格波動進行研究,考慮了價格波動對我國燃料油期貨市場帶來的風險,并通過將時間序列模型與極值理論分析相結合的規范方法對價格波動風險進行度量.金融序列常用GARCH模型捕捉序列波動,本文通過對數據進行長記憶性檢驗得知,燃料油期貨市場具有長記憶性.對比結果發現,引入能捕捉長記憶性的FIGARCH模型后能更好地度量風險.此外,本文結合了能考慮極端情況發生的極值理論模型,與傳統風險度量模型不同的是,極值理論不需要對原始序列分布做出任何假設.實證結果表明本文選取的模型有效,能很好地規避風險,這可為那些金融市場參與者提供一種規避風險的工具,以便更好地辨識和預防損失的發生.