王彥瑋(上海交通大學 安泰經濟與管理學院,上海 200030)
指數成分股的高頻波動相關性衡量與探究
王彥瑋
(上海交通大學 安泰經濟與管理學院,上海 200030)
以指數的高頻波動率為研究對象,將其從一個嶄新的角度進行了拆解:個股波動維度以及成分股波動相關性維度。按照不同指數走勢的時間區間分類,對波動率的這兩個維度與指數整體波動的相關性和一致性進行了考察及比較,以探究波動率變動的成因。最后,利用這樣的拆解構建了高頻波動率的預測模型,并將該模型的擬合和預測效果和其他模型進行了比較。
高頻波動;個股波動;波動相關性
對資產收益的波動率進行探究是目前金融學術研究的一個重要方向。資產收益的波動性之所以成為目前學界研究的熱點,主要是因為波動率指標在資產定價、資產組合管理、投資風險管理等領域都有著不可取代的重要作用。對于我國資本市場來講,由于金融衍生產品市場的逐步興起、風險管理觀念的成長以及數量化投資方式的發展,金融產品收益率的波動性研究自然日漸成為一個不可忽視的重要課題。
與此同時,隨著計算機技術的普及以及數據存儲技術的發展,很多學者在近年來對金融市場的研究中將研究數據從傳統的日間數據逐步過渡到日內高頻數據。由于采樣更密集、包含的信息更多,相比較傳統的低頻數據時間序列,高頻數據可以更好地發掘金融資產價格的運動規律以及微觀結構,給我們提供更詳盡的數據和信息。
首先,對于高頻的價格數據,在波動率計算方法方面,由于原始數據采取了更密集的采樣頻率,與采用低頻采樣時有所不同。 Andersen和Bollerslev(1998)[1]率先提出了已實現波動率的概念,計算方式為針對秒級別或者分鐘級別的高頻價格序列,求出對應的高頻收益率并進行平方加和。
由于既往研究表明[2-4],已實現波動率的測度方法具有無偏性以及較好的穩健性等優秀的統計特性,在本文中,對日內波動率的計算采用已實現波動率作為波動率測度。一般地,其定義式如式(1)所示:
(1)
其中,RVt為t時間段內的高頻已實現波動率;ri為t時間段內根據采樣的價格序列得出的對應的收益率;n為區間內收益率樣本數。Andersen(2003)[5]證明隨著采樣頻率的增加,已實現波動率會逐步趨近于對應區間的積分波動率,即:
(2)
需要指出的是,在計算收益率的時候,我們采取的是對數收益率,一方面因為其具備更好的統計特性,另一方面因為對數收益率是已實現波動率推導的理論基礎。
目前,學術界對于高頻波動率的測度和預測模型的研究已經較為成熟和充分,但是本文對于波動率的探究會從一個全新的角度進行。本文的研究對象為指數的高頻收益波動情況,而對于計算得出的高頻波動率,將其進一步拆解為兩個維度:成分股波動行為的維度以及成分股之間波動行為相關性的維度。
定性地來看:成分股波動行為維度衡量的是個股各自的波動大小,而成分股之間波動行為相關性維度則是衡量構成指數的成分股的波動行為的一致性和相關性。
舉例來講,當成分股的波動較大、但是個股之間走勢背離較大的時候,由于加權平均,指數層面的總體波動會出現一定的中和作用,往往會出現指數基本保持穩定、整體波動較小;反之,當個股之間的走勢趨于一致的時候,也就是成分股波動相關性維度較大時,指數表現出來的波動也就相對較大。
本文做這樣拆解的目的在于兩點:第一,試圖通過這樣的拆解來探究不同的大盤趨勢下指數波動的成因,即在指數出現較大幅度波動的情況下,分析其內在因素是個股波動還是個股波動相關性因素;第二,通過這樣的拆解來從指數波動率數據中挖掘出更多的有效信息從而構建更好的波動率回歸和預測模型。
所以,將指數波動率進行拆解,其中個股波動率和指標記做sumt,其計算公式定義為式(3):
(3)
其中,ωit為t時間段內成分股i在指數中的權重;σit為在t時間段內個股i的已實現波動率的平方根;n為指數成分股個數。從式(3)可以明顯看出,該指標維度大小衡量的是成分股之間各自獨立的波動行為。
類似地,將波動一致性指標記作rhot,并將其定義為:

(4)
其中,indext為指數在時間段t內的已實現波動率;sumt為時間段t內按照式(3)計算得出的個股波動率和指標。進一步展開式(4)可以得到:

(5)
其中,ρij為成分股i和成分股j之間的波動率相關系數;σit和σjt為在t時間段內個股的波動率;n為指數成分股個數。從式(5)我們較為直觀地做出判斷,rhot指標本質是對成分股之間的波動率相關系數的一個加權平均。當個股之間波動相關系數ρij全部等于1的時候,rhot會等于1;反之,隨著ρij的下降,rhot也會隨之發生下降。通過式(5),也可以發現,該指標衡量的確實是指數成分股之間波動的相關性。
至此,文章完成了對兩個波動維度的量化拆解和定義。下文的主要結構為:第三部分會對指數波動以及兩個分維度進行描述性統計的初步分析;第四部分會使用copula模型對三者之間的關系進行更詳盡的定性探究;第五部分會按照對波動率的拆解結果,嘗試進行回歸以及預測模型的構建;最后一部分簡單總結全文,并進行后續工作的展望。
本文的研究對象為上證50指數及其成分股,所使用的高頻數據均來源于新浪財經,高頻數據的采樣頻率是每3秒一個價格數據。指數成分股的權重等其余數據信息均來源于東方財富choice數據終端,樣本區間覆蓋范圍為2013—2015年的完整三年,區間內共包含727個交易日。其中,為了避免極端數值的影響,實證中將樣本中“光大烏龍指”事件所發生的2013年8月16日對應的指數異常波動時間段去除。
對于所有有效樣本數據,將五分鐘,也就是300秒作為一個考察單位,對于每個考察區間,包含100個價格數據,利用包含在單個考察單位內的所有采樣數據計算五分鐘內的已實現波動率和其對應的兩個波動維度的拆解數據。而對于每個交易日,我們擁有四個小時的交易時間,也就是說每個交易日可以獲得48個波動率數據樣本。
本文基于Matlab2014b,eviews8.0以及excel等平臺開展數據處理和模型構建。
由于在不同的大盤走勢情況下,指數的波動會呈現較大的差異,所以本部分的探討將基于這三種大盤走勢進行分段的探究。圖1是樣本區間內考察對象上證50指數每日收盤價走勢圖。眾所周知,從2014年底開始到2015年年中,A股迎來了一波快速上漲的牛市行情,但是接著出現了一波急劇下跌,三個月內,從接近3 500點的高位跌到2 000點以下。將這樣兩段時間定義為趨勢性上漲和下跌階段,剩下的定義為指數趨勢性波動階段。具體劃分情況見圖1。

圖1 上證50收盤價走勢及時間段劃分
首先,按照前一部分給出的定義,對于波動相關性指標rhot按照一般的認知進行分析。在整個指數呈現趨勢上漲或者下跌的時間區間,由于成分股價格運動的趨勢較為明顯,成分股之間的波動相關性應該較為一致;而在盤整波動階段,由于趨勢性較弱,個股之間走勢分歧較大,相應的波動相關性應該較弱。對于個股波動和維度sumt,在市場出現大幅波動的時間段內,個股的波動也可能顯著提高。所以,我們合理預測,在指數趨勢上漲、下跌以及波動階段,波動性自身大小及其兩個子維度的大小勢必會呈現出不同的統計特性。
為了對指數波動率indext、個股波動和指標sumt以及波動相關性指標rhot有一個總體的認識,將各個指標進行日內平均。定義如下:
(6)
(7)
(8)
圖2和圖3為指數波動情況和其拆解指標在樣本區間內的變動情況。

圖2 指數波動index_day

圖3 波動拆解rho_day以及sum_day
從圖2可以看出,趨勢波動時間段內的指數波動,除去部分極端波動之外,相比較上漲和下跌階段低,而下跌階段的指數波動則遠遠大于其余時間段且極端波動數值較多。
接著觀察拆解為兩個具體維度的圖3。首先,對趨勢上漲區間進行分析。實線所代表的個股波動維度sum_dayt和趨勢波動區間相比沒有顯著差異,即在趨勢上漲中,個股的價格波動行為并沒有發生顯著變化;與此不同的是,可以看到虛線所代表的波動一致性維度rho_dayt顯著高于趨勢波動階段,這個結果與我們之前的預期是一致的。由于趨勢性的存在,使得成分股之間的相關性呈現上升趨勢,即趨勢上漲時間段內指數波動升高的主要原因在于個股之間波動一致性的提高,而非個股波動行為的變動。
但是,趨勢下跌階段情況則不同,個股波動和波動一致性兩個維度都遠遠高于其他兩種階段,兩者的協同作用導致了圖2中所示趨勢下跌階段指數波動的大幅增加,即趨勢下跌階段的指數波動增加是個股行為和成分股相關性提高帶來的協同效應。
為了進一步進行定性的大小比較,表1列出波動率及其兩個拆解維度的描述性統計數據。從偏度值和峰度值我們可以清楚看出分布的尖峰厚尾特性以及典型的右偏性。具體來看,首先,對于整體指數波動指標indext,和圖2中反映的直觀感受是一致的,趨勢下跌階段的波動性顯著較大,而趨勢上漲階段波動性又顯著大于趨勢波動階段。對于相關性維度rhot,三種階段的大小關系與指數波動的大小關系一致。最后,對于個股波動維度sumt,趨勢下跌階段依舊明顯大于另外兩者。

表1 波動率數據描述性統計
注:其中的峰度數據統一為超額峰度數值。
結合圖2、圖3以及表1反映出來的信息,可以得出以下幾點結論:
首先,在股市的趨勢上漲和趨勢下跌階段其高頻波動性會顯著提升,而且在股市下跌中波動性增幅更大,這也反映出金融市場中普遍存在的不對稱性。由于風險厭惡性的存在,相比較上漲,投資者對于下跌所做出的反應更劇烈,恐慌情緒對市場穩定性的破壞也更大。通俗來講,也就是所謂的“殺跌”影響要大于“追漲”影響,從而造成下跌階段中更多的極端波動時間段。
同時,通過對波動性兩個成因的詳細比較我們可以看出,在趨勢上漲階段,個股的波動行為并未出現提升,指數波動性提升的主要原因在于個股之間波動一致性的提升,但是在趨勢下跌階段,個股波動和波動一致性兩個維度均出現了較大程度的提升。
上一部分,初步定性地對指數波動及其兩個維度在不同走勢情況下的表現進行了比較。為了進一步定量地衡量在不同的大盤走勢下,拆解出的兩個維度值和整體的指數波動的相關關系,將采用copula模型來進行定量分析。
copula模型由統計學家Sklar在1959年首次提出,Nelson(2006)首次系統性地總結了copula理論的主要研究成果。
在對變量相關性的探討方面,copula函數可以將多個變量自身的邊緣分布函數和已知的聯合分布情況聯系起來,進而可以通過擬合得出的連接函數計算得出變量之間相關關系的大小。同時,魏平等[6]的研究指出,copula還具有一些優良的性質,比如copula函數在單調遞增變換下可以保持函數以及秩相關性不變性,可以發掘變量之間的相關模式,等等。
張連增等[7]指出,copula模型的構建可以分為三大類,參數法、半參數法以及非參數法。其中,參數法是對于變量的邊際分布以及copula函數形式都做出分布假設并進行擬合;半參數法是不對邊際分布做假設和擬合,直接使用經驗分布,僅僅指定copula連接函數的形式進行擬合;非參數法則是對邊際分布和copula聯合函數都不做假設,直接進行估算。
由于我們的樣本數據往往無法完全符合某種特定分布,所以為了避免在邊緣分布擬合中帶來誤差累積,本文使用的估計方式是半參數估計方法,即不對變量的邊緣分布進行模型假設和擬合,使用變量的經驗分布函數代入。
連接函數方面,在金融領域中對copula函數的使用主要有兩種:橢圓族函數以及阿基米德族函數[6]。其中,橢圓族函數主要包括正態copula以及t-copula,共同點是描述的是對稱關系,而相比較正態copula模型,t-copula模型對于變量的尾部相關性更敏感。阿基米德族函數中主要使用的包括,Gumbel,Clyton,Frank函數。其中,Gumbel函數對于上尾部的權重更大,Clyton對于下尾部權重更大,Frank模型則呈現上下尾部對稱分布。
基于copula模型,對變量之間相關程度的衡量參數主要包括Kendall秩相關系數、Spearman秩相關系數、Gini相關系數以及尾部相關系數等。
對于已知的copula函數C(u,v),令τ為Kendall秩相關系數,定義式如式(9):

(9)
令ρ為Spearman秩相關系數,定義式如式(10):

(10)
令γ為Gini秩相關系數,定義式如式(11):

(11)
與Spearman,Kendall以及Gini這樣的全局相關系數不同的是,尾部相關系數則更多集中關注變量分布的極端情況,上尾和下尾相關系數的定義分別如式(12)、(13)所示:

(12)

(13)
以上定義的五種相關系數為正表示呈現正相關,而數值越接近0,兩者的相關度越小,越接近于1,兩者的相關度則越大。
對indext與thot以及sumt分別進行copula擬合,并計算其相關性,試圖找出在不同趨勢下,這兩個維度對整個指數波動的相關性質。可以預計的是,計算出的相關系數應該都是顯著為正,而系數越接近于1,表明該維度與指數波動的一致性越高。為了保證結果的有效性,將使用不同模型進行擬合,并得出不同的相關系數。所有結果匯總于表2至表4中。

表2 趨勢波動階段copula模型擬合情況

表3 趨勢上漲階段copula模型擬合情況

表4 趨勢下跌階段copula模型擬合情況
注:為了便于比較,兩個維度中較大的指標加粗標注。
結合表中的數據,進行分析。首先,從上下尾部的極端相關性來看,可以看到下尾相關性很大,但是上尾相關性較小。這是因為波動率的右端極端值與其他數值落差較大且數目較小,導致上尾相關性的降低。但是,在波動率較低的區域,數值分布較為集中,所以造成了較大的上下尾不對稱。
對于不同趨勢下的模型數據進行對比分析,整體來講,可以看出,趨勢下跌區間的相關性整體高于其余兩種波動階段,表明存在較為顯著的行情下跌時,兩個維度的解釋性都會得到提高。
接著對三個階段進行內部比較。首先,對于趨勢波動階段,各模型的結論較為一致,即個股波動維度與整個指數波動情況的一致性更高。對于趨勢上漲階段,結論則相反,波動相關性與指數波動性的一致性更好,可以認為波動一致性的變動是指數波動更好的解釋因素,這與在前一部分描述性統計中的觀察結論是一致的。最后,對于趨勢下跌階段,各模型的結論出現了不一致,且兩個因素與整體波動的相關系數差距較小,我們認為這表明兩個因素均存在較大的一致性,即在指數趨勢下跌階段,指數波動的兩個維度均隨著指數波動自身的增長出現了顯著增長,并共同導致了指數波動的大幅增加。
在該部分,文章使用了copula模型對指數波動的兩個解釋維度進行了相關性探究。根據擬合得出的相關性的大小,得出結論:
在指數呈現趨勢波動的時候,指數波動大小變動的主要成因為個股拉動;在指數波動上漲階段,指數波動大小變動的主要因素則是個股波動的相關性變動導致;在指數波動下跌階段,個股行為和成分股波動相關性維度都是重要的成因。
在對拆解出的變量進行了性質分析之后,文章在本部分將試圖將其應用在構建指數波動預測領域。在傳統的波動率預測模型中,最廣為使用的是GARCH模型以及SV模型,但是在低頻領域得到大家廣泛認可的這兩個模型在高頻數據建模領域存在一定的局限性。Andersen等人(2003)[5]發現對已實現波動率取對數后,近似符合正態分布,結合其長記憶性特征提出ARFIMA-Ln(RV)模型;Crosi(2009)[8]基于異質市場理論,提出HAR-RV模型,通過不同時間跨度的已實現波動率的線性擬合來刻畫市場波動信息。目前來講,對于高頻波動率的探究大部分都是以ARFIMA以及HAR-RV兩個模型為基礎進行改進和拓展。
由于相比較ARFIMA模型,HAR-RV模型有更好的經濟學意義,所以本文選取HAR-RV作為波動率預測模型。該模型主要的經濟學意義是通過將不同時間內的波動率來互相疊加。
但是過往的經驗顯示,金融資產的價格并不是一直保持連續的波動,而是存在著跳躍性的價格變動。Merton[9]的研究指出,金融資產的價格在一般情況下會遵循一個連續的路徑運動,但是在異常波動或者重大事件的影響下,會出現不連續的跳躍現象。所以,在傳統的價格隨機變動過程方程的基礎上,需要增加離散跳躍項:
dp(t)=μ(t)dt+σ(t)dw+κ(t)dq(t)
(14)
其中,μ(t)為漂移項,反映價格的均值過程;σ(t)為價格的瞬間波動,存在左極限且右連續;w(t)為標準布朗過程;q(t)是時變強度為λ(t)的計數過程,滿足λ(t)dt=P(dq(t)=1);κ(t)為價格對數序列的跳躍成份,κ(t)=p(t)-p(t-)等式右側前兩項為傳統的價格波動描述。對式(14)做二次變差可以求出實際價格波動率[10]:
(15)


同時,根據過往的研究,由于波動率本身極端值落差較大,所以進行取對數操作之后可以獲得更好的正態分布,從而LNHAR-RV-CJ模型可以獲得更好的預測和擬合特性[13-14]。
于是,仿照常規的LNHAR-RV-CJ模型,嘗試建立高頻波動預測模型,將原模型中的日內波動考察單位改為5分鐘內的波動率,原先的周波動率以日波動率代替,月波動率以周波動率代替。得到的回歸模型如下:

(16)
其中:




續路徑方差各變量定義可類比上述定義。
同時,為了下文的對比工作,同樣對原始的LNHAR-RV模型進行回歸擬合:

(17)



(18)

同時,為了更好地闡述模型的解釋能力,對模型的樣本外預測能力進行考察,而為了測算預測模型的估計效果,引入多個常見的預測效果評估指標:誤差均方根(RMSE)、絕對誤差平均(MAE)、相對誤差絕對值平均(MAPE)以及希爾不等系數(TIC)。分別定義為:

(19)
(20)
(21)


(22)
其中T為樣本容量,n為樣本外預測數目,y^為預測值,yt為真實值。由表達式可以看出,以上四個誤差評判指標越小,說明預測效果越好。

表5 趨勢波動階段模型擬合與預測效果對比
由于在上文的探究中,發現在不同的大盤走勢情況下,各指標與整體波動的相關程度存在顯著差異,所以本部分的擬合和預測會分大盤走勢階段進行。對比模型為LNHAR-RV與LNHAR-RV-CJ,對于趨勢波動、趨勢上漲和趨勢下跌三種階段都采取將樣本數據的90%用作擬合,將剩下的10%用作樣本外預測。為了便于表達,將構造的式(18)模型簡稱為LNHAR-RV-RS模型。

表6 趨勢上漲階段模型擬合與預測效果對比

表7 趨勢下跌階段模型擬合與預測效果對比
注:表5-7中上半部分為擬合結果,下半部分為預測誤差度量,其中***,**,*分別代表擬合系數在1%、5%以及10%的水平下顯著。對于預測模塊,三個模型中表現最好的模型都加粗標注。
結合表5-7中的數據,可以看出LNHAR-RV-RS模型在三個階段預測和擬合效果都是最好的。與預期有落差的是,在高頻領域,LNHAR-RV-CJ模型表現不夠穩定,在趨勢上漲階段的預測中表現甚至不及傳統模型。通過對比各個模型擬合系數的顯著性看出,對于LNHAR-RV-CJ模型,跳躍路徑方差部分除了分鐘數據均較為顯著之外,日度和周度均值都較為不顯著,這也直接影響了該模型的解釋和預測能力。LNHAR-RV-RS模型中兩個維度的拆解在回歸中均顯現出較為理想的顯著性和解釋能力。
對這一差異是這樣理解的:對于波動率數據,其跳躍分量一般出現在較短時間內。長期來講,沖擊效應會很不顯著,對于回歸以及預測的作用也就相對較小。但是對于該拆解方法,由于個股行為維度和相關性維度為兩個對稱的維度,所以這樣的拆解就避免了其中某個變量長期不顯著的問題,構建的模型從而獲得了更好的解釋和預測能力。
本文嘗試對指數波動進行拆解。首先,對拆解的兩個維度和波動率自身進行了初步的描述性統計分析,進一步使用copula模型進行了定量的一致性分析,最后以此為基礎進行了波動率解釋和預測模型的構建。相關結論表明,這樣的拆解不僅可以向我們很好地解釋和闡述不同大盤走勢下指數波動增加的主要成因,也可以給波動率解釋和預測模型的構建帶來更多的有效信息,達到更好的擬合與預測效果,這樣的結果也給對波動率的研究和預測工作帶來了一種嶄新的思路。
以本文現有的工作為基礎,在后續的探究中,還可以設想依據這樣的拆解,對指數的極端波動時間段進行預警或者構建對應的指數買賣策略實現套利。
[ 1 ] ANDERSEN T G, BOLLERSLEV T. Answering the Skeptics: yes, standard volatility models do provide accurate forecasts[J]. International Economic Review, 1998, 39(4):885-905.
[ 2 ] BARNDORFF-NIELSEN O E, GRAVERSEN S E, SHEPHARD N. Power variation and stochastic volatility: a review and some new results[J]. Journal of Applied Probability, 2004, 41(1):133-143.
[ 3 ] KIM C, MARK P. Realized range-based estimation of integrated variance[J]. Journal of Econometrics, 2007, 141(2):323-349.
[ 4 ] 徐正國, 張世英. 多維高頻數據的“已實現”波動建模研究[J]. 系統工程學報, 2006, 21(1):6-11.
[ 5 ] ANDERSENT G, BOLLERSLEV T, DIEBOLD F X, et al. Modeling and forecasting realized volatility[J]. Econometrica, 2003,71(2):579-625.
[ 6 ] 魏平, 劉海生. Copula模型在滬深股市相關性研究中的應用[J]. 數理統計與管理, 2010, 29(5):890-898.
[ 7 ] 張連增,胡祥. Copula的參數與半參數估計方法的比較[J]. 統計研究,2014(2):91-95.
[ 8 ] CORSI F. A simple approximate long-memory model of realized volatility[J]. Social Science Electronic Publishing, 2009, 7(2):174-196.
[ 9 ] MERTON R C. Option pricing when underlying stock returns are discontinuous[J]. Working Papers, 1975, 3(1/2):125-144.
[10] ANDERSEN T G, BOLLERSLEV T, DIEBOLD F X. Roughing it up: including jump components in the measurement, modeling, and forecasting of return volatility[J]. Review of Economics & Statistics, 2007, 89(4):701-720.
[11] HUANG X, TAUCHEN G. The relative contribution of jumps to total price variance[J]. Journal of Financial Econometrics, 2005, 3(4):456-499.
[12] ANDERSEN T G, DOBREV D, SCHAUMBURG E. Jump-robust volatility estimation using nearest neighbor truncation[J]. Journal of Econometrics, 2010, 169(15533):75-93.
[13] ANDERSEN T G, BOLLERSLEV T, DIEBOLD F X, et al. The distribution of realized stock return volatility[J]. Journal of Financial Economics, 2001, 61(1):43-76.
[14] DEO R, HURVICH C, LU Y. Forecasting realized volatility using a long-memory stochastic volatility model: estimation, prediction and seasonal adjustment[J]. Journal of Econometrics, 2003, 131(1/2):29-58.
TheCorrelationofHigh-frequencyVolatilityamongIndexConstituentStocks
WANGYanwei
(Antai College of Economics & Management,Shanghai Jiao Tong University, Shanghai 200030, China)
This paper will study the high-frequency volatility of index from a brand-new perspective. The volatility of index will be decomposed into two separate dimensions-sum of volatility and correlation of volatility. The consistency between these two dimensions and the volatility of index will be checked and demonstrated separately under increasing stage, decreasing stage and fluctuating stage. Finally, this two variables will be applied to construct prediction equation for volatility which will be compared with other prediction models.
high-frequency volatility; sum of volatility; correlation of volatility
F 832
A
2016-12-20
王彥瑋(1992—),男,上海人,金融學碩士,主要研究方向:金融工程。E-mail:atswyw@126.com.
1005-9679(2017)05-0020-08