張 戡,李 婷,李凌飛
統計套利策略是通過配對交易,同時做多或者做空價格波動具有相關關系的股票,可以對沖掉大部分的市場風險,從而獲得一個與大盤的走勢相關性比較低的收益,屬于市場無風險中性策略。在當前我國A股市場上,由于投資者普遍采用的基本分析和技術分析具有很高的同質性,導致獲取超額收益的難度不斷加大,而統計套利屬于量化的投資手段,針對股票價格序列波動的錯誤定價建立模型,發掘獲利的機會,在市場有效性程度不高的情況下,可以獲得更高的潛在收益。所以對統計套利策略的研究,具有較強的理論意義和實踐意義。
本文設計的統計套利策略首先通過對能夠反映股票基本面信息的指標對股票池中的股票進行系統聚類,獲得了在內在價值方面相似度較高的股票對;然后針對股票價格序列波動的可預測性再對這些股票組合進行協整檢驗,選擇具有協整關系的股票組合;最后通過構建可行的交易系統計算累計收益率。
實施統計套利策略的關鍵是通過一定的方法尋找到股票價格波動存在高度相關的股票組合,然后對股票價格序列建立交易系統。為了能將選擇股票的基本面分析與量化手段聯系起來,本文對能反映一只股票價格波動和內在價值的指標(一般投資者在選擇股票投資時主要參考的指標),包括年化收益率(最近24個月),市盈率,換手率(%)及beta值等在內的指標進行相似度分類。
假設每個樣品有P個變量,則每個樣品都可以看成是P維空間的一個點,N個樣品就是P維空間的N個點,則樣品i與樣品j之間的距離記為dij。
(1)開始時,每個樣本自成一類,dij為其距離,設類Gi與Gj之間的距離為Dpq,dij大于0。

(2)當滿足Dpq=min dij,將類Gp和 Gq合并成一個新類,記為Gr,則新一類Gk和Gr的距離是:

其中,Xi∈Gk,Xj∈Gr。
重復(1),(2)使元素合并成一個新類,最終結果是,具有最小方差的兩個類合并成一個大類。
考慮到每只股票的各項指標間較可能會存在一定的相關性,所以樣本間的聚類采用馬氏距離:dij=,馬氏距離的優點在于,既可以消除各指標間的相關性干擾,又消除了各指標的量綱。類與類之間的距離采用最小距離方法。由于本文采用聚類分析主要是得到相互之間相似度比較高的兩只或幾只股票,而不是相似性比較高的股票組,所以只采用樹形聚類圖的初次分類結果。
在經過聚類分析得到基本面各指標相關性較高的股票組合后,統計套利策略需要進一步選出股價之間具有長期穩定協同性的股票組合。協整檢驗方法能較好地檢驗多個變量間長期穩定關系。協整可定義為:令xt=(x1t,x2t,…,xNt)'為N×1階列向量,其中每一個元素表示一個時間序列,如果xt每個分量的單整階數都是d,xjt~I(d),j=1、2、… N,存在一個N ×1階列向量 β =(β1、β2、…βn)',( β≠0),使得 xtβ~ I(d-b),則稱x1t、x2t、…、xNt存在(d,b)階協整關系,表示為xt~ CI(d,b)。其中,β 稱為協整向量,β的元素稱為協整參數。
通過協整檢驗的股票對股價序列之間具有相關性,流動性以及價格趨同性,股價變動在長期內會恢復到其均衡值。此時可以假定證券市場為中性,協整選取的股票對具有與市場走勢無關,風險暴露低,波動性小等優點。
本文采取的交易策略是成對交易。成對交易策略是指在買入股價相對低估的股票的同時,做空股價相對高估的股票。為了維持市場的中性頭寸,交易金額比例為1:1(Christian L.Dunis(2011),即買入1元的Y,賣出1元的X,或者賣出1元的Y,買進1元的X,持有至均值回歸時行平倉。
(1)計算兩只股票間的價差

Zt是t時刻股票X,Y的價差,PXt是股票X在時刻t的價格,PYt是股票Y在時刻t的價格,β是X,Y的協整系數。計算樣本外累計收益率時采用樣本內數據得到的協整系數。
(2)確定買入點,賣出點和止損位
由于無法得到真正的離差序列εt,通過通過殘差序列{et}來代替εt。通過OLS可以得到方程PYt=α+βˉ?PXt,由于 Zt=PYt- β ?PXt 等于回歸方程的常數項與殘差項之和,根據OLS估計的假設條件,殘差項的均值為0,所以對價差去中心化后的值就是回歸方程的殘差序列{et}。然后計算殘差序列的標準差σ。當et≥0.75σ時,Y股票股價相對高估,買入1元的X,賣出1元的Y;當et≤-0.75σ時,Y股價相對低估賣出1元的X,買入1元的Y;當et值回到[-0.75σ,0.75σ]區間時,股價波動均值回歸,進行平倉[6]。為了控制風險,當價差超過2倍標準差時進行強制平倉。計算樣本外累計收益率時,采用由樣本內數據得到的標準差。
(3)計算累計收益率
在不考慮交易成本和融資費用的情況下,對每一期的收益我們計算下:

其中,Ret是一次完整交易的收益;PXt是在t時刻做多的價格相對低估的股票在t時期的價格,PXt+1是t+1時期進行平倉時的價格;PYt是在t時刻做空的價格相對高估的股票在t時期的價格,PYt+1是t+1時期進行平倉時的價格。然后對每個股票對樣本周期內的收益相加得到每只股票的累計收益率∑Re t。
本文選取地產、鋼鐵、煤電、銀行和汽車五個同質性較高的行業做實證分析,共計30只股票,利用其2010年1月4日至2011年6月16日351個交易日數據,數據來源為巨靈數據庫。同質性行業內部經營方式相似度高,提供的產品或服務差異小,所以此類行業中的企業的股票價格序列走勢更相似;而異質股票對的協整關系會受到很多外生沖擊的影響,行業間差異就是一個主要的外生沖擊,其中包含不同行業在政策面、消息面乃至基本面上的差異難以在統計套利策略中避免。
為提高實證研究的現實意義與可操作性,針對中國A股市場現行的T+1交易制度,本文選取日交易數據,對2010年1月4日至2010年12月31日股票數據做系統聚類分析和樣本內檢驗,但經過協整檢驗的樣本內數據并不能代表樣本外數據也具有同樣的特性,為了保證其可行性,選擇2011年1月4日至2011年6月16日數據做樣本外檢驗計算累計收益率。
(1)聚類分析指標選取
本文系統聚類選取每股復權后日收盤價、年化收益率(最近24個月)、市盈率、市凈率,這些指標反映了股票內在價值;漲跌幅(%)、換手率(%)、beta值,這三個指標反映了股票交易中的波動及對市場的敏感程度。這些指標可以綜合反映股票在長期內的價格波動情況和價值回歸過程,保證了系統聚類后的股票對具有良好的統計套利特性。
(2)系統聚類結果分析
運用SPSS軟件對韶鋼松山、武鋼股份、寶鋼股份、南鋼股份、鞍鋼股份、安陽鋼鐵這六只股票(編號依次為1、2、3、4、5、6)2010年間面板數據進行系統聚類分析。系統聚類分析中,樣本間的距離計算馬氏距離、小類間距離以離差平方和法計算。首先對樣本數據作Z處理,即標準化,結果見表1:

表1 樣本系統聚類中凝聚狀態
由表1可以看出,六只股票經過四次聚類歸為一個大類,因為所得股票對較多,本文僅選取第一次聚類所得股票對(韶鋼松山,鞍鋼股份)、(寶鋼股份,安陽股份)作為以下分析對象。運用類似方法對其他四個行業內股票進行系統聚類,聚類所得股票對組合見表2。

表2 系統聚類股票組合

銀行行業 (工商銀行,中國銀行)、(招商銀行,交通銀行)
(3)聚類效果的檢驗
分別檢驗經過聚類分析得到的股票組合價格序列的相關性和自成一類股票配對組合價格序列相關性,結果分別見表3和表4:

表3 聚類后股票組合相關系數

表4 自成一類股票對相關系數
通過表3、表4分析得到,同行業中經過聚類分析的屬于同一類的股票組合的相關系數高于兩只自成一類的股票的相關系數,聚類分析起到了優化股票篩選模型的作用。
首先用EViews軟件對韶鋼松山和鞍鋼股份兩只股票股價序列做ADF檢驗。結果顯示:韶鋼松山和鞍鋼股股價序列未差分前ADF統計量分別為-2.668066和-3.451028,而在1%的顯著性水平下臨界值為-3.4592,故在1%的水平下均為非平穩序列;取一階差分后ADF統計量分別為-9.652866和-8.330887,在5%的顯著性水平下小于臨界值-2.8738,故韶鋼松山和鞍鋼股份股價序列均為一階單整的,即它們在一階差分后變為平穩序列。
為了分析韶鋼松山股價(Xt)和鞍鋼股份股價(Yt)之間是否存在協整關系,先做兩變量的回歸,然后檢驗回歸殘差的平穩性。以鞍鋼股份股價(Yt)做被解釋變量,韶鋼松山股價(Xt)為解釋變量,設定回歸模型Yt=α+β*Xt+et,OLS估計結果如表3所示:

表5 回歸結果
在回歸結果中得到回歸系數β的t值為64.77529,大于在0.05的顯著性水平下的臨界值t0.025(240)=1.960,回歸系數β通過顯著性檢驗;在0.01的顯著性水平下F分布臨界值為 F(1,241)=6.63,F=4195.838>F(1,241),說明回歸方程顯著。因此得回歸方程為Yt=-5.048112+1.101227*Xt+et,回歸過程中 EViews會生成回歸殘差序列{et},為檢驗Xt與Yt間長期協整關系,對殘差序列{et}進行單位根檢驗,由于殘差序列均值為0,所以選擇無截距項、無趨勢項ADF檢驗,ADF統計量-4.017843小于在5%顯著性水平下的臨界值-1.9410,表明殘差序列不存在單位根,是平穩序列,說明韶鋼松山股價(Xt)和鞍鋼股份股價(Yt)之間存在協整關系。
同時對鋼鐵行業另一對股票寶鋼股份和安陽股份股價進行ADF檢驗和協整檢驗,發現寶鋼股份和安陽股份股價在未差分前均為非平穩數列,在一階差分后平穩,對這兩只股票做如上回歸,得OLS估計殘差序列ADF統計量為-1.203757,大于在5%的顯著性水平下的臨界值-1.9410,故殘差序列仍為非平穩序列,說明寶鋼股份和安陽股份股價之間不存在協整關系。同理對聚類得到的其他四個行業內股票對進行單位根檢驗和協整分析,得到具有協整關系的股票組合與殘差序列標準差列于表6:

表6 協整關系股票組合殘差序列標準
按照前文提出的交易模型,我們計算了樣本外時期,即2011年1月4日至2011年6月16日期間,在樣本內同行業內通過實證檢驗具有協整關系的股票對和不具有協整關系的股票對的累計收益率。

表7 無協整關系的股票對樣本外累計收益率

表8 協整關系的股票對樣本外累計收益率
表7列示了不具有協整關系的股票對樣本外累計收益率,表8列示了具有協整關系的股票對的樣本外累計收益率。
通過對上述表7和表8的分析可以得到,相對于不具有協整關系的股票對,具有協整關系的股票對在半年內的累計收益明顯偏高,交易機會較多,收益最高的是中潤投資和中茵股份組合收益高達58%,交易機會最多的是萬科和保利組合,高達19次。在每次交易中,不具有協整關系的股票對虧損的次數在總交易次數的比重較大,分別為33%,37.5%,45%,20%,累積的虧損額分別為1.6%,20.6%,6.5%,7.4%;而具有協整關系的股票組合虧損的次數在總交易次數的比重相對較小,分別為25%,10.5%,14.3%,12.5%,28.6%,17%,6%,說明具有協整關系的股票組合波動較小,收益相對穩定。同時也發現,不同的行業,收益也是不一樣的:地產股組合收益最高,分別為58%,33.92%,20%;收益比較穩定的是銀行股,虧損的次數少,虧損率較低;收益比較差的是煤電行業的股票。
(1)統計套利可以較好地捕捉同行業高度相關的兩只股票持續穩定的價格變化,并利用動態的價格偏離贏得交易機會。
(2)具有協整關系的股票對相對于不具有協整關系的股票對具有更穩定和更高的收益,而且由于行業屬性不同,各行業間統計套利策略實施結果呈現差異性和特殊性。
(3)統計套利策略在我國A股市場具有可操作性。目前融資融券業務和股指期貨在我國已經推出,為投資者選擇統計套利策略提供了所必須的市場條件,統計套利策略將有廣闊的發展空間。
[1]A.N.Burgess.A Computational Methodolology for Modelling the Dy?namics of Statistical Arbitrage[J].London Business School,PhDThesis,1999,(10).
[2]Carol Alexander,Anca Dimitriu.Indexing.Cointegration and Equity Market Regimes[J].Financeand Economics,2005,(10).
[3]Capocci.D.p.The Neutrality of Market Neutral Funds[J].Global Fi?nance Journal,2005,(6).
[4]方昊.統計套利的理論模式及應用分析—基于中國封閉式基金市場的檢驗[J].統計與決策,2005,6.
[5]周健.絕對收益策略系列研究—統計套利[R].海通證券研究報告,2010,(9).
[6]高鐵梅.計量經濟分析方法與建模.Eviews應用及實例[M].北京:清華大學出版社2009.