摘要:本文簡要介紹了統計套利的概念,對滬深300股指期貨IFLX0、IFLX1合約,通過ADF和EG兩步法檢驗其平穩性和協整性,利用統計套利的方法發現價差穩定性及變量間長期均衡關系,研究成對交易方法下套利機會存在的可能性。選取2010年4月16日至2011年3月31日滬深300股指期貨合約數據作為研究對象,進行實證分析,計算模型下套利收益。
關鍵詞:統計套利 成對交易 協整檢驗
一、簡介
本文應用滬深300的交易數據完善了對于S. Hogan, R. Jarrow, and M.Warachka提出的衍生品市場的統計套利機會的檢驗。從數理金融的理論方面來講,一個投資組合就是投資者選取的在市場中交易的金融工具的一個集合。在國外有很多的依靠數據挖掘技術而自主交易獲利的交易系統。一些常用的交易策略包括著名的“配對交易”和“套利融合”都被直接應用于股票市場的交易中獲利。這里我們采用歷史數據對“配對交易”獲利的可行性進行深入的探討。
1、金融的簡單發展歷史——從數學家的角度
在1900年,Louis Bachelier 用布朗運動解釋了不同的股票價格的波動。他是第一個對后來被廣泛認可的“隨機游走”理論做出深入探討的學者。可惜的是,他的論文直到1950才在數理金融領域得到認可。
金融學的現代化要追溯到1952年馬科維茨發表的“投資組合選擇”這篇文章。在這篇著名的論文中,馬科維茨對于風險和收益給出了在數學角度上精準的定義——投資的方差和均值。
學術界和實務界曾經為效率市場理論(EMH)進行過一場十分激烈的討論。EMH認為證券的價格能夠在任何時候充分的反映所有于證券有關的信息。這就意味著在一個絕對有效的市場中沒有任何的套利交易機會,一個簡單的例子就是投資者不可能以低于證券價值的價格買到任何的證券,同時也不能以高于證券價值的價格賣出證券。
20世紀60年代,法碼和他的后繼工作者曾經對于EMH理論進行過補充探究。他們指出,證券的價格在市場中是不可以預測的。“隨機游走”理論和20世紀初期的布朗運動理論之間有很大聯系。在半個世紀中,學者們對于有效市場假說進行了大量的實踐檢驗。眾多的實踐結果證明 ,證券的價格在一定程度上是可以預測的。雖然這一結果與有效市場假說相背離,他卻恰恰證明了統計套利機會存在的可能。S.Hogan, R Jarrow 和M. Warachka 為我們演示了一種證明該機會存在的策略,同時他們證明了該機會的存在并不與有效市場假說相背離。
2、無風險套利和統計套利
無風險套利是指某資產未來的現金流量能夠被其他資產組合所完全復制,同時用于復制的組合的價格應該與原資產價格基本一致。因此,無套利條件能夠如下表示:
payoff |Xt-Rt |<TC
其中,Xt是原資產(或資產組合), Rt表示復制資產,TC是指買入復制的組合和賣出原資產Xt (或者買入原資產,賣出復制的組合的反向操作)的凈交易成本。這個一般的關系更是構成了“無風險定價”原理,并通常被用于衍生產品定價,例如,期權、期貨和互換。從這個角度講,Xt -Rt可以被看作是兩個資產間的錯誤定價。
S. Hogan, R. Jarrow和 M. Warachka 對統計套利進行了精確的數學定義:
設初始投入為0的自融資交易策略{x(t):t>0}在t時刻經無風險利率折現后的價值為v(t),如果v(t)滿足:
1) v(t)=0
2) limt→∞E[v(t)]>0
3) limt→∞P(v(t))<0)=0
則稱該交易策略為一個統計套利機會(statistical arbitrage opportunity).
上面四個條件的經濟意義分別是:
1)自融資項目初始投入資金為0;
2)期望收益足夠長時間后是正的;
3)足夠長時間后,發生虧損的概率趨于0;
4)如果在任意有限時間點上,發生虧損的概率都大于0,則要求隨著時間的推移,收益v(t)方差的增加速度能被t控制住.(時間平均方差收斂于0)
按照Hogan等(2004)的假定,v(t)可用下面的過程加以描述:
△v(t)=μ+δtλωt
這里△v(t)表示t-1時刻到t時刻之間交易策略x(t)的價值增值為v(t)-v(t-1),經無風險利率貼現到基期的價值,ωt為標準正態隨機變量.Hogan等(2004)指出,在這個假定的前提下,只要滿足μ>0和λ<0兩個條件,就存在定義2中所描述的統計套利機會.
3、本文實證檢驗理論基礎與數據來源
統計套利的均值回歸策略(Mean-reverting strategies)
這種策略是建立假設條件——股票價格是均值回歸的。因此,如果股票價格超過它的平均價格,它被預計在未來將朝反方向運行。依照該策略,賣出超越市場表現的股票(預期下跌),而買入低于市場表現的股票(預期上漲)。相當于逆向交易(或者動量交易)。相關性較高的股票或其他證券是均值回歸的,即:兩者的相關性可持續,一旦其價格出現背離,則產生套利機會,因為背離將在未來得到糾正。故而統計套利的實際應用,可通過識別相關股票或其他衍生品間的背離,買進表現差的,賣出表現相對好的,當背離得到糾正后,反向平倉。
該論文以滬深300股指期貨的交易數據為基礎,通過配對交易的實踐,來證明在中國的證券交易市場上存在著不用冒任何風險卻可以取得穩定收益的機會。通過恰當的投資組合,投資者可以實現“高賣”和“低買”實現套利。
4、相關方面的研究資料
丁秀玲、華仁海(2007)對大連商品交易所大豆和豆粕期貨價格進行平穩性和協整檢驗,發現兩種期貨價格長期均衡,短期可偏離;但在考慮交易費用的前提下,發現二者套利統計上并不顯著。
吳振翔,陳敏(2007)在Hogan等(2004)的基礎上,采用證偽的方式來驗證市場的有效性:只要有統計套利的存在,就與有效市場假定相違背。利用這種方法,還對我國A股市場的弱有效性加以檢驗,發現我國A股市場弱有效性不成立,存在統計套利。
Oleg Bondarenko(2003)提出了套利機會(SAO,statistical arbitrage opportunity)的概念,與純套利機會不同的是,在保證平均收益為正的條件下,SAO可以有負收益;并將統計套利機會應用于證券資產定價。
Steve Hogan, Robert Jarrow, Melvyn Teo, Mitch Warachka (2004)定義統計套利為可以產生無風險利潤并發現持續異常關系的交易策略。文章介紹了一種檢驗統計套利的方法,并在實證中證明了動量投資和價值投資策略中具有統計套利機會。
Ganapathy Vidyamurthy(2004)提出統計套利是以相對定價為基礎,具有相似特征的股票價格相關,其價差即為錯誤定價,錯誤定價程度越高,這之中具有的套利潛力越大。他將協整方法與統計套利相結合,為配對交易構建了參數化形式。
二、數據的處理
配對標的的協整關系的檢驗:
首先選取當月合約和下月合約每日收盤價進行対數化,檢驗步驟如下:對兩個時間序列進行平穩性檢驗,首先進行ADF檢驗,根據t檢驗值判斷兩序列的單位根存在與否,和平穩性。后用EG檢驗法來確定協整關系。對兩個時間序列進行OLS回歸,得出殘差序列,進行平穩性檢驗。若模型的回歸和單位根檢驗,拒絕原假設,殘差序列也為平穩的。則兩個變量間存在協整關系。
實際檢驗中,取IFLX0和IFLX1每日收盤價(共232個樣本數據)取對數處理進行ADF檢驗,發現不滿足t檢驗值條件,一階差分后結果如下:
然后利用EG兩步法,對DLOGA、DLOGB進行OLS回歸,得殘差項做平穩檢驗,
同樣拒絕原假設,殘差項為平穩的,因而兩個序列間存在協整關系。
三、統計套利的檢驗
1、日線統計套利機會的檢驗
通過對誤差修正模型進行估計,求得在統計套利組合比例為1:0.947995,即價差為Spread=0.947995×IFLX1 - IFLX0。由此比例,可以計算出兩個合約間的對數價差(Spread)時間序列圖和價差中心化時序圖(MSspread=Spread-mean)。
在“Pairs Trading:Quantitative Methods and Analysis”(John WileySons,2005)一書中有詳細介紹,其中介紹了混合正態分布,ARMA模型、隱含 Markov ARMA 模型和非參數方法。書中推薦采用非參數方法。同時,文中通過隨機模擬說明了:假設去均值后的價差波動是一個白噪聲序列,那么最大收益的交易邊界條件是 ±0.75σ。這比較適合作為樣本內數據的設定。為控制交易風險,避免過度波動下,對保證金等交易成本的沖擊,設定超過兩倍標準差時的頭寸為止盈止損點,進行強行平倉。根據VAR思想:假設去中心化的對數價差符合正態分布,則有96%的信心保證其波動幅度不超過1.96倍標準差(即2σ)。
當MSspread低于下觸發點,即<-0.75σ時,買入IFLX1,對應賣空0.947995的IFLX0;同理,當MSspread高于上觸發點,即>0.75σ時,賣出IFLX1,對應買入0.947995的IFLX0合約。
套利頭寸建立后,當價差回歸至±0.75σ區間,即可進行反向操作,完成一次跨期套利。若價差波動幅度過大,為避免風險,當價差超過±2σ的止損區域時,進行平倉操作。
在采用簡化處理的條件下,在2011年4月16日至2011年3月31日的時間中,從文中選擇的數據序列共有39次進入套利區間,其中9次由于波幅過大,超過了兩倍標準差;排除連續超過止損點數據,共有35次交易機會及5次采取強制平倉策略止損。
在232次交易機會中,跨期套利次數占所有交易次數的15.9%。最低交易保證金為合約價值的12%,交易手續費取為0.01%(中金所交易費用0.005%,各期貨公司有所不同),故套利組合每次變動成本為0.04%,而超過上下止損界時的對沖頭寸成本為0.02%。通過計算,在不計算交易成本的前提下,組合收益達到了203.1%,但交易成本也達到了150%(35*0.04%+5*0.02%),由此組合在持有期內收益下降至53.1%,平均套利收益率為1.52%。
2、高頻數據統計套機機會的檢驗
以IF1103和IF1104在2011年2月25日9點15分至15點15分共273組數據為例,做與上文日線交易數據相同的處理和分析。我們得出其中共有118次套利機會,13次超過強制平倉止損位置,如圖。通過計算每分鐘高頻數據可以獲得更高效率的套利時機和投機回報。
四、后續研究完善的方向
頻繁交易帶來的交易成本,手續費等,原模型尚不十分契合高頻套利的實際應用,還應考慮不同標準差倍數和保證金規模對套利組合的影響,本文的研究在統計套利機會的分析方面具有一定指導作用,若要運用到實際中,還需進一步加以研究修正。但協整分析的方法,使得對時間序列價差間波動的把握更為客觀、穩健,有利于在無需市場進行分析的前提下,制定套利策略,從短時間的價差偏離建立對沖組合,從而獲利。
五、結論
經過對簡單的配對交易策略的實證檢驗,我們發現,在中國的證券交易市場上同樣存在這統計套機機會,只要投資組合得當,投資時機把握準確,投資者有可能取得無風險的套利收益。
參考文獻:
1.Fama, E. F. (1965), Random walks in stock market prices, Financial Analysts Journal, 21 (5):55-59.
2.B. G. Malkiel. The efficient market hypothesis and its critics. Working paper (2003)
3.S. Hogan, R. Jarrow, M. Warachka. Statistical arbitrage and tests of market efficiency. (2002)Working paper
4.KUN ZHU. A Statistical Arbitrage Strategy. Master Thesis, Royal Institute of Technology, 2005
5.Hogan, S.R. Jarrow, M. Teo, and M. Warachka. Testing market efficiency using statistical arbitrage with applications to momentum and value trading strategies. Journal of Financial Economics, 2004, 73(3): 525~565
6.大連商品交易所大豆與豆粕期貨價格之間的套利研究《 統計研究 》2007年 24卷 2期 55-59
7.Oleg Bondarenko, Estimation of risk-neutral densities using positive convolution approximation.《Journal of Econometrics》, 2003 1/2
8.中國股票市場弱有效性的統計套利檢驗 2007年 27卷 2期《 系統工程理論與實踐 》92-98
9.統計套利模型研究——基于上證50指數成份股的檢驗韓廣哲 陳守東 2007年 26卷 5期《 數理統計與管理 》908-916
(作者單位:浙江大學竺可楨學院 浙江大學經濟學院)
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文