李 倫
(華東政法大學商學院,上海 201620)
統計套利策略是國外市場上較為成熟的策略,廣泛運用于股票、期貨以及外匯的交易之中。期貨中的跨期套利策略就是統計套利策略在期貨方面應用的代表。統計套利策略20世紀80年代最早由Morgan Stanley的Nunzio Tartaglia研發并投入使用,取得了巨大的成功,當時主要應用于股票領域。統計套利策略的實施過程首先需要找到兩種走勢相近的資產構建價差組合并要求其價差是一個平穩過程,具有均值回復的屬性,在價差偏離均值一定距離時對價差進行交易并預期價差將會回到均值附近從而獲利。不同到期日的股指期貨合約都以滬深300指數為標的,具有實施統計套利策略的先天優勢。近年來,隨著我國股指期貨市場的逐漸活躍以及網絡技術的改善,統計套利策略的競爭也進入了分鐘級別,成為高頻交易商的最愛。
關于統計套利實施方法的研究主要包括以下三個方面:①距離方法:Gatev et al.(2006)應用該方法對1962~2002年間的股票市場日數據進行了檢驗,結果表明年化收益率達到了11%。距離方法的好處在于簡單易用并且不需要任何估計,但其不足之處在于無法保證價差序列的平穩性,忽視了價差過程的動態性。②協整方法:Vidyamurthy(2004)對于協整方法做了較為詳細的論述;仇中群,程希駿(2008)應用協整方法分析股指期貨1分鐘高頻仿真交易數據,發現協整方法在股指期貨的跨期套利中具有一定的盈利空間。③隨機價差方法:Elliot et al.(2005)從價差服從vasicek過程為前提,推導得出交易信號的確立機制。
本文主要對仇中群,程希駿(2008)基于協整方法的跨期套利策略做出改進,構建一個基于Z-score的更加具有可行性的交易策略。
仇中群,程希駿 (2008)判斷協整關系的方法屬于Engle-Granger兩步法,其方法可表述如下:
假設有兩時間序列Yt和Zt。
①估計Yt=α1+β1Zt+e1t或者Zt=α2+β2Yt+e2t。
②對e1t或者e2t進行單位根檢驗。
如果e1t或者e2t為不含單位根的平穩序列,則Yt和Zt存在協整關系。
仇中群,程希駿(2008)在進行檢驗時使用了IF0806和IF0807兩張合約在08-05-19到08-05-21內共816分鐘的一分鐘對數價格。對第101~700分鐘的數據進行估計之后得到lnF2=0.8490250108lnF1+1.331246397+resid1。假設前600分鐘的協整關系在第701~800分鐘仍然延續,取resid2=lnF2-0.8490250108lnF1-1.331246397,可認為resid2和resid1具有相同分布,且都是均值為0的白噪聲。令resid3=resid2/var(resid1)作為交易信號衡量價差偏離協整關系的程度。
交易策略可以表述為當resid3的絕對值超過1再回落到1時開倉;開倉后當resid3回落到0時平倉;開倉后當resid3的絕對值超過2時止損出場,避免價差偏離協整關系過遠而導致賬戶爆倉。為了與后面基于Z-score的交易策略保持一致,將該策略改為當resid3的絕對值超過1時開倉;開倉后當resid3回落到0時平倉。
本文選取了2012年全年當月連續和下月連續數據,共59670分鐘(數據來源:RESSET數據庫)。考慮到樣本時間跨度較長,期間協整關系可能會出現變化,因此采取動態估計的方法,將樣本分為多個周期,每個周期內包含估計期和交易期。估計期內對數據進行協整檢驗,得出相應參數后在交易期內假設協整關系保持不變,并根據上一部分提到的方法進行交易。交易期結束之后再次對協整關系進行檢驗,如此重復。
假設初始資金為100萬元,每次只交易一手價差組合,無交易成本。選取樣本前60%的數據,即35800分鐘數據作為樣本內數據,以最大夏普比率為目標函數,對檢驗期M與交易期N兩個參數進行優化, 得到 M=1020,N=40,sharp ratio=1.65。 以 M=1020,N=40對全年數據進行模擬,最后得到年化收益率20.6%,夏普比率1.53。
盡管基于協整方法的統計套利策略在沒有交易成本的情況下取得了20.6%的收益率與1.53的夏普比率,但是這一策略在實踐中很難執行。以仇中群,程希駿(2008)得到的回歸方程為例:resid2=lnF2-0.8490250108lnF1-1.331246397,假設我們需要賣空該價差組合,則我們需要賣出1手IF0807,買入0.8490250108手IF0806,非整數倍數的合約數量我們無法進行交易。為了實現1/0.85的對沖比率,我們必須賣出20手IF0807,買入17手IF0806。在分鐘級別的統計套利策略中買賣如此大量的合約將會導致交易成本吞噬掉我們大部分的利潤。
為了使交易策略在實踐中可行,我們需要構建一個整數的對沖比率。協整模型的思想是找到一個對沖比率β,使得Yt=α+βZt+et中的殘差et成為一個平穩過程,即通過調整β使殘差平穩,然后根據殘差得到交易信號。統計套利策略的要點在于交易信號的平穩性而不是殘差的平穩性,我們可以設定β不變得到一個不平穩的殘差序列,然后對殘差序列進行調整得出我們需要的平穩交易信號。基于這種想法,我們不妨先將對沖比率設定為1,然后對其殘差序列進行調整,使其成為一個平穩序列,最后據此得出可以用來交易的信號。
這里仍然使用2012年度當月連續與下月連續的1分鐘數據。為了構建一個適合交易的平穩交易信號序列,我們采用Z-score對價差序列進行調整,調整后的信號序列為其中St為價差序列。Mean(St)為樣本均值,Std(St)為樣本標準差。選取20為時間窗口,并向前滾動,計算價差序列的Z-score。
據此我們構建交易策略如下:當|Zt|>1時開倉,當Zt回到0時平倉。得到年化收益率25.7%,夏普比率10.5,相比基于協整模型的交易策略,收益率提升25%,夏普比率則提高了586%。我們選取不同的閥值與時間窗口長度對交易策略的收益率和夏普比率進行分析。發現閥值對于策略的收益率和夏普比率有著最重要的影響,而時間窗口的長度則對交易策略的表現影響不是很顯著,閥值的選擇是整個策略成功與否的關鍵。閥值直接關系到策略產生交易信號的多少,從這一點也可以看出交易次數對套利策略的重要影響。不論從收益率還是夏普比率方面考慮,閥值為1,時間窗口長度為20時策略的表現都是最佳的。同時策略的收益率與夏普比例直接保持了良好的比例關系,說明風險在一定程度上維持不變,跨期套利策略很好得控制了風險。
從上面的結果來看,基于協整方法的股指期貨跨期套利策略擁有非常不錯的表現。但是非整數的對沖比例導致它在股指期貨跨期套利的實際應用中面臨著障礙,這也導致了基于協整方法的統計套利模型主要應用于外匯市場之中。基于Z-score的跨期套利策略通過將不平穩的殘差平穩化得到交易信號的方法回避了這一障礙。
與基于協整方法的跨期套利策略相比,基于Z-score的跨期套利策略的交易信號更加平穩,更加符合統計套利策略盈利的原理。兩種策略的盈利水平差別不是很大,但是夏普比率后者則顯著強于前者。不論從實際可操作性還是策略表現來看,基于Z-score的跨期套利策略均優于基于協整方法的跨期套利策略。
[1]Andrew Pole.Statistical Arbitrage:Algorithm ic Trading Insights and Techniques[M].New Jersey:John W iley&Sons,Inc.2007.
[2]Ellott R J,Van der Hoek J,Malco W.Pairs trading[J].Quantitative Finance,2005(3):271~276.
[3]Gatev E,Gotzmann W,Rouwenborst G.Pairs trading:performance of a relative value arbitrage rule[J].The Review of Financial Studies,2006(3):797~827.
[4]Vidyamurthy G.Pairs trading:quantitative methods and analysis[M].New Jersey:John W iley&Sons,Inc.2004.
[5]仇中群,程希駿.基于協整的股指期貨跨期套利策略模型[J].系統工程,2008(12):26-29.
[6]王偉峰,劉陽.股指期貨的跨期套利研究——模擬股指市場實證[J].金融研究,2007(12):236-241.
[7]楊立勇,王海俠.基于統計套利思想的股指期貨跨期套利[J].經濟數學,2012(2):61-65.