彭闖
摘要:本文主要介紹了統計套利的基本含義和基于協整的交易策略,之后選取了國內期貨市場中具有代表性的滬銅1907和滬銅1908的的5分鐘的高頻交易數據來進行實證研究,其中包括相關系數檢驗、平穩性檢驗及協整檢驗等方法,最后根據檢驗的結果建立了誤差修正模型并制定了套利策略,并依據建立的套利策略對歷史數據進行了回測,根據回測結果對套利策略及模型的有效性給與了評估。
關鍵詞:統計套利;協整檢驗;誤差修正模型;高頻數據
中圖分類號:F820 ? ?文獻標識碼:A
文章編號:1005-913X(2019)09-0051-03
一、研究背景
國內對于股指期貨的統計套利大多停留在日間數據,而對于分鐘數據等高頻數據的研究較少,而高頻數據具有交易次數多,換手頻率快等特點。相比于人為的投資操作,計算機的自動化操作具有風險小、套利機會多等特點。基于此背景,本文選取了上海期貨市場滬銅期貨1907與滬銅1908的5分鐘數據,希望再期貨合約的高頻交易中使用協整檢驗和誤差修正模型,獲得協整檢驗、誤差修正模型在高頻數據的自動交易策略。
二、模型及交易策略介紹
(一)建模步驟及模型介紹
1.相關性檢驗。進行協整統計套利的投資標的物之間必須是有相互關系,要先進行相關性分析,這里選用pearson簡單相關系數。
設X,Y是兩個變量,則
其中ρxy為x,y的相關系數,cov(x,y)為兩者的協方差,σx,σy為x和y的方差,μX,μY為x,y的均值。
2.平穩性檢驗。在進行時間序列建模時必須要求數據的時間序列數據平穩,必須先進行平穩性檢驗,單位根檢驗是判斷時間序列平穩的重要方法,本文采用ADF檢驗,ADF檢驗為判斷時間序列是否存在單位根的重要統計方法之一,如果序列平穩則不存在單位根,反之存在單位根。
設時間序列的p階滯后項回歸方程為
原假設H0:=0,存在一個單位根,對公式1進行OLS回歸可得估計量及相應的t統計量,t統計量又被稱為ADF統計量,如果的ADF值小于其ADF統計量的臨界值,則拒絕原假設,證明原時間序列存在單位根。
3.單整。如果時間序列Xt平穩,則稱Xt為零階單整,記為Xt-I(0),如時間序列前d-1階差分不平穩,第t階差分為平穩序列,則稱Xt為t階單整,記為Xt-I(t)。
4.協整。如果兩個時間序列{Xt}和{Yt}是兩個不平穩的時間序列,但兩個時間序列是同階單整的,即:Xt-I(t),Yt-I(t),并且這兩個序列的線性組合β1Xt+β2Yt是t-j階單整的,記為β1Xt+β2Yt-I(k-j),則稱{Xt}和{Yt}為(k,j)階協整。
協整檢驗鐘最常見的方法便是EG兩步法,假設存在兩個變量X1t和X2t,需要確定兩個變量是否具有協整關系簡要步驟可以表示為:
第一步:確定兩個變量的單整階數是否一致;
第二步:估計長期均衡關系。假設兩個變量X1t、X2t都為1階單整序列,則建立回歸方程:
X1t=β0+β1X2t+εt估計長期均衡關系。估計的殘差為εt=X1t-β0-β1X2t
第三步:檢驗序列是否平穩,是偏離長期均衡關系的利差估計值,如果這些利差估計值是平穩的則稱X1t,X2t是(1,1)階協整。
5.誤差修正模型。如果兩個變量是協整的,那么兩個變量之間必然存在長期均衡關系,但由于市場波動及信息不對稱等因素長期均衡中往往存在著短期偏差,這兩個變量短期偏離的不均衡現象可以用誤差修正模型描述。誤差修正模型的常用方法有E-G兩步法和直接估計法:
其中E-G兩步法有:
第一步:根據協整檢驗的結果得到{Xt}和{Yt}的協整方程:
Yt=α0+α1xt+εt ?(1)
則其殘差序列為:
εt =Yt-α0-α1xt (2)
第二步:設{Xt}和{Yt}的短期不均衡關系為:
△yt=β1△xt+β2ecmt-1+ut (3)
將(2)得到的εt-1替代(3)中的ecmt-1,得到誤差修正方程
△yt=β1△xt+β2(Yt-1-α0-α1xt-1)+ut
之后根據OLS估計求出β1、β2的值,β1其中被稱為誤差修正系數。
直接估計法:
通過以△yt為因變量,△xt,yt-1,xt-1為自變量直接建立回歸方程構建誤差修正模型。
(二)交易策略分析
根據誤差修正模型可以得出交易時兩個期貨商品的對沖比例。計算出兩種投資標的物價差的時間序列記為spread,根據時間序列算出spread的均值μ和σ標準差,根據價差序列的分布,確定無套利區間、套利區間和止損區間來指導交易。這三個區間用均值加方差的波動來進行劃分。
基本劃分標準為:
第一步:設閥值:0<φ1<φ2<φ3
第二步:設立區間,其中(μ-φ1σ,μ+φ1σ)為無套利區間(-∞,μ-φ3σ)及(μ+φ3σ,+∞)為止損區間,在這兩個區間中不持有頭寸。μ±φ2σ為建倉點。
第三步:設立交易步驟,當樣本價差序列向上突破μ+φ2σ,或者從止損區域(μ+φ3σ,+∞)向下擊穿μ+φ3σ做多價差,帶spread價差序列回歸至μ+φ1σ時獲利止盈離場或者spread擴大至μ+φ3σ時止損離場。當樣本價差序列spread向下突破μ-φ2σ,或者從止損區域(-∞,μ-φ3σ)向上突破μ+φ3σ做多價差,待spread價差序列回歸至μ-φ1σ時獲利止盈離場,或者spread擴大至μ-φ3σ時止損離場。
其中φ1、φ2、φ3是以歷史最大化收益為原則求出的。
三、實證分析
本文選取了從2018年5月1號到2019年5月1號滬銅1907和滬銅1908的一年的5分鐘交易數據,其中包括交易時間、交易量、買賣價格等變量。并以交易價格作為時間序列進行分析,共計19547個樣本。本文抽取了所有樣本數據的前70%的數據進行建模,并用后30%的數據進行回測。
對期貨進行統計套利的前提是這兩種期貨商品擁有較強的相關性,本文先選取滬銅1907與滬銅1908都為銅期貨的兩個不同的品種,本文希望先通過兩種數據的折現圖和散點圖的分布去探究下兩者的相關程度,由于高頻數據的數據量較大,故選取了前200個點進行描述性分析。滬銅1907與1908的折線圖與散點分布圖分別如圖1、圖2所示。
從兩者的散點圖和折現圖可以看出兩種期貨商品之間存在一定的均衡關系,接著對兩種期貨商品進行相關性分析:
從相關分析的表中也可以看出兩種期貨商品的相關系數達到了0.92,具有高度正相關。
接著對原序列做平穩性檢驗,并找出兩種商品的單整系數。具體的ADF檢驗結果如表2所示
從表中可以看出兩者的ADF統計量分別為-2.22和-2.23,均大于1%、5%、10%的臨界值,在進行一階差分以后,兩者的ADF統計量分別變為-19.53和-19.55小于1%的臨界值,說明滬銅1907與滬銅1908均為一階單整序列。接下來采用E-G兩步法進行協整檢驗,先建立回歸方程,回歸方程結果如表3所示:
由表得出的回歸方程為cu1807=443.9+0.988cu
1808,接著對回歸方程的殘差進行單位根檢驗,具體結果如表4所示:
通過協整檢驗可以知道滬銅1907與滬銅1908具有協整關系。接著用直接估計法建立兩者的誤差修正模型,其中以滬銅1907為因變量,具體結果如表5所示:
得出的誤差修正模型為:
△cu.1907=237.35+0.95△cu.1908-0.533△cu.1907t-1+0.527△cu.1908t-1+εt
=237.35+0.95△cu.1908-0.533(cu.1907t-1-0.988cu.1908t-1)+εt
error.ecm=cu.1907t-1-0.988cu.1908t-1
其中error.ecm為誤差修正項,表明在兩種期貨商品的長期協整關系中,當滬銅1907偏離均衡值時下一期的波動值不僅和cu.1908的變動值有關還和兩者的誤差修正項有關,其修正的速度為-0.53,基于此得出的協整向量位(1,-0.988),表明進行修正時兩種產品的對沖比例為1:0.98,表明在進行統計套利時做多一手滬銅1907時也要做空0.98手滬銅1908,同理做空一手滬銅1907,也要做多0.988手滬銅1908。
從而可以建立兩個期貨品種的樣本內對沖價差時間序列spreadt=cu.1907-0.988cu.1908。
根據樣本內的價差序列,得出樣本內價差時間序列的均值為0.105,方差為1.33×10-7,根據樣本內價差的均值和方差,按照上面所寫的投資策略制定無套利、套利和止損區間。抽取了歷史數據的后三個月六千樣本作為測試數據,用r語言自己編寫回測函數,以歷史數據的收益最大化為約束條件求出三個區間的閾值φ1=0.4、φ2=1.5、φ3=3.3,每次交易的交易費用按10元計算,初始資金以滬銅1907與滬銅1908的一手的資金總和計算,前500個數據的價差走勢圖及回測總體累計收益數分別如圖3與圖4所示。
可以看出基于誤差修正模型得出的套利策略在前3000時套機機會較多,隨著時間的推移大約在4000期以后套利的機會開始逐漸降低。最后根據模型得出的收益數按照全年240個交易日,得出年化收益率、最大回撤、最長持倉時間等模型回測指標,具體結果見回測結果匯總表。
根據回測結果匯總表可以看出基于誤差修正模型得出的套利策略在測試數據中得到了29.67%的年收益率,期間共套利360次。
四、結論與建議
通過本文的實踐證明,在期貨市場上運用誤差修正模型去進行統計套利是可行的,并且相比于股票市場中日交易數據,統計套利更適用于基于高頻交易數據去實現程序化、自動化交易,但是也可以看出高頻數據也具有交易次數頻繁,波動劇烈等特點,并且期貨市場上需要的入市資金過高,更適用于大額資金的投資者。
參考文獻:
[1] Engle R F,Granger C W J.Cointegration and error correction:reprensenation,estimation and testing[J].Econometvica, 1987(2).
[2] Burgess A N,Refense A N.1996a.Modelling non-linear cointegration in intenational equity index futrues[C].Netural Networks in Financial Engineering.World Scientific,Singapore,1996:50-63.
[3] 仇中群.基于協整的股指期貨套利研究[D].合肥:中國科學技術大學,2009.
[4] 蔡志成.基于協整分析的統計套利策略研究[D].杭州:杭州電子科技大學,2014.
[5] 趙 華.時間序列數據分析——R軟件應用[M].北京:清華大學出版社,2016.
[責任編輯:譚志遠]