邢恩泉 尹濤

摘要 對基于協整理論的配對交易策略進行了改進.改進后的模型利用計算機能夠快速循環運算的特點,循環查找最優配對組合與建倉閾值,使模型能夠快速運用到各類資產及多種數據頻率的配對交易中,具有根據數據變化進行自我動態修正的功能.
關鍵詞 協整模型;配對交易;遍利性
中圖分類號 F832.51 文獻標識碼 A
AbstractThis paper is aimed at improving pairs trading strategy based on the cointegration theory. The improved model loops and searches for the optimized pairs and transaction threshold by taking advantage of the rapid loop calculation of computer, which accelerates its application in pairs trading of assets and data frequency of various kinds. The model has the function of dynamic selfcorrection in accordance with the data changes.
Key wordscointegration model; pairs trading; ergodic research
1引言
從本質上講,統計套利就是一種投資組合策略.其基本過程可以大致歸納為:首先,運用統計分析工具對投資組合中資產價格的歷史數據進行分析與研究;然后,建立能夠刻畫出資產價格之間關系的數量模型;最后,在資產價格之間的關系偏離模型預測的均衡值時,利用“均值回歸”理論,進行相應的套利操作,從而實現穩定的投資收益.
統計套利自從20世紀80年代,由Nunzio Tartaglia帶領的摩根士丹利的一支數量分析團隊提出以來,其套利策略被廣泛應用,目前在歐美、日本等成熟市場已成為主流,被對沖基金、共同基金、投資公司及資深的獨立投資者使用.統計套利的有效使用和廣泛傳播,一直被看作是資本市場成熟的重要標志之一.其不僅豐富了投資者的投資策略,而且有利于最大限度地發揮資本市場的“自我糾錯”機制,從而優化與提高了資本市場的資源配置效率.
統計套利的常見方法包括:配對交易、β中性策略與多因素模型等.其中,配對交易策略(Pairs Trading)在國內資本市場有著較為廣泛的應用,在統計套利中的具有尤為突出的地位.基于統計套利的配對交易策略是一種市場中性策略,具體的說,是指從市場上找出歷史股價走勢相近的股票進行配對,當配對的股票價格差(Spreads)偏離歷史均值時,則做空股價較高的股票同時買進股價較低的股票,等待他們回歸到長期均衡關系,由此賺取兩股票價格收斂的報酬.
配對交易一般采用“最小化偏差平方和”、“隨機價差模型”與“協整模型”等方法來進行資產組合的選擇與交易.其中,協整模型的應用頻率相對較高.
在通常情況下,采用協整模型實現配對交易時:首先,通過構建協整模型確定資產價格之間存在的長期均衡關系;然后,根據價差波動的特性,確定交易頻率、交易觸發條件與平倉規則等交易規則;最后,對價差走勢進行動態追蹤,從而完成套利交易.在關于統計套利的研究中,存在著兩個“經驗性”選擇:依靠經驗選擇構建配對交易的基本品種;依靠經驗選擇偏離均值的標準差倍數.本文將利用計算機技術,對上述兩個“經驗性”選擇進行遍歷性研究,從而實現對配對交易協整模型的改進與優化.
2文獻回顧
國外學者主要對配對交易的模型與方法進行了大量的研究.其中,除了可以運用普通最小二乘法對傳統的協整模型進行估計之外,Giovanni等利用彈性最小二乘法對配對交易中的回歸模型進行了估計,并以標準普爾500期貨指數為對象驗證了該方法是有效的1].Robert等在研究了配對交易策略的分析框架之后,為價差建立均值回歸馬爾科夫鏈模型,并用模型給出的價差預測值與價差的觀測值進行比較,從而決定合適的交易時機2.C.L. Dunis等以WTI原油期貨和BRENT原油期貨為配對交易對象,分別使用協整模型、移動平均法、神經網絡分析法、自回歸移動平均法建立套利模型,并比較了模型之間的套利績效,發現利用移動平均法和自回歸移動平均法進行模擬交易的年收益較高,而傳統協整模型,神經網絡分析法并未獲得理想效果.國外學者對套利品種的研究也較為多樣3.Paul以原油及原油提煉品期貨為研究對象,發現其價格之間存在的長期均衡關系.因而根據協整理論,對裂解價差的套利機會進行了研究,并設計出相應的套利策略.歷史數據表明原油及原油提煉品期貨價格之間存在可盈利的風險套利機會,且在統計學上是顯著的4.Christos研究多國股票市場指數的長期協整關系,研究表明市場指數的表現會影響這種長期關系,當一個市場趨勢顯著改變時,投資者應該重新構建套利組合5.
國內也有學者對配對交易的方法進行了研究.吳栩等運用價差服從OU過程的隨機價差模型與基于Elliott的隨機價差模型對滬深300股指期貨和上證180ETF的配對交易機會進行了研究與預測,研究結果表明價差服從OU過程的隨機價差模型的預測效果更好6.也有很多學者對基于協整模型的配對交易進行了實證研究.雷井生和林莎基于股票價格的日數據和5種日內高頻數據,采用協整策略對上證超級大盤指數的20只成分股進行統計套利,通過對套利結果的比較與分析,得出在各頻率數據下,統計套利策略均能有效地應用于我國股票市場7.期貨品種之間的統計套利研究也是國內學界關注的焦點,如丁秀玲和華仁海以協整理論為基礎,對大豆與豆粕期貨之間的歷史價格關系進行了深入研究,發現其價格會相互影響且存在長期的均衡關系,并在此基礎上對樣本數據進行模擬套利交易,發現套利的平均利潤并不顯著8.扈文秀等選取商品指數期貨與上證大宗商品股票ETF作為套利對象,運用協整統計模型設計套利方案,其中交易信號設置為價差偏離序列標準差的0.75倍.研究表明該統計套利方案能夠獲得穩定收益,證明統計套利在商品指數期貨雙跨套利是可行的9.賈尚輝、江令對股指期貨與其相對應的股票指數關聯性進行了討論,并以滬深300股指期貨與滬深300指數為對象進行了協整關系的實證研究10.
協整模型作為目前國內配對交易研究中主要使用的研究方法,已經有不少國內學者對其提出了改進.比如何樹紅等在協整理論的基礎上,引入GARCH模型,建立了股指期貨跨期套利模型.在建立套利交易策略時,利用標準正態分布的置信水平確定建倉閾值.實證研究表明該模型能夠有效的發現股指期貨市場存在的日內跨期套利機會,并且通過建立合理的套利交易機制可以獲得較為可觀的收益11.賀正楚等立足于期貨市場的基本功能,發現期鋅市場及其現貨市場對來自各自身的沖擊反應迅速,且具有強持續性.期貨市場對現貨市場沖擊是積極、有效的,但現貨市場對期貨的沖擊是消極、微弱的,研究結果為套期保值時點的選擇提供了重要的理論參考依據12.在配對交易策略的改進方面,丁濤提出了基于協整模型的延后開倉配對交易策略并證明了該策略在我國的可行性13.
上述文獻對本文的研究具有重要的啟發與借鑒意義.但同時也存在一些不足:首先,雖然統計套利研究中的配對交易品種較為多樣化,但是配對交易品種的選擇主要依靠實際經驗或者依據配對交易對象之間存在的某些經濟學聯系.其次,建倉閾值的選擇具有主觀性,特別是在使用協整方法進行套利的研究中,多數以kσ(σ為價差序列的標準差)作為建倉閾值,而k值的確定依賴于經驗判斷,如果選取的k值過大,交易機會就會減少,不會盡可能多的獲得交易利潤,而如果選取的k值太小,又會導致交易太頻繁,產生巨大的交易成本,導致利潤減少.本文以協整模型為基礎,利用計算機能夠快速循環運算的特點對傳統模型進行改進,給出配對交易中具有一般性的統計套利模型,循環查找最優配對組合與建倉閾值,利用計算機技術進行循環計算與數據挖掘,從而得到遍歷解.
3模型構建
3.1傳統套利模型
3.1.1套利對象的選擇
傳統套利模型在選取配對交易的對象時通常以兩個具有高度相關性的資產作為配對組合,并且假設它們之間相關性是長期可持續的.一般來講,這種相關性主要來源于不同種類的資產之間存在某種經濟學聯系,例如,上下游產業鏈的商品期貨價格往往相互影響,從而使期貨之間的價格走勢存在某種穩定的關系.以此為基礎,在套利模型建立之初,投資者就會憑借經驗選擇一組套利對象,然后檢驗其是否具有協整關系,若不具備協整關系,則投資者就會按照上述原則繼續尋找其他配對組合,若所選對象具有協整關系,則根據協整回歸模型來確定資產間的配置比例,最后通過價差的統計性質來確定套利機制.這樣的選擇方法存在的問題就是效率低,且所選取的配對組合未必能夠實現預期利潤.3.1.2協整關系檢驗
檢驗資產之間的協整關系主要采用EngleGranger兩步法.其具體步驟是:首先,假設{Xt}與{Yt}代表資產X與資產Y的價格序列,對時間序列{Xt}與{Yt}進行ADF檢驗確定兩者的平穩性,確定其均為非平穩序列且是一階單整.其次,構造回歸模型:
3.2套利模型的改進
第一,在選取配對交易對象時,先將所有考慮范圍內的資產價格時間序列作為輸入變量,其次,輸入已經設計好的計算機程序,然后通過計算機的循環運算,篩選出兩兩之間具有協整關系的配對交易品種.假設共有N種資產,首先利用ADF檢驗篩選出M個均是一階單整的資產價格時間序列;再次,將這M個資產價格時間序列進行兩兩組合,則共有M*(M-1)/2個組合結果,記為集合G;最后,對所有組合結果做協整檢驗,篩選出具有協整關系的資產組合作為配對交易對象.
4實證分析
本文選取在大連商品交易所交易的8個商品期貨品種,即大豆、豆油、豆粕、PVC、玉米、塑料、棕櫚油和焦炭.數據來源于Wind資訊金融終端.由于每個期貨合約都有到期時間,因此期貨價格具有不連續的特點,而且,在同一交易日,同一期貨品種有若干個不同交割月的合約在交易,為了研究方便,我們選用行情報價系統提供的連續合約價格,即豆一連續、豆油連續、豆粕連續、PVC連續、焦炭連續、塑料連續、玉米連續、棕櫚油連續.時間段選取2012年1月4日到2014年4月18日,在數據頻率上,選取日內收盤數據,每個序列有樣本552個,并將其中每個序列的最后100個數據作為樣本外數據.
其次,將8個品種的期貨價格時間序列作為輸入變量,導入用matlab編寫好的程序中(參見附錄),其中,將K值的取值范圍設置為[0,3],以0.01為步長.運行后得到如表1結果.
實際運行結果說明,8個期貨品種的配對組合中有14個組合存在協整關系,其中,有7對配對交易組合在樣本外測試階段不存在任何交易機會.另外,由于沒有考慮交易費用以及止損水平,因此所有的收益率都表現為正值.
在剔除這7對交易組合后,系統根據總收益率最大原則輸出最終選擇結果,即最優配對交易組合為豆油和棕櫚油,其配對交易的樣本內收益率為76.99%,樣本收益率為17.93%,總收益率為94.93%.配對系數為0.932,即交易組合的比例為250∶233,即賣出250手豆油合約的同時需要買入233手棕櫚油合約,或者買出250手豆油合約的同時賣出233手棕櫚油合約.此外,豆油與棕櫚油配對交易的最優k值為0.06,代表當開倉信號設置為價差均值基礎上±0.06σ時,其總收益率達到最大.
5總結與展望
本次研究以協整模型為基礎,利用計算機能夠快速循環運算的特點對傳統模型進行改進,給出配對交易中具有一般性的統計套利模型.該模型具有很強的普適性:
第一,在任何數據頻率下,能夠對任意種類的資產進行模型檢驗,并迅速地找到能夠進行配對交易的品種.
第二,克服依靠經驗選擇建倉閾值的缺點,利用計算機循環運算的功能,快速找出使樣本內收益最大的交易閾值.
第三,以樣本內與樣本外總數據區間內的收益率最大為標準,選取最優配對交易組合,并且自動剔除掉樣本內收益率或樣本外收益率小于等于零的配對交易組合,以此增強模型的穩健性.
為簡單介紹模型功能,本文以在大連商品交易所上市的8個期貨品種為例,將8個期貨品種的價格時間序列作為輸入變量,經過計算機運算,首先發現14個組合長期上存在協整關系,然后比較出其中最優配對交易組合為豆油和棕櫚油,其最優K值為0.06;最后,通過計算機指令將所有結果進行輸出.在研究中,由于樣本外數據區間較短,且樣本外數據的波動性與樣本內數據不同,最終結果中有7個配對交易組合在樣本外測試期間不存在任何交易機會.因此,在實際使用模型進行配對交易時,還需要對模型進行進一步的調整,如優化數據區間的選擇,計算交易費用對收益的影響,建立完善的風險控制機制,設置合理的止損水平等.
參考文獻
[1]G MONTANA, K TRIANTAFYLLOPOULOS,T TSAGARIS. Flexible least squares for temporal data mining and statistical arbitrage[J]. Expert Systems with Applications. 2009, 36:2819-2830.
[2]R J ELLIOTT, JOHN, V D HOEK,et al. Pairs trading[J].Quantitative Finance. 2005,3: 271-276.
[3]C L DUNIS, J LAWS, B EVANS. Trading futures spreads: An application of correlation and threshold filters[J].Applied Financial Economics. 2006. 16: 903-914.
[4]P B GIRMA, A S PAULSON. Risk arbitrage opportunities in petroleum futures spreads[J].The Journal of Futures Markets,1999,8:931-955.
[5]CHRISTOS, ALEXAKIS. Longrun relations among equity indices under different market conditions:Implications on the implementation of statistical arbitrage strategies[J].Journal of International Financial Markets, Institutions & Money.2010,20: 389-403.
[6]吳栩,宋光輝,董艷.滬深股市夏普比率的多重分形相關性分析[J].經濟數學,2014,31(2):13-18.
[7]雷井生,林莎.基于高頻數據的統計套利策略及實證研究[J].科研管理,2013,34(6):138-145.
[8]丁秀玲,華仁海.大連商品交易所大豆與與豆粕期貨價格之間的套利研究[J].統計研究.2007,24(2):55-59.
[9]扈文秀,牛靜,李芳,等.基于統計套利模型的商品指數期貨雙跨套利方案研究[J].管理評論,2013,25(9):100-107.
[10]賈尚暉,江令.股指期貨和股票指數的關聯性分析[J].數學的實踐與認識.2013,43(2):90-94.
[11]何樹紅,張月秋,張文.基于GARCH模型的股指期貨協整跨期套利實證研究[J].數學的實踐與認識,2013,43(20):274-279.
[12]賀正楚,周賢軍,文先明.基于SVAR模型的期鋅市場及其現貨市場的價格發現功能實證研究[J].湖南大學學報:自然科學版,2011,38(7): 92-97.
[13]丁濤.配對交易策略在A股市場的應用與改進[J].中國商貿.2013,(2):24-27.