摘要:統計套利策略是一種基于數理模型的量化投資策略,被對沖基金等金融機構廣泛使用。我國的融資融券的啟動和股指期貨上市,統計套利開始在我國有了發展的空間和平臺。本文從統計套利的定義和原理、策略種類以及在我國金融市場的應用基礎等方面做了簡要的分析。
關鍵詞:統計套利;協整理論;程序化交易
一、統計套利的定義與原理
統計套利模型是依據兩個或者一組股票(或其他證券)之間所具有的較高的相關性進行套利的一種策略模型。在用一定的方法驗證這兩種資產的價格波動在一段時間內保持這種良好的相關性之后,那么兩者的價差一旦出現了背離的走勢,并且這種價格的背離在未來預計會得到恢復,那么便可以產生套利機會。在統計套利實踐中,當兩個具有此類相關性的資產的價格之間出現背離,那么可以買進價格被低估的證券,同時賣出價格被高估的證券,那么當未來兩者之間的價格背離得到糾正時,進行相反的平倉操作,就可獲得套利的利潤。統計套利原理要得到實現,必須要以均值回復為前提。均值回復指的是資產的價差存在一個均值區間,通常表現為資產價格之差在時間序列上具有平穩性,如果價格差背離至均值區間之外,那這種背離只是短暫的,隨著時間的推移,資產價格將會恢復到它的均值區間內。例如,處于同一行業的兩只股票,它們在某些程度上具有和許多共同性,其市場價格之間也存在著較為穩定的相關性,一只股票價格的變化通常伴隨另一只股票價格的同方向變化,從而價格之差往往會圍繞著某一固定值上下波動。因此,如果經檢驗發現某資產的價格差時間序列是平穩的,便可以構造統計套利交易的信號發現機制,該信號機制將會顯示資產價格是否已經偏離了長期均值從而尋找套利的機會。
二、統計套利策略
統計套利策略如今被對沖基金廣泛使用,其具體的操作方法策略種類繁多,如成對交易、多因素模型、均值回歸策略、協整策略等。另外在計算機科學發展的基礎上,越來越多的資產價格預測方法都開始運用模式識別、系統理論、數據挖掘、機器學習等理論。雖然這些理論基礎在金融市場的應用還處于試探的起步階段,但是隨著理論的不斷完善和在其他領域應用拓展,可以想象今后的資產交易模式會廣泛使用這些理論,而它們比傳統的統計套利方法更加高效。
(一)均值回復策略
均值回復策略是股票市場的中的一種典型的投資策略,它與趨勢追蹤策略相反,認為股價經過大幅度的上漲后便比較可能出現下跌的情況,反之股價大幅度下降后很可能會上升。這種策略特點是盡可能多地捕捉小的機會,雖然每一次收益率不高,但是成功地可能性較高。但我國股市發展還處于不成熟的階段,投資者行為不理性,導致我國股票價格趨勢性比較明顯,而均值回復并不經常發生,所以這種策略在我國股市上并不容易實現。但是,統計套利策略基于的均值回復策略不單單是利用單個資產的價格的變化,更多地是基于兩個或者多個具有較高相關性的資產之間的均值回復現象。即兩個或多個相關資產之間的超額收益率如果存在著均值回復現象,那么在一段時間內,當某一資產與另一資產相比具有明顯的超額收益時,則在將來的某一段時間內,另一資產的超額收益率往往會超過該資產。
(二)多因子策略
多因子策略的思想是股票的收益與多種選擇因素相關,這類方法以套利定價模型為代表。多因子策略首先要選擇和定義影響股票收益的因素,用股票收益對這些因素進行多元回歸,再基于多元回歸結果的相關性選擇和確定投資組合。多因子模型通過尋找引起資產價格變動的共同因素,再構建基于這些因素的多元模型,簡化了投資組合策略中需輸入的資產間的相關系數的要求。在實踐操作中,多因子模型效果的優劣主要是取決于影響因子的選擇。
(三)協整策略
協整套利策略是所有統計套利方法中理論基礎最堅實,應用最廣泛的一種,同時也是實證證明效果非常好的一種策略。在傳統的金融建模理論中,需要保證金融數據具有動態穩定性,也就是說,在分析時間序列數據時要假設時間序列具有平穩性。即時間序列數據的統計特性不會隨時間變化而變化,不會因時間節點的選取而變化。但實際情況是,金融時間序列通常不具有平穩性,如果使用這種不平穩時間數據建立一個穩定的模型,會出現“偽回歸”的問題。協整理論的出現是的這種不穩定型的問題得到了解決。協整理論描述的是經濟變量之間存在的一種均衡關系,對于兩個或者多個自身不具有平穩性的經濟變量來說,如果它們之間存在協整關系,也就是說它們之間存在一個長期的均衡關系,而協整套利模型可以利用這種價差的平穩性尋求套利機會。協整套利策略主要有三個步驟:第一,構建資產組合,確定資產比例;第二,建立協整模型,確定交易信號;第三,按照交易信號實施策略。
三、統計套利在我國金融市場的應用基礎
(一)理論基礎
韓廣哲,陳守東(2007)對上證50指數成分股進行統計套利研究,運用方差比分析法發現統計套利策略在樣本外的績效對交易成本非常敏感,計算出針對機構投資者的樣本外數據年化夏普比率符合市場中的投資要求,說明統計套利策略是可行的。顏涵(2012)分別運用OLS恒定波動模型、GARCH時變波動模型和O-U隨機波動模型對滬深300股指期貨的5分鐘高頻數據進行了統計套利分析。何樹紅,張月秋等(2013)結合了協整模型和GARCH模型,發現樣本數據從結果上看存在套利獲利的機會。張金雷(2014)使用EGARCH 模型進行統計套利的構建,并使用時變方差作為交易閾值的開平倉操作方式,結果表明使用時變方差進行交易閾值的預測比以往使用常數方差更為精準和高效。李樂,張淳奕等(2014)使用了從0.5秒到30分鐘的一系列數據對跨期套利進行對比研究分析,實證結果發現,使用1分鐘高頻數據取得的跨期套利效果最佳。
總體來說,我國金融市場對統計套利的應用尚處于起步階段,協整模型是使用最廣泛的統計套利模型。隨著高頻數據運用的興起,計算機科學的發展,投資者越發地開始關注日內高頻數據的使用和數據挖掘、機器學習等理論的應用。
(二)市場應用基礎
1.做空機制為統計套利提供市場基礎
2010年03月30日,上交所、深交所分別發布公告,表示將于2010年3月31日起正式開通融資融券交易系統,融資融券業務正式啟動;4月16日,滬深300股指期貨在我國正式上市交易,標志著我國資本市場改革發展又邁出了一大步,也標志我國資本市場單邊市就此終結。這對于發展和完善我國資本市場體系具有重要而深遠的意義。融資融券和股指期貨推出前后,各大券商紛紛對融資融券和股指期貨加大研究力度,推出了一系列高質量的研究報告,其中出現最多的當屬統計套利,中信、海通、華泰聯合、光大、招商、齊魯、浙商等券商都曾出過關于統計套利的研究報告,并據此構建各自的統計套利策略組合。可見,隨著“做空時代”的到來,統計套利策略在量化投資策略中占據著越來越重要的地位。
2.程序化交易發展現狀
我國程序化交易系統發展得相對較晚,無論是在交易系統研究還是系統應用方面的成果都較為缺乏。我國的程序化交易仍處在起步階段,在期貨市場上,主要是采用短線和超短線的趨勢交易策略對商品期貨進行投機,證券市場上,則是主流券商運用程序化交易對交易所交易基金進行套利。不過,由于我國的信息技術應用起步較高,近幾年隨著市場化程度的提高,新的投資理念被源源不斷地引進,各交易所也適時推出了套利交易指令,各種各樣的程序化交易系統被開發出來,盡管在市面上還看不到商業化的交易系統推出,但底層的程序化交易開發平臺、應用平臺等均已較為完善。程序化交易發展為統計套利提供了應用的平臺,相信將來統計套利會在我國廣泛應用和發展。
作者簡介:賀藍卿,女,1993.06.20,湖南懷化,漢族,職稱:無,長沙理工大學碩士研究生,研究方向:統計學。