韓澤文


高頻交易市場是許多金融機構角力的重要場所,量價關系則是眾多學者研究的重點。通過量價關系在高頻交易市場構建合適的模型來預測價格趨勢一直是各大券商研究的方向之一。本文通過掛單量因子這一指標,構建了嶺回歸模型來預測價格變化,并根據模型建立的簡單策略進行模擬交易,取得了不錯的效果。
一、引言
長期以來,以股指期貨為主的二級市場都是各大券商的必爭之地,而作為矛頭的高頻交易策略則是一家券商硬實力的集中體現之一。與傳統的中低頻交易側重關注收盤信息的特點不同,高頻交易要求交易者能對日內數據的變化做出及時應對。一個理想的右側交易策略應該是能較為準確地在價格低位發出開倉信號,在價格到達高位后及時發出信號平倉。為了探尋合適的交易信號來構建一個穩定可行的交易策略,需要選取一些合適的指標來預測價格的趨勢。以往的量價關系的研究多集中于論證上·,鮮有成果能成功找到穩健的因子;且因子的運用多集中在日頻交易等中低頻交易中,對高頻交易的研究往往被忽視,而在市場中進行交易正是研究的目的。因此,本文以Cont的掛單量因子模型作為基礎,根據高頻市場的特征對模型進行改進,并在滬深股市上用一年的高頻數據(tick級)進行模擬交易。
二、數據預處理
對數據的預處理在模型擬合中十分關鍵。如果不能很好的處理數據,模型會很大程度地受到樣本不平衡等負面因素影響,導致模擬交易的失敗。這也是高頻交易中模型擬合的一大難點。本文主要通過增大訓練集的方法來避免這些問題的出現。
讀取2020整年的數據,將數據按交易時間做升序排列,得到新的數據集。根據交易時間對該數據做篩選,選出發生在09:30:00至11:30:00、13:00:00至14:56:57間的交易信息,同時生成在這時間內頻率為3秒的均勻時間序列。對比后發現手頭的數據與標準的時間序列不同,將多余的刪去,缺失的用前一個tick補上,得到標準的序列,數據預處理完畢。
為了訓練和檢驗模型,將數據集劃分為訓練集和測試集兩塊。將前兩個月的交易數據,即前65861個tick數據作為訓練集訓練模型,剩下的數據則作為測試集來檢驗模型的擬合效果,以判斷模型是否可用于交易。
三、構建模型
本文的模型建立在Cont構造的掛單量因子上,并根據Bartolozzi的理論,將原本日頻的模型引用到高頻交易中
(一)構建自變量:
1.委買量序列:
以一檔為例,如果一檔買價跟前一tick比成上升趨勢,w1為該tick的一檔委買量。如果買價下降,w1為前一tick的一檔委買量的負值。如果買價并無變化,w1為該tick的一檔委買量和前一tick的差值。即:
其中,w1n 為新定義的一檔買量序列,buyvolume1n 為在n時刻的一檔委買量,buyprice1n為在n時刻的一檔買價。
以此類推,得到十檔委買量序列:w1~w10。
2.委賣量序列:
以一檔為例,如果n時刻的一檔賣價比前一時刻的賣價高,v1為前一時刻的一檔委賣量的負值。如果賣價下降,v1為該時刻的委賣量。如果賣價并無變化,v1為該時刻的一檔委賣量和前一時刻的差值。即:
其中,v1n為新定義的一檔賣量序列,sellvolume1n 為在n時刻的一檔委賣量,sellprice1n為在n時刻的一檔賣價。
以此類推,得到十檔委賣量序列:v1~v10。
3.差值序列:
每檔委買量序列與委賣量序列的差值,即:
4.掛單流差值序列(Order Flow Imbalance):
根據經驗法則,約每十秒會有比較顯著的掛單流差值變動,因此,以每三個tick為單位對每檔的差值序列取平均,得到新的每檔序列,即:
此處的每檔OFI序列即為所需的自變量。
(二)構建因變量:
構建加權價格序列:
構建盤口加權價格序列weighted-price,即:
其中,buyprice1(n) 為n時刻的一檔買價,buyvolume1(n)為一檔買量,sellprice1(n) 為n時刻的一檔賣價,sellvolume1(n)為一檔賣量。
(三)模型擬合:
構建嶺回歸:
利用逐步回歸的思想,構建一個包含十檔信息的函數,再根據顯著性檢驗剔除自變量,得到最后的模型。即:
為了避免出現利用明日數據構建明日模型造成的過擬合,我們用該時刻和前一時刻的tick數據構建自變量去預測下一tick時的中間價與現在的差值。得到的模型R方為0.149,雖然從統計學角度出發,模型的擬合結果并不夠顯著,但在高頻交易中該模型的擬合結果是可以接受的。
四、模型實踐
(一)構建策略:
根據信息可知:該股股價在100左右浮動,為了避免因為誤觸信號而造成的錯誤開倉,我們將閾值設定為大于交易成本的為0.24,即:當模型預測的差值減去前一tick的差值上穿閾值,在下一tick按賣一價買入,當預測值減去觀測值下穿閾值,則在下一tick按買一價賣出平倉。
(二)實踐策略:
在測試集中實踐這個策略,得到122次交易機會,平均收益率約為0.0028,勝率為0.5。凈值曲線如下圖:
從凈值曲線中可以看出,即便收益率有所波動,該策略在高頻交易中的表現是比較優秀的,能在去除交易費用的情況下保持較高的交易次數和勝率,有一定的可行性。
五、結語
本文以相關研究為基礎,將Cont等人的掛單量因子模型應用到高頻交易市場,嘗試在模擬日內交易中獲得超額收益,并取得了不錯的成績。由此可以看出,掛單量因子可以為交易者提供超額收益。
(作者單位:吉林大學 數學學院統計學專業)