潘敬 胥少陽|文
對期貨價格進行技術分析,量(成交量、持倉量)、價(價格及其形態)因素缺一不可。采用無監督學習的方法對倫敦金屬交易所鋅三月期貨合約進行大數據挖掘,讓數據說話,打開背后的“黑匣子”、揭示量與價之間的量化關系。
在傳統的技術分析方法中,學者們對量、價因素有著大量的定性研究:例如,具有長上(下)影線的蠟燭圖往往預示著趨勢的反轉。價格下跌,而成交量、持倉量增加,預示著價格仍將下行。然而多長的上(下)影線才會預示著趨勢反轉? 成交量、持倉量的變化需要達到什么樣幅度才會對價格趨勢產生影響?如果基于價格形態上看漲,但從量的因素分析上看跌,投資者們該如何綜合分析?諸如此類問題,僅僅依靠定性分析是無法解答的。投資者們不得不加入更多的主觀判斷。隨著科技的日益發達,投資者們獲得交易數據的途徑更加便捷,通過對這些數據進行挖掘,找出潛在的量化信息,彌補了傳統技術分析方法上的不足。因此,近年來,通過大數據學習制定交易策略的方法越來越受到青睞。本文采用無監督學習的方法對倫敦金屬交易所的鋅三月期貨合約(以下簡稱“倫鋅”)進行分析,挖掘背后蘊藏的定量關系并將具有相似量價關系的交易日歸為一類,通過對交易日進行分類,找出最優的交易策略。

本文采用倫鋅合約過去2527 個交易日的數據(2009年1月9日~2019年1月12日),包括:最高價、最低價、開盤價、收盤價、成交量以及持倉量,在R 語言平臺進行挖掘。
首先,確定數據挖掘的維度。基于以上數據,模型從5 個維度進行分析:第一,最高價與收盤價的差;第二,最低價與收盤價的差;第三,最高價與最低價的差;第四,當日與上一交易日持倉量的變化;第五,當日成交量。第一個及第二個維度反映了價格沖高回落或觸底反彈的程度,第三個維度為當日最大的波幅,持倉量的變化反映了當前價格是由于交易者清倉離場還是主動開倉造成的,成交量維度反映了價格變化的能量。在對數據進行挖掘之前,首先對以上五個維度的數據進行標準化處理。
第二,選擇數據挖掘的算法。本文采用層次聚類(Hierarchical Clustering)中的最遠距離聚類算法(Farthest-Neighbor Method) 從 以 上5 個 維度對2527 個交易日進行分類,將具有相似交易情況的交易日歸在一起。最遠距離聚類算法通過計算歐氏距離來確定每個交易日之間的相似程度:

在確定45 個類別個數后,最遠距離聚類算法將2527 個交易日分別歸入到45 個類別之中,其中第7 個類別包含的交易日最多,共413 個交易日,第20、21 和第43 個類別包含的交易日最少,分別只包含了一個交易日。以第19 個類別為例,有6 個交易日被歸到了一起,從下圖的數據可以看出(圖1),雖然每個交易日所處的價格區間大有不同,但這6 個交易日的波幅普遍較大,蠟燭圖實體較長,成交量也相對較大。
2018年11月12日 與2018年11月13日倫鋅價格分別收于2498 美元/噸、2492 美元/噸,雖然連續2 個交易日的收盤價基本持平,波幅也較為相似,但2 個交易日分別被無監督學習模型納入了第7、第10 個類別,或許這是由于2 個交易日的沖高回落幅度相差較大的所造成的,2018年11月12日從最高價到收盤價回落約0.99%,而11月13日的回落幅度約1.96%(圖2)。由此可見,數據挖掘可以幫助人們找到大數據背后更多的潛在信息。

圖1 第19個類別所包含的交易日

圖2 2018年11月12日與2018年11月13日的分類結果

圖3 10種最優做多交易策略

圖4 10種最優做空交易策略
一個好的交易策略需要滿足三個條件:第一,勝率高;然而勝率高并不能保證最終盈利。假設根據一個策略共交易10 次,其中9 次正確,每次盈利1美元,而最后一次交易虧損100 美元,最終虧損為91 美元,所以第二個條件是較高的盈利;第三,最大回撤較低。通過聚類分析,2527 個交易日被分為45 個類別,也就意味著總共有1980 種(45×44)開平倉類別組合。我們選定過去2527 個交易日中勝率高于70%的開平倉組合,并按照最大回撤進行排序,分別選出10 種最優的做多、做空策略。
圖3為最優的10 種做多策略。10種開平倉組合在過去10年中總計出現過57 次,利潤率均達到了兩位數,但是其中7 種策略的最大回撤幅度較大,超過了10%。
最優的10 種做空策略在過去10年間共出現過60 次(圖4),勝率高的同時,利潤率也超過了10%。其中排在第一的做空組合的最大回撤僅為7%左右,利潤率卻高達18%。
得出最優策略后,下一步需要將未來的每個交易日歸入到45 個類別之中。首先,可以選擇神經網絡或邏輯回歸等算法對過去的2527 個交易日及其所屬類別標簽進行有監督學習,挖掘出背后的分類算法,其次,將新的交易日的5 個維度代入到算法中,從而得出其所屬類別。由于篇幅原因,本文在此不做詳細描述。
對交易數據進行深度挖掘可以幫助人們找到背后的量價關系,做出科學的投資決策,從而避免了主觀判斷上的隨意性。對于倫鋅來說,根據過去10年間的數據,本文分別選取出了10 種最佳的做多和做空交易策略。所選取的交易策略勝率較高且利潤率超過10%以上,但由于鋅的交易流動性較好,波動較大,最大回撤幅度也比較高。
對于模型本身而言,在未來可以向兩個方向繼續進行擴展:一是可以根據不同的交易頻率(15 分鐘、30 分鐘、1小時級別等)從新對數據進行學習;二是可以增加更多的分析維度,例如通過增加時間維度,來反映一個趨勢力度的變化。