李琳潔
(安徽財經大學金融學院,安徽 蚌埠 233000)
1998年,鮑姆將隱馬爾科夫策略應用于語音識別,并取得了顯著的成效。在金融投資領域,隱馬爾科夫模型通常被用來研究股票市場價格的震蕩。由于馬爾可夫鏈具有有限記憶的特征,也就是說其屬性與其近時期內的數據相關,這與股票市場的價格走向類似,所以可以考慮基于馬爾科夫鏈來根據歷史數據來模擬未來股票價格走勢。我們無法知道市場未來的確切狀態,而市場狀態與擇時策略息息相關,我們就可以基于HMM的量化模型,通過觀察股票市場的某些指標,例如成交量,主力資金流向,換手率等對市場狀態進行預測,進而得到近期市場的大致走向,這對股票市場擇時選擇具有重要的參考價值。
由于隱馬爾科夫模型的熵值得大小可以度量系統的不確定性和無規則性,這和股票市場股價波動趨勢不謀而和。因此,我們可以猜測是否可以用隱馬爾可夫的隱含狀態的屬性來度量股價的波動趨勢呢,這就形成了一個基于HMM的量化雛形。
設狀態序列Y,觀測序列X,兩個狀態轉移概率:從yi-1到yi的條件概率分布p(yi-1|yi),狀態yi的輸出觀測概率p(xi|yi),初始概率po(y)。
隱馬爾可夫模型依賴于已知數據的概率分布,當下的決策要根據以往的歷史來確定,但是實際能夠用來做測試的數據不連續,而且很龐大,不能一一給出所有數據的分布情況,所以才要估計x,y的條件概率。
由于隱馬爾可夫模型需要每個變量之間有嚴格的獨立關系,且有限的元素對市場狀態的識別稍有欠缺,而最大熵模型相比使用范圍更廣,沒有獨立性要求,它的本質是有向概率圖模型,即每個yi只依賴于xi,并且每個C(yi,yi-1,xi)組合之間是獨立且局部詭異,相比較來說,比較完善。
在證券投資中,我們往往選擇組合投資策略,進而更大程度的降低風險,我們可以在此稱之為最大熵原理。當取得最大熵時,則代表各種隨機的情況發生的可能性是相同的。據此,可以將客觀存在的事實為前提,得到最大熵的概率分布關系。
假設特征函數為f(x,y),可以看出,它為一個二元隱函數,令f(x,y)=1時,表示事件x,y發生。
在實際市場環境中,某一觀測值對應的隱含條件是由其所在的環境決定的,這就極大的體現出來特征函數取值的靈活性,我們可以根據市場的變化來隨意的調整選取的指標。
在數據集T={(X,Y)}中,分別計算出模型和經驗期望:
通過拉格朗日對偶原理將原式變為無約束的極值求解:
用p(yi|yi-1,Xi)分布來代替HMM中的兩個條件概率分布,它表示從先前狀態在觀測值下得到當前狀態的概率,即根據前一狀態和當前觀測狀態。每個這樣的分布函數pyi-1(yi|xi)都是一個服從最大熵的指數模型。
其中λi是模型中各個特征函數的參數向量,Z是以觀測序列X為條件概率的歸一化因子,其意義是將復雜的聯合概率分布分解為多個因子的乘積。
最大熵模型,可以說是集簡與繁于一休,形式簡單,實現復雜。在現代社會,我們可以觀察到有很多領域或多或少的用到了最大熵模型。比如谷歌的翻譯機器。該模型最大的優勢是可以在無數種影響因子的條件下建立對應的無數種模型,這正好可以滿足影響股票市場波動的無數種因素的需求。世界上最早創立文藝復興科技公司的達拉皮垂兄弟,改進了最大熵模型并成功的運用了最大熵模型和其他些先進的數學工具對股票預測,取得了前所未有的成功。據統計,從該基金1988年創六至今,它的凈同報率高達平均每年34%。也就是說,如果1988年你在該基金投入一塊錢,今天你能得到200塊錢。這個業績,遠遠超過股神巴菲特的旗艦公司伯克夏哈撒韋(Bcrkshirc Hathaway)。同期,伯克夏哈撒韋的總回報是16倍。縱觀現代科技技術,很多數學手段被廣泛用來信息處理,包括隱含馬爾可大模型、子波變換、貝葉斯網絡等等,在華爾街多有直接的應用。
參數設置。對A股市場做了實證研究(2010年~2016年),首先,本文作出如下說明:
隱藏狀態數(hidden state)∶既要保證隱含狀態間的相互獨立,又要做出明確的市場現狀分析,進而做出成功的投資策略。基于證券市場隱含狀態的無窮化,所以這就要求HMM模型所觀測的數據的平穩性、廣泛性以及迭代次數的可信服性等。
特征向量∶1日、5日對數收益差、當日對數高低價差、當日成交量、對數獨資余額差,總計5個;假設所有的特征向量的狀態服從高斯分布。
結果如下圖所示,我們用不同的顏色來表示不同的狀態:
可以看到,不同市場的狀態都可以用HMM來表示出來。大體上,我們可以認為市場有三大種(包括六種形態)顯著不同的特征,即快速上升狀態,快速下跌狀態以及震蕩狀態。其中,震蕩這種狀態最為復雜,也就是難于預測,這可能與時下的國家經濟政策、投資者的投資傾向、消費的季節性等因素相關。震蕩狀態包含有不同的亞隱藏狀態,例如震蕩上升,震蕩下跌等復雜的市場狀態。需要說明的是,這里對操作做了延時一日的處埋,即當天得到某狀態后,第二天才能進行操作。可以看到,狀態0和狀態2是一個明顯的上升階段,可以分別對應于牛市的泡沫期和熊市的反彈期;可以明顯看出,熊市下跌期是狀態1,泡沫破裂階段對應狀態4,狀態5很可能是市場由于某種原因上升后做出的的調整,而狀態3的走勢比較平穩,所以更加符合當前的市場狀態。
利用股指期貨市場可以做空的優勢,我們可以做出這樣一個策略,在不考慮第三天的情況下,當處于狀態0和2時,第二天做多,當處于狀態1、2和5時第二天做空,其收益曲線圖如下所示:
從圖中可以看到,從2010年至2016年的約6年間,可以獲得約10倍的收益(股災過后的影響被盡量壓縮了),約為46.3%的年化收益率。所以這個模型的可靠性是相當可以。由于技術的限制,在現有的Python現有的版本中HMMleam擴展包不夠完善,無法實時生行數據回測,所以日前暫時無法執行相關實時測試,相信等到該擴展包完善之后就能夠實際投入量化操作之中進行實盤交易了。
由于當代A股市場更加的市場化、法治化、國際化,極大地打擊了市場投機,這對有些原本被高估的板塊施加了更大的壓力。而優質藍籌股卻面臨著前所未有的給予,這些優質股往往與經濟基本面分析密切聯系,越來越受到投資者的青睞,成為大眾投資的重地,如大消費、大健康以及高端制造業等領域。與此同步,市場也更加注重對前景看好的板塊給予更多的優惠政策。近年以來,“龍頭+白馬”股的強勢行情,使得A股市場的機構投資成為重要的資金來源,公募、私募和保險等資金不斷涌入。目前,投資者把重倉的重心轉移向了優質股,這意味著企業的長期、穩定的盈利將會被給予更多的關注,而短期的炒作一方面由于投資者更加趨于理智化,另一方面由于監管力度的加強而越來越少,這有利于社會資金的有效配置。從投資者的傾向來看,未來資金有可能集中分布在兩個板塊:一方面是致力于經濟轉型和經濟創新的新興企業,比如互聯網行業;二是代表企業核心競爭力的產業,也就是實力產業。最近“漂亮50”做為A股市場最具有發展潛力的藍籌股的代表,其走勢大致上緊隨大盤走勢,往往受到機構投資者的青睞。“漂亮50”往往會造成指數加速上行,經常出現在市場最后一沖的階段,所以對于這種行情在把握時要隨時準備撤離。而隱馬爾可夫模型HMM的證券市場擇時策略在風險和收益方面,長期表現良好,適合長期操作,而且面對極端情況能夠保持穩定,具有良好的實用價值,適用于長期操作,對于投資者來說,能夠大致預測合適的入場時機,是一個不錯的擇時策略選擇。