999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于隱馬爾科夫模型的市場(chǎng)指數(shù)量化擇時(shí)研究

2018-06-12 02:59:02傅中杰吳清強(qiáng)
關(guān)鍵詞:特征策略模型

傅中杰,吳清強(qiáng)

(廈門大學(xué)軟件學(xué)院,福建 廈門 361005)

精準(zhǔn)預(yù)測(cè)金融市場(chǎng)是一件非常困難的任務(wù),但是預(yù)測(cè)市場(chǎng)在未來(lái)一段時(shí)間的趨勢(shì)或狀態(tài)依舊是可行的.國(guó)內(nèi)外許多文獻(xiàn)已經(jīng)指出,在金融市場(chǎng)尤其是股票市場(chǎng)和債券市場(chǎng)中,存在崩潰、緩慢成長(zhǎng)、熊市和恢復(fù)階段[1].De Angelis等[2]提出了檢測(cè)市場(chǎng)穩(wěn)定和混亂狀態(tài)的框架模型,并且預(yù)測(cè)了兩種狀態(tài)之間的轉(zhuǎn)換.Salhi等[3]使用隱馬爾科夫模型(hidden Markov model,HMM)完成了金融危機(jī)和穩(wěn)定時(shí)期的分類任務(wù).與此同時(shí),多種機(jī)器學(xué)習(xí)算法被應(yīng)用于股票市場(chǎng)預(yù)測(cè),如支持向量機(jī)(support vector machine,SVM)[4-6],神經(jīng)網(wǎng)絡(luò)[7],集成學(xué)習(xí)[8],深度學(xué)習(xí)[9]等.Galeshchuk[7]發(fā)現(xiàn)了擁有最佳預(yù)測(cè)能力的神經(jīng)網(wǎng)絡(luò),并用于交易所數(shù)據(jù)預(yù)測(cè).Bebarta等[8]應(yīng)用集成學(xué)習(xí)方法,組合人工神經(jīng)網(wǎng)絡(luò)、HMM和遺傳算法構(gòu)建了一個(gè)股票預(yù)測(cè)系統(tǒng).并且隨著深度學(xué)習(xí)的興起與成熟,越來(lái)越多的研究開始利用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行股票漲跌預(yù)測(cè)[9].然而由于為股票價(jià)格序列做標(biāo)注難度較大,難以進(jìn)行有效的監(jiān)督學(xué)習(xí),故HMM等非監(jiān)督方法也被大量研究.Hassan等[10]利用HMM找到與預(yù)測(cè)當(dāng)天最相似的歷史數(shù)據(jù),用以預(yù)測(cè)下一天的股價(jià),為股票預(yù)測(cè)提供了一種新范式.之后,Park等[11]使用連續(xù)HMM預(yù)測(cè)下一天收盤價(jià)的變化方向.Seethalakshmi等[12]利用HMM識(shí)別股價(jià)的危機(jī)期和穩(wěn)定期.但這些研究多數(shù)直接使用攜帶噪音更多的日內(nèi)開盤價(jià)、最高價(jià)、最低價(jià)和收盤價(jià)作為模型的輸入特征進(jìn)行訓(xùn)練,沒(méi)有在特征的選擇上進(jìn)行探究,并且沒(méi)有充分發(fā)揮HMM對(duì)隱狀態(tài)的刻畫能力,也缺乏策略層面的充分驗(yàn)證.

為了在環(huán)境多變、難以預(yù)測(cè)的股票市場(chǎng)中研發(fā)可靠的量化交易策略,取代主觀性較強(qiáng)的人工交易方式,有效地保障資產(chǎn)組合保值增值,本研究利用HMM自身特點(diǎn)來(lái)識(shí)別和預(yù)測(cè)市場(chǎng)狀態(tài),將可觀察的特征作為觀測(cè)值,將金融市場(chǎng)狀態(tài)作為預(yù)測(cè)目標(biāo)的隱狀態(tài).在此基礎(chǔ)上,生成指數(shù)基金的量化交易策略,對(duì)策略的有效性通過(guò)各個(gè)層面予以評(píng)估,且通過(guò)與當(dāng)前業(yè)內(nèi)較為常用的基于技術(shù)指標(biāo)以及基于無(wú)監(jiān)督聚類的擇時(shí)方法對(duì)比說(shuō)明了該方法的有效性,同時(shí)也分析了這種方法的局限性和缺陷.

1 股票市場(chǎng)的HMM算法

圖1 HMM量化金融示例Fig.1 Example of HMM on quantitative finance

股票市場(chǎng)周期可以粗略區(qū)分為牛市、熊市和震蕩市,還能分成更多細(xì)粒度的市場(chǎng)狀態(tài),這些市場(chǎng)狀態(tài)難以觀察,且轉(zhuǎn)換過(guò)程往往并非一蹴而就,存在一定的過(guò)渡期.圖1為HMM模型量化金融示例圖,HMM假設(shè)當(dāng)前交易日t的市場(chǎng)狀態(tài)st僅依賴于前一交易日狀態(tài)st-1,故市場(chǎng)狀態(tài)之間的轉(zhuǎn)移概率分布為

P(st|st-1,st-2,…,s1,o1,o2,…,ot-1)=

P(st|st-1),

(1)

其中ot為觀測(cè)狀態(tài),這里可觀測(cè)變量很多,一般表現(xiàn)為股價(jià)和成交量的波動(dòng),也可表現(xiàn)為一些技術(shù)指標(biāo)的數(shù)值變化.進(jìn)而,轉(zhuǎn)移概率矩陣A可表示為

A=(aij)=(P(st=j|st-1=i)).

(2)

市場(chǎng)狀態(tài)st映射到觀測(cè)狀態(tài)ot的輸出概率分布為

P(ot|st,st-1,…,s1,o1,o2,…,ot-1)=P(ot|st),

(3)

B=(bjk)=(P(ot=k|st=j)).

(4)

其中B為輸出概率矩陣.根據(jù)HMM,在上述轉(zhuǎn)移概率和輸出概率的基礎(chǔ)上,還需要有作為市場(chǎng)狀態(tài)序列開端的初始狀態(tài)概率分布π.

π=(πi)=(P(s1=i)).

(5)

因此,股票市場(chǎng)可由一個(gè)完整的HMM模型θ=(A,B,π)的三元組描述.HMM的訓(xùn)練過(guò)程目前尚無(wú)最優(yōu)解方法,一般采用鮑姆-韋爾奇(Baum-Welch)算法,根據(jù)期望-最大化(EM)原理確定局部最優(yōu)的θ三元組.

預(yù)測(cè)過(guò)程則使用維特比(Viterbi)算法,定義狀態(tài)空間為S={s1,s2,…st},令Vt,sk為在已有t個(gè)觀測(cè)值下以狀態(tài)sk為結(jié)尾的最可能狀態(tài)序列的概率如式(6)和(7)所示,則當(dāng)前狀態(tài)st可由式(8)得到.

V1,sk=P(o1|k)·πk,

(6)

Vt,sk=maxs∈S(P(ot|sk)·as,sk·Vt-1,st-1),

(7)

st=argmaxs∈S(Vt,s).

(8)

HMM保留了與當(dāng)前交易日關(guān)聯(lián)最強(qiáng)的前一交易日的信息,簡(jiǎn)化了建模過(guò)程,降低了模型復(fù)雜度;且HMM相較于神經(jīng)網(wǎng)絡(luò)等其他模型來(lái)說(shuō)具有更好的可解釋性;另外HMM也假設(shè)每個(gè)觀測(cè)值僅依賴于當(dāng)前的隱狀態(tài),該假設(shè)符合人們對(duì)于市場(chǎng)的理解認(rèn)知.在牛市和熊市期間,市場(chǎng)的收益率和波動(dòng)率分布具有顯著差異[13],因此有理由相信在不同市場(chǎng)狀態(tài)下觀測(cè)值擁有不同的分布.

總的來(lái)說(shuō),HMM擁有結(jié)構(gòu)簡(jiǎn)單、魯棒性強(qiáng)和可解釋性好的優(yōu)勢(shì),它在手寫體識(shí)別[14-15]、體態(tài)識(shí)別[16]、自然語(yǔ)言處理[17-18]和語(yǔ)音識(shí)別[19]等時(shí)序相關(guān)領(lǐng)域的應(yīng)用已經(jīng)相當(dāng)成熟;其不足主要在于部分遠(yuǎn)期歷史信息的丟失以及缺乏對(duì)每個(gè)狀態(tài)的直接解釋.

2 基于HMM的量化擇時(shí)模型

模型整體流程如圖2所示.首先,通過(guò)開源數(shù)據(jù)接口獲取股票市場(chǎng)指數(shù)的原始日頻歷史行情數(shù)據(jù),并從中計(jì)算得到相關(guān)候選特征.其次,為了能夠找到擁有卓越盈利能力的特征,使用HMM對(duì)單個(gè)候選特征建模以進(jìn)行回測(cè)檢驗(yàn),并根據(jù)評(píng)估指標(biāo)選取有效特征.隨后,利用有效特征集合對(duì)給定狀態(tài)數(shù)的HMM模型進(jìn)行訓(xùn)練.最后在回測(cè)階段,模型被用于預(yù)測(cè)后一交易日的市場(chǎng)狀態(tài),并發(fā)出相應(yīng)的交易信號(hào).通過(guò)上述步驟,得到模型的最佳參數(shù),并用于實(shí)際的量化交易中.

圖2 模型流程圖Fig.2 Flow diagram of the model

2.1 特征準(zhǔn)備

文中使用經(jīng)過(guò)計(jì)算的特征取代前文所述的原始特征.在股票市場(chǎng)中,候選特征主要分為技術(shù)面特征和基本面特征兩類.技術(shù)面特征主要是一些常用的技術(shù)指標(biāo),如相對(duì)強(qiáng)弱指數(shù)(relative strength index,RSI)、平均真實(shí)波動(dòng)率(average true range,ATR)等,在這些指標(biāo)的計(jì)算中往往對(duì)股價(jià)信息做了不同程度的平滑處理,在一定程度上減少了噪聲,且這些指標(biāo)在市場(chǎng)上被廣泛運(yùn)用多年,具有很強(qiáng)的可靠性.基本面特征主要是一些能夠反映國(guó)家宏觀經(jīng)濟(jì)狀態(tài)的指標(biāo).上述特征都從各自的特定角度揭示了當(dāng)前金融經(jīng)濟(jì)市場(chǎng)的狀態(tài).為了使模型更具通用性,本文中的主要研究對(duì)象為技術(shù)面特征.

2.2 特征篩選

特征篩選的主要任務(wù)是從所有候選特征中挑選高質(zhì)量的特征.不同特征從不同角度反映了市場(chǎng)狀態(tài),本文中將這些特征組合在一起以期能夠起到互補(bǔ)效果,提高模型表現(xiàn).

根據(jù)圖2,在生成各個(gè)候選特征后,為每個(gè)特征構(gòu)建單獨(dú)的HMM模型并執(zhí)行單特征檢驗(yàn).訓(xùn)練集上的單特征時(shí)間序列作為HMM模型的輸入,可得到一個(gè)經(jīng)過(guò)單特征訓(xùn)練的HMM模型,隨后觀察該模型在回測(cè)驗(yàn)證集上的預(yù)測(cè)表現(xiàn).由于訓(xùn)練過(guò)程還涉及到狀態(tài)數(shù)目的確定,本文中為每個(gè)單特征分別檢驗(yàn)了狀態(tài)數(shù)n∈[2,13]的回測(cè)情況,并對(duì)各個(gè)狀態(tài)數(shù)下得到的回測(cè)結(jié)果的評(píng)估指標(biāo)計(jì)算平均值獲得該特征的綜合回測(cè)性能表現(xiàn).通過(guò)觀察每個(gè)單特征模型在數(shù)據(jù)集上的回測(cè)表現(xiàn),能夠比較這些特征,評(píng)估它們的效用.在量化金融領(lǐng)域,常用年化收益率、最大回撤、夏普比率、交易勝率和交易頻率等作為評(píng)估指標(biāo).年化收益率是衡量盈利能力的直接指標(biāo),而最大回撤是衡量模型可能遇到的最壞情況的有效指標(biāo),夏普比率衡量了單位風(fēng)險(xiǎn)水平下可獲得的收益,交易勝率代表了盈利交易的比例,交易頻率則衡量了交易成本的數(shù)量.在由專家給出指標(biāo)的相對(duì)重要性后,評(píng)估指標(biāo)RSI、平滑異同移動(dòng)平均線(MACD)、ATR、資金流指標(biāo)(MFI)、順勢(shì)指標(biāo)(CCI)、乖離率指標(biāo)(BIAS)的權(quán)重可由層次分析法獲得,層次分析結(jié)構(gòu)如圖3所示.

圖3 層次分析圖Fig.3 Analytic hierarchy process diagram

評(píng)估出指標(biāo)權(quán)重wi后,可計(jì)算每個(gè)特征的綜合得分,可以得到

(9)

其中,n為評(píng)價(jià)指標(biāo)數(shù)量,ei為評(píng)價(jià)指標(biāo)值.據(jù)此篩選得到表現(xiàn)靠前的K個(gè)特征,組合成訓(xùn)練特征集用于最終模型的訓(xùn)練.

2.3 狀態(tài)識(shí)別

HMM模型的輸出包含多個(gè)狀態(tài)區(qū)間如圖4所示,為了識(shí)別出盈利和非盈利狀態(tài),需要在訓(xùn)練集上為每種狀態(tài)執(zhí)行多頭策略(即在預(yù)測(cè)為該狀態(tài)的交易日買入持倉(cāng),在非該狀態(tài)的交易日賣出),并且統(tǒng)計(jì)它們各自的累積收益率曲線.

圖4 狀態(tài)區(qū)間Fig.4 Interval of states

一種簡(jiǎn)單的方法是根據(jù)在訓(xùn)練區(qū)間上統(tǒng)計(jì)得到的狀態(tài)累積收益情況將狀態(tài)分為2類,累積收益為正,代表可盈利狀態(tài),累積收益為負(fù),代表不可盈利狀態(tài).根據(jù)狀態(tài)所屬類型,相應(yīng)的執(zhí)行多頭或空頭策略.若在考察期間共有T個(gè)交易日,第t個(gè)交易日的累積收益為rt,本文中識(shí)別可盈利狀態(tài)的判定條件為:

rT>15%∨(rT>5%∧(?t≤T,

?rt>-3%)).

(10)

式(10)定義的判定條件實(shí)際上代表了兩類可盈利狀態(tài):第一類是具有明顯盈利能力的狀態(tài),其收益率顯著為正;第二類是微盈利、小波動(dòng)的狀態(tài),多數(shù)出現(xiàn)在震蕩上行的行情.從長(zhǎng)期來(lái)看,這兩類狀態(tài)都能夠帶來(lái)一定的利潤(rùn).

一些盈利狀態(tài)在某個(gè)特定時(shí)期可能會(huì)變得失效,一些狀態(tài)也可能會(huì)從非盈利變?yōu)榭捎?這一方面是由于狀態(tài)的含義不精準(zhǔn),導(dǎo)致狀態(tài)識(shí)別存在一定的誤差,另一方面也是由于市場(chǎng)本身的不穩(wěn)定性造成的.尤其是當(dāng)所選擇狀態(tài)數(shù)量多、比例大的時(shí)候,更有可能引入“不準(zhǔn)確”狀態(tài).為了解決這個(gè)問(wèn)題,采用一種直觀的方法來(lái)滿足需求——?jiǎng)討B(tài)狀態(tài)池.對(duì)每個(gè)狀態(tài)在每個(gè)交易日進(jìn)行監(jiān)控,并根據(jù)式(10)條件進(jìn)行檢驗(yàn),一旦某個(gè)狀態(tài)滿足條件,則將其加入到候選狀態(tài)池中,相應(yīng)地在該狀態(tài)執(zhí)行多頭策略.相反,如果狀態(tài)不能滿足條件,則移出池子.

在狀態(tài)識(shí)別的基礎(chǔ)上,綜合模型還需要確定最佳的狀態(tài)參數(shù).該步驟與單特征篩選的過(guò)程較為類似,主要通過(guò)分析一定范圍狀態(tài)數(shù)的綜合模型在數(shù)據(jù)集上的回測(cè)驗(yàn)證結(jié)果,綜合國(guó)家經(jīng)濟(jì)運(yùn)行背景,選取其中狀態(tài)區(qū)分度大,且盈利狀態(tài)所獲累積收益加和最高的狀態(tài)數(shù)作為模型最終的狀態(tài)參數(shù).

2.4 回 測(cè)

訓(xùn)練后的模型能夠預(yù)測(cè)后一天的市場(chǎng)狀態(tài),根據(jù)預(yù)測(cè)得到的市場(chǎng)狀態(tài)在相對(duì)應(yīng)的指數(shù)交易所交易基金(exchange traded funds,ETF)上進(jìn)行交易.交易規(guī)則如式(11)所示,pt+1為下一個(gè)交易日倉(cāng)位,st+1表示預(yù)測(cè)的下一個(gè)交易日的市場(chǎng)狀態(tài)類型,盈利狀態(tài)為1,其他狀態(tài)為0.

(11)

卓越的投資表現(xiàn)主要由以下3個(gè)因素構(gòu)成:

1) 回報(bào)率衡量投資組合獲取絕對(duì)收益和超額收益的能力,也是一個(gè)交易策略的基本要求.通常用年化收益率和超額收益率來(lái)衡量回報(bào)率,它分別衡量投資策略獲取盈利的速度以及戰(zhàn)勝市場(chǎng)的能力.

2) 風(fēng)險(xiǎn)也是一個(gè)重要的指標(biāo).一個(gè)穩(wěn)定的策略能夠規(guī)避糟糕的市場(chǎng)環(huán)境帶來(lái)的巨大損失,低風(fēng)險(xiǎn)的策略能夠做到低回撤.

3) 交易成本也是需要考慮的因素之一.在大多數(shù)情況下,過(guò)量的交易會(huì)帶來(lái)大量的無(wú)效交易.在中國(guó),證券公司會(huì)對(duì)每筆交易收取成交額的0.15%作為傭金手續(xù)費(fèi),從長(zhǎng)期來(lái)看,這是一筆巨大的開支并且會(huì)侵蝕一部分的利潤(rùn).因此,保持相對(duì)高的勝率和控制合適的交易頻率是必要的.

日頻數(shù)據(jù)的使用也意味著本文中的策略是日頻策略,策略模型監(jiān)控每天的市場(chǎng)狀態(tài)并且在下一個(gè)交易日做出相應(yīng)的交易決策.添加倉(cāng)位控制、止盈止損措施可以在很大程度上進(jìn)一步將風(fēng)險(xiǎn)控制在更低的水平.

3 實(shí) 驗(yàn)

3.1 數(shù)據(jù)介紹

為了簡(jiǎn)化實(shí)驗(yàn),本文中選擇市場(chǎng)指數(shù)作為實(shí)驗(yàn)對(duì)象,國(guó)內(nèi)市場(chǎng)選取滬深300(CSI 300)指數(shù),在國(guó)際市場(chǎng)選取標(biāo)準(zhǔn)普爾500(S&P 500)指數(shù)作為建模標(biāo)的,其中選取跟蹤C(jī)SI 300指數(shù)的300ETF(510300.OF)來(lái)模擬真實(shí)的交易場(chǎng)景.原始數(shù)據(jù)主要包含了交易日期、開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、成交量、成交額信息.本研究選擇CSI 300作為跟蹤標(biāo)的主要原因?yàn)?CSI 300是我國(guó)股票市場(chǎng)最為重要的交易指數(shù)之一,其跟蹤標(biāo)的流動(dòng)性好,不易受到操縱,且波動(dòng)性適中;同時(shí)希望通過(guò)指數(shù)擇時(shí),能夠?yàn)橹笖?shù)增強(qiáng)型基金產(chǎn)品提供一些新思路,以期獲得超過(guò)純被動(dòng)型指數(shù)基金的超額收益.

3.2 特征篩選

如2.2節(jié)所述,本研究根據(jù)5個(gè)評(píng)價(jià)指標(biāo)對(duì)18個(gè)候選特征進(jìn)行綜合打分并篩選特征.在保證一定盈利水平、可控制風(fēng)險(xiǎn)、維持一定的穩(wěn)定性的目標(biāo)下,由專家指導(dǎo)給出每個(gè)指標(biāo)的重要程度分值,可得如式(12)所示的評(píng)估指標(biāo)判斷矩陣C.

(12)

矩陣元素cij表示指標(biāo)i相對(duì)于指標(biāo)j的相對(duì)重要程度,矩陣自左向右和自上向下分別表示年化收益率、最大回撤、夏普比率、交易勝率、交易頻率.通過(guò)對(duì)式(12)中的C進(jìn)行特征向量分析,取最大特征值對(duì)應(yīng)的特征向量進(jìn)行歸一化,即可得到每個(gè)指標(biāo)具體對(duì)應(yīng)的權(quán)重,本研究中上述指標(biāo)最終權(quán)重向量W=(wi)=[0.30,0.25,0.20,0.15,0.10].其中最大回撤和交易頻率指標(biāo)是反向指標(biāo),因此在計(jì)算最終分值時(shí)需要給予負(fù)值處理.另外由于評(píng)價(jià)指標(biāo)存在量綱不一致問(wèn)題,需要在計(jì)算前進(jìn)行標(biāo)準(zhǔn)化,主要依據(jù)各個(gè)評(píng)估指標(biāo)的含義,以及其在量化投資領(lǐng)域常見(jiàn)的取值范圍進(jìn)行最大最小標(biāo)準(zhǔn)化(max-min normalization),夏普比率主要取值范圍在(0,10),其余指標(biāo)取值范圍主要在(0,100),映射后可使所有指標(biāo)不會(huì)帶有額外的權(quán)重影響.

表1 候選特征得分

表2 所選特征的平均測(cè)試結(jié)果

注:*表示單特征下表現(xiàn)最好的狀態(tài)數(shù),()表示擁有最高累計(jì)收益率的狀態(tài)數(shù),R表示累積收益率與最大回撤率比值,下同.經(jīng)過(guò)上述步驟并結(jié)合式(9),便可為每個(gè)候選特征打分,選取其中得分高于5分、最大回撤小于30%且夏普比率高于1的特征作為篩選后特征集.表1列出了各個(gè)候選屬性的得分,最終選出了6個(gè)特征:14日ATR、20日價(jià)格效率、每日收益率、MACD、意愿指標(biāo)和MFI.表2給出了這些特征作為單特征模型在2014—2016年間的表現(xiàn).表中的結(jié)果是狀態(tài)數(shù)分別為2~13時(shí)的測(cè)試結(jié)果統(tǒng)計(jì)平均值.一些特征在特定的狀態(tài)數(shù)上表現(xiàn)突出.以這些特征為輸入的模型的回測(cè)結(jié)果均獲得了正的年化收益率,勝率大多超過(guò)50%,且交易次數(shù)適中.

3.3 狀態(tài)識(shí)別

如圖5所示,將表2中選出的特征組合為每個(gè)交易日維度d=6的特征向量,作為綜合HMM模型的輸入.對(duì)于不同的市場(chǎng),有不同的理想狀態(tài)數(shù).實(shí)驗(yàn)結(jié)果表明,一些狀態(tài)可能從非盈利狀態(tài)轉(zhuǎn)換為盈利狀態(tài),意味著動(dòng)態(tài)狀態(tài)池是必要的.實(shí)際上,在模型中隱狀態(tài)的含義是不確定的,隱狀態(tài)可能代表了某段時(shí)期的賺錢效應(yīng),也可能代表了市場(chǎng)的波動(dòng)率.在一定程度上,可以通過(guò)輸入不同的特征集來(lái)控制隱狀態(tài)的內(nèi)在含義,這解釋了為什么在表2中“每日收益率”的回測(cè)結(jié)果能夠取得最高的累積收益率.

圖5 組合特征Fig.5 Combined features

表3第1行為配合動(dòng)態(tài)狀態(tài)池并取得最佳回測(cè)表現(xiàn)的9狀態(tài)HMM模型得到的結(jié)果,在回測(cè)過(guò)程中,動(dòng)態(tài)狀態(tài)池由3狀態(tài)增加到4狀態(tài),說(shuō)明其檢測(cè)到了新的盈利狀態(tài).為了探索通過(guò)動(dòng)態(tài)狀態(tài)池能夠獲得的利潤(rùn)空間上限,引入未來(lái)函數(shù)對(duì)比實(shí)驗(yàn)結(jié)果.訓(xùn)練集被定義在2005—2013年,回測(cè)驗(yàn)證集定義為2014—2016年.通過(guò)直接觀察2005—2016年間滿足式(10)定義的條件的狀態(tài),得到一個(gè)包含未來(lái)信息的“未來(lái)狀態(tài)集”.

圖6 CSI 300指數(shù)走勢(shì)圖(2014—2016年)Fig.6 Trend chart for CSI 300 index (2014—2016)

表3 9狀態(tài)數(shù)HMM在CSI 300指數(shù)上的回測(cè)結(jié)果(2014—2016年)

注:灰色表示使用了未來(lái)狀態(tài)集的結(jié)果,下同.

表3中第2和3行分別展示了9狀態(tài)模型在靜態(tài)狀態(tài)集中的預(yù)測(cè)能力和獲取潛在更高累積收益的能力.對(duì)比靜態(tài)狀態(tài)集,對(duì)于大部分狀態(tài)數(shù)模型,隨著時(shí)間推移,在回測(cè)區(qū)間上至少出現(xiàn)一個(gè)能夠獲取收益的新狀態(tài),部分狀態(tài)數(shù)模型甚至出現(xiàn)2~3個(gè)新增的候選狀態(tài),且這些新狀態(tài)所帶來(lái)的收益是非常顯著的.從表3中可以看出,9狀態(tài)動(dòng)態(tài)狀態(tài)池模型結(jié)果已經(jīng)非常接近9狀態(tài)下所能達(dá)到的最大潛在收益率105.14%,這說(shuō)明動(dòng)態(tài)狀態(tài)池是有效且必要的.圖6展示了CSI 300指數(shù)2014—2016年期間的市場(chǎng)運(yùn)行情況,CSI 300指數(shù)基準(zhǔn)收益率為43.95%,9狀態(tài)模型獲得了超過(guò)60%的超額收益.

為了檢驗(yàn)本文中模型狀態(tài)識(shí)別能力的通用性,也對(duì)模型在國(guó)際市場(chǎng)的表現(xiàn)進(jìn)行了測(cè)試.由于本文中的股票特征具有明確的市場(chǎng)意義,其有效性具有一定的跨市場(chǎng)通用性,因此在國(guó)際市場(chǎng)中,直接使用3.2節(jié)中在國(guó)內(nèi)市場(chǎng)上篩選得到的特征集.選取美國(guó)金融市場(chǎng)作為測(cè)試目標(biāo),實(shí)驗(yàn)中使用S&P 500指數(shù)2000—2006年期間的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),2007—2016年作為回測(cè)集.表4給出了4狀態(tài)HMM在S&P 500上的回測(cè)結(jié)果.狀態(tài)數(shù)為3時(shí),得到了236.63%的最大潛在累積收益,而指數(shù)的基準(zhǔn)收益為140.27%.圖7分別展示了HMM預(yù)測(cè)結(jié)果在回測(cè)區(qū)間上的狀態(tài)轉(zhuǎn)移情況和各個(gè)狀態(tài)根據(jù)轉(zhuǎn)移情況得到的凈值曲線.從圖7可知,長(zhǎng)期而言,狀態(tài)0,1代表了上升趨勢(shì),狀態(tài)2代表市場(chǎng)反彈,同樣可以帶來(lái)利潤(rùn).另外,狀態(tài)1在開始階段經(jīng)歷了損失,直到2009年才成為一個(gè)候選狀態(tài),而后為整個(gè)資產(chǎn)組合帶來(lái)了利潤(rùn).狀態(tài)3代表了劇烈的下跌趨勢(shì).可以看到訓(xùn)練后的HMM模型避免了2008年金融危機(jī)給股市帶來(lái)的劇烈下跌.受益于更加成熟的市場(chǎng)環(huán)境,在美國(guó)市場(chǎng)只需要更少的狀態(tài)就能夠充分描述市場(chǎng)變化,獲取穩(wěn)定收益.

表4 S&P 500指數(shù)部分結(jié)果(2007—2016年)

圖7 S&P 500指數(shù)4狀態(tài)HMM模型Fig.7 4-states HMM model for S&P 500 index

3.4 結(jié)果分析

文中將基于HMM的量化擇時(shí)模型與基于雙均線技術(shù)指標(biāo)、基于k-均值聚類算法的量化擇時(shí)模型進(jìn)行了性能對(duì)比.

1) 基于雙均線技術(shù)指標(biāo)的量化擇時(shí)模型

移動(dòng)平均線是股票和期貨市場(chǎng)上歷史最為悠久、應(yīng)用最為廣泛的技術(shù)指標(biāo)之一,基于均線的擇時(shí)策略也因其簡(jiǎn)單易懂而廣泛運(yùn)用.雙均線策略主要利用短期移動(dòng)平均線和長(zhǎng)期移動(dòng)平均線之間的相對(duì)位置關(guān)系發(fā)出交易信號(hào)[20-21],短期均線運(yùn)行在長(zhǎng)期均線上方則視為持倉(cāng)信號(hào),反之則視為空倉(cāng)信號(hào).均線模型主要涉及的參數(shù)為長(zhǎng)短期均線的周期.

2) 基于k-均值聚類算法的量化擇時(shí)模型

近年來(lái),已有研究將機(jī)器學(xué)習(xí)方法運(yùn)用在量化投資領(lǐng)域[22].本文中基于k-均值聚類算法將每天的特征向量作為對(duì)每個(gè)交易日的描述,并將歐式距離作為樣本間相似度的度量標(biāo)準(zhǔn),將擁有相似特征的相似交易日進(jìn)行聚類并預(yù)測(cè)為同一種市場(chǎng)狀態(tài),根據(jù)預(yù)測(cè)得到的狀態(tài)發(fā)出相應(yīng)交易信號(hào).

3種方法的比較結(jié)果如表5所示.通過(guò)組合長(zhǎng)短期均線周期(5/10/20/30/60),對(duì)雙均線擇時(shí)模型共10個(gè)參數(shù)組合進(jìn)行了測(cè)試,MA10/MA60參數(shù)組合獲得了最佳表現(xiàn).在2014—2016年期間,該模型共發(fā)生6筆交易,獲得23.73%的年化收益率,此時(shí)最大回撤25.68%.從結(jié)果上看,雙均線策略的平均最大回撤率分別比HMM高出16.5個(gè)百分點(diǎn),比k-均值聚類算法高出13.56個(gè)百分點(diǎn),均線策略本身的延遲性造成了幅度更大的回撤區(qū)間.利用表2中的特征對(duì)基于k-均值聚類算法的量化擇時(shí)模型進(jìn)行測(cè)試.在沒(méi)有使用動(dòng)態(tài)狀態(tài)選擇的情況下,5狀態(tài)k-均值聚類算法在2014—2016年期間取得了15.19%的年化收益率和對(duì)應(yīng)13.29%的最大回撤.通過(guò)使用動(dòng)態(tài)狀態(tài)選擇,8狀態(tài)k-均值聚類算法能夠帶來(lái)84%的潛在收益,對(duì)應(yīng)最大回撤僅12.74%.不過(guò)在大多數(shù)情況下,其勝率都低于50%,且交易頻率偏高.

表5 3種方法統(tǒng)計(jì)結(jié)果

注:Avg表示平均值,Max表示最大值,Min表示最小值,SD表示標(biāo)準(zhǔn)差.

綜合對(duì)比結(jié)果可知,HMM擁有參數(shù)少、魯棒性強(qiáng)和可解釋性強(qiáng)的優(yōu)勢(shì).從最大回撤率的角度來(lái)看,基于HMM的策略的表現(xiàn)皆優(yōu)于k-均值聚類算法和雙均線策略,表明相較于其他常見(jiàn)策略,HMM在規(guī)避風(fēng)險(xiǎn)的敏感性和在控制回撤的有效性上表現(xiàn)更佳.從期望收益率的角度看,基于HMM的策略的表現(xiàn)優(yōu)于k-均值聚類算法,與均線策略相當(dāng).這主要源于HMM合理的馬爾科夫性質(zhì)假設(shè).另外,HMM策略帶來(lái)了長(zhǎng)期高于50%的交易勝率,以及更低的交易頻率.從平均意義上來(lái)說(shuō),它產(chǎn)生更少的交易費(fèi)用.

均線策略的最大缺陷來(lái)源于均線的延遲性,這會(huì)在趨勢(shì)不明顯的震蕩市帶來(lái)長(zhǎng)期的虧損.只有在趨勢(shì)明顯的牛市或熊市期間均線策略才能夠帶來(lái)大幅利潤(rùn)或避免大幅損失.然而通常來(lái)說(shuō),在經(jīng)濟(jì)周期的影響下,市場(chǎng)每經(jīng)過(guò)7~8年才會(huì)有一輪趨勢(shì)明顯的牛市或熊市,因此均線策略所需回報(bào)周期更長(zhǎng).另外,找到合適的均線參數(shù)也是相當(dāng)困難的,很容易造成過(guò)擬合.而k-均值聚類算法則完全沒(méi)有考慮相鄰交易日之間的關(guān)系,導(dǎo)致了頻繁的狀態(tài)轉(zhuǎn)換和高昂的交易成本.

4 結(jié) 論

本研究圍繞量化投資領(lǐng)域的量化擇時(shí)問(wèn)題,研究了HMM在該領(lǐng)域的應(yīng)用,給出了如何基于HMM構(gòu)建量化交易策略的完整流程.同時(shí)將基于移動(dòng)平均線和k-均值聚類算法的量化擇時(shí)模型作為對(duì)比,對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析,驗(yàn)證了HMM具有識(shí)別市場(chǎng)中長(zhǎng)期狀態(tài)的能力.HMM的主要原理在于馬爾科夫性質(zhì)的假設(shè),相鄰時(shí)序樣本之間的關(guān)聯(lián)信息能夠被有效利用,隱狀態(tài)的轉(zhuǎn)換存在一定的概率分布,因而它能夠選擇合適的交易時(shí)機(jī),并在市場(chǎng)迎來(lái)暴跌時(shí)有效保護(hù)資產(chǎn)組合.另外相較于其他兩種常見(jiàn)策略,它在敏感性和穩(wěn)定性上有更好的表現(xiàn).

盡管HMM在量化擇時(shí)上有較為優(yōu)越的表現(xiàn),但是仍然存在一些不足,在后續(xù)的研究中將進(jìn)一步改進(jìn).

1) 當(dāng)前模型的狀態(tài)選擇依然屬于靜態(tài)規(guī)則,不能有效監(jiān)控各個(gè)狀態(tài)的動(dòng)態(tài)變化.當(dāng)某個(gè)狀態(tài)當(dāng)前不能滿足特定條件時(shí),很容易錯(cuò)過(guò)巨額的利潤(rùn)空間,而滿足條件時(shí),又很容易遭遇巨幅回撤,也即在動(dòng)態(tài)狀態(tài)監(jiān)控上存在滯后.因此需要對(duì)動(dòng)態(tài)狀態(tài)選擇機(jī)制進(jìn)行進(jìn)一步的智能優(yōu)化.

2) 擇時(shí)往往只是一個(gè)量化交易系統(tǒng)的一部分,通過(guò)合理利用策略融合技術(shù),將隱馬爾科夫擇時(shí)模型與其他的策略組合使用,充分利用擇時(shí)模型對(duì)市場(chǎng)環(huán)境的預(yù)判能力,能夠更加有效地挖掘個(gè)股股價(jià)的利潤(rùn)空間,規(guī)避市場(chǎng)風(fēng)險(xiǎn).

3) 本文中提出的策略流程,尚未考慮任何倉(cāng)位控制和止盈止損措施,如何合理通過(guò)添加風(fēng)險(xiǎn)控制措施來(lái)提高策略的可控性也是重要的研究課題.

4) 當(dāng)前針對(duì)的主要跟蹤交易對(duì)象為市場(chǎng)指數(shù),在后續(xù)研究中,將進(jìn)一步針對(duì)預(yù)測(cè)難度更大的個(gè)股以及期貨品種進(jìn)行模型研究.

[1] GUIDOLIN M,TIMMERMANN A.Asset allocation under multivariate regime switching[J].Journal of Economic Dynamics & Control,2007,31(11):3503-3544.

[2] DE ANGELIS L,PAAS L J.A dynamic analysis of stock markets using a hidden Markov model[J].Journal of Applied Statistics,2013,40(8):1682-1700.

[3] SALHI K,DEACONU M,LEJAY A,et al.Regime switching model for financial data:empirical risk analysis[J].Physica a-Statistical Mechanics and Its Applications,2016,461:148-157.

[4] 楊新斌,黃曉娟.基于支持向量機(jī)的股票價(jià)格預(yù)測(cè)研究[J].計(jì)算機(jī)仿真,2010,27(9):302-305.

[5] 謝國(guó)強(qiáng).基于支持向量回歸機(jī)的股票價(jià)格預(yù)測(cè)[J].計(jì)算機(jī)仿真,2012,29(4):379-382.

[6] CAO L,TAY F E H.Financial forecasting using support vector machines[J].Neural Computing & Applications,2010,10(2):184-192.

[7] GALESHCHUK S.Neural networks performance in exchange rate prediction[J].Neurocomputing,2016,172(C):446-452.

[8] BEBARTA D K,SUDHA T E,BISOYI R.An intelligent stock forecasting system using a unify model of CEFLANN,HMM and GA for stock time series phenomena[C]∥Emerging Ict for Bridging the Future.Berlin:Springer-Verlag Berlin,2015:485-496.

[9] 李文鵬,高宇菲,錢佳佳,等.深度學(xué)習(xí)在量化投資中的應(yīng)用[J].統(tǒng)計(jì)與管理,2017,9(8):104-106.

[10] HASSAN R,NATH B.Stock market forecasting using hidden Markov model:a new approach[C]∥5th International Conference on Intelligent Systems Design and Applications.Los Alamitos:IEEE,2005:192-196.

[11] PARK S H,LEE J H,SONG J W,et al.Forecasting change directions for financial time series using hidden Markov model[C]∥Rough Sets and Knowledge Technology.Berlin:Springer,2009:184-191.

[12] SEETHALAKSHMI R,KRISHNAKUMARI B,SAAVITHRI V.Gaussian kernel based HMM for time series data analysis[C]∥Conference Proceedings of 2012 International Conference on Management Issues in Emerging Economies.Thanjavur:IEEE,2012:105-109.

[13] 李臘生,翟淑萍,關(guān)敏芳.證券市場(chǎng)收益率分布時(shí)變性的經(jīng)濟(jì)學(xué)分析及其我國(guó)的經(jīng)驗(yàn)證據(jù)[J].統(tǒng)計(jì)研究,2011,28(11):66-78.

[14] FIERREZ J,ORTEGA-GARCIA J,RAMOS D,et al.HMM-based on-line signature verification:feature extraction and signature modeling[J].Pattern Recognition Letters,2007,28(16):2325-2334.

[15] 肖明,賈振紅.基于輪廓特征的HMM手寫數(shù)字識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(33):172-174,211.

[16] CHEN F S,FU C M,HUANG C L.Hand gesture recognition using a real-time tracking method and hidden Markov models[J].Image and Vision Computing,2003,21(8):745-758.

[17] KHAN W,DAUD A,NASIR J A,et al.A survey on the state-of-the-art machine learning models in the context of NLP[J].Kuwait Journal of Science,2016,43(4):95-113.

[18] 韓普,姜杰.HMM在自然語(yǔ)言處理領(lǐng)域中的應(yīng)用研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010(2):245-248,252.

[19] PARAMONOV P,SUTULA N.Simplified scoring methods for HMM-based speech recognition[J].Soft Computing,2016,20(9):3455-3460.

[20] 譚磊.趨勢(shì)跟蹤類策略的內(nèi)在邏輯[J].當(dāng)代經(jīng)濟(jì),2017,27(6):144-145.

[21] 景泰然.量化投資在期貨交易中的應(yīng)用[J].現(xiàn)代商業(yè),2015,12(18):152-153.

[22] 張文俊,張永進(jìn).4種數(shù)據(jù)挖掘典型分類方法在股票預(yù)測(cè)中的性能分析[J].安徽工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,34(1):97-102.

猜你喜歡
特征策略模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
例談未知角三角函數(shù)值的求解策略
如何表達(dá)“特征”
我說(shuō)你做講策略
不忠誠(chéng)的四個(gè)特征
高中數(shù)學(xué)復(fù)習(xí)的具體策略
抓住特征巧觀察
3D打印中的模型分割與打包
主站蜘蛛池模板: 日本a级免费| 国产精品美乳| 成人国产一区二区三区| 99精品免费在线| 青青草原国产一区二区| igao国产精品| 精品精品国产高清A毛片| 免费高清毛片| 亚洲第一天堂无码专区| 国产精品久线在线观看| 四虎综合网| 欧美成人一级| 亚洲国产系列| 一级香蕉视频在线观看| a欧美在线| 欧美日韩国产在线人| 日本AⅤ精品一区二区三区日| Aⅴ无码专区在线观看| 99久视频| 欧美激情第一区| 亚洲国产看片基地久久1024| 亚洲精品日产AⅤ| 国产玖玖玖精品视频| 亚洲色图在线观看| 99热这里只有精品久久免费| 最新国产高清在线| 尤物成AV人片在线观看| 在线观看无码av五月花| 婷婷亚洲最大| 亚洲精品成人片在线播放| 伊人欧美在线| 特级欧美视频aaaaaa| 成人午夜福利视频| 被公侵犯人妻少妇一区二区三区| 久久久久青草线综合超碰| 久久久久免费看成人影片| 天堂成人av| 青青草国产一区二区三区| 欧美色香蕉| 午夜日本永久乱码免费播放片| 国产十八禁在线观看免费| 一级香蕉视频在线观看| 国产欧美日韩在线一区| 国产精品久久久免费视频| 国内精品视频在线| 亚洲精品少妇熟女| 日韩免费无码人妻系列| 成人国产精品一级毛片天堂| 久久久久无码精品国产免费| 免费高清自慰一区二区三区| 女同国产精品一区二区| 自拍偷拍欧美| 色综合久久久久8天国| 久久综合五月婷婷| 99久久精彩视频| 国产伦精品一区二区三区视频优播 | 国产在线观看成人91| 青青热久麻豆精品视频在线观看| 国产97区一区二区三区无码| 22sihu国产精品视频影视资讯| 亚洲精品视频免费观看| 欧美国产日韩在线| 欧美午夜理伦三级在线观看| 国产欧美日韩综合在线第一| 真实国产乱子伦视频| 狠狠色综合久久狠狠色综合| 中文字幕中文字字幕码一二区| 好吊妞欧美视频免费| 亚洲美女久久| 亚洲精品国产综合99| 亚洲九九视频| 国产波多野结衣中文在线播放| 欧美日韩成人| 91免费国产高清观看| 国产乱论视频| aa级毛片毛片免费观看久| 国产爽爽视频| 国产一区亚洲一区| 99激情网| 国产精品私拍在线爆乳| 免费国产小视频在线观看| 国产永久在线观看|