999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習和經驗模態分解的跨期套利研究

2022-01-16 01:25:20周亮陳辰李寧
西南大學學報(自然科學版) 2022年1期
關鍵詞:信號模型

周亮,陳辰,李寧

1. 湖南財政經濟學院 財政金融學院,長沙 410205; 2. 西南財經大學 金融學院,成都 611130

跨期套利是利用同一種期貨品種、不同到期時間合約間價差的不尋常變動,進而實施反向交易,在兩個合約間價差回歸常態時進行平倉獲利的投資方式.相對于股票等金融工具的買入并持有策略而言,跨期套利由于交易的是同一種期貨品種不同合約之間的價差,相對風險更低.相對于跨品種或者跨市場套利,跨期套利的合約價差更為穩定,因此投資的穩定性更高,風險也相對較低.跨期套利在價差超過正常值較遠的時候進行反向交易,單筆利潤相對于買入持有的趨勢投資策略往往更低,由于期貨市場具有較高的杠桿屬性,且T+0的交易模式使得交易頻率可以更高,致使套利交易的風險調整后收益往往更高[1-4],致使越來越多的基金公司在實踐中引入套利交易.同時,套利交易與買入持有策略間的相關性極低甚至為負,因此是分散投資風險及規避尾部風險的重要手段,如2020年年初新冠肺炎疫情導致全球股票市場、債券市場、商品市場均發生了大幅回撤,如果在投資組合中加入套利交易,則可以對尾部風險進行極為有效的控制。

對價差的準確預測是跨期套利成功實施的關鍵所在,現有絕大部分文獻及實際投資者均是利用價差均值回復原理的標準距離法設計策略,即當價差超過合理范圍(常見的為均值±1倍或多倍標準差)的時候進行反向交易,待價差回到均值附近時進行平倉[5-7].隨著機器學習模型在金融預測領域應用得越來越廣泛、且預測精度高,眾多學者和投資者利用機器學習模型對價差進行預測,并在預測價差超過一定閾值后進行交易,從而獲得套利收益.常用來進行套利交易的機器學習模型包括人工神經網絡[8-12]、支持向量機[13-14]和隨機森林[15]等。

但是,直接對價差進行預測無疑喪失了許多細節信息,如熊志斌[16]和周亮[17]對人民幣匯率的研究均發現,用ARIMA模型預測線性部分、用機器學習模型預測非線性部分或殘差部分能夠實現對離岸人民幣匯率更精準的預測.Huang等[18]提出的經驗模態分解(EMD)模型在工程信號領域有著廣泛的應用,該模型可以將信號分解為多個本征模函數(IMF)及殘差項,每個本征模函數及殘差項均有自身的特征益于分析及預測.自EMD模型提出后,眾多學者將該模型應用于經濟問題分析,包括原油價格分析[19-20]、環境問題分析[21-23]等,相對于對原始數據的直接分析,利用分解信號進行分析的研究結果更為準確和穩健。

本文擬采用EMD模型對滬深300股指期貨當月合約與下月合約的價差進行分解,并利用神經網絡、支持向量機、隨機森林以及ARIMA模型分別對高頻和低頻信號進行預測,再從預測準確性及套利績效兩個方面來評估模型的優劣.相較于已有期貨跨期套利的文獻,本文的主要創新之處在于:① 通過EMD模型對原始價差變動序列進行滾動分解,再利用各機器學習模型對分信號進行預測,相對于純機器學習預測模型,對序列信號考慮得更加周全和完整,也大幅提高了模型的預測精度及套利績效; ② 通過將多個機器學習模型及線性的時間序列模型進行比較及綜合,既挑選出了更適用于跨期套利的模型,同時也將線性模型和非線性模型整合,在增加模型套利績效的同時,也增加了機器學習模型的經濟解釋能力。

1 研究設計

1.1 機器學習模型

1.1.1 Elman網絡

Elman神經網絡是一種簡單的循環神經網絡,在眾多學者的研究中均表現出超過普通反饋神經網絡(如BP網絡)的特征[12,24].Elman神經網絡除了常見的輸入層、隱藏層和輸出層之外,在隱藏層的輸入和輸出之間增加了一個承接層,該模塊存儲了隱藏層的輸入信號,再作為輸入變量影響隱藏層的下期輸入,具體結構如圖1所示。

圖1 Elman神經網絡結構圖

Elman神經網絡的傳導公式為:

xt(t)=x(t-1)

x(t)=f1(w1xc(t)+w2(u(t-1)))

y(t)=f2(w3x(t))

(1)

式(1)中,w1,w2,w3分別表示承接層到隱藏層、輸入層到隱藏層及隱藏層到輸出層之間的連接權重;u為輸入向量,x和xc分別為隱藏層和承接層的輸出向量;f1(·)為隱藏層的激勵函數,f2(·)為輸出層的激勵函數,本文采用常見的sigmod激勵函數,由于實證中輸入層包括20個節點,因此我們將隱藏層設置為40個節點。

1.1.2 隨機森林

隨機森林(RF)是一種集成學習方法,它的基本單元是決策樹,每棵決策樹都是一個分類器.隨機森林只關注樹的集成學習,在樹的集成(森林)產生之后,該模型使用投票的方法來組合預測結果,將投票次數最多的類別指定為最終的輸出.隨機森林可以處理大量的數據,而大數據中所謂的“維數災難”常常會讓其他模型失敗,同時隨機森林對于大多數學習任務的誤差率幾乎和其他方法處于同等水平,并具有更少的過度擬合傾向.本文中隨機森林采用500顆決策樹進行分析。

1.1.3 支持向量回歸

SVM模型的目標是最大化支持向量與超平面之間的距離.SVM基于預測函數f(·)設置了一個通道ε.如果數據點在通道之內,則損失函數為零; 如果數據點在通道之外,則損失函數設為|yi-f(w,xi)|-ε.二次規劃問題可以設置為:

st:

yi-f(wTxi)≤ε+ξi

(2)

(3)

式(3)中,k(xi,x*)為核函數,將原始數據的非線性特征映射到高維空間,從而能夠采用線性關系來對數據進行預測,本文采用實證中最常見的RBF(Radial Basis Function)徑向基核函數。

1.2 經驗模態分解(EMD)

EMD是一種非線性、非平穩數據處理方法,它假定數據根據其復雜性可能同時存在多種振蕩模式.EMD可以基于數據本身的局部特征,從原始時間序列提取出本征模函數(IMF),它滿足以下兩個條件:① 函數的極值和零交叉數相同,或最多相差1; ② 函數關于局部零均值是對稱的.這兩個條件確保IMF近似周期性的函數,并且均值為零.IMF是一種類似諧波的函數,但在不同時間具有可變的幅度和頻率。

EMD具體計算步驟如下:① 確定時間序列x(t)的所有極大值和極小值.② 用3次樣條插值生成其上下包絡emin(t)和emax(t).③ 計算上下包絡的逐點平均值m(t)=(emin(t)+emax(t))/2.④ 將x(t)和m(t)之差定義為d(t)=x(t)-m(t).⑤ 如果d(t)是IMF,則將d(t)表示為第i個IMF,并用殘差r(t)=x(t)-d(t)替換x(t),第i個IMF通常表示為ci(t); 如果d(t)不是IMF,則用d(t)替換x(t).⑥ 重復步驟①至步驟⑤,直到殘差項滿足某種停止標準為止。

Huang等[25]指出提取IMF的停止標準為:殘差項滿足零交叉數和極值相差不超過一個,并且可以滿足下列預定標準:成分ci(t)或殘差項r(t)小于實際結果的預定值,或者殘差項r(t)變成單調函數,無法再提取IMF.IMF的總數一般限制為log2N,其中N是數據序列的長度.原始時間序列可以表示為所有IMF和殘差項的總和。

(4)

式(4)中N是IMF的數量,r(t)是最終的殘差項。

EMD往往分解出來的IMF信號比較多,如果對每個信號進行建模,無疑會加大計算機的運算難度,從而導致計算時間過長,因此我們借鑒Zhang等[22]的方法,將所有的IMF合成高頻和低頻兩個部分,實現信號重構.具體計算步驟為:① 計算每個成分(殘差項除外)的c1(t)到ci(t)之和的平均值; ② 使用T檢驗確定均值顯著偏離零的i; ③ 在均值發生突變的變化點,使用IMF從該位置進行部分重建,分別合成低頻部分和高頻部分,即用c1(t)到ci(t)合成高頻部分,用ci+1(t)到cN(t)合成低頻部分。

1.3 模型績效評估

(5)

(6)

(7)

(8)

(9)

1.4 套利模型設計

本文利用機器學習的預測結果來構造跨期套利策略,當模型預測下期價差與當期價差的差值大于α時,則買入當月合約,賣出下月合約; 當模型預測下期價差與當期價差小于-α時,則賣出當月合約,買入下月合約; 當持有套利組合且模型預測值的絕對值小于α時平倉.股指期貨的杠桿是10倍,交易手續費為0.23%%,樣本區間內兩個合約的均價在3 150附近,因此我們假定每單位交易手續費為0.15元.考慮到期貨市場杠桿率較高、風險較大,當出現套利機會時,我們只采用75%的資金進行滾動套利。

2 實證檢驗

2.1 樣本描述

為了檢驗機器學習融合經驗模態分解的跨期套利策略的可行性,本文選擇滬深300股指期貨的當月連續合約和下月連續合約進行分析,由于滬深300股指期貨(以下簡稱IF合約)2010年4月16日才上市,因此最終選擇了IF當月連續和下月連續合約2010年4月16日-2020年7月31日的所有日數據進行分析,共2 503個交易日.圖1報告了兩個合約在樣本區間的走勢,左軸為IF當月連續合約價格曲線,右軸為IF下月連續合約價格曲線.由圖1可以看到,兩者走勢幾乎一致,計算發現兩者相關系數高達0.999,兩者的價差在-130~70之間波動(99%置信區間),存在著跨期套利的可行性。

圖1 IF合約價格走勢

2.2 基于機器學習的預測和套利

2.2.1 預測效果

表1 對價格變動序列的預測效果

2.2.2 套利分析

采用不同的α閾值進行套利,表2報告了4個模型的套利結果,其中Panel A是α=1時的套利效果,Panel B是α=4時的套利效果,Panel C是α=8時的套利效果.第2至第5列分別報告了基于Elman,RF,SVM及ARIMA模型預測結果的套利效果,為了避免單一模型進行預測時的弊端,第6列和第7列綜合了RF模型和ARIMA模型預測結果進行套利.本文采用RF模型是因為其表現較為穩健,預測效果介于Elman和SVM之間; 綜合一個非線性的機器學習模型(RF)和一個線性的時序預測模型(ARIMA),預期會增加套利模型的穩健性; 第6列是將兩個模型預測值進行平均,第7列是只有兩個模型預測值都超過閾值時才進行套利。

表2 套利結果分析

由表2可知,所有模型在任何閾值下均能取得較高的套利收益,收益率最高的是ARIMA模型在α=1時,年化收益率高達46.29%; 勝率最高的是SVM模型在α=8時,勝率高達91.67%,但是其交易時間很短,僅交易了0.81%的樣本時間,即僅交易了12次,其他所有模型的勝率均在57%以上,說明機器學習在進行股指期貨跨期套利時,總體勝率均不錯; 最大回撤最低值是SVM模型在α=8時,僅回撤了0.02%,同時可以看到,絕大部分模型最大回撤均能控制在20%以內,說明套利模型風險控制較好; 所有模型的波動率均低于33%,下行波動率均低于16%,因此模型夏普比率和索提諾比率均較好.夏普比率最高的是SVM模型在α=1時,高達1.857 9; 索提諾比率最高的是SVM模型在α=8時,高達383.06,但是由于此時交易量過低導致下行波動率極低,索提諾比率次高的是SVM模型在α=1時,達到了4.498 6.從第6列和第7列可以看出,相對于僅采用RF或ARIMA進行預測,混合模型的風險控制更好,表現為更低的波動率、下行波動率以及最大回撤,尤其是第7列,只有當兩個模型預測值均大于閾值時才進行套利,風險控制更為出色,說明將非線性模型和線性模型融合使用能夠改善模型的風險控制能力,在實踐中可能應用價值更高.實際上,采用SVM與ARIMA相結合的模型風險控制更佳,限于篇幅,結果未列出。

2.3 EMD分解及機器學習預測

為了更好地了解跨期價差的微觀結構,提高跨期套利的績效表現,本文采用EMD模型對原始價差變動數據進行信號分解(圖2).由圖2可知,EMD模型將原始信號分成了10個IMF信號及1個殘差信號,從IMF1-IMF10分別表示從高頻到低頻的本征模函數.圖2中越低頻的信號越平穩,IMF10及殘差信號已經變成了一條非常平滑的曲線.由于對所有序列進行建模會加大計算機的工作量,本文后面的分析將借鑒Zhang等[22]的方法,將所有IMF合成一個高頻信號和一個低頻信號,其中高頻信號波動劇烈,與原始信號相似性較強,而低頻信號及殘差信號則表現出較強的線性特征。

圖2 EMD分解

表3 EMD滾動套利結果

圖3展示了套利模型的凈值走勢圖.圖3總體來看,各曲線均能保持較平穩的上升趨勢,尤其是EMD-ARIMA模型,最終凈值接近60,平均模型和綜合模型也獲得了較高的回報,最終凈值均在30以上.綜合來看,跨期套利相對于買入持有策略,風險更低(絕大部分股票指數的年化波動率均在30%以上,最大回撤一般在50%以上,個股的波動率和最大回撤更高),如果能夠選擇到合適的套利模型,同樣能夠獲得非常高的投資收益,進而大幅提高投資的風險調整后收益。

圖3 套利模型凈值走勢圖

2.4 分樣本穩健性檢驗

為了檢驗研究結論的穩健性,本文將整個套利區間劃分為兩個時間相等的分樣本,各包括3年時間,分別是2014年7月-2017年7月、2017年8月-2020年7月.表4報告了分樣本檢驗結果,其中Panel A和Panel B是2014年7月-2017年7月的套利結果,Panel C和Panel D是2017年8月-2020年7月的套利結果; Panel A和Panel C僅采用了機器學習模型,Panel B和Panel D采用了機器學習與EMD相結合的套利模型(限于篇幅,同樣僅報告了α=1時的套利結果).由表4可以看到與全樣本相似的結果,無論是2017年7月以前還是以后,機器學習加EMD模型的套利風險雖然與純機器學習模型相當,但其套利收益卻要顯著高于純機器學習模型(除第一階段RF+EMD的投資收益相對RF模型略有降低外),從而使得機器學習加EMD模型的夏普比率和索提諾比率均顯著高于純機器學習模型,本文的研究結論穩健.從表4還可知,相對于2017年7月之前,2017年7月之后的套利收益有所下降,套利風險也有所降低,這也間接說明隨著期貨市場的不斷發展,市場有效性在逐步提高,從而使得套利空間有所收窄。

表4 分樣本穩健性檢驗

2.5 EMD全分解滾動套利效果

表3和表4的分析均是基于EMD分解后再將多個本征模函數合成一個高頻信號和一個低頻信號,這樣的操作方式可以極大地提高計算機的運算速度,但是也會喪失較多的信號信息,因此本文利用RF,SVM和ARIMA分別對每個本征模函數及殘差信號進行預測,再綜合為最終的預測值.相對于合成兩個信號,這種方法利用到了更多的信息,但是運行速度慢了約5倍.表5報告了對每個分解信號單獨進行預測的套利結果,其中Panel A是模型的預測偏差,Panel B是基于預測值的套利結果,同樣僅報告了α=1時的套利績效.與表3相比較可知,基于EMD所有信號的套利模型,RF模型和SVM模型的預測精度有所提高,ARIMA略有下降.所有模型的投資收益均有一定幅度的上升,波動率也略有上升,而下行波動率反而有所下降(除SVM模型略有上升),因此模型的夏普比率和索提諾比率均大幅上升,同時模型的勝率也顯著提高.總體來看,基于EMD所有信號預測值的套利模型相對于將信號合成高頻和低頻的模型,投資績效又有了一定程度的上升,只是損失了計算機的運行速度,在實際投資過程中可能會因價格變動過快而導致實際投資收益與回測收益有一定的偏差,比較適合于較低頻率及較穩定市場的套利投資。

表5 基于EMD所有信號的套利結果

2.6 商品期貨跨期套利研究

為了進一步檢驗研究結論的穩健性,本文還對商品期貨進行了檢驗.螺紋鋼是商品期貨中交易量最大的品種,因此選擇螺紋鋼期貨2020年8月和2020年9月到期合約的30 min數據進行分析,為了避免合約剛上市及快要交割時價格波動幅度過大的弊端,本文選擇了這兩個合約2019年10月15日-2020年7月15日的所有30 min數據,共2 190組.同樣滾動采用1 000組數據來進行建模,通過EMD進行分解后將信號合成高頻和低頻兩部分,并分別利用RF,SVM和ARIMA進行預測并整合.表6報告了機器學習+EMD套利結果,其中Panel A是模型的預測結果,Panel B是模型的套利效果。

表6 螺紋鋼期貨機器學習+EMD套利

由表6可知,3個模型均能對螺紋鋼期貨的價差變動進行較好的預測,且基于預測值的套利模型能夠取得非常不錯的套利績效.ARIMA模型的套利績效最優,其夏普比率和索提諾比率分別高達4.45和11.07; 而綜合模型的套利風險最低,下行波動率和最大回撤分別為8.88%和5.77%.總體來看,EMD分解能夠改善機器學習模型的套利績效,而將線性ARIMA模型和非線性機器學習模型結合使用的綜合模型,能夠更好地控制投資風險,是更為穩健的投資方式。

3 結論與討論

選擇IF當月連續和下月連續合約2010年4月16日-2020年7月31日的所有日數據,利用3種機器學習方法(Elman,RF,SVM)及ARIMA模型對兩個合約的價差變動序列進行預測并構建套利模型.研究結果發現:① SVM和ARIMA模型的預測精確度相對較高,Elman模型表現較差,而RF模型由于集成了多個弱分類器,表現出的結果較為穩健.② 所有模型在任何閾值下均能取得較高的套利收益,同時絕大部分模型最大回撤均能控制在20%以內,波動率均低于33%,下行波動率均低于16%,說明套利模型風險控制較好; 相對于僅采用RF或ARIMA進行預測,混合模型(將預測值進行平均或作為并列條件)的風險控制更好,表現為更低的波動率、下行波動率及最大回撤,說明將非線性模型和線性模型融合使用能夠改善模型的風險控制能力.③ 將機器學習預測與EMD分解技術相融合可以在不提高風險的同時大幅提高模型的收益率,從而使得模型的夏普比率和索提諾比率均有較大幅度上升,表現最好的是EMD-ARIMA模型,其年化收益率高達96.52%,夏普比率和索提諾比率分別高達2.854 9和8.271 1.④ 分樣本檢驗、全IMF信號預測及基于商品期貨市場的套利分析,均證明融合EMD的機器學習模型可以獲得比純機器學習模型更優異的套利效果。

本文的研究結論不僅是對期貨投資理論及人工智能方法在金融領域中應用的補充,同時也具有較強的實踐價值:① 跨期套利是一種有效的投資策略,相對于買入持有等基于價格預測的投資策略,套利策略的風險更低,如果方法得當,收益卻反而可能獲得提高.同時,大量理論研究及實踐均證明,商品期貨策略(尤其是套利策略)與股市等投資策略的相關性極低甚至為負,因此在股票投資策略中增加跨期套利策略,可以有效降低整體投資組合的風險,從而提高投資收益率,并且可以在極端的市場風險下保護資產的安全性.② 機器學習模型在對非線性金融時間序列數據進行預測時具有較好的效果,但是機器學習模型完全由數據驅動,其經濟基礎較為薄弱,因此將其與經濟基礎更為穩健的線性預測模型相結合,可以在提升模型預測能力的同時,增加模型的經濟解釋能力.③ 金融時間序列具有較高的復雜性及噪聲比率,采用單一模型進行預測無疑會喪失很多信息,通過EMD等信號分解模型將金融時間序列進行分解,通過趨勢成分或波動成分的提取分別進行預測,可以實現對金融時間序列更為準確的預測,并進而提升跨期套利成功的幾率。

猜你喜歡
信號模型
一半模型
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
重要模型『一線三等角』
完形填空二則
重尾非線性自回歸模型自加權M-估計的漸近分布
孩子停止長個的信號
3D打印中的模型分割與打包
基于LabVIEW的力加載信號采集與PID控制
一種基于極大似然估計的信號盲抽取算法
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 色欲综合久久中文字幕网| 永久免费AⅤ无码网站在线观看| 玖玖免费视频在线观看 | 四虎影视永久在线精品| 老司国产精品视频| 国产凹凸视频在线观看| 婷婷激情亚洲| 日韩经典精品无码一区二区| 四虎综合网| 色欲不卡无码一区二区| 在线免费a视频| 青青国产在线| 中文字幕人成乱码熟女免费| 亚洲第一黄色网| 亚洲国产日韩欧美在线| 国产亚洲视频免费播放| 亚洲aⅴ天堂| 国产精品久久自在自线观看| 99久久成人国产精品免费| 亚洲VA中文字幕| 亚洲精品色AV无码看| 国产综合色在线视频播放线视 | 亚洲精品在线观看91| 国产欧美日本在线观看| 久久国产拍爱| 99成人在线观看| 精品久久久久久成人AV| 欧美自慰一级看片免费| 国产午夜不卡| 制服丝袜一区| 久久久久亚洲AV成人网站软件| 国产精品综合色区在线观看| 国产亚洲第一页| 久久99蜜桃精品久久久久小说| 亚洲天堂网在线视频| 亚洲精品少妇熟女| 91国内外精品自在线播放| 国产a网站| 成人国内精品久久久久影院| 午夜三级在线| 色综合网址| 国产午夜福利在线小视频| 美女亚洲一区| 欧美黑人欧美精品刺激| 国产Av无码精品色午夜| 亚洲日韩国产精品综合在线观看| 欧美在线视频不卡| 手机在线看片不卡中文字幕| 国产亚洲精久久久久久久91| 蜜臀av性久久久久蜜臀aⅴ麻豆| 久久无码av三级| 国产毛片久久国产| 久久精品中文字幕免费| 中文字幕中文字字幕码一二区| 精品91在线| 日韩精品中文字幕一区三区| 中文字幕无码av专区久久| 精品国产美女福到在线直播| 亚洲欧美日韩高清综合678| 日韩精品成人在线| 国产成本人片免费a∨短片| 亚洲国产天堂久久综合| 亚洲AV成人一区国产精品| 日韩大片免费观看视频播放| 强奷白丝美女在线观看| 91久久性奴调教国产免费| 超碰色了色| 色男人的天堂久久综合| 欧美性猛交一区二区三区| 午夜精品久久久久久久无码软件 | 国产精品入口麻豆| 九九九九热精品视频| 无码aaa视频| 无码网站免费观看| 亚洲一区二区约美女探花| 日韩欧美中文| 国产欧美日韩另类精彩视频| 亚洲无限乱码一二三四区| 国产亚洲高清在线精品99| 欧美中文字幕第一页线路一| 香蕉国产精品视频| P尤物久久99国产综合精品|