牛紅麗,趙亞枝
北京科技大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京 100083
股票市場是金融市場的重要組成部分,能夠在一定程度上反映國家的經(jīng)濟(jì)發(fā)展?fàn)顩r。提前預(yù)判股票市場的走勢,有助于國家監(jiān)管部門了解經(jīng)濟(jì)的運(yùn)行情況,出臺相關(guān)政策對市場進(jìn)行調(diào)整,維護(hù)經(jīng)濟(jì)穩(wěn)定健康發(fā)展。同時(shí),股票市場也是投資市場最重要的組成部分,與其他行業(yè)相比,股票市場是高投資回報(bào)率與高風(fēng)險(xiǎn)并存的,有效的股票價(jià)格預(yù)測可以幫助投資者規(guī)避投資時(shí)的高風(fēng)險(xiǎn)。因此預(yù)測股票價(jià)格對政策制定者和投資者有著十分重要的意義。
由于影響股票價(jià)格的因素眾多,使得股票價(jià)格時(shí)間序列具有非線性、非平穩(wěn)性和高噪聲的特點(diǎn),導(dǎo)致對其價(jià)格的準(zhǔn)確預(yù)測非常困難。國內(nèi)外學(xué)者在股票價(jià)格研究方法上做了許多的研究。早期,計(jì)量經(jīng)濟(jì)學(xué)方法被學(xué)者們用于股票價(jià)格預(yù)測,學(xué)者們利用統(tǒng)計(jì)學(xué)理論對股票價(jià)格的波動和趨勢進(jìn)行預(yù)測研究,指導(dǎo)投資者的投資活動。學(xué)者們常用的計(jì)量經(jīng)濟(jì)學(xué)模型包括自回歸滑動平均模型(ARMA)、差分整合移動平均自回歸模型(ARIMA)、廣義自回歸條件異方差模型(GARCH)。例如,吳玉霞等[1]使用ARIMA模型預(yù)測創(chuàng)業(yè)板股票價(jià)格的走勢和變化趨勢,投資者和企業(yè)在決策時(shí)可參考其預(yù)測結(jié)果。李木易等[2]對股票波動率特征進(jìn)行分析并提出了新的動態(tài)混合HGARCH模型對股票日內(nèi)波動率進(jìn)行分析預(yù)測,提出模型能夠更好地刻畫波動率特征。金瑤和蔡之華[3]將AR模型和Kalman濾波結(jié)合起來預(yù)測股票價(jià)格,新的方法克服了單一模型的缺點(diǎn),取得了更好的預(yù)測結(jié)果。上述研究雖然取得了一定的成果,然而,計(jì)量經(jīng)濟(jì)學(xué)模型有很嚴(yán)格的假設(shè)條件,其在處理線性數(shù)據(jù)占有優(yōu)勢,而股票價(jià)格時(shí)間序列數(shù)據(jù)具有非線性、非平穩(wěn)和高噪聲的特征,使得運(yùn)用傳統(tǒng)計(jì)量經(jīng)濟(jì)學(xué)方法難以取得令人滿意的效果。
相對于計(jì)量經(jīng)濟(jì)學(xué)方法,機(jī)器學(xué)習(xí)方法無需設(shè)置任何假設(shè)條件能直接挖掘輸入數(shù)據(jù)之間的非線性關(guān)系,它的網(wǎng)絡(luò)學(xué)習(xí)模式使得它具有學(xué)習(xí)精度高和泛化能力強(qiáng)的優(yōu)點(diǎn),非常適合于處理非線性、非平穩(wěn)的數(shù)據(jù)集。因此,近年來機(jī)器學(xué)習(xí)方法逐漸取代了計(jì)量經(jīng)濟(jì)學(xué)方法,被廣泛應(yīng)用于股票價(jià)格預(yù)測領(lǐng)域。常用的機(jī)器學(xué)習(xí)方法包括支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等。SVM方法的預(yù)測精度難以令人滿意,因?yàn)槠湓趯斎霐?shù)據(jù)集進(jìn)行特征選擇時(shí),無法篩選出最合適的特征數(shù)量[4]。而人工神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)學(xué)習(xí)模式使其擁有更強(qiáng)大的學(xué)習(xí)能力,在處理非線性、非平穩(wěn)和高頻高噪聲的數(shù)據(jù)集時(shí)更有優(yōu)勢,因而,在股票價(jià)格預(yù)測領(lǐng)域的應(yīng)用更有應(yīng)用前景。近年來,學(xué)者們利用神經(jīng)網(wǎng)絡(luò)在股票價(jià)格預(yù)測領(lǐng)域做了大量的研究。例如,于卓熙等學(xué)者[5]首先采用主成分分析方法對輸入變量進(jìn)行降維后,然后通過廣義回歸神經(jīng)網(wǎng)絡(luò)對股票價(jià)格進(jìn)行預(yù)測,將其預(yù)測結(jié)果與ARIMA模型的預(yù)測結(jié)果對比,目標(biāo)模型具有更好的預(yù)測性能。由于BP神經(jīng)網(wǎng)絡(luò)模型在參數(shù)尋優(yōu)過程中容易陷入局部最優(yōu)解,綦方中等[6]針對這個(gè)問題,利用改進(jìn)的果蠅算法尋找BP神經(jīng)網(wǎng)絡(luò)參數(shù)最優(yōu)解,使其獲得了更好的預(yù)測效果。肖菁和潘中亮[7]利用LM算法改進(jìn)了三層BP神經(jīng)網(wǎng)絡(luò),并用遺傳算法來尋找參數(shù)的最優(yōu)解,來解決傳統(tǒng)神經(jīng)網(wǎng)絡(luò)容易陷入局部最優(yōu)解的問題,實(shí)驗(yàn)結(jié)果也表明,該種方式提高了預(yù)測精度。對于高維的輸入變量,鄧烜堃等[8]使用基于受限布爾茲曼機(jī)的深度自編碼器方法對輸入數(shù)據(jù)集進(jìn)行降維,降維后的數(shù)據(jù)使用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,所提出的降維方法減少了運(yùn)算開銷同時(shí)提高了BP的預(yù)測精度。利用技術(shù)方法改進(jìn)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)在一定程度上避免了在參數(shù)尋優(yōu)過程中陷入局部最優(yōu)解,通過構(gòu)建降維方法篩選有效的輸入變量可以減少神經(jīng)網(wǎng)絡(luò)的計(jì)算負(fù)擔(dān)同時(shí)可以提高模型的預(yù)測精度,但傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在預(yù)測時(shí)往往容易出現(xiàn)過度擬合的現(xiàn)象,導(dǎo)致模型的樣本外預(yù)測能力變差[9]。
與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,深度神經(jīng)網(wǎng)絡(luò)對金融時(shí)間序列預(yù)測更加具有優(yōu)勢,能夠更好地學(xué)習(xí)輸入變量之間的復(fù)雜非線性關(guān)系,取得更好的樣本外擬合結(jié)果[10]。隨著計(jì)算機(jī)運(yùn)算能力的提升,深度學(xué)習(xí)方法受到廣泛關(guān)注。以RNN(recurrent neural network),LSTM(long short-term memory)和GRU(gated recurrent unit)為代表的深度學(xué)習(xí)方法,在股票價(jià)格預(yù)測領(lǐng)域開展了很多的研究。谷麗瓊等[11]使用LSTM和GRU預(yù)測股票價(jià)格,實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)GRU的預(yù)測效果略優(yōu)于LSTM模型且具有更快的訓(xùn)練速度,總體要好于LSTM模型。朱偉等[12]針對電力負(fù)荷時(shí)間序列的隨機(jī)性,使用集合經(jīng)驗(yàn)?zāi)B(tài)分解算法結(jié)合GRU模型預(yù)測短期電力負(fù)荷,發(fā)現(xiàn)與RNN相比,GRU的預(yù)測效果更好。Saud等[13]比較了三種深度學(xué)習(xí)模型,RNN、LSTM和GRU的股票價(jià)格預(yù)測性能,發(fā)現(xiàn)GRU能夠更快更高質(zhì)量的訓(xùn)練模型,有更好的股價(jià)預(yù)測能力。張倩玉等[14]將集成經(jīng)驗(yàn)?zāi)B(tài)分解算法結(jié)合門控循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行股票價(jià)格預(yù)測實(shí)驗(yàn),得出與RNN、LSTM相比,GRU模型能夠有效減少預(yù)測誤差,提高模型預(yù)測能力的結(jié)論。黨建武和從筱卿[15]針對股票數(shù)據(jù)非線性的特點(diǎn),將CNN與GRU結(jié)合,發(fā)現(xiàn)GRU能夠利用其獨(dú)特的門結(jié)構(gòu)學(xué)習(xí)數(shù)據(jù)的時(shí)間依賴關(guān)系和復(fù)雜非線性關(guān)系。門控循環(huán)神經(jīng)網(wǎng)絡(luò)(GRU)克服了RNN在學(xué)習(xí)長期依賴關(guān)系時(shí)存在的梯度消失和梯度爆炸的缺點(diǎn)[16],能夠充分保留時(shí)間序列的歷史信息且運(yùn)算速度快,成為了當(dāng)今預(yù)測股票價(jià)格走勢的熱門工具。
Bagging[17]方法是一種集成學(xué)習(xí)方法,可以將多個(gè)預(yù)測模型組合起來,每種預(yù)測模型都使用經(jīng)原始訓(xùn)練集采樣得到的訓(xùn)練樣本集來構(gòu)建預(yù)測模型。當(dāng)它用于預(yù)測時(shí),不僅可以降低預(yù)測的誤差,還可以降低結(jié)果的方差,避免過擬合的發(fā)生,使得預(yù)測結(jié)果更加穩(wěn)定。例如,Karol[18]將Bagging算法與單個(gè)隱含層的前饋神經(jīng)網(wǎng)絡(luò)結(jié)合預(yù)測波蘭的通貨膨脹數(shù)據(jù),通過與單個(gè)模型的預(yù)測結(jié)果比較,該模型表現(xiàn)出更好的預(yù)測性能。Yin等[19]使用Bagging方法對股票溢價(jià)進(jìn)行預(yù)測,與LASSO方法相比,不管是經(jīng)濟(jì)繁榮還是衰退時(shí)期均取得了更多的經(jīng)濟(jì)收益。王康等[20]為了提高電力系統(tǒng)短期負(fù)荷預(yù)測精度,引入Bagging算法對雙向加權(quán)GRU模型進(jìn)行集成處理來提高模型的預(yù)測能力。Khwaja等[21]提出將裝袋與ANN結(jié)合來改善短期電力負(fù)荷預(yù)測,通過實(shí)際數(shù)據(jù)證明,與單個(gè)ANN相比,兩個(gè)方法結(jié)合后減少了負(fù)荷預(yù)測誤差,并且在不同實(shí)例為并行的10個(gè)集合中,負(fù)荷預(yù)測的誤差變化較小。
上述研究表明,GRU能夠捕獲金融時(shí)間序列的長期依賴關(guān)系且運(yùn)算速度快,在股價(jià)預(yù)測中極具優(yōu)勢。Bagging方法用于預(yù)測研究時(shí)可以減少預(yù)測誤差,提高預(yù)測精度。為此,本文引入Bagging方法并結(jié)合GRU神經(jīng)網(wǎng)絡(luò)對股價(jià)指數(shù)進(jìn)行建模分析。首先,用Bagging方法對訓(xùn)練集進(jìn)行采樣10次,然后使用GRU模型對采樣得到的訓(xùn)練集樣本分別進(jìn)行預(yù)測,最后對預(yù)測結(jié)果取平均值得到最終預(yù)測結(jié)果。通過一個(gè)國內(nèi)指數(shù)(上證指數(shù))和一個(gè)國際指數(shù)(德國DAX)為實(shí)驗(yàn)數(shù)據(jù)對本文構(gòu)建的預(yù)測模型與其他三個(gè)基準(zhǔn)模型(未加入裝袋算法的GRU模型,極限學(xué)習(xí)機(jī)模型ELM和BP)的預(yù)測效果進(jìn)行對比分析,驗(yàn)證本文所提出方法的有效性和實(shí)用性。
本文旨在提出一種有效的股價(jià)預(yù)測方法,為監(jiān)管部門了解股市運(yùn)行狀況,制定有效的調(diào)整政策和幫助投資者規(guī)避股市的高風(fēng)險(xiǎn),提高投資回報(bào)率提供一個(gè)有力的工具。本文的主要創(chuàng)新之處在于:(1)將Bagging方法引入到股指建模預(yù)測中去,通過對訓(xùn)練數(shù)據(jù)集進(jìn)行多次采樣,引入了隨機(jī)性,降低了預(yù)測結(jié)果的方差和誤差。(2)針對采樣生成的多個(gè)訓(xùn)練集,采用GRU對其分別進(jìn)行預(yù)測,GRU模型更好地捕獲了復(fù)雜金融時(shí)間序列的長期依賴性,能夠?yàn)榉蔷€性的金融時(shí)間序列建模提供參考。(3)引入Bagging方法與GRU神經(jīng)網(wǎng)絡(luò)結(jié)合,構(gòu)建了集成學(xué)習(xí)框架,給機(jī)器學(xué)習(xí)建模設(shè)計(jì)提供了參考方向。
RNN不能很好地學(xué)習(xí)股票時(shí)間序列的長期依賴關(guān)系,在訓(xùn)練過程中極易發(fā)生梯度消失和爆炸現(xiàn)象,使得模型陷入局部最優(yōu)解[22]。為了解決這一問題,Hochreiter和Schmidhuber提出了LSTM神經(jīng)網(wǎng)絡(luò)模型[23]。LSTM神經(jīng)網(wǎng)絡(luò)與RNN相比做了一些改進(jìn),增加了能夠保存長期狀態(tài)的單元狀態(tài)(cell state)結(jié)構(gòu),以及三個(gè)對單元狀態(tài)進(jìn)行控制的門(gate)結(jié)構(gòu),分別是遺忘門(forget gate)、輸入門(input gate)和輸出門(output gate)。三個(gè)控制門的存在,使得LSTM可以保存更長時(shí)間的信息。此外,可以通過LSTM的內(nèi)部參數(shù)共享,設(shè)置權(quán)重矩陣維度控制輸出維度。LSTM在輸入和反饋之間建立長時(shí)間的延遲可以避免產(chǎn)生梯度消失或者梯度爆炸現(xiàn)象,能夠很好地學(xué)習(xí)長期依賴關(guān)系。而GRU[24]改進(jìn)了LSTM復(fù)雜的單元結(jié)構(gòu),減少并且合并了LSTM的門結(jié)構(gòu),在保證精度的基礎(chǔ)上增加了網(wǎng)絡(luò)訓(xùn)練的速度[25]。與LSTM有三個(gè)門(輸入門、遺忘門、輸出門)相比,GRU只有更新門(update gate)和重置門(reset gate),相關(guān)細(xì)節(jié)如下所示:
(1)將輸入門、遺忘門、輸出門變?yōu)楦麻TZt和重置門rt。
(2)將LSTM的單元狀態(tài)ct與輸出合并為一個(gè)狀態(tài)ht,圖1為GRU神經(jīng)元的單元結(jié)構(gòu)。

圖1 GRU神經(jīng)元結(jié)構(gòu)Fig.1 GRU neuron structure
更新門Zt決定了上一時(shí)刻隱藏狀態(tài)中有多少信息傳遞到當(dāng)前隱藏狀態(tài)ht中,重置門rt決定了上一時(shí)刻隱藏層狀態(tài)中的信息有多少是需要被遺忘的,h?t為當(dāng)前時(shí)刻的隱藏層的候選狀態(tài),使用重置門可以決定當(dāng)前候選狀態(tài)中需要遺忘多少上一時(shí)刻隱藏狀態(tài)ht-1的內(nèi)容。W是權(quán)重矩陣,b是偏差向量,[ht-1,xt]表示兩個(gè)向量的連接,σ和tanh是S型或者雙曲正切函數(shù)。GRU單元的工作流程可以歸納為式(1)~式(4):

其中,?代表矩陣相乘,⊙代表矩陣對應(yīng)元素相乘。與LSTM相比,GRU僅通過更新門Zt和重置門rt實(shí)現(xiàn)對信息的保留和遺忘,加快了訓(xùn)練速度。
Bagging[17]方法是一種集成學(xué)習(xí)方法,可以將多個(gè)預(yù)測模型組合起來,每種預(yù)測模型都使用經(jīng)過原始訓(xùn)練集采樣產(chǎn)生的訓(xùn)練集樣本來構(gòu)建預(yù)測模型。當(dāng)它用于預(yù)測時(shí),通過對訓(xùn)練集進(jìn)行隨機(jī)化采樣處理,可以有效減少預(yù)測結(jié)果的方差,避免過擬合的發(fā)生,使得預(yù)測結(jié)果更加穩(wěn)定[20]。Bagging方法的主要過程是從初始訓(xùn)練集中隨機(jī)有放回地采樣得到T個(gè)訓(xùn)練數(shù)據(jù)集,利用采樣得到的訓(xùn)練集樣本訓(xùn)練基學(xué)習(xí)器。對于預(yù)測問題,將T個(gè)預(yù)測模型產(chǎn)生的T個(gè)預(yù)測結(jié)果進(jìn)行平均加權(quán)處理得到強(qiáng)學(xué)習(xí)器。Bagging涉及的步驟如下所示:
(1)輸入訓(xùn)練樣本集:假設(shè)神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù)為p,全部數(shù)據(jù)集預(yù)處理后得到m個(gè)樣本。則處理后的樣本為A1=(x1,x2,…,xp,xp+1),…,Ai=(xi,…,xi+p-1,xi+p),…,Am=(xm,…,xm+p-1,xm+p)。
(2)根據(jù)預(yù)處理得到的初始訓(xùn)練集D={A1,A2,…,Am},從初始訓(xùn)練集中隨機(jī)有放回采集m個(gè)樣本,得到一次采樣結(jié)果Ft。
(3)迭代次數(shù)為T,對于每個(gè)t=1,2,…,T:對初始訓(xùn)練集進(jìn)行第t次隨機(jī)有放回采樣,得到采樣集Ft,用采樣集Ft訓(xùn)練第t個(gè)基模型。
Bagging-GRU集成的架構(gòu)如圖2所示,模型結(jié)構(gòu)主要分為數(shù)據(jù)預(yù)處理、隨機(jī)采樣、訓(xùn)練、預(yù)測和集合。首先數(shù)據(jù)預(yù)處理將數(shù)據(jù)分為訓(xùn)練集和測試集,然后從輸入層的訓(xùn)練數(shù)據(jù)集中隨機(jī)有放回地抽取樣本數(shù)m的樣本集,共采集T次,得到T個(gè)訓(xùn)練集。隨機(jī)有放回采樣使得這T個(gè)訓(xùn)練集互不影響。將GRU神經(jīng)網(wǎng)絡(luò)作為基學(xué)習(xí)器,用采樣得到的樣本集訓(xùn)練GRU神經(jīng)網(wǎng)絡(luò)。通過T個(gè)訓(xùn)練好的GRU模型對測試集數(shù)據(jù)進(jìn)行預(yù)測,得到T個(gè)預(yù)測結(jié)果,最后將T個(gè)預(yù)測結(jié)果進(jìn)行平均加權(quán)處理獲得最終預(yù)測結(jié)果。

圖2 Bagging集成策略Fig.2 Bagging integration strategy
本文采用國內(nèi)上證指數(shù)(000001)、滬深300指數(shù)和標(biāo)普500指數(shù)、恒生指數(shù)的日收盤價(jià)數(shù)據(jù)作為預(yù)測變量,數(shù)據(jù)來源于Wind數(shù)據(jù)庫。為了消除數(shù)據(jù)之間的量綱差距,首先將指數(shù)取自然對數(shù)lnP,后對數(shù)據(jù)進(jìn)行歸一化處理。歸一化過程采用以下公式:

上證指數(shù)數(shù)據(jù)和標(biāo)普500指數(shù)時(shí)間范圍從2016年10月25日起至2020年11月30日止,共1 000條數(shù)據(jù)。滬深300指數(shù)數(shù)據(jù)時(shí)間范圍從2017年5月18日起至2021年6月25日止,共1 000條數(shù)據(jù)。恒生指數(shù)數(shù)據(jù)時(shí)間范圍從2017年6月7日起至2021年6月25日止,共1 000條數(shù)據(jù)。為了觀察不同預(yù)測方法對股指的預(yù)測效果,本文取各指數(shù)整體數(shù)據(jù)集最后100天作為測試數(shù)據(jù)集,剔除測試集即為對應(yīng)訓(xùn)練數(shù)據(jù)集。
本文的Bagging-GRU和GRU預(yù)測模型是在Python3.7中的Keras框架下搭建并完成計(jì)算的,Keras版本為2.0.5,采用Keras中的Sequential模型結(jié)構(gòu),建立GRU預(yù)測模型。ELM和BP模型的預(yù)測是用Matlab搭建完成的。四種模型,Bagging-GRU、GRU、ELM、BP的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)都為4-4-1,即輸入節(jié)點(diǎn)數(shù)量為4,隱藏節(jié)點(diǎn)數(shù)為4,輸出節(jié)點(diǎn)為1。其中GRU模型的批處理大小(batch_size)為2,迭代次數(shù)(epoch)為100。基學(xué)習(xí)器的數(shù)目取10。
為了評估目標(biāo)模型Bagging-GRU的對股票價(jià)格的預(yù)測性能,本文采用平均絕對(MAE)、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)和平均絕對百分比誤差的標(biāo)準(zhǔn)差(SDAPE)[9]四種誤差評價(jià)指標(biāo)對模型預(yù)測性能進(jìn)行評價(jià),四種指標(biāo)的計(jì)算公式如下所示:


MAE、RMSE、MAPE是用來度量真實(shí)值與預(yù)測值之間的誤差,數(shù)值越小證明誤差越小。SDAPE的值越小代表預(yù)測結(jié)果越穩(wěn)定。
為了比較它們的預(yù)測性能,進(jìn)行了對比實(shí)驗(yàn),觀察不同模型對同一指數(shù)的單步預(yù)測效果和同一模型對不同指數(shù)的預(yù)測效果,對比分析目標(biāo)模型與其他模型的預(yù)測精度和穩(wěn)定性差異情況。
本文采用100個(gè)交易日的長度衡量Bagging-GRU模型與GRU模型,ELM模型和BP神經(jīng)網(wǎng)絡(luò)四種預(yù)測算法的表現(xiàn)。圖3展示了4種建模方法的100天預(yù)測結(jié)果,表1~表4展示了4個(gè)不同指數(shù)的測試集的預(yù)測誤差。

表4 100個(gè)交易日恒生指數(shù)預(yù)測結(jié)果Table 4 Hang Seng index forecast results for 100 trading days
從圖3中可以看出,四條曲線都圍繞在真實(shí)值周圍上下波動,其中Bagging-GRU的預(yù)測曲線與真實(shí)值曲線最為接近。從表1~4的誤差統(tǒng)計(jì)表中可以看出,GRU對上證指數(shù)的預(yù)測精度高于ELM和BP模型,穩(wěn)定度低于ELM模型高于BP模型。GRU對標(biāo)普500指數(shù)的預(yù)測精度高于ELM和BP模型,穩(wěn)定度低于上述兩種模型。對滬深300指數(shù)的預(yù)測精度要高于ELM和BP模型,但是穩(wěn)定度稍微低于ELM模型。對恒生指數(shù)的預(yù)測精度和穩(wěn)定度均高于ELM和BP模型。而ELM模型對上證指數(shù)、標(biāo)普500指數(shù)、滬深300指數(shù)和恒生指數(shù)的預(yù)測精度和穩(wěn)定度優(yōu)于BP模型。將Bagging方法和GRU模型結(jié)合以后,顯著提高了GRU的預(yù)測精度和穩(wěn)定度。以恒生指數(shù)為例,Bagging-GRU模型的MAE、RMSE、MAPE值分別為0.012 7、0.015 8、0.124 0相對于ELM的0.014 7、0.018 6、0.142 9,它的預(yù)測精度分別提高了13.6%、15.1%和13.2%;相對于BP的0.016 8、0.021 8、0.163 4,分別提高了24.4%、27.5%、24.1%;相對于GRU的0.013 3、0.017 1、0.129 5,分別提高了4.5%、7.6%和4.2%;Bagging-GRU的預(yù)測SDAPE值為0.009 1,相對于GRU(0.010 4)、ELM(0.011 1)、BP(0.013 6)穩(wěn)定度分別提升了12.5%、18.0%、33.1%,穩(wěn)定度有了大幅度提升。對于另外三個(gè)指數(shù)、精度和穩(wěn)定度都有相似程度的提升。由此可見,Bagging-GRU方法在預(yù)測股價(jià)指數(shù)時(shí),對多種股指數(shù)據(jù)預(yù)測都有效,可提高預(yù)測精度和穩(wěn)定度,對股指預(yù)測具有優(yōu)越性。

圖3 4種建模方法的預(yù)測結(jié)果對比Fig.3 Comparison of long-term prediction results of four modeling methods

表1 100個(gè)交易日上證指數(shù)預(yù)測結(jié)果Table 1 Shanghai Stock exchange index forecast results in 100 trading days

表2 100個(gè)交易日標(biāo)普500指數(shù)預(yù)測結(jié)果Table 2 Forecast results of SPX500 index in 100 trading days

表3 100個(gè)交易日滬深300指數(shù)預(yù)測結(jié)果Table 3 Forecast results of the Shanghai and Shenzhen 300 index in 100 trading days
綜合來看,GRU模型在對100天股價(jià)指數(shù)預(yù)測時(shí),相對于ELM和BP模型,在大多數(shù)情況下都有較小的預(yù)測誤差和較高的穩(wěn)定度,比較適合于用來預(yù)測非線性、非平穩(wěn)的股票價(jià)格時(shí)間序列。將Bagging方法和GRU結(jié)合起來對股票價(jià)格指數(shù)進(jìn)行預(yù)測時(shí),它的預(yù)測誤差明顯小于其他三種對比模型,預(yù)測穩(wěn)定度高于對比模型。由此可見,引入Bagging算法可以進(jìn)一步提高模型預(yù)測精度和穩(wěn)定度。
本文根據(jù)股指時(shí)間序列長期依賴性的特點(diǎn),引入目前前沿的深度學(xué)習(xí)領(lǐng)域的GRU神經(jīng)網(wǎng)絡(luò)模型,結(jié)合Bagging集成方法,構(gòu)造Bagging-GRU模型,對國內(nèi)外代表性股指時(shí)間序列進(jìn)行單步預(yù)測研究。同時(shí),與三種對照模型(GRU模型、ELM模型和BP神經(jīng)網(wǎng)絡(luò)模型)的100天預(yù)測結(jié)果進(jìn)行對比分析,并系統(tǒng)地分析了各個(gè)預(yù)測模型的評價(jià)指標(biāo)數(shù)據(jù),得到如下結(jié)論:(1)GRU網(wǎng)絡(luò)模型確實(shí)是比較好的股價(jià)預(yù)測模型,在預(yù)測股價(jià)時(shí),能夠較好地捕獲非線性時(shí)間序列的特征,取得更好的預(yù)測效果。(2)將Bagging方法與GRU模型結(jié)合以后,顯著提高了GRU模型的預(yù)測效果,該模型的預(yù)測結(jié)果顯示最小的預(yù)測誤差和最大的預(yù)測穩(wěn)定度。(3)Bagging-GRU模型對多種股指時(shí)間序列的預(yù)測都有優(yōu)越的預(yù)測效果,非常適合于股票價(jià)格預(yù)測。
結(jié)合上述結(jié)論,可以看出本文構(gòu)建的Bagging-GRU模型能夠比較全面、準(zhǔn)確地掌握股指數(shù)據(jù)的變化情況,有助于決策部門和政策制定者對股票市場乃至金融市場提前預(yù)判,為相關(guān)政策制定提供參考。其次,本文構(gòu)建的機(jī)器學(xué)習(xí)模型可以監(jiān)控股票市場變動,幫助投資者發(fā)現(xiàn)投資機(jī)會,提高投資回報(bào)率。本文構(gòu)建的模型還可以為其他金融市場時(shí)間序列預(yù)測提供實(shí)踐經(jīng)驗(yàn)。由于神經(jīng)網(wǎng)絡(luò)的可調(diào)節(jié)性,未來可以對模型可以進(jìn)行進(jìn)一步改進(jìn),例如在輸入變量上可以選擇其他非同質(zhì)化信息,也可以在技術(shù)方面對模型優(yōu)化和改進(jìn),這是未來值得探究的方向。