王龍



關鍵詞:雙向門控循環神經網絡(BiGRU) ;極端隨機樹(ETR) ;Stacking集成思想;股價預測
0 引言
股票市場作為金融市場中的重要組成部分,從一定程度上能反映一個國家經濟狀況的發展情況,可以說是經濟發展的晴雨表。因此對股票市場波動趨勢的準確把握便顯得尤為重要,越來越多的學者開始研究如何利用模型對股票價格及其走勢進行精準的預測。胡聿文[1]以LSTM模型為基礎,通過主成分分析法對股票序列中的特征進行篩選然后進行預測得出比未篩選特征時更加精確的預測效果。孫麗麗等[2]以XGBoost模型為基礎,通過網格搜索算法對模型中包含的參數進行優化,最終優化后的模型得出比參數優化前更加優秀的預測結果。李新堯[3]使用SSA算法對LSTM網絡中的超參數進行尋優后應用于股票預測中取得了較好的預測效果。陳帥[4]將遺傳算法應用到BP神經網絡的參數優化上,在股票價格的預測中相比于基礎模型有了較大的提高。蒙懿[5]等人使用注意力機制對股票時間序列中的時間特征進行提取,結合CNN-BiLSTM模型對股票進行預測最終得出了優秀的預測效果。李輝[6]等人將RF模型和LSTM模型進行組合相比于基礎模型極大提高了股票時間序列的預測精度。Thomas 等[7]引入了長短期記憶神經網絡(LSTM) 進行股價預測分析,進一步表明了LSTM在股價預測中能取得較好的結果。Chandar等[8]使用灰狼優化算法GWO對ENN神經網絡中的大量參數進行尋優處理取得了較好的預測效果。Yu[9]等將局部線性嵌入降維算法(LLE) 應用到股票價格影響因素的降維中,減小了特征的冗余度,然后再將降維后的數據運用到BP神經網絡中訓練并預測,對股價序列實現了更高精確度的預測。Bose[10]等使用多元自適應回歸樣條算法(MARS) 對股價特征數據進行降維處理,然后通過深度神經網絡模型進行預測,實驗結果表明經過MARS處理后的數據集代入模型會取得更加優秀的預測效果。
基于Stacking集成思想,本文將善于處理時間序列數據的BiGRU模型以及處理復雜特征數據性能優良的ETR模型結合起來,充分融合兩模型各自的優勢,從而發揮混合集成模型BiGRU-ETR在處理具有長記憶性和多特征特點的股票價格數據中的優勢,進而提高在股票預測中的穩定性和預測精度。
1 實驗方法理論
1.1 極端隨機樹模型
決策樹是一種遞歸構建的單分類回歸器算法,是一種樹狀結構的機器學習算法,通常被用于很多集成模型的基礎模型。一棵完整的決策樹由根節點、葉節點和內部節點構成,決策樹一般按照一定的分裂規則進行結點的分裂,不同的分裂規則對應不同的算法,目前最常用的是根據基尼系數進行結點分裂的CART 決策樹。一棵決策樹的構建過程包含諸多參數,像樹的深度,結點的特征數量等參數會對決策樹效果的好壞產生重要的影響。
極端隨機森林算法類似于隨機森林,都是由許多不同的決策樹并行構成,屬于bagging集成算法的一種。與隨機森林算法不同的是,構成極端隨機森林算法的每棵決策樹所使用的樣本為全部訓練樣本,不進行隨機抽樣,并且決策樹在進行結點的分裂時隨機選取特征和特征閾值,采用隨機閾值進行分裂。對于某棵決策樹而言,盡管使用的樣本均為全部訓練樣本,但由于在結點分裂時的雙重隨機性,保證了構成極端隨機森林的每棵決策樹均是不同的,相比于隨機森林而言模型的方差更小,泛化性更強。
1.2 BiGRU 的結構和原理介紹
1.2.1 GRU 模型
門控循環神經網絡(Gated Recurrent Neural Net?work,GRU) 模型是為了更好地處理時序數據中的長期依賴性而進化出的一種更高級的循環神經網絡(Re?current Neural Network, RNN) 。GRU模型相比于長短期記憶網絡(LSTM) ,通過減少門控制組件有效減少參數量,模型訓練效率大幅提高。GRU模型通過門保留了時間序列的重要特征,緩解了[1] 循環神經網絡(RNN) 模型梯度消失問題,在訓練任務中保留了模型的記憶功能。
圖1為GRU模型單個神經元結構展開圖,t 時刻的輸入值xt 和t - 1時刻的隱藏狀態ht - 1 共同構成t 時刻神經元的輸入值;輸出值由t 時刻隱藏狀態的輸出值yt和傳輸到t+1時刻的隱藏狀態ht所構成。
其中,公式(1) 為更新門公式,公式(2) 為重置門公式,公式(3) 為候選隱藏狀態更新公式,公式(4) 為最終隱藏狀態更新公式,公式(5) 為輸出值公式。其中Wr、Wz、Wh?、Wo 分別為更新門、重置門、更新和輸出公式的權重,br、bz、bh 分別為更新門、重置門和候選隱藏狀態公式的偏置。
1.2.2 BiGRU 模型
公式(6) 為t 時刻神經元前向隱藏層狀態更新公式,公式(7) 為t 時刻神經元反向隱藏層狀態更新,公式(8) 為BiGRU模型t 時刻隱藏狀態加權更新公式。其中,Wt 表示t 時刻神經元的前向隱藏狀態ht 的權值;Vt 分別表示t 時刻神經元反向隱藏狀態ht 的權值;bt 是t時刻隱藏狀態的偏置。
1.3 網格尋優算法(GS)
網格尋優算法是一種枚舉尋優算法,即在指定的參數范圍內,按步長依次調整參數,利用調整的參數訓練學習器,從所有的參數中找到在驗證集上精度最高的參數,這其實是一個訓練和比較的過程,對影響模型性能優劣的所有參數進行迭代搜索,最終根據損失函數值的大小選出使損失函數最小的一組參數,也就是使模型性能達到最大的一組參數,參數范圍越大,算法運行所需的時間也就越長。
2 BiGRU-ETR 模型的構建
2.1 特征選擇
本文在指標體系的選擇上不僅包括開盤價、最高價、最低價、當日收盤價、漲跌值、漲跌幅、成交量和成交額等8 種基本行情指標,還納入了MA、MACD、MTM、BIAS等多達11種各類技術指標。本文將次日收盤價的價格作為預測因變量。由于本文所構建的指標體系指標眾多,為了消除無關指標對預測效果的影響,本文選擇遞歸特征消除法對特征指標集進行最優特征子集的篩選,依次剔除一個特征變量作為特征子集,然后在所有的特征子集中篩選出使驗證集波動最小的集合作為最優特征集。最終得到的最優特征集包括開盤價、最高價、最低價、成交量、成交額、當日收盤價、MACD、OBV、RSI、CSI、VR和ROC等12項特征指標。
2.2 模型評價指標
對于本文所提模型及其他對比模型,均采用擬合優度R2、平均絕對誤差(MAE)以及均方根誤差(RMSE) 等三項指標作為評判模型優劣的標準。三項評價指標的含義及公式如下所示:
擬合優度R2又稱為決定系數,R2值的取值范圍為[0,1],R2值越接近于1,說明模型的擬合效果越好,自變量對因變量的解釋程度越高。如公式(9) 所示;
平均絕對誤差MAE用來衡量模型預測值與真實值之間的平均偏差,通過絕對值來計算以防止偏差值的正負抵消。MAE的值越小說明真實值和預測值的偏差越小,模型的預測效果越好。如公式(10) 所示:
均方根誤差RMSE是在均方誤差MSE的基礎上開方計算而來,MSE表示模型預測值和真實值誤差平方和的均值,能夠很好地評判模型預測效果的好壞。如公式(11) 所示:
2.3 模型構建流程
為了驗證本文所提混合模型在股票預測中的優越性,本文選取了A股市場中具有代表性的股票指數以及個股中國平安作為實驗對象,首先針對數據集進行數據清洗工作,去除異常數據以及補全缺失值,然后進行數據標準化處理減小量級差距過大對模型預測過程中產生的影響。對處理后的數據使用遞歸特征消除法進行最優特征子集的篩選,然后將篩選后的數據集合使用網格搜索法進行最優參數的選擇。將兩只股票數據集按照8:2的比例劃分為訓練集和測試集,代入混合模型BiGRU-ETR以及其他對比模型進行訓練和預測,最后對各模型結果進行對比分析以證實本文所提模型的優越性。
3 實證分析
3.1 數據來源
本文所有數據均來源于網易財經網站,實證過程選取了A股市場中的上證指數和中國平安兩只股票進行研究,每只股票均選取自2015年1月1日至2022 年1月1日共7年間的數據集。
3.2 實驗環境
本文所有實驗均為Python語言編譯,運行環境為Anaconda 編譯器,運行設備為英特爾i7、3.3GHZ 頻率、4核心8線程的計算機。
3.3 參數優化
本文使用網格搜索算法分別對涉及的基礎模型ETR和BIGRU進行參數尋優以提高模型的預測效果和穩定性,參數優化的結果如表1和表2所示。
3.4 上證指數
上證指數為上海證券交易所中最為顯著的大盤指數,可以反映上海證券交易所中所有股票的平均變動趨勢,對于投資者決策具有重要的參考價值。上證指數各模型實證結果如表3所示,從評價指標表中可以看出,本文所選基礎模型BiGRU相對于單向GRU 模型而言由于其雙向時間處理能力從而大幅提升了預測效果;本文所提混合模型BiGRU-ETR相對于基礎模型ETR在MAE值上獲得了14%的提升,相對于基礎模型BiGRU而言MAE值提升了18%;從效果擬合圖3可以看出,混合模型BiGRU-ETR在所有模型中的擬合效果最好,對于股價變化的跟隨能力最強,在股價轉折點的預測精度均顯著優于其他對比模型。
3.5 中國平安
為了進一步驗證所提模型在股票預測中的泛化性和優越性,本文又選取了A股市場中的個股中國平安進行實驗驗證。中國平安各模型實證結果如表10 所示,從評價指標表中可以看出,混合模型BiGRUETR的MAE值相較于基礎模型ETR和BiGRU而言分別提高了25.9%和18.3%;從擬合效果圖4中可以看出,混合模型BiGRU-ETR的擬合效果在所有模型中最優,對股價波動的跟隨能力最強。從而進一步證實了本文所提混合模型的穩定性和優秀的預測性能。
4 結論
本文基于兩種基礎模型BiGRU和ETR提出了一種新的混合模型BiGRU-ETR,BiGRU模型的雙向神經網絡結構在處理股票價格時間序列上具有比單向GRU網絡更好的效果,同時ETR模型在處理股票價格序列中的大量特征方面具有較好的表現,因此考慮優勢互補,將兩種模型集成為混合模型BiGRU-ETR,通過在上證指數和中國平安的兩只股票中進行實驗最終得出混合模型BiGRU-ETR在多特征的股票時間序列的預測中具有更優秀的預測效果以及穩健性,從而為投資者獲取收益或規避風險提供了有效的策略價值和參考意義。