邱創杰?許統洭?林哲?徐燁熙?黃瀅瀅

摘要:通過樹模型的測試結合,可以看出樹模型對非平穩序列的較好擬合作用,可以基本確定價格與成交量的回歸數值。同時,考慮的是在 30 個 tick_time的價格與交易量,計算開銷較大,因此本文使用基于樹模型的集成算法—XGBoost 和 LightGBM。這兩種算法均是以回歸樹為模型,將多棵回歸樹預測得到的結果進行權重判斷,將葉節點以及根節點融合,預測出回歸數據。為了進一步提高回歸數據的準確性,本文融合了時間開銷較大的 LSTM 神經網絡。LSTM 模型作為滯后算法,可以很好結合本題所提高的時間序列問題,為了提高模型準確性以及增強模型的魯棒性,本文進行了特征構造——構建了時間特征日均線、自相關系數、統計量特征、WR、RSI 作為特征。通過簡單加權平均融合,用融合后的數據作為價格與交易量的預測。最后,本文使用 MSE 作為評價指標,結果表明基于樹模型和 LSTM 的預測數據的 MSE 小于 0.1,因此本文認為預測結果準確。[1]
關鍵詞:XGBoost;LightBGM;LSTM;WR;PSI
1.引言
股票是金融市場的重要組成部分。股票的價格往往隨著時間而發生變化。股票的價格變化是投資者經常受關注的,因此能否預測股票價格和交易量對交易者在進行交易選擇具有重大的參考價值。
2.模型的建立
(1)構造特征
本文對題目所給數據構造了多個時間特征以及統計量特征,本文構造了指標:自相關系數、RSI 系數、五日均線等。自相關系數公式如下:
(2)數據預處理即歸一化
建立在問題一的基礎上,本文發現在 8.25 股票存在噪聲,為了提高模型的準確性以及收斂速度,本文剔除了 10 支股票在 8.25 當前tick成交量的異常值。使用MIN-MAXScaler 函數對價格與交易量數據以及RSI系數等指標進行歸一化,將數值范圍限定在 [0,1] 之間。歸一化公式如下:
(3)建立 XGBoost 以及 LightGBM 樹模型、LSTM 神經網絡模型
樹模型通過生成多個回歸樹,將葉子節點以及根節點綜合考慮,集成時間、價格、交易量進行回歸,得到兩組價格與交易量的預測值。
神經網絡通過建立輸入層和隱藏層、輸出層,將構造好的特征作為輸入層感知,形成神經網絡層進行回歸,得到一組價格與交易量的預測值。
XGBoost 樹模型公式如下:
LightGBM 樹模型公式如下:
(4)調節模型參數以及評價模型
之后,通過調節模型參數來讓訓練器更好訓練題目所給數據,以此達到訓練器最好的回歸效果,本文通過網格搜索法對樹模型的特征進行窮舉,對于每個超參數構建一個較小的有限集合進行探索,以此來讓模型達到更好的回歸效果。最后,本文使用 MSE作為評價指標用來評價模型的優良性。MSE 評價公式如下:
(5)模型融合
模型融合通過將不同訓練器回歸的三組數據進行幾何平均來達到一個更好的回歸數據,對于本題中高度復雜,高度無序性的股票,進行樹模型和神經網絡的融合,可以有著更好的回歸預測效果。
3.問題的求解
首先,為了能夠很好的提高樹模型以及神經網絡模型的準確性,從而更好的預測價格與交易量,因此本文根據已有的價格與成交量數據,構建了時間特征——日均線、自相關系數、統計量特征——WR、RSI 系數。以使提高數據集的復雜程度,同時自相關系數表明了序列的平穩性,WR 系數表明了序列的震蕩程度,RSI 系數表明了未來市場的走勢。
當 T 值大于5% 的值時說明序列平穩,當 T 值小于5% 的值時說明序列不平穩。從上表可以看出:平安銀行的成交量 T 值小于5% 的值說明序列不平穩,價格 T 值大于5% 的值說明序列平穩。
隨后,為了更好地讓訓練器準確地預測數據,在剔除 8.25 異常數據后,進行歸一化,將數據限定在區間 [0,1],從而,更好地讓樹模型和 LSTM 準確地回歸預測數據。
之后, 將數據分別導入 XGBoost 和 LightBGM 樹模型和 LSTM 神經網絡。在樹模型中將構造好的特征以及時間作為 X,把要預測的股票價格作為 Y,通過模型訓練得到回歸數據。而在神經網絡之中,使用移動窗口滯后算法,結合構造后的特征,回歸得出預測數據。[2]
在得出回歸數據后,使用網格搜索法對樹模型參數進行調整,直至 MSE 評價指標最低;而針對 LSTM 模型的調參,考慮到 LSTM 算法時間開銷大,不使用網格搜索法,更多的依賴于個人經驗。對于不同股票的數據為防止欠擬合,本文調整了不同的訓練輪回。[3]
在對樹模型和 LSTM 的調參之后,將這幾個模型的回歸預測數據,進行幾何平均得到模型融合的結果。
4.總結
通過XGBoost、LightGBM和LSTM對十只股票30個tick _time的價格和交易量的預測,構建了時間特征日均線、自相關系數、統計量特征、WR、RSI 作為其特征。最后通過簡單加權平均融合,用融合后的數據作為價格與交易量的預測并且本文計算出來的MSE偏小,驗證了本文模型的準確性。綜上所述,這有利于交易者進行交易的時候做出合理的選擇。
參考文獻:
[1]李輝.基于RF-LSTM組合模型的股票價格預測[D].河南理工大學,2022.
[2]齊曉娜.深度學習算法在股票價格預測方面的研究[D].軟件,2022.
[3]武博.基于LSTM模型的股票價格預測[D].大連理工大學,2021.