鄭愛宇,孫德山
基于HP濾波的股票長期價格神經網絡模型預測
鄭愛宇,孫德山
(遼寧師范大學 數學學院,遼寧 大連 116029)
將上證指數和深證成指股票數據作為研究對象,對股票長期價格進行預測.選取長短期神經網絡、循環神經網絡、HP濾波長短期神經網絡混合模型和HP濾波循環神經網絡混合模型進行比較分析.經過模型間的對比分析,發現HP濾波對長短期神經網絡預測的優化效果要優于循環神經網絡.
長短期神經網絡;循環神經網絡;股票預測;HP濾波
隨著我國經濟的快速發展和金融市場的強烈需求,如今股票市場不僅成為人們生活水平的體現,也是市場經濟的晴雨表.股票市場中對于股票價格的預測一直以來為學術界所關注,但是股票市場受到政策、新聞輿論和投資意向等眾多因素影響,總是在不斷地波動變化,具有高噪聲和非線性等特點,所以對于股票價格難以準確預測.
現如今人工智能快速發展,基于深度神經網絡對股票市場進行預測研究成為了該領域的熱點.雒佳文[1]用HP濾波和指數平滑法預測上證指數收盤價,分離出趨勢線,排除了一些和趨勢線相反的指數平滑類別,規避了波動成分的影響;王理同[2]等利用上證50股指及其成分股,在單因子循環神經網絡的隱藏層采用了長短期神經網絡結構,相比傳統循環神經網絡,單因子模型對股票預測精度更高;楊青[3]等以全球30多種股票指數作為研究對象,用長短期神經網絡進行股票收盤價的預測,發現在預測精度上要優于支持向量機和時間序列模型.
由于股票數據具有非平穩性和時序性,導致循環神經網絡和長短期神經網絡存在過擬合和梯度消失等問題.本文使用HP濾波法對非平穩的股票數據進行分解,分解成長期趨勢序列和短期波動序列,再對數據進行預測分析.實驗對比發現,經過HP濾波處理過后的數據,由長短期神經網絡進行預測的效果要優于循環神經網絡.
Hodrick-Prescott(HP)過濾器是宏觀經濟學中常用的工具,是由經濟學家Robert Hodrick和Edward Prescott提出的研究經濟運行的一種濾波方法,它把經濟運行看作是增長趨勢和短期波動的結合,將實際產出分解為趨勢和周期性2種成分[4-5].該方法采用對稱的數據移動平均方法原理,將時間序列數據分為趨勢要素數據和周期性波動數據2部分.

的解,式中:為正數,用以調節比重,是用來控制平滑程度的懲罰因子,稱為平滑參數;為時間序列的樣本數.值越大,趨勢序列中的變化總數相對于原序列中的變化越小,即越大,趨勢序列越平滑;當值趨向于無窮時,,此時,HP濾波退化為最小二乘法.
循環神經網絡是一類具有短期記憶的神經網絡,如果將每一時刻的狀態看成前饋神經網絡的一層,那么可以將循環神經網絡看作是在時間維度上權值共享的神經網絡[6].
循環神經網絡的網絡結構見圖1,通過在隱藏層上的回路連接,前一時刻的網絡狀態能夠傳遞給當前時刻,而當前時刻的狀態也能夠傳遞給下一時刻.
隱藏層的表達式為


輸出層的表達式為


由于循環神經網絡用的是反向傳播算法,會碰到梯度消失的狀況,因此循環神經網絡不適合處理比較長的時間序列.長短期人工神經網絡作為循環神經網絡的一種變體,在循環神經網絡的結構基礎上進行了改進,引入“門”的概念.
對比循環神經網絡,長短期人工神經網絡的優點在于解決了在訓練過程中出現的梯度爆炸和梯度消失的問題,使模型能夠實現更長時間的記憶,非常適合解決和時間序列相關性較高的問題,如本文所研究的股票預測問題[7-8].
相比標準的循環神經網絡模型,長短期人工神經網絡在結構中增加了遺忘門、輸入門和輸出門3個門控單元,具體體系結構見圖2[9-10].

圖2 長短期人工神經網絡體系結構






金融時間序列由于受到政治、經濟以及市場技術等多方面的因素影響,具有不確定性、高噪聲和非線性等特征.為了在提高模型精度的同時不增加模型的復雜程度,本文提出了HP-LSTM模型.
首先用HP 濾波將上證指數的收盤價、開盤價、最高價、最低價和交易量5個指標的時間序列分解為長期趨勢序列和短期波動序列,之后用長短期人工神經網絡分別對分解出的2個序列進行靜態預測.具體的建模步驟為:
Step1先用HP濾波將數據分解為長期趨勢序列和短期波動序列(在HP濾波將數據分解前對原始數據進行了歸一化處理,以便提高HP濾波的運行速度).
Step2為了能夠消除不同量綱對最終預測結果的影響,同時提高模型的運行速度,對Step1得到的長期趨勢序列和短期波動序列分別進行歸一化.
Step3將生成的數據集劃分為測試集和預測集,在訓練集中訓練模型,將用于預測長期趨勢序列的長短期人工神經網絡模型稱為LSTM-L模型,將用于預測短期波動序列的長短期人工神經網絡模型稱為 LSTM-S模型.
Step4將測試集分別輸入Step3的 LSTM-L模型和 LSTM-S模型中進行靜態預測,得到2個序列的預測結果,將得到的2個預測結果分別進行反歸一化.
Step5將反歸一化的結果疊加,得到最終的預測結果.
使用數據為上證指數和深證成指,皆來自網易財經.上證指數的時間跨度為1990-12-20—2022-10-17,深證成指的時間跨度為1991-04-04—2022-10-14.選取每日開盤價、最高價、最低價、收盤價和交易量5個特征作為模型的輸入,次日的收盤價為模型的輸出.上證指數擁有7 773條數據,深證成指擁有7 682條數據,2個數據樣本都選取前5 500個數據進行模型的建立,其余數據進行模型測試.實驗是在Windows10x64 操作系統下進行,使用的R軟件是4.1.2版本.
為對預測效果進行評估,采用百分比誤差絕對值的平均值和均方根誤差作為衡量指標,百分比誤差絕對值的平均值和均方根誤差的值越小代表預測精度越高.百分比誤差絕對值的平均值和均方根誤差的計算公式分別為



長短期人工神經網絡由輸入層、LSTM層、全連接層和輸出層組成.LSTM層batchsize的值設置為20,使用的目標優化函數為均方誤差(MSE),使用的優化器為亞當優化器(Adam).通過網格搜索法,神經元個數在1~100之間,間隔為2地遞增,在模型的訓練過程中不斷調整參數值,直到模型預測效果最佳,得到的LSTM-L模型和LSTM-S模型的設置參數見表1.
循環神經網絡模型由輸入層、隱藏層和輸出層組成,本文中將用于預測長期趨勢序列和預測短期波動序列的循環神經網絡分別稱為RNN-L模型和RNN-S模型.結合網格搜索法和處理時間序列的經驗,得到RNN-L模型和RNN-S模型的設置參數(見表2).

表1 長短期人工神經網絡模型參數

表2 循環神經網絡模型參數
將長短期人工神經網絡型、循環神經網絡、HP濾波長短期神經網絡混合模型(HP-LSTM混合模型)和HP濾波循環神經網絡混合模型(HP-RNN混合模型)進行比較分析,結果見表3.

表3 模型預測結果比較
由表3可以看出,數據經過HP濾波處理之后,HP-LSTM混合模型相比單一長短期人工神經網絡模型,上證指數數據的均方根誤差縮減了36.22%,百分比誤差絕對值的平均值縮減了10.45%;深證成指數據的均方根誤差縮減了53.15%,百分比誤差絕對值的平均值縮減了99.88%,可以認為HP濾波對數據提前進行預處理在長短期人工神經網絡模型的股票預測精度提高上是有明顯正面效果的.而HP-RNN混合模型相比單一循環神經網絡模型,上證指數數據的均方根誤差僅縮減了4.33%,百分比誤差絕對值的平均值還增長了0.34%,深證成指的均方根誤差和百分比誤差絕對值的平均值分別增長了104.72%,86.91%.因此,HP 濾波對長短期人工神經網絡模型的預測精度的提升要優于循環神經網絡模型.
同時還可以比較2個HP濾波的混合模型,在模型運行過程中,循環神經網絡模型運行速度要比長短期人工神經網絡模型慢得多(循環神經網絡模型用時約5 h,長短期人工神經網絡模型用時約1 min),且混合模型HP-RNN要對長期趨勢序列和短期波動序列都進行循環神經網絡模型預測,較比HP-LSTM 混合模型用時更長;而比較均方根誤差和百分比誤差絕對值的平均值來看,HP-RNN預測精度要比HP-LSTM預測精度要低,所以綜合來說,用HP-LSTM混合模型對股票進行預測是要優于HP-RNN混合模型的.
研究中選取上證指數和深證成指,使用長短期神經網絡、循環神經網絡、HP濾波長短期神經網絡混合模型和HP濾波循環神經網絡混合模型對股票數據進行預測.研究表明,通過先用HP濾波處理數據,相比循環神經網絡模型能更好提高長短期人工神經網絡模型的預測效果,提高了長短期人工神經網絡模型的精確度.另外,本研究雖然比較了加入HP濾波之后的長短期人工神經網絡模型和循環神經網絡模型,但是沒有比較其他的神經網絡模型,且本研究的研究數據是長時間跨度,以后可以在此基礎上對不同時間跨度的股票數據進行進一步的研究.
[1]雒佳文.基于HP濾波和指數平滑法預測上證指數收盤價[J].時代金融,2016(21):159-160.
[2]王理同,薛騰騰,王惠敏,等.基于循環神經網絡的股指價格預測研究[J].浙江工業大學學報,2019,47(2):186-191.
[3]楊青,王晨蔚.基于深度學習LSTM神經網絡的全球股票指數預測研究[J].統計研究,2019,36(3):65-77.
[4]彭兆祺,孫超.基于HP濾波分析方法的我國經濟增長研究[J].山西財經大學學報,2011,33(增刊1):15-17.
[5]魏媛.基于HP濾波和Garch模型的股票價格波動研究[J].商,2016(27):211.
[6]楊麗,吳雨茜,王俊麗,等.循環神經網絡研究綜述[J].計算機應用,2018,38(增刊2):1-6,26.
[7]丁文絹.基于股票預測的ARIMA模型、LSTM模型比較[J].工業控制計算機,2021,34(7):109-112,116.
[8]劉翀,杜軍平.一種基于深度LSTM和注意力機制的金融數據預測方法[J].計算機科學,2020(12):125-130.
[9]李麗萍,曾麗芳,江紹萍,等.基于LSTM神經網絡的股票價格預測[J].云南民族大學學報(自然科學版),2022(12):1-10.
[10]姚遠,張朝陽.基于HP-LSTM模型的股指價格預測方法[J].計算機工程與應用,2021,57(24):296-304.
Neural network model prediction of long-term stock prices based on HP filter
ZHENG Aiyu,SUN Deshan
(School of Mathematics,Liaoning Normal University,Dalian 116029,China)
Using the Shanghai composite index and Shenzhen composite index stock data as research objects,the long-term stock prices is predicted.Long and short term neural network,recurrent neural network,HP filtered long and short term neural network hybrid models and HP filtered recurrent neural network hybrid models are selected for comparative analysis.Through comparative analysis between models,it is found that HP filtering has better optimization effects on the long and short term neural network models than recurrent neural network models.
long and short term neural network model;recurrent neural network model;stock preparation;HP filter
1007-9831(2023)10-0036-05
TP391
A
10.3969/j.issn.1007-9831.2023.10.007
2023-02-10
遼寧省教育廳項目資助(LJKMZ20221424)
鄭愛宇(1998-),女,遼寧丹東人,在讀碩士研究生,從事統計機器學習研究.E-mail:1105125887@qq.com