任鑫 韓旭


摘? 要:作為A股市場重要的股票指數之一,對滬深300股指的走勢進行預測對于投資者進行套期保值和風險轉移具有重要的意義。本文利用LSTM網絡具備的復雜非線性時序特征提取能力,設計了一個LSTM深度循環神經網絡來對滬深300股指的走勢進行預測。結果表明,LSTM能夠被成功地運用于股票價格指數走勢的預測。
關鍵詞:股指期貨;神經網絡;非線性;時序特征
股票的發展到今天已經有幾百年的歷史。股票市場的變化可以說是整個社會經濟的“晴雨表”,它反映了社會經濟的發展狀況和公司的運營狀況。股票價格指數被當做一種指標,反映了股票市場上所有股票市場價格的總體水平和相應的變化情況。股票指數的變化對于廣大投資者和社會經濟都有十分重要的影響。研究股指的主要作用是為套期保值者規避和轉移風險。人們不斷進行股指期貨的研究,可是大多數研究者對我國的股指期貨研究僅限于交易規則的制定和管理方式方法上。我們需要一種更加有效地方法對股指變化做出預測。
近年來以神經網絡為基本構造模塊的深度神經網絡模型眾多領域取得了巨大的成功。股票價格指數數據往往蘊含著大量的高噪聲和復雜的非線性,淺層學習方法無法對其進行有效建模。由于深度神經網絡能夠提取出數據中蘊含的復雜非線性特征,因此本文通過長短期記憶循環神經網絡對我國滬深300指數走勢進行研究預測,以此來為投資者規避股市風險和實現財富保增值提供預判。
一、長短期記憶循環神經網絡
長短期記憶循環神經網絡(Long-Short Term Memory,LSTM)是一種改進的循環神經網絡,其獨特的門控設計使得其可以學習到時間序列中存在的多種長短期依賴信息。LSTM的每個神經元都有4個門控制著信息在單元內的流通,這4個門分別如下:
基于此本文設計了一個隱藏層大小為20的LSTM網絡作為模型的第一層來提取股指數據中的高度復雜非線性時序特征,LSTM接收大小為? 的一個矩陣,然后輸出一個大小為 的向量;然后設計了一個隱藏層大小為1的全連接層作為輸出層,其接收LSTM輸出 大小的向量,然后輸出大小為? 的標量作為模型的輸出;最后通過誤差函數計算全連接層的輸出與樣本真實值之間的誤差,以此誤差進行反向傳播更新模型參數以完成模型訓練。
二、實驗
(1)實驗數據。本文選2018年1月1日至2018年12月30日共239個交易日的滬深300指數交易數據作為建模數據,將前5個交易日的開盤點位、最低點位、最高點位、成交量、成交金額、收盤點和第6個交易日的收盤點位作為一對訓練樣本,一共可獲得234對訓練樣本作為訓練數據。
(2)實驗設置。本實驗所設計的LSTM循環神經網絡模型,使用python編程語言進行實現,運行在內存為8GB,顯存為3GB的Ubuntu18.04操作系統上。模型采用Xavier方法作為各權重矩陣的初始化方式,學習率設定為0.1,模型損失通過MSE均方誤差函數實現,優化方法為隨機梯度下降法,迭代次數設定為200次。
(3)實驗結果。經過200次迭代,模型平均誤差從最開始的2.4135逐漸下降收斂到0.0014,說明模型對于訓練樣本之間的映射關系能夠進行良好地學習。訓練完成的模型的預測結果與真實值的比較如圖1所示,不難發現本文所訓練的模型對于滬深300指數前五個交易日的交易數據同第六個交易日的收盤點位之間的復雜關系能夠進行良好地建模。
本文通過構建基于LSTM的循環神經網絡模型,將其用于滬深300指數的預測。實驗表明,LSTM網絡能夠對于滬深300指數數據自身存在的高度復雜非線性時序特征進行良好的學習建模。
參考文獻
[1]Hochreiter S,Schmidhuber J.Long Short-Term Memory[J].Neural Computation,1997.9(08):1735-1780
[2]Xavier Glorot,Y.Bengio.Understanding the difficulty of training deep feedforward neural networks[J].Journal of Machine Learning Research,2010.01(09):249-256
作者簡介:任鑫(1995-),男,漢族,四川省南充市,碩士研究生,成都理工大學管理科學學院應用統計專業,研究方向:大數據統計。
韓旭(1994–),男,漢族,黑龍江省綏化市人,碩士研究生,單位:成都理工大學管理科學學院應用統計專業,研究方向:地學數據統計分析。