孫冰潔 唐 瑞 左 毅 黃明和
(1.江西師范大學軟件學院 南昌 330022)(2.江西省科技型中小企業創新基金管理中心 南昌 330046)
小波分析下的神經網絡股票預測研究
孫冰潔1唐瑞1左毅2黃明和1
(1.江西師范大學軟件學院南昌330022)(2.江西省科技型中小企業創新基金管理中心南昌330046)
摘要研究股票價格準確預測問題。股票市場是一個非常復雜的非線性動力學系統,傳統的時間序列預測方法很難揭示其內在規律,預測結果誤差較大。論文利用小波分解與重構,將原始非平穩時間序列分解為不同尺度下的時間序列分量,依照其各自特點,分別采用Elman神經網絡和BP神經網絡模型,對各層系數進行建模與預測,通過整合各層系數,得到原始時間序列的預測值。通過對滬深300指數的仿真預測實驗表明,基于小波分解的神經網絡組合預測方法比傳統神經網絡預測方法的預測精度明顯提高,具有實際的推廣應用價值。
關鍵詞小波分解與重構; 神經網絡; 股票預測; 滬深300指數
Class NumberTP391
1引言
隨著我國市場經濟的繁榮發展,股票走進了千家萬戶,成為許多人息息相關的投資產品。因此,對股票走勢的預測成為越來越多人所關注的課題。準確預測股票價格的運行態勢,不論對于政府宏觀管理,還是對于投資者而言,都有很強的現實意義[1]。
人工智能和計算機技術的迅猛發展,尤其是人工神經網絡技術的出現,給股票預測研究提供了新的研究方向。隨著神經網絡理論日趨完善,國內外學者對其在股票市場的建模和預測方面進行了大量研究,并取得了突出的研究成果。Cao等[2]采用小波神經網絡、Shi等[3]采用回聲向量機、Han等[4]用遞歸神經網絡分別對股票走勢進行了預測。2010年,馮興杰和孟欣建立了基于遺傳算法的神經網絡對股票走勢進行了短期預測,改進后的模型在預測精度方面顯著提高[5]。翁蘇駿等利用RBF神經網絡、BP神經網絡和Elman反饋神經網絡進行股票價格的短期預測,實驗結果表明反饋神經網絡的預測能力高于前饋神經網絡[6]。
然而,股票市場的價格走勢極為復雜,單一的預測模型以及對股票價格的直接預測無法揭示其內在規律,預測精度無法進一步提高。本文在小波分解與重構的基礎上,對不同尺度下的時間序列分量進行擬合預測,預測精度明顯提高。
2股票價格預測的基本思想
高噪聲、嚴重非線性和投資者的盲目任意性等因素決定了股票預測的復雜與困難度,應用現有的技術分析方法,預測結果精度較低[7]。
隨著小波分析理論的提出與發展,因其多尺度分析的特性,而且在時頻兩域都具有表征信號局部特征的能力,被廣泛應用于信號分析與處理。近年來,小波分析方法也被引入到經濟和金融領域,并顯示出其獨特的優勢。
本文在小波分解與重構的基礎上,將原始時間序列分解成一個低頻序列和若干個高頻序列,分別采用動態Elman神經網絡和傳統靜態BP神經網絡模型進行擬合預測,分而治之,通過整合各層預測結果,得到原始時間序列的預測值。這樣,傳統的預測方法就可以應用在非平穩的時間序列研究中,從而為某些非平穩時間序列的預測提供了一種新的方法。建模預測過程可以用圖1描述。

圖1 基于小波分析的股票預測模型建模過程
3股票價格預測的基本理論
3.1小波的分解與重構
小波變換的實質是將信號f(t)分解在基函數的不同頻帶上的子信號。小波具有多分辨率的特點,可以由粗到細地逐步觀察信號。
在股票預測分析中,原始時間序列就是一組信號值。利用多尺度分解,將原始序列分解到不同的頻率上。由于分解后的序列在頻率成分上比原始序列單一,并且小波分解對原始序列作了平滑處理,因此對分解后的時間序列建模得到的結果更準確。
多尺度分析是小波分析中一種對信號的空間分解的方法,多尺度分析理論認為任何一個信號都可以分解為兩部分:低頻(主體信息)和高頻(細節紋理)。為了將信號的低頻與高頻部分分開處理,Mallat提出了信號的塔式多尺度分解與重構的著名算法,稱為Mallat算法[8],其算法的主要思想是:將有限能量信號f∈L2(R)在分辨率2j下的近似Cjf分解為分辨率2j-1下的近似Cj-1f,以及位于分辨率2j-1和2j之間的細節紋理Dj-1f之和。分解過程如圖2所示。

圖2 Mallat塔式分解過程
根據上述分解原理,得到Mallat塔式分解算法遞推公式的矩陣表達形式:
(1)
其中,Cj,Dj分別是小波系數的列向量形式;h0,h1為相應的多尺度分析中濾波器的低通濾波與高通濾波系數。
分解后的各層小波系數可以通過單支重構恢復到原序列長度,使之具有與原序列時間尺度一致的性質[9]。有相應的重構公式:
(2)
3.2BP神經網絡模型
由于BP神經網絡具有構造簡單、并行處理和有效解決非線性目標函數的逼近問題的能力而被廣泛應用于信號處理、模式識別、系統辨識等學科領域中[9]。
股票市場的潛在規律通過BP神經網絡模型來學習,進而預測股票價格未來走勢,這對研究股票市場的非常規性的漲跌具有極其重要的意義。
BP網絡是一種分層型的典型多層網絡,具有輸入層、隱含層和輸出層,層與層之間多采用全連接的方式。一個典型的三層BP神經網絡如圖3所示。

圖3 三層BP神經網絡結構圖
BP算法由兩部分組成:信息的正向傳遞和誤差的反向傳播。具體學習過程如下:
步驟1:信息的正向傳遞
1) 隱含層中第i個神經元的輸出為
(3)
2) 輸出層第k個神經元的輸出為
(4)
3) 定義誤差函數為
(5)
步驟2:利用梯度下降法求權值變化及誤差的反向傳播
1) 輸出層的權值變化。對從第i個輸入到第k個輸出的權值,有:
(6)
2) 隱含層權值變化。對從第j個輸入到第i個輸出的權值,有:
(7)
3.3Elman神經網絡模型
Elman神經網絡可以看做是一個具有局部記憶單元和局部反饋連接的前向神經網絡。它與BP神經網絡具有相似的多層結構,不同之處在于它多了一個承接層,如圖4所示。

圖4 Elman神經網絡結構圖
承接層從隱含層接收反饋信號,用來記憶隱含層神經元前一時刻的輸出值,承接層神經元的輸出經延遲與存儲,再輸入到隱含層。這樣就使其對歷史數據具有敏感性,增加了網絡自身處理動態信息的能力。
這樣,Elman神經網絡給用于時間序列的股票價格預測的建模提供了理論保證。其學習算法采用BP算法。
3.4誤差分析
對序列的建模預測分析是為了探尋序列現象內在的關系,而預測效果的好壞則是檢驗這種關系存在與否以及解析力度大小的標準[10]。
一般地,對預測結果采用誤差形式進行評價,常用的衡量觀測值與實際值之間的偏差參數如下:
1) 均方誤差(Mean Squared Error)
(8)
2) 均方根誤差(Root Mean Squared Error)
(9)
3) 平均絕對誤差(Mean Absolute Error)
(10)
4) 平均絕對相對誤差(Mean Absolute Percent Error)
(11)

4股票價格預測的建模仿真
4.1樣本選取和數據劃分
滬深300指數股是從滬市和深市共挑選300只具有代表性的股票作為指標股,它能很好地反應市場的整體水平和情況。本文選取滬深300指數2013年6月4日至2014年9月30日共325個交易日的收盤價數據,預測未來20天的收盤價。
本文進行股票預測的分析周期選取5日,依次將順序五天的數據作為網絡的輸入數據,其后一天的數據作為網絡輸出即目標數據,按此方式進行滾動式排列,形成神經網絡的訓練樣本。
4.2原始序列的小波分解與重構
選取db4小波基函數對樣本數據進行三層小波分解,并對小波分解后的各層小波系數進行單支重構,獲得與原實際序列時間尺度一致的各層小波系數,如圖5所示。
其中,x是原始數據,a3代表低頻成分,d1,d2,d3為不同頻率的高頻成分,低頻成分a3與原始數據x的趨勢大體相同,d1,d2,d3均圍繞零上下波動,說明其趨勢項已得到很好的分離,然后采用上述的分別建模預測原理,對其進行預測。

圖5 原始序列重構后各層小波系數
4.3低頻序列和高頻序列的建模預測
低頻序列代表非平穩時間序列分析中的長期走勢,適合有良好記憶性的動態Elman神經網絡進行建模預測,隱層網絡采用tansig傳遞函數,輸出層采用purelin傳遞函數,學習函數采用traingdx。在Matlab中進行仿真建模,預測結果如圖6所示。

圖6 基于Elman神經網絡的低頻序列預測
從圖6中可以看出,低頻序列的預測值和實際值基本吻合,在轉折點處誤差較大。
高頻序列代表波動項,它包含周期項和隨機項,在金融數據等實際的時間序列問題中,高頻信息成分常常就是隨機因素,可以認為其對歷史數據不具有敏感性,因而使用傳統靜態BP神經網絡分別對三個高頻序列進行建模預測。仿真結果表明:高頻序列的預測結果和實際值吻合良好,文中不逐一列出。
4.4預測結果及比較分析
整合各層序列的預測結果,得到原始時間序列的預測值,預測結果如圖7所示。
為了驗證本文提出的基于小波分析的神經網絡組合預測方法在預測精度方面的優越性能,同時采用了傳統BP神經網絡對原始序列進行預測。預測結果如圖8所示。

圖7 基于小波分析的股票價格預測

圖8 基于BP神經網絡的股票價格預測
由以上兩圖可以明顯看出基于小波分析的神經網絡組合預測結果優于BP神經網絡的直接預測,前者不僅在數值上更接近實際值,而且在趨勢上更符合股票的實際漲跌情況,比如在第8、11和第14個交易日很好地糾正了BP神經網絡預測趨勢相反的情況,這正是投資者更為關注的。
為了進一步檢驗基于小波分析的神經網絡組合預測模型的適用性和可靠性,根據3.4節誤差分析計算公式,將其預測結果和單一的BP神經網絡模型的誤差評價指標作對比分析,結果如表1所示。

表1 實驗誤差結果比較
對比可知,基于小波分析的神經網絡模型的預測方法明顯優于傳統BP神經網絡模型。
5結語
由于股票價格序列中各種因素交織在一起,使得序列變得復雜,難以準確預測。而小波分析的最大優勢在于能將時間序列按不同尺度分解成不同的層次,這樣就可以根據不同層次序列的特點,分而治之,預測精度明顯提高。通過對滬深300指數進行仿真預測,并與直接利用BP神經網絡模型的預測效果進行比較,表明本文提出的基于小波分析的神經網絡預測模型是可行的,具有實際應用價值。
參 考 文 獻
[1] 楊耀宇.基于支持向量機的滬深300指數預測研究[D].上海:上海師范大學,2014.
YANG Yaoyu. Prediction of CSI 300 index based on support vector machine[D]. Shanghai: Shanghai Normal University,2014.
[2] CAO L Y, HONG Y G, FANG H P. Predicting chaotic time series with wavelet networks[J]. Physica D,1995,85(1/2):225-238.
[3] SHI Z W, HAN M. Support vector echo state machine for chaotic time series prediction[J]. IEEE Transactions on Neural Networks,2007,18(2):359-372.
[4] HAN M, XI J H, XU S G. Prediction of chaotic time series based on the recurrent predictor neural network[J]. IEEE Transactions on Signal Processing,2004,52(12):3409-3416.
[5] 馮興杰,孟欣.基于參數修正的BP改進算法的股票價格預測[J]. International Conference on Services, Management and Engineering,2010.
FENG Xingjie, MENG Xin. Stock pirce prediction based on BP improved algorithm of parameter revision[J]. International Conference on Services, Management and Engineering,2010.
[6] 翁蘇駿,林熙.BP網絡、RBF網絡和Elman網絡在股價預測中的應用[C]//中國智能自動化學術會議論文集,1999.
WENG Sujun, LIN Xi. The application of BP network, RBF nerwork and Elman network in stock price forecast[C]//China Intelligent Automation Conference Proceedings,1999.
[7] 趙煥平,張凌曉,楊新鋒.CAR-BPNN在股票價格預測中的應用[J].計算機仿真,2012,29(1):348-351.
ZHAO Huangping, ZHANG Lingxiao, YANG Xinfeng. Application on Stock Price Prediction Based on CAR and BPNN[J]. Computer Simulation,2012,29(1):348-351.
[8] Mallat S G. Multi-frequency channel decom- positions of images and wavelet models[J]. IEEE Transactions on Acoustics, Speech and Signal Processing,1989,12:2091-2110.
[9] 王學武,譚得鍵.神經網絡的應用與發展趨勢[J].計算機工程與應用,2003,39(3):98-100.
WANG Xuewu, TAN Dejian. Application and Developing Trends of Neural Network[J]. Computer Engineering and Application,2003,39(3):98-100.
[10] 黎志勇,李寧.基于小波的非平穩時間序列預測方法研究[J].計算機工程與應用,2014,50(10):38-43.LI Zhiyong, LI Ning. Research on non-stationary time series forecasting method based on wavelet[J]. Computer Engineering and Applications,2014,50(10):38-43.
Neural Network Stock Prediction Based on Wavelet Analysis
SUN Bingjie1TANG Rui1ZUO Yi2HUANG Minghe1
(1. College of Software, Jiangxi Normal University, Nanchang330022)(2. Jiangxi Provincial Administration Center of Innovation Foundation for Scientific Small-and-medium-sized Enterprises, Nanchang330046)
AbstractStock price prediction is current research hotspot. The stock market is a very complicated nonlinear dynamic system, the traditional time series forecasting merhods are difficult to reveal the inherent law, prediction results are often unsatisfactory. By using wavelet decomposed and reconstruction, the original non-stationary time series is decomposed into the time series components of different scales. According to their respective characteristics, the Elman neural network and BP neural network model are used to model and predict the coefficients of each layer, and the prediction value of the original time series is obtained by integrating the coefficients. The forecasting results of the CSI 300 index show that the forecasting accruacy of the neural network combination forecasting method based on wavelet decomposition is improved significantly than the traditional neural network forecasting method, which has the practical application value.
Key Wordswavelet decomposition and reconstruction, neural network, stock prediction, CSI 300 index
收稿日期:2015年12月7日,修回日期:2016年1月26日
作者簡介:孫冰潔,女,碩士研究生,研究方向:數據挖掘。唐瑞,男,碩士研究生,研究方向:數據挖掘,室內定位。左毅,男,助理研究員,研究方向:數據挖掘。黃明和,男,碩士生導師,研究方向:數據挖掘,算法設計與分析。
中圖分類號TP391
DOI:10.3969/j.issn.1672-9722.2016.06.010