賈永鋒 閆宏圖 閻紅燦
摘 要: 時間序列分析是根據客觀事物的連續性和規律性推測未來發展趨勢的預測方法,分析時設法過濾除去不規則變動,突出反映趨勢性和周期性變動。為了提高預測精度,構建了EMD-BP神經網絡預測模型,利用Hilbert-Huang變換中的經驗模態分解將時間序列分解為有限個本征模函數,重構后進行BP神經網絡預測。通過對中國石化的股票資料進行實驗仿真,表明該模型降低了被預測數據的非平穩性,其精度比直接用神經網絡預測有較明顯的提高。
關鍵詞: 時間序列; BP神經網絡; EMD; 本征模函數; 預測模型
中圖分類號:TP311.1 文獻標志碼:A 文章編號:1006-8228(2014)02-01-04
0 引言
時間序列是將某種現象某一個統計指標在不同時間上的各個數值,按時間先后順序排列而形成的序列。時間序列分析是一種動態的數列分析[1],出發點是承認數據的有序性和相關性,通過數據內部的相互關系來辨識系統的變化規律。常用的時間序列分析法主要是建立在回歸——移動平均模型(ARMA)[2-3]之上,被用來對股價(最高價、最低價、開盤價、收盤價)及綜合指數進行預測[4-5]。然而,這些經典回歸分析暗含著一個重要假設:數據是平穩的。如果數據非平穩,往往導致出現“虛假回歸”,嚴重影響預測效果。股票等金融數據是典型的非平穩時間序列,一般地說,股票價格的變化主要包括經濟性因素、政治性因素、人為操縱因素、有關行業及投資者心理等多種因素的影響,各因素的影響程度、時間范圍和方式也不盡相同;且股市各因素間相互關系錯綜復雜,主次關系變化不定,數量關系難以提取及定量分析[6]。因此,需要尋找一種好的方法來避免或減弱這些因素的影響,于是學者研究小波分析[6]和神經網絡[7-8]用于時間序列分析預測。小波變換可以使非平穩數據中的有效成分和噪聲呈現出各自不同的特征,但小波變換中小波基的選取會對數據去噪的效果產生很大的影響,因此利用小波變換對非平穩數據分析的方法缺乏自適應性。Zhaohua Wu[11]等人通過大量的實驗,證實經驗模態分解(EMD,Empirical mode decomposition)具有類似小波變換中的二進濾波器特性,通過分解、數據重組后實現了數據的去噪,汲取了小波變換優勢,同時又克服了小波變換中的小波基選擇難的問題。
本文將經驗模態分解和BP神經網絡相結合,構建了一種基于EMD-BP神經網絡的預測模型,通過對中國石化股票進行預測模擬仿真,實驗結果得出結論,將EMD用于時間序列的預測分析,大大降低了擾動因素的影響,提高了預測精度。
1 時間序列的BP神經網絡訓練
神經網絡具有較強的學習能力和適應能力,在非線性系統中的預測方面得到了廣泛的應用。考慮到金融數據是一類非線性較強的時間序列,本文選用BP神經網絡作為預測工具。BP網絡[9-10]是一種多層前饋型神經網絡,其神經采用的傳遞函數一般都是Sigmoid(S形彎曲)型可微函數,是嚴格的遞增函數,在線性和非線性之間顯現出較好的平衡,所以可實現輸入和輸出間的任意非線性映射,適用于中長期的預測;逼近效果好,計算速度快,不需要建立數學模型,精度高;理論依據堅實,推導過程嚴謹,所得公式對稱優美,具有強非線性擬合能力。目前,已經有一些比較成熟的神經網絡軟件包,其中MATLAB的神經網絡工具箱應用最為廣泛。
在網絡訓練中,最重要的三個參數是權值、學習率和單元數。權值可能變得很大,這會使神經元的輸入變得很大,從而使得其激活函數的導函數在輸入點的取值很小,這樣訓練的步長就會變得非常小,進而導致訓練的速度下降到很小的程度,最終可能使得網絡停止收斂,即網絡癱瘓。因此在對網絡的連接權矩陣進行初始化時,隨機給定各層之間的權值與閾值的初始值比單純地隨機給定某一部分層的收斂速度更快。學習率的選擇,其合理與否是網絡是否穩定的關鍵:太高的學習率,可以減少網絡訓練的時間,但是容易導致網絡的不穩定與訓練誤差的增加;太低的學習率,需要較長的訓練時間。在一定的條件下,較少的單元數目往往能夠提高網絡的收斂速度,而較多的單元數目有可能在規定的訓練長度里不能滿足要求。因此,對于參數數目的選擇,并沒有一個固定的模型,往往根據更多的經驗成分。
2.1 經驗模態分解(EMD)
經驗模態分解法EMD[11]是由美國NASA的黃鍔博士提出的一種信號分析方法。它適合于分析非線性、非平穩信號序列,具有很高的信噪比。該方法的關鍵是經驗模式分解,它能使復雜信號分解為有限個本征模函數(Intrinsic Mode Function,簡稱IMF),所分解出來的各IMF分量包含了原信號的不同時間尺度的局部特征信號。
EMD是基于以下假設條件:①數據至少有一個最大值和一個最小值兩個極值點;②數據極值點間的時間尺度惟一確定局部時域特性;③如果數據沒有極值點但必須有拐點,通過對數據微分一次或多次求得極值,再通過積分來獲得分解結果。
2.2 數據重構
對原始數據進行EMD分解后,得到有限個IMF分量。為了降低原始數據中的非平穩性,需要對得到的各分量進行相關系數分析,篩選出有用的IMF分量,對其進行重構,以得到一個與原始數據近似的新數據進行預測實驗。
數據重組的方法有多種,本文采用相關系數分析法進行數據的篩選。由于篇幅有限,關于EMD分解與重構的代碼不在本文提供。
2.3 應用訓練好的神經網絡對合成數據預測
對于非線性系統,BP神經網絡預測有著明顯的優勢。但是在復雜的非線性系統中,非平穩因素給預測帶來了一定的困難。正是因為EMD分解降低了各個分量的平穩性[12],才得到了廣泛應用[13-15]。金融數據等時間序列隨著時間,以及在多種因素的影響下會隨之改變,所以數據本質上是非平穩的,因此利用神經網絡對該數據進行預測,數據的平穩性使得其預測結果不是很理想,為了提高預測精度,我們用EMD方法對數據進行分解,以降低其非平穩性對預測精度的影響。然后對分解后的各分量進行相關系數分析比較,選取有用的IMF分量,進行數據的合成,從而得到一個與原始數據近似的新數據。將重組后的擬合數據輸入到訓練好的BP神經網絡進行預測。預測過程如圖1所示。
3 應用實例和分析
3.1 股票數據的BP神經網絡訓練
將中國石化股票從2011年6月至2011年12月共130天的股票價格數據進行樣本劃分。用前60天的數據來預測后5天的數據,作為網絡訓練集。選取剩下的60天數據預測最后的5天,作為測試集。
3.3 數據合成及預測
本文對中國石化股票數據(圖3)進行EMD分解后得到4個IMF分量和1個剩余分量。對4個分量分別進行與剩余分量的相關系數分析。分析結果表明,IMF3和IMF4相關性較大,并與剩余分量的相關性也較大(相關門限值選取0.3)。所以選取IMF3和IMF4兩個分量與剩余分量進行重構,得到與原始數據近似的較平滑的新數據如圖9所示。
經過比較可知,對于具有非平穩性行為強烈的股票時間序列的預測,基于EMD的BP神經網絡預測要比直接BP神經網絡預測更為準確。
對于非平穩的時間序列,BP神經網絡預測有著明顯的優勢,但是對于影響因素復雜的非平穩數據,多種因素的干擾給預測帶來了一定的困難。EMD分解分離了各個不同因素的相互干擾,通過對各分量單獨預測再合成的處理,從而提高了預測精度。從表1可以看出最終的預測誤差經過EMD分解的信號要精確于直接神經網絡預測。從圖4中可以看出影響信號平穩性程度最大的是IMF1,如果再對其進行分解處理,整個系統的預測精度會得到更大的改善。
4 結束語
對于非平穩的時間序列,BP神經網絡預測有著明顯的優勢,但是對于影響因素復雜的非平穩數據,多種因素的干擾給預測帶來了一定的困難。EMD分解分離了各個不同因素的相互干擾,通過對各分量分析再合成的處理,提高了預測精度。目前EMD方法主要用于模擬信號和大氣數據分析[13-15],用于金融數據預測還較為少見。本文將其與BP神經網絡結合,構建了EMD-BP神經網絡預測模型。從本文的預測過程和仿真結果可以看到,利用EMD分解的BP神經網絡預測優于直接BP神經網絡預測,相比其精確度有了明顯的提高。
參考文獻:
[1] 劉瑛慧,曹家璉.時間序列分析理論與發展趨勢[J].電腦知識與技術,2010.2:257-258
[2] 劉佳,趙文慧,劉光榮.基于SAS的非平穩時間序列分析及實證研究[J].汕頭大學學報.2010.2(1):48-53.
[3] 李海林,郭崇慧,時間序列數據挖掘中特征表示與相似性度量研究綜述[J].計算機應用研究,2013.5(30):1285-1290
[4] 魏宇.中國股票市場的最優波動率預測模型研究[J].管理學報,2010.6(6):936-942
[5] 方啟東,溫鑫,蔣佳靜等.基于時間序列的股價預測[J].宿州學院學報,2010.8(8):71-74
[6] 杜建衛,王超峰.小波分析方法在金融股票數據中的應用[J].數學的實踐與認識,2008.7(38-7):68-75
[7] 劉海玥,白艷萍.時間序列模型和神經網絡模型在股票預測中的分析[J].數學的實踐與認識,2011.2(4):14-19
[8] 張媛,劉紅忠.基于行為金融的神經網絡模型在股票價格預測中的有效性研究[J].世界經濟情況,2011.2(2):62-67
[9] 焦淑華,夏冰,徐海靜,劉瑩.BP神經網絡預測的MATLAB實現[J].哈爾濱金融高等專科學校學報,2009.3(97):55-56
[10] 李萍,曾令可,稅安澤,金雪莉,劉艷春,王慧.基于MATLAB的BP神經網絡預測系統的設計[J].計算機應用與軟件,2008.4(25-4):149-151
[11] Zhaohua Wu, Norden E. Huang. A study of the characteristics of white noise using the empirical mode decomposition method[J].The Royal Society,2004.3(10):1597-1611
[12] 劉慧婷,倪志偉,李建洋.經驗模態分解方法及其應用[J].計算機工程及應用,2006.1(32):44-47
[13] 徐世艷.經驗模態分解的時頻分析方法及其應用[J].吉林大學學報,2009.9(27-5):487-492
[14] 玄兆燕,楊公訓.EMD在地面氣溫預測中的應用[J].微計算機信息,2008.2(24-3):230-232
[15] 玄兆艷,楊公訓.經驗模態分解法在大氣時間序列預測中的應用[J].自動化學報,2008.1(34-1):97-101