樊明智,劉道文
(許昌學院a.數學與統計學院;b.公共實驗中心,河南 許昌461000)
隨著我國經濟的快速發展,股指預測成了一個當前研究的熱點課題,業內專家學者試圖通過分析股指的特性,把握其變化規律,從而做出較準確的股票價格指數走勢分析。股票市場受多種因素的影響,在較短時期內,股指可能波動較大,表現出明顯的非線性和不確定性;但在較長時期內有某些確定的基本因素起作用,股指的變化具有一定的趨勢性[1]。在分析股指混沌特性的基礎上,尋求一種較理想的股指預測方法具有現實意義。
混沌是指確定性系統中存在的一種貌似無規則、隨機的現象,其固有的確定性表明許多貌似隨機的現象是可以預測的,一般是將具有混沌特性的時間序列轉換到高維空間中,找出蘊涵在混沌吸引子中的演化規律。在實際預測過程中,當嵌入維數較高時,時間序列的相空間軌跡可能很復雜,很難找出一種映射關系來預測未來時刻的數值。而神經網絡是通過對簡單的非線性函數的多次復合來逼近復雜函數,可以表達復雜的物理現象[2]。從股票市場中提取出來的股指時間序列隨時間波動比較劇烈,依據混沌理論計算出來的相空間重構最佳嵌入維數較大。本文將依據混沌理論確定其時間延遲和最佳嵌入維數后,以最佳嵌入維數作為輸入結點數目建立神經網絡模型來預測股指的未來值。
股票市場是一個復雜的非線性動力系統,在實際數據分析時往往只是從股票價格隨時間變化的時間序列入手。而影響股票市場的因素眾多,僅僅依賴時間這一因素來預測股票市場的變化顯然存在較大的局限性,利用相空間重構[3]的方法可以將時間序列從一維轉換到高維空間中,從而在高維空間中把握系統變化規律,在此基礎上進行股票價格指數的預測在理論上是可行的。Takens[4]證明了可以找到一個合適的嵌入維,即如果延遲坐標的維數m≥2d+1,其中d是動力系統的維數,在這個嵌入維空間里可以把有規律的軌跡(吸引子)恢復出來。也即在重構的Rm空間中的軌線上原動力系統保持微分同胚,從而為混沌時間序列的預測奠定了堅實的理論基礎。
設時間序列{xi,i=1…N}是從股票市場提取出來的股指時間序列,若序列具有混沌特性,則依據混沌理論計算出該時間序列的延遲時間τ和最佳嵌入維m,根據這兩個參數對股指時間序列進行相空間重構,將其從一維轉換到高維空間中。相空間重構得到的空間向量為:

X1,X2,…Xj,…,XM為相空間中的相點,由這些相點構造相空間[X1,X2,…,XM]T。因此,可用這些相點在m維相空間中描述系統的演化軌跡,即有:

狀態方程組(2)中的各個方程是關于向量的表達式,為直觀地展現歷史數據的演化規律,將(2)式表示為關于時間序列數據元素的方程式[5]:

狀態空間中相點Xj→Xj+1的演化反映了系統的演化規律,這樣可由歷史數據預測系統演化趨勢[6]。由于相點Xj+1中前(m-1)維是已知的歷史數據,將其化為單輸出得:

這里F(x)是一個從Rm到R的映射,一般為非線性映射關系,預測問題的實質就是如何獲得關于F(x)的一個最佳逼近[7]。
根據歷史數據對系統的未來值進行預測實際上是尋求一個歷史數據與未來值間的映射,這個映射關系的準確性決定了預測結果的可靠性。神經網絡在理論上能實現非線性函數的無限逼近,具有良好的預測能力,因此利用神經網絡模型能準確地進行非線性時間序列的預測。根據股指時間序列的特點,本文建立徑向基函數(RBF)神經網絡預測模型。
RBF神經網絡是局部逼近網絡,收斂速度快且不易陷入局部最小點,可以在任意精度下逼近任意的非線性函數。本文建立三層網絡結構的預測模型(如圖1),輸入層將變量傳輸到隱含層,隱含層的基函數采用高斯函數,對輸入變量產生局部的響應,隱含層到輸出層是一個線性加權的過程。徑向基函數為:

式中,Xk是第k個樣本向量,Ci是第i個隱含層神經元的中心,δ為寬度值。因此RBF神經網絡的輸出為:

式中,ωj是輸出層的連接權值且,Gj(Xk)是第k個樣本經過第i個神經元加工得到的輸出值。

圖1 RBF神經網絡模型示意圖
在RBF神經網絡的應用中,神經網絡模型每層神經元數目的選取對預測結果的影響具有關鍵意義。對于混沌時間序列的預測,一般地將該序列相空間重構的最佳嵌入維數作為輸入層結點數。研究表明,以此數目作為輸入層結點數建立的預測模型具有較好的預測效果[8]。對于隱含層神經元數目的確定本文采取動態調整的方法,事先設定一個精度值,隱含層的神經元數目由小到大增加,當網絡預測精度達到設定值時的數目即為隱含層神經元的個數。RBF神經網絡的訓練分為兩步驟:首先確定隱含層徑向基函數的中心點,本文采用K-均值聚類算法確定中心點Ci;其次通過最小二乘法修改連接權值。
在建立神經網絡預測模型時,將股指時間序列的最佳嵌入維數作為輸入結點的數目,而最佳嵌入維數是依據混沌理論計算得來的。由于依據混沌理論計算延遲時間、嵌入維數等參數時對時間序列的元素數量要求較大,因此選取了上海證券交易所2002年12月11日~2011年3月10日2000個交易日的股指收盤價作為分析對象。為便于混沌特性的分析和計算,將由這2000個數據構成時間序列進行歸一化處理。設樣本原始數據為{yi,i=1…N,N=2000},經歸一化處理得到的時間序列為{xi,i=1,2…N,N=2000}。

其中,ymax=max{yi,i=1,2…2000};ymin=min{yi,i=1,2… 2000}。
相空間重構是基于混沌理論的方法,需要證實所研究的對象是一個混沌動力系統或混沌時間序列,因此分析確定股票價格指數時間序列具有混沌特性,是基于混沌理論股票價格指數預測的前提。從股票市場這一非線性動力系統中提取出來的股票價格指數時間序列,其混沌特性可以用該序列的關聯維數及最大Lyapunov指數來判定。
關聯維是判定一個時間序列具有混沌特性的一個重要特征量,混沌時間序列的關聯維數為非整數并且會隨著嵌入維數的增大而趨于收斂。確定時間序列的關聯維數和嵌入維數最常用方法是G-P法[9],用此法計算關聯維時,需事先計算出時間序列的延遲時間。股指時間序列的數據量很大且具有明顯的非線性,本文采用C-C Method[10]法計算其延遲時間τ=24,該方法既能有效地減小互信息法的計算量,又能保持非線性特征。為了直觀地觀察和分析股指時間序列的混沌特性,在計算其關聯維數的同時分別繪制了ln(C(ε))-lnε曲線(如圖2)和D(m)-m曲線(如圖3)。從圖3中可以看出,該時間序列的關聯維數隨著嵌入維數的增加而趨于收斂,當嵌入維數m等于12時關聯維數的值是1.0186,為非整數。
對于離散的非線性時間序列,判定其是否具有混沌特性的另一重要特征量是最大Lyapunov指數。若最大Lyapunov指數λ1<0,該序列呈現定常或周期狀態;λ1>0意味著該序列具有混沌特性。根據延遲時間τ=24和最佳嵌入維數mmin=12,采用小數據量方法計算出上證指數時間序列的最大Lyapunov指數λ1=0.0033。綜上所述,可以判定該時間序列具備混沌特性。

圖2 ln(C(ε))-lnε曲線

圖3 D(m)-m曲線
利用RBF神經網絡預測股指時,選用序列{xi,i=1…N,N=2000}的前1600個數據作為訓練樣本訓練神經網絡,第1601~2000個數據進行RBF神經網絡檢驗,對股指時間序列最后135個數據進行預測。預測的結果如圖4所示。

圖4 上證指數源數據與預測值
本文參考文獻[6]的評價方法,以預測結果的相對誤差評價預測的效果:

針對嵌入維數較高的混沌時間序列很難在相空間中找出一種映射關系來預測其變化趨勢。本文基于混沌理論計算了上證指數時間序列的混沌特性參數,在相空間基礎上建立RBF神經網絡預測模型并對上海證券交易所股指時間序列進行了預測。研究結果表明,基于混沌特性參數的神經網絡能準確地反映股指變化的趨勢,具有較理想的預測效果和應用價值。但該方法仍還有一些值得改進的地方。一方面該方法對歷史數據要求嚴格且計算量大,如何改進算法減小計算量值得進一步研究;另一方面神經網絡模型中心點和權值的選擇方法有待于進一步優化改進。
[1]鮑新中,劉澄,孫彬.LM-BP算法在金融股指預測中的參數設定[J].系統管理學報,2009,(6).
[2]雷紹蘭.基于電力負荷時間序列混沌特性的短期負荷預測方法研究[D].重慶:重慶大學,2005.
[3]呂金虎,張鎖春.加權一階局域法電力系統短期負荷預測中的應用[J].控制理論與應用,2002,(5).
[4]F.Takens.Determing Strange Attractorsin Turbulence[C].Lecture Notes in Math,898,1981.
[5]樂曉波,匡迎春,唐賢瑛.短期電力負荷的混沌預測及其神經網絡的實現[J].長沙理工大學學報(自然科學版),2005,(2).
[6]張玉梅,曲仕茹,溫凱歌.基于混沌和RBF神經網絡的短時交通流量預測[J].系統工程,2007,(11).
[7]侯建軍,東防,蔡烽.混沌理論和神經網絡相結合的艦船搖蕩運動極短期預報[J].艦船科學技術,2008,(1).
[8]呂金虎,陸安君,陳士華.混沌時間序列分析及其應用[M].武漢:武漢大學出版社,2005.
[9]P.Grassberger,I.Procaccia.Measuring the Strangeness of Strange At?tractors[J].Physica D,1983,(9).
[10]H.S.Kim,R.Eykholt,J.D.Salas.Nonlinear Dynamics,Delay Times,and Embedding Windows[J].Physica D,1999,(127).