[摘 要] 針對證券市場內部結構的復雜性、外部因素的多變性,本文采用動態模糊神經網絡(DFNN)進行金融股指預測。DFNN能夠實現在線學習,并且參數估計與結構辨識同時進行;同時采用誤差下降率(ERR)修剪技術,保證網絡拓撲結構不會持續增長,避免了過擬合及過訓練現象,確保了DFNN的泛化能力。本文以上證指數為例,通過與同樣以高斯函數作為傳遞函數的RBF算法預測結果的比較和分析,表明DFNN預測上證指數的偏差較小,預測的方向準確性較高。通過DFNN模型提取的模糊規則對金融系統運行模式進行分析,為研究金融非線性系統辨識提供了啟發性思路。
[關鍵詞] 股票指數預測;TSK模糊系統;DFNN;ERR修剪技術;非線性系統辨識
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2009 . 21 . 028
[中圖分類號]F830[文獻標識碼]A[文章編號]1673 - 0194(2009)21 - 0089 - 04
1引言
在金融系統的預測研究中,金融股票指數預測是一個熱門的課題。很難建立一個足夠精確的模型來描述金融非線性系統,利用傳統的時間序列等統計手段很難解決金融股票指數預測問題。近年來模糊神經網絡成為針對非線性系統預測研究的一個熱點,并形成了一個較為完善的體系[1 - 4]。現有模糊神經網絡預測必須預先劃分輸入空間,然后確定模糊規則數,從而預先定好神經網絡的結構,在此基礎上,再利用神經網絡的學習功能和自適應能力對系統參數優化,并且其學習方式多為BP算法。BP算法速度較慢,且容易陷入局部極小點。因此迫切需要尋找針對實時應用的模糊神經網絡算法。
針對傳統模糊神經網絡自身存在的以上缺點,本文采用動態模糊神經網絡(Dynamic Fuzzy Neural Network,DFNN)對上證指數進行預測,該算法構架基于RBF神經元的模糊神經網絡,通過自適應構建專家推理規則來構建神經網絡拓撲結構。通過啟發式學習算法實現參數估計與結構辨識同時進行,并采用誤差下降率(Error Reduction Rate,ERR),使得網絡結構不會持續增長,避免了過擬合及過訓練現象,確保了模型的泛化能力,實現模型的動態在線控制。
2動態模糊神經網絡(DFNN)
2.1DFNN結構
DFNN采用五層神經網絡拓撲結構: x1, x2, …, xr是輸入的語言變量,y是系統的輸出,MFij是第i個輸入變量的第j個隸屬函數,Rj是第j條模糊規則,Nj表示第j個歸一化節點,wj是第j個規則的結果參數或者連接權,u是系統總的規則數。
第一層:輸入層,每個節點代表一個輸入的語言變量。
第二層:隸屬函數層,每個節點分別代表一個隸屬函數,該隸屬函數采用高斯函數;
uij (xi) = exp[-(xi - cij)2 / σ2j], i = 1,2,…,r; j = 1,2,…,u(2.1)
式中,uij是xi的第j個隸屬函數,cij是xi的第j個隸屬函數的中心, σj是xi的第j個高斯隸屬函數寬度,r是輸入變量數,u是隸屬函數的數量,即系統總的規則數。
第三層:T - 范數層,每個節點分別代表一個可能的模糊規則中的IF - 部分。第j個規則Rj的輸出為:
j = exp[- (xi - cij)2] = exp[-|| X - Cj||2 / σ2j], j = 1, 2, …, u (2.2)
式中,X = (x1, x2, …xr) Rr,Cj = (x1, x2, …xrj) Rr 是第j個RBF單元的中心。
第四層:歸一化層,這些節點為 N節點,第j個節點Nj的輸出為:
j = j /k, j = 1, 2, …, u (2.3)
第五層:輸出層,每個節點分別表示一個輸出變量,該變量是所有輸入信號的疊加
y(X) = wk#8226;k (2.4)
式中,y是輸出變量,wk是THEN-部分(結果參數)或者第k個規則的連接權。對于TSK模型:
wk = αk0 + αk1x1+ … + αkrxr, k = 1, 2, …, u (2.5)
將(2.2) 、(2.3)、 (2.5)代入(2.4),則:
y(X) =[(αi0 + αi1x1+ … + αirxr)exp ] /exp(- ) (2.6)
2.2 DFNN學習算法
2.2.1 規則產生準則
(1) 系統誤差判據
對于第i個觀測數據(Xi, ti),其中,Xi是輸入向量,ti是期望的輸出,由(2.6)計算出DFNN現有機構的全部輸出yi。定義系統誤差ei : || ei || = || ti - yi ||;當 || ei || > ke時,則增加一條新的規則,其中ke是根據DFNN的期望精度預先設定的。
(2) 可容納邊界判據
對于第i個觀測數據(Xi, ti),計算輸入值Xi和現有RBF單元的中心Cj之間的距離,即di(j) = || Xi - Cj ||,j = 1, 2, …, u;其中,u是現有的模糊規則或者RBF單元的數量。取dmin = arg min(di(j));當dmin > kd時,則增加一條新的規則,其中kd是可容納邊界的有效半徑。
2.2.2分級學習
文獻[5]提出每個RBF單元的可容納邊界不是固定的而是動態調整的:開始可容納邊界設置較大,以實現全局學習,隨著學習邊界逐漸減小,開始局部學習。ke、kd不是常數,而由下式確定:ke = max[emax× βi,emin]; ke = max[dmax× γi,dmin]。其中,emax是預先定義好的最大誤差,emin是期望的DFNN精度, β(0 < β < 1)是收斂常數,dmax是輸入空間的最大長度,dmin是最小長度,γ(0 < γ < 1)是衰減常數。
2.2.3前提參數分配
新產生的規則的初始參數按照如下方式分配:Ci = Xi; γi = k × dmin;其中,k(k > 1)是重疊因子。
當第一個觀測數據(X1,t1)得到后,此時DFNN還沒有建立起來,因此C1 = X1,σ1 = σ0,其中σ0是預先設定的常數。① 當|| ei || > ke,dmin > kd時,則DFNN增加一條模糊規則。② 當|| ei || < ke,dmin ≤ kd時,則DFNN可以完全容納觀測數據(Xi,ti),不需更新結果參數。③ 當|| ei || ≤ ke,dmin > kd 時,則DFNN具有較好的泛化能力,只對結果參數調整。④ 當|| ei || > ke,dmin ≤ kd時,則Xi可以聚集在已有的RBF單元的附近,但覆蓋Xi的RBF單元泛化能力不好。該RBF節點及結果參數同時被更新。對于最接近Xi的第k個RBF單元按照下式調整: σik = kw × σki - 1;其中,kw(kw > 1)是預定的常數。
2.2.4修剪算法
本文采用文獻[6]提出的誤差下降率(ERR)作為修剪策略。ηi反映第i個規則的重要性,ηi越大表示第i個規則越重要。若ηi < kerr(其中,kerr表示預設的閾值),則第i個規則可刪除。圖1是DFNN流程圖。
3仿真實驗與分析
3.1實驗數據
上證指數作為反映宏觀經濟形勢的重要指標,其價格的波動和宏觀經濟指標也是密切相關的。本文通過第n周的上證指數收盤價和成交額及當期的月社會商品零售總額、物價指數、固定資產投資額針對第n + 1周的上證指數收盤價(n = 1,2,…,187)進行預測,構建基于DFNN的預測模型。
3.2實驗評價指標
v1是規格化的均方誤差,v2是方向一致性指標。指標的計算方法如下:
v1 = #8226;(preal, i - preal, i)2,
λ2 = #8226;(preal, i - ppredl, i)2;
v2 = #8226;di,
di= 1,(preal, i - preal, i - 1)(preal, i - preal, i - 1) ≥ 00,其他。
其中,preal,i 為第i周的周收盤價實際值,ppred,i為第i周的周收盤價預測值(i = 1,2,…,n)。
3.3實驗環境與結果分析
采用Matlab語言在PC Pentium4/ CPU3.0GHz/ RAM1.0G上編程實現上述DFNN。為了測試算法的有效性,將針對上證指數的預測與現實中的上證指數進行比較,并與傳統RBF預測效率及結果進行比較。
DFNN所涉及的參數預先設定如下:預先定義好的最大誤差emax = 1.1;期望的DFNN精度emin = 0.02;收斂常數β = 0.85;輸入空間的最大長度dmax = 35;最小長度dmin = 2;衰減常數γ = 0.98;預先設定的第一個隸屬函數寬度σ0 = 1;重疊因子k = 2.5;隸屬函數寬度調整參數kw = 1.05;修剪算法閾值參數kerr = 0.000 7。
RBF采用三層神經網絡拓撲結構,隱層傳遞函數采用高斯函數,輸出層采用線性函數。RBF所涉及的參數預先設定如下:根據輸入樣本數(共187個數據) ,隱含層神經元數為187;相應寬度C = 187。
實驗1: DFNN拓撲結構、性能參數分析及模糊規則分布情況
如圖2(a)所示,經過175個訓練數據,規則數穩定在2條。需要指出的是,規則數保持穩定不代表規則是保持不變的。實際上,當新的樣本數據加入后,前提參數(寬度)和結果參數一直保持更新。而且,一條新規則的產生可能會剔除一條或兩條已有的規則而同樣保持系統的精確。
實驗2: DFNN與RBF預測效果比較
表1給出了兩種算法通過對樣本進行訓練學習后,對上證指數2007年11月9日到2008年7月4日進行仿真預測后,評價指標對比情況及算法計算時間比較。DFNN的評價指標v1,v2均優于RBF,證明在神經網絡中融入模糊專家規則后,DFNN的預測效果要優于同樣以高斯函數作為隱層函數的RBF;DFNN在算法計算時間方面略長。
表1算法評價指標及計算時間比較
兩種算法預測誤差走勢圖如圖3(a)所示,在預測穩定性方面,本文采用的DFNN預測誤差能夠控制在15%以內,其穩定性要優于RBF。如圖3(b)所示,與RBF預測結果相比,DFNN滾動預測37周上證指數周收盤價格與實際值較接近,并且走勢一致。
4結束語
本文采用DFNN直接利用金融股指以及相關宏觀經濟指標的輸入/輸出數據進行學習并進行預測。仿真結果表明,基于DFNN提取模糊規則的算法比較有效。將DFNN與RBF對上證指數預測的評價指標比較發現,DFNN算法在預測準確性、穩定性上均優于RBF神經網絡。DFNN控制算法為研究非線性多變量金融系統預測問題,提供了一種新的思路,具有一定的理論意義和工程應用價值。
主要參考文獻
[1] Lin C T, Lee C S G. Neural Fuzzy System: A Neural-Fuzzy Synergism to Intelligent Systems[M]. Englewood Cliffs, NJ: Prentice-Hall,1996.
[2] Jang J-S R, Sun C T, Mizutani E. Neuro-Fuzzy and Soft Computing[M]. Englewood Cliffs,NJ: Prentice-Hall,1997.
[3] 劉瑞蘭,蘇宏業,褚健.模糊神經網絡的混合學習算法及其軟測量建模[J].系統仿真學報,2005,17(12): 2878 -2881.
[4] 胡玉玲,曹建國. 基于模糊神經網絡的動態非線性系統辨識研究[J].系統仿真學報,2007,19(3): 560 -562.
[5] Lee S, Kil R M. A Gaussian Potential Function Network with Hierarchically Self-Organizing Learning[J]. Neural Networks, 1991(4): 207-224.
[6] Lu Y, Sundararajan N, Saratchandran P. A Sequential Learning Scheme for Function Approximation by Using Minimal Radial Basis Function Networks[J]. Neural Computation, 1997(9): 461-478.
The Study on the Application of DFNN in Stock Index Prediction and Financial Nonlinear System Identification
SUN Bin,LI Tie-ke,ZHANG Wen-xue
(School of Economics and Management,University of Science andTechnology Beijing,Beijing 100083,China)
Abstract: Aiming at the complexity of inside structure and levity of exterior complication in system of stock market which make stock market prediction a complex problem, method of modeling dynamic fuzzy neural network (referred to as DFNN) that is based on thorough study of the difficult problems facing stock predication is proposed. The fuzzy neural network based on extended radial basis function neural networks is equivalent to TSK fuzzy systems on the function. DFNN could achieve online learning, parameter estimation and structure identification. The algorithm uses the error reduction rate (referred to as ERR) pruning technology, network structure does not guarantee sustained growth, to avoid over fitting and over-training phenomenon, to ensure that the system’s generalization ability. In this paper, DFNN shows smaller deviation and higher accuracy in prediction of Shanghai Composite Index, comparing with RBF algorithm and gets fuzzy rules of financial system which reveal the financial system operating mode.
Keywords: Stock Index Prediction; TSK Fuzzy System; DFNN; ERR Pruning Technique; Nonlinear System Identification
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文