摘要:本文介紹了RBF神經(jīng)網(wǎng)絡的基本概念以及網(wǎng)絡結構,并利用基于RBF建立的概率神經(jīng)網(wǎng)絡對上證股市的漲跌進行了分類預測,實例計算分析表明基于RBF的概率神經(jīng)網(wǎng)絡在對股市整體走勢的預測上表現(xiàn)較好。
關鍵詞:RBF 概率神經(jīng)網(wǎng)絡 股市預測
0 引言
人們一直致力于研究股票市場價格的變化,希望能從中找出一些規(guī)律,避免大的股市波動,從而使損失最小化,收益最大化。但股票市場是一個復雜的非線性動力系統(tǒng),同時受多種因素諸如銀行利率、國家政策、公司業(yè)績等交互影響,對于股票未來價格的精確預測是非常困難的,也可以說是不可能的,這時對股票未來整體走勢的把握就顯得尤為關鍵。
對股市的漲跌預測或分類方法大致可以分為兩種:一種是傳統(tǒng)的基本分析法與技術分析法,另一種則是智能化方法,尤其以神經(jīng)網(wǎng)絡最為突出[1]。傳統(tǒng)的方法一般是基于股票交易中歷史事件重現(xiàn)的假設,因此常以圖形或者統(tǒng)計分析結果來顯示股票市場變化的幅度、方向、轉(zhuǎn)折點和趨勢,最常見的有K線圖,移動平均圖等;在對歷史事件進行重現(xiàn)的同時加上個人或?qū)<业募夹g分析,最后形成股市預測,顯然這種方法帶有了強烈的人為因素在里面,在對歷史事件進行重現(xiàn)時具有明顯的不足。人工神經(jīng)網(wǎng)絡在股市預測及分類方面則具有先天的優(yōu)勢[2],這是因為對于股市這樣典型的非線性動力系統(tǒng),神經(jīng)網(wǎng)絡可以通過學習訓練比較好地尋找到這些無規(guī)律數(shù)字之間的非線性關系,避免了人為干擾。人工神經(jīng)網(wǎng)絡應用較多的有BP神經(jīng)網(wǎng)絡,RBF神經(jīng)網(wǎng)絡,線性神經(jīng)網(wǎng)絡,反饋型神經(jīng)網(wǎng)絡,競爭型神經(jīng)網(wǎng)絡等。本文選用的是RBF神經(jīng)網(wǎng)絡對股市進行分類及預測[3],主要是因為RBF神經(jīng)網(wǎng)絡是一種局部逼近網(wǎng)絡,對于每個訓練樣本只需要對少量的權值和閾值進行修正,訓練速度快;同時克服了BP神經(jīng)網(wǎng)絡采用負梯度下降法帶來的收斂速度慢和局部極小等缺點。
1 RBF神經(jīng)網(wǎng)絡模型
徑向基函數(shù)網(wǎng)絡方法是在高維空間進行插值的一種技術,網(wǎng)絡由輸入,隱層和輸出三層組成,它的突出特點是隱層神經(jīng)元的輸出函數(shù)被定義為具有徑向?qū)ΨQ的基函數(shù)(徑向基函數(shù)),而基函數(shù)的中心向量被定義為網(wǎng)絡輸入層到隱層的連接權向量[5]。這個特點使得隱層對輸入樣本有一個聚類的作用,其中,中心向量為類均值,它的個數(shù)代表聚類的類數(shù)。
RBF神經(jīng)網(wǎng)絡結構如圖1所示,它實現(xiàn)了如下一種映射關系:
其中x∈RN表示模式向量,cppp=1RN是基函數(shù)中心,λp是權函數(shù),φ是選定的非線性基函數(shù)。
常用的非線性基函數(shù)主要有高斯基函數(shù),薄板樣條函數(shù),多二次函數(shù)和逆多二次函數(shù)等,一般認為非線性基函數(shù)φ的具體形式對網(wǎng)絡的性能影響不大。因此本文中選取的基函數(shù)為常用的高斯基函數(shù),其具體形式如下:
這里參數(shù)σp是第p個高斯基函數(shù)Rp(x)的“寬度”或“平坦程度”。在MATLAB中徑向基神經(jīng)網(wǎng)絡中采用的高斯基函數(shù)為radbas,可以表示為如下形式:
a(n)=radbas(n)=e-n (1.3)
2 RBF神經(jīng)網(wǎng)絡結構
徑向基函數(shù)網(wǎng)絡包括隱層和輸出層。輸入信號傳遞到隱層,隱層節(jié)點函數(shù)為高斯基函數(shù);輸出層則對經(jīng)過處理的信號進行再次處理,其節(jié)點函數(shù)通常是簡單的線性函數(shù)。如果第二層為一特殊的線性層,那么此時RBF神經(jīng)網(wǎng)絡就變?yōu)閺V義回歸神經(jīng)網(wǎng)絡(GRNN),通常用于函數(shù)逼近;如果第二層為一競爭型網(wǎng)絡層,那么RBF神經(jīng)網(wǎng)絡就變?yōu)楦怕噬窠?jīng)網(wǎng)絡(PNN),通常用于模式分類。本文所采用的分類方法就是基于RBF的概率神經(jīng)網(wǎng)絡,如圖2所示,第二層為隱層,傳遞函數(shù)為高斯基函數(shù),IW1,1為矩陣向量,第三層為競爭層,LW2,1為期望值向量矩陣,C為競爭傳遞函數(shù)。
3 股票漲跌分類預測
本文選取上證指數(shù)中連續(xù)51天(2008.10.6——2008.12.15)的數(shù)據(jù),數(shù)據(jù)中包括開盤價、最高價、收盤價、最低價、成交量及成交額六組股票數(shù)據(jù)。選取前40天的數(shù)據(jù)作為訓練學習數(shù)據(jù),后10天的數(shù)據(jù)作為檢驗數(shù)據(jù)。
由于股票數(shù)據(jù)數(shù)量眾多,首先進行數(shù)據(jù)的歸一化。對每一組數(shù)據(jù)分別進行歸一化,采用如下的形式:
由于股票分類只有漲跌兩種情況 ,因此采用概率神經(jīng)網(wǎng)絡來對數(shù)據(jù)進行學習分類,分類為漲或跌兩種。經(jīng)過訓練學習,得到的訓練樣本的輸出中只有兩個樣本與實際漲跌不同(第13,30天),訓練樣本學習成功率高達95%,這說明網(wǎng)絡能夠完全擬合股市的波動。應用該網(wǎng)絡模型對后10組數(shù)據(jù)進行分類預測,結果只有5天預測情況與實際漲跌相同(第42,44,46,48,49天),這說明該模型在預測某一天的漲跌上不是很理想。但預測結果顯示該模型在對股市的整體走勢上預測比較理想,股票走勢見圖3。
在圖3中可以看出,雖然股市在局部有小的波動,但從整體看來上證指數(shù)在第41—46天呈現(xiàn)上升趨勢,第46—50天呈現(xiàn)一種下降趨勢,而在表1的預測結果中可以看出神經(jīng)網(wǎng)絡預測第41—44天股市是上升的,從第45天起股市開始下跌,這與實際情況是比較吻合的。同時也說明了神經(jīng)網(wǎng)絡比實際提前1—2天預測到了股市的未來走勢。
4 結論
本文通過基于RBF得到的概率神經(jīng)網(wǎng)絡對上證指數(shù)的漲跌進行分類預測,經(jīng)過分析得到一下結論:①該神經(jīng)網(wǎng)絡在樣本學習時能夠比較好的完成學習,但是在預測某一天的實際漲跌時卻不是很理想,成功率較低。這說明該網(wǎng)絡的學習過程能夠達到較高的精度,但是可預測性差,即推廣能力較差。②該模型雖然在預測某一天的股市漲跌時較差,但是對股市的未來幾天的整體走勢把握較好,能夠反應出股市的大體走向。③該模型只是應用了概率神經(jīng)網(wǎng)絡對股市的漲跌進行了分類預測,如果結合其他神經(jīng)網(wǎng)絡例如BP網(wǎng)絡對股市的價格預測就能夠提供更加豐富的信息,為股市操作提供有利的支持。
雖然基于RBF的概率神經(jīng)網(wǎng)絡對股票的單天漲跌預測不是很理想,但是對未來的整體走勢預測較好,比較適合于長線操作。概率神經(jīng)網(wǎng)絡還存在著一些問題,例如預測精度較差,對參數(shù)比較敏感等,這些都需要進一步的改進。
參考文獻:
[1]吳微,神經(jīng)網(wǎng)絡計算[M],高等教育出版社.
[2]葉東毅,劉文標,徑向基函數(shù)神經(jīng)網(wǎng)絡在股票走勢模式分類中的應用[J],運籌與管理,1999.9.
[3]付成宏,博明,閾建榮,基于RBF神經(jīng)網(wǎng)絡的股票價格預測[J],企業(yè)技術開發(fā),2004.4.