劉佳祺 劉德紅 林甜甜
摘 要:本文將BP神經網絡模型與主成分分析法和遺傳算法相結合,建立了預測股票價格變化的動態PCA-GA-BP模型。該模型能改善BP神經網絡模型運算速度緩慢和易陷入局部最小值的缺點,彌補傳統股票價格預測方法的不足。
關鍵詞:BP神經網絡模型 主成分分析 遺傳算法 PCA-GA-BP模型
中圖分類號:F832 文獻標識碼:A 文章編號:2096-0298(2018)03(b)-029-02
股票的價格走勢不僅可以從一定程度上體現宏觀經濟的發展狀況,而且與每個投資者的經濟利益相關,因此研究我國股票市場的可預測性非常有意義。股票價格的預測方法主要分為兩類:第一類是基于線性模型的傳統統計經濟學方法,第二類是采用人工神經網絡模型的非線性方法。然而股票市場是一個復雜的系統,它具有非結構性、非線性、高噪聲的特性,使用傳統的方法建立精確、有效的模型比較困難。研究結果表明,BP神經網絡模型能有效地考慮到影響股票價格的各種非線性因素,在股市預測方面效率和精準度相對較高。
1 BP神經網絡模型
BP神經網絡是由Rumelhart和McClelland為首的科學家提出的概念,是一種按照誤差逆向傳播算法訓練的多層前饋神經網絡,是目前應用最廣泛的神經網絡。
1.1 BP神經網絡模型原理
BP神經網絡模型主要包括三個部分,分別是輸入層、隱含層和輸出層如圖1所示。學習樣本從輸入層經各隱含層傳向輸出層,最終在輸出層的各個神經元收到來自輸入層的信息。之后,系統以減少輸出值與期望值的誤差為目標,從輸出層開始經過各個中間隱含層修正各連接權值,最后回到輸入層。隨著這種修正傳播的不斷進行,網絡調整權值直至誤差達到理想值。

1.2 BP神經網絡模型優缺點
首先,BP神經網絡模型具有非線性映射能力強、自適應性和自學習能力強、容錯能力強等優點,能通過網絡訓練儲存網絡權值中的學習內容,較好地處理內部作用機制復雜的非線性函數,從而準確地預測數據。
但是在實際應用中,BP神經網絡模型存在著隱含層節點難確立、變量選擇困難、運算速度緩慢等缺點。針對這些問題,作者對BP神經網絡進行了改進,使其能準確、高效地預測股票價格。
2 BP神經網絡模型的改進
2.1 BP神經網絡與主成分分析結合
對股市未來趨勢進行預測的基礎是股市大量的歷史數據,雖然這些數據簡單明了,但直接將這些數據作為模型的輸入樣本是錯誤的,因為這組數據之間存在相關性。而主成分分析法能將一組互相影響的輸入因子轉換成兩兩不相關的、變量數少的綜合指標,盡可能反映原指數信息的實際需求,揭示影響股價信息的一般因素和特殊信息。所以應先對數據進行主成分分析,選取足夠的主成分數,從而作為輸入層數據代入BP神經網絡模型。
主成分分析對BP神經網絡的改進主要體現在它可以有效地降低輸入變量的維度,提取原指標的主要信息,減少模型的訓練學習時間。但是,主成分分析不能捕捉股價因素之間的非線性關系,不能直接用于股票價格預測,而BP神經網絡模型能很好地處理內部作用機制復雜的非線性關系。由此可知,主成分分析和BP神經網絡模型的功能可以進行互補,整合各自的數據處理優勢,從而對股價進行準確預測。
2.2 BP神經網絡隱含層單元數的確定
在BP神經網絡模型中,研究的問題本身已經確定了輸入單元數和輸出單元數。因此,模型成功的關鍵在于如何精準確定隱含層的層數和相應的單元數。因為一個隱含層就可以訓練BP神經網絡無限接近某一目標非線性函數,所以本文將網絡層數確定為3,即只有一個隱含層。相反,確定隱含層的單元數是個十分復雜的問題。一方面,過多的單元數會影響網絡的概括推理功能,另一方面,過少的單元數則會影響模型訓練和預測的精度,降低實證效果。本文采用沈花玉等提出的BP神經網絡隱含層單元數的改進方法,該方法基于3種基本確定單元數途徑,即:

其中為隱含層單元數,n為輸入單元數,m為輸出單元數。
筆者提出綜合這三種方法來確定最佳隱含層單元數的邊界值,然后按照單元數范圍從小到大依次對數據進行訓練,根據訓練誤差和對應的測試誤差,選擇隱含層的最佳數目。
2.3 BP神經網絡與遺傳算法結合
遺傳算法是一種自適應優化搜索算法,其思想來源于生物遺傳學和適者生存的自然規律。遺傳算法以期望的函數為目標,評價每個向量的適應度,然后根據該適應值實施變異、交換、選擇等操作。在這過程中,適應度高的元素被留下來并傳給下一代新的數據組,而適應度低的元素則被淘汰。
遺傳算法具有較強的全局搜索能力,能彌補BP神經網絡模型具有易陷入局部最小值的缺陷。將BP神經網絡和遺傳算法結合,可以充分發揮兩者的優點,使新算法既有神經網絡的學習能力和魯棒性,又有遺傳算法的強全局搜索能力。
3 PCA-GA-BP模型的股票預測
采用PCA—GA—BP模型預測股票價格流程如下:首先,選取股票交易的歷史數據,用主成分分析法對數據進行預處理,消除數據間的冗余,以達到降維的目的;其次,利用本文2.2節所述方法選取合適的隱含層單元數,構建BP神經網絡模型;再次,將輸入變量分為訓練段和預測段兩部分,確保訓練段數據盡量擬合,從而確定遺傳算法相關參數;最后,訓練改進后的BP神經網絡,并用其預測股價。具體算法,如圖2所示。
4 結語
PCA—GA—BP模型改進了BP神經網絡隱含層節點難確立、變量選擇困難、運算速度緩慢等缺陷,能準確預測具有非線性和隨機性的股票價格,使預測值的誤差達到最小值,實現更好的預測效果。

參考文獻
[1] 齊曉娜,程維剛.基于遺傳LMBP神經網絡模型的股票預測[J].無線互聯科技,2016(3).
[2] 黃宏運,朱家明,李詩爭.基于遺傳算法優化的BP神經網絡在股指預測中的應用研究[J].云南大學學報(自然科學版),2017(3).
[3] 劉永福,李建功.利用BP神經網絡預測上證指數[J].商務周刊, 2003(10).
[4] 柏丹,靳鑫,孫方方.BP神經網絡的股票價格預測模型建立[J].科技創業月刊,2013,26(1).