摘 要:本文對股價相關自變量進行主成分分析,然后采用PSO-BP神經網絡對行業(yè)龍頭性典型醫(yī)藥上市公司進行仿真與股價預測。實驗結果表明,經過主成分分析處理的PSO-BP神經網絡模型預測精度達到預測效果。
關鍵詞:主成分分析 PSO-BP神經網絡 股價預測
一、引言
我國上市公司股票價格的波動受諸多因素的綜合影響,包括政策、政治、經濟、社會、行業(yè)、上市公司自身等。加之我國股市發(fā)展歷程尚短,各種配套制度尚不完善,股價走勢呈現(xiàn)高波動性、高非線性。如何把握股價走勢,對股價進行預測獲取正盈利是投資者最為關心的問題。目前常見的分析方法主要有傳統(tǒng)的基本面分析和技術分析,現(xiàn)代的回歸分析、灰色模型、狀態(tài)空間以及人工智能神經網絡模型。各種改進算法的ANNs模型以及SVM模型在股價預測方面眾多學者進行了大量的研究,取得了許多具有實際應用價值的研究成果。但大部分的研究都沒有把關注點聚焦到輸入變量的選擇與處理上面,對于神經網絡模型來說,只有輸入自變量與因變量具有高度的相關性,并且沒有遺漏重要的自變量影響因素,才能有效地解釋股價走勢的變化關系,對股價趨勢作出比較準確的預測。因此,本文首先運用SPSS22.0對股價影響因素相關指標進行了相關性檢驗,刪選出相關性較高的輸入指標變量,然后通過因子分析里面的降維,進行主成分分析,減少冗余的相關性較低的自變量輸入,從而縮短BP神經網絡的訓練時間,獲得更理想的預測精度。在模型算法的優(yōu)化上,本文選擇了PSO算法,來提高BP神經網絡全局尋優(yōu)的能力和收斂的速度。本文以恒瑞醫(yī)藥(600276)為例,對股價走勢進行仿真預測。
二、PSO-BP神經網絡模型
1.模型基本原理。BP神經網絡模型能通過調整層與層之間的權值與閾值來刻畫出自變量與因變量之間任意的非線性關系,通過對歷史數據的學習,使得BPNN模型儲存自變量與因變量之間的映射關系信息,再通過自變量的輸入信息來預測因變量的取值。本文在BP神經網絡模型的原理基礎上,構建股價影響因素輸入指標體系,運用主成分分析降維,用主成分得分來進行BP神經網絡模型的仿真與預測。
2.主成分分析法。主成分分析法是通過正交變換將一組可能存在相關性的股價影響因素輸入變量指標轉換成線性不相關的幾個綜合變量指標,并根據需要選取較少的幾個變量以盡可能反映原來的輸入變量的信息,對輸入指標進行降維。
3.PSO算法。PSO算法中,每個待優(yōu)化問題的潛在解稱之為“粒子”,總的粒子個數即為種群規(guī)模,其中每個粒子都由其在解空間中的位置及其飛行速度所決定。粒子的適應度函數由待優(yōu)化的具體問題決定,根據粒子的適應度值確定粒子的個體最優(yōu)值以及粒子種群的全局最優(yōu)值。每個粒子不斷迭代計算在解空間中進行搜索,并不斷更新其速度和位置。
4.BP神經網絡。人工神經網絡一般包括輸入層、隱含層和輸出層,隱含層可以只有一層,也可以有多層,隱含層中的神經元一般采用S型傳遞函數,可以學習輸入輸出之間的線性或非線性關系,一般采用單調可微的遞增函數。BP神經網絡又稱前饋型神經網絡,是一種有導師的人工神經網絡模型,可以通過輸出結果誤差的反向傳遞來調整層與層之間的權值和閾值,從而來實現(xiàn)輸入輸出之間的復雜映射關系。
三、仿真實驗
1.輸入指標體系的選取。本文選取恒瑞醫(yī)藥(600276)為實驗對象。數據區(qū)間為2015年1月9日到2016年2月19日之間共58周的交易數據,以股票每周的開盤價、收盤價、最高價、最低價、MA5、MA10、、MA20、、MA60、、MACD的2個指標DIF、DEA、龍系長線2個指標LON、LONMA(10)以及ZLJC的3個指標JCS、JCM、JCL共15個輸入指標變量。所有指標在被刪選作為股價相關性因素作為輸入變量之前,均通過相關性檢驗,在0.01的置信度(雙側)上,顯著相關(>0.6)。
2.輸入指標PCA處理。本文利用SPSS20.0統(tǒng)計分析軟件進行主成分分析,使得多個指標可以被轉化為少數的幾個指標來反映股價影響因素綜合變量。運用主成分分析法來提取因子并進行了方差最大正交旋轉,參照碎石圖確定抽取因子的有效數目。KMO和 Bartlett檢驗用來判斷原始數據的有效性,KMO值為0.915,Bartlett's 球形檢驗值為 15655.238(Sig=0.000)。說明原始指標變量適合用來進行主成分分析。提取主成分的原則是,主成分對應的特征值要大于1,且方差累計貢獻率達到85%的前m個主成分。根據計算結果,提取出了2個主成分,即m=2。這意味著用2個主成分可以代替原來的15個指標變量,前2個主成分的累積貢獻率達到94.621%,2個主成分包含了全部指標絕大部分的信息,并得到了樣本數據的主成分得分。
3.PSO-BPNN模型的實現(xiàn)。根據主成分分析,選擇2個主成分作為神經網絡的輸入,神經網絡的輸出為下一周的最高價。根據多次調試選取了七層神經網絡,一個輸入層、五個隱含層、神經元個數分別為2、5、1。BP神經網絡的訓練學習尋求全局最優(yōu)的過程采用PSO粒子群算法。用2015年1月9日到2016年2月19日共48周數據作為訓練樣本,2015年12月11日到2016年2月19日共10周數據作為預測數據,采取滾動預測的方法,即用前面48周預測第49周,然后用前面49周預測第50周,依此類推。
4.預測結果分析。運用所建立的神經網絡模型對樣本進行仿真訓練,得到的結果見下表。從結果中可以看到,擬合的精度比較理想,預測值與實際值的誤差在可以接受的范圍內(3%以內),即經過主成分分析降維的PSO—BP神經網絡模型進行股價預測能達到期望的預測效果。
四、結語
我國二級股票市場屬于弱式有效市場,股價影響因素錯綜復雜,波動劇烈,股價走勢的規(guī)律難以捕捉,但諸多學者利用各種不同的數據挖掘技術,發(fā)現(xiàn)股價走勢存在“趨勢性”,這種趨勢的規(guī)律可以被挖掘分析,從而進行股價的預測,并且具有實際投資參考價值。本文運用經過主成分分析降維處理的PSO-BP神經網絡對恒瑞醫(yī)藥(600276)進行預測研究,輸入指標不僅有較常見的技術指標均線、MACD,同時也納入了資金流指標LON與ZLJC,以提高預測的準確度。
參考文獻:
[1]陳可,張琴舜等.BP神經網絡在證劵分析預測中應用[J].計算機工程,2001(11):95-97.
[2]吳成東.人工神經元BP網絡在股票預測方面的應用[J].控制工程,2002,9(5):48-51
[3]董長虹.MATLAB 神經網絡與應用[M].北京:國防工業(yè)出版設,2005.12.
[4]蔡紅,陳榮耀.基于 PCA-BP神經網絡的股票價格預測研究[J],計算機仿真,2011,03:365~368
[5]鄭杰.SPSS統(tǒng)計分析從入門到精通[M].北京:中國鐵道出版社,2015.
[6] Liu X Y, Shao C, Ma H F and Liu R X. Optimal earth pressure balance control for shield tunneling based on LS-SVM and PSO. Automation in Construction, 2011, 20: 321–327.
[7]楊建剛.人工神經網絡實用教程[M].北京:中國石化出版社,2003.
作者簡介:張彩鳳(1989—),女,漢族,籍貫:湖北武穴,單位:五邑大學經濟管理學院,2013級碩士研究生,研究方向:管理科學與工程。