陳婧 孫英凡







摘要:在全球金融領域中,股票擇時投資一直是研究的熱點。文章借助BP神經網絡模型,結合較全面的影響股價的因素指標,利用主成分分析和計算機挖掘大數據信息的方式,對股票進行擇時分析,具有較大的準確性和客觀性,對該模型的推廣可以彌補我國證券市場的有效性不足問題。
關鍵詞:BP神經網絡模型;股票投資
一、引言
近年來,中國資本市場中證券交易發展較為迅速,證券市場價格的劇烈波動給投資者帶來巨大的風險。因此,構建基于大數據挖掘技術的股票價格預測模型,對股票投資研究具有深遠的意義。當前的研究大多是基于神經網絡、決策樹、支持向量機等模型研究股票擇時問題,但是股票價格的影響因素較多,形成過程復雜,易造成較大誤差。所以,本文選擇適合處理非線性函數的BP神經網絡模型來對股票進行擇時研究,相比其他預測方法具有很大的優越性,實現了較好的訓練效果,能夠為投資者、上市公司和監管部門等提供可靠性依據。
二、BP神經網絡模型理論
人工神經網絡的類型不同是由拓撲結構的差異導致的,常用的前向型網絡中就包含BP神經網絡模型,它是人工神經網絡的經典模型。它的工作原理包括兩個部分,即正向數據傳輸和誤差反傳校正,如圖2-1所示:
在圖2-1的正向數據傳輸中,輸入變量從輸入層進入神經元,通過權值與閾值的加總計算、激活函數的轉換后,將變量儲存在隱藏層中;隱藏層的神經元節點再次將變量進行上述運算后,將變量傳輸給了輸出層;輸出層的神經元節點會將輸出變量與期望輸出變量進行對比,將誤差反傳給輸入層,調整權值和閾值,進行第二次的輸入輸出計算。循環往復,直到輸出誤差小于期望誤差時,輸出結果,這時模型的擬合結果會更好地趨向實際值,實現了誤差反傳校正[1]。
三、BP神經網絡模型的構建
(一)BP神經網絡模型參數的選取
1.BP神經網絡模型輸入變量的選擇
BP神經網絡模型是一種處理非線性、復雜的多維函數的工具,它通過捕捉輸入變量與輸出變量之間存在的關系進行預測。通過經濟學的價值價格理論可知股票價格是由價值決定的,但股票的價值受到多種因素的影響結合而成,故其價格的形成是十分復雜的[2]。通過建模分析市場的相關因素,能夠研究股票在市場上的行為,預測股票價格的波動。因此為了模型更加的準確,本文選取了較多的并且經前人總結較為有效的、常用的一些指標,具體介紹如下:
(1)股票的收盤價和開盤價
股票開盤價是證券交易所每個交易日所產生的第一筆交易價格。股票收盤價是證券交易每天交易活動結束前最后一筆交易產生的交易價格。股票前一日的開盤價和收盤價是投資者重要的參考依據,對形成股票價格具有一定影響。
(2)股票的成交量
成交量是指股票在單位時間內成交的交易總量,其與股票價格的發展趨勢有很大的關聯影響。
(3)股票的最高價和最低價
股市當天的最高價和最低價進行比較,通過比較可以確定開盤價在股價中的地位。股票的最高價和最低價可以反映股價的波動性。其中,可以運用相關數據計算股票的人氣指標值,AR 值的計算公式如公式(3.1)所示:
公式中為當日股票交易成交價格的最高價,為當日股票交易成交價格的最低價,為當日股票交易成交價格的開盤價,N為我們設定的參數,通常設定為26日。
2.BP神經網絡模型激活函數的選擇
神經網絡模型的激活函數是指內部處理信息的函數。當輸入層的信號進入神經元后,會引起神經元的反應,反應的結果就是神經元激活函數變換的結果[3]。網絡中作用很大的激活函數,其對模型解決問題的能力和效率有著很大影響。
S型激活函數是最常用的函數,與另外兩種函數不同,S型激活函數是連續可導的。它的輸出范圍只能為[-1,1]或者[0,1],輸入輸出關系如公式(3.2)或(3.3)所示:
在建立神經網絡模型中,需要激活函數是可導函數,故選擇S型激活函數來進行建模分析。
(二)模型構建步驟
1.利用數據進行BP神經網絡模型分析
首先對主成分數據和樣本進行歸一化處理,消除輸入變量各維數據之間的數量級差異。數據規范化后,所有數據都可以映射到[-1,1]區間。數據歸一化的方法運用的是Min-Max法。選取BP神經網絡模型的參數設置模型的輸入,4個指標作為神經網絡模型的輸入變量。將股票的收盤價作為唯一輸出變量建立模型。處理后的數據可以作為神經網絡模型的輸入變量,將股票的收盤價作為唯一輸出變量建立模型。建立模型時,選取部分數據作為訓練的樣本,另外部分數據作為測試的樣本,系統會自動計算利用測試的樣本進行模擬后產生的結果。其次設定不同隱藏節點數目,分別進行試驗,選擇使得誤差最小的隱藏節點的數目,就可以得到最優網絡。最后將數據進行反歸一化[4]。
利用MATLAB建模時,模型的輸入變量確定為4個;模型的輸出變量只有1個,即股票的收盤價格;模型還需要通過前人總結的試算公式來確定隱藏層的節點數量。普遍被認可的試湊公式如公式(3.4)-(3.6)所示:
公式中q代表輸出層中節點的數量,p代表輸入層中節點的數量,m表示隱藏層中節點的數量,α則為一個從1至10中含有的常數。在模型建立中,由于有4個輸入變量和1個輸出變量,所以輸入層有4個節點、輸出層有1個節點,從而可以確定隱藏層的節點個數的取值范圍3-13[5]。雖然無法確定隱藏層節點數,但是可以通過確定的范圍多次實驗,最后確定最優的節點數量。模型結果得出數據的預測值和真實值兩者相對的誤差值基本都均控制在2%以下。
為了確定最優的隱藏層節點數量,找到模型的最優情況,繼續對隱藏層節點分別為3-13時建立BP神經網絡模型,并計算各模型的平均相對誤差進行比較。可知,當隱藏層的節點為5時,模型的預測效果最好,并且平均相對誤差值較低。因此利用主成分分析和BP神經網絡模型是可以追蹤上證綜合指數走勢的。
(三)模型有效性檢驗
基于之前BP神經網絡的模型以及做出的投資決策,需要建立合理的評價指標對該模型的分析結果進行檢驗。以下是所列舉的兩個指標:
1.預測值和實際值的均方誤差MSE
MSE是指數理統計中參數的估計值與參數的真實值做差平方的期望值。其公式可以表示為:
測量“平均誤差”通常采用均方誤差這種方法,它可以評價估計值與實際值的擬合程度。公式中求出的MSE值越小,則證明模型預測描述實驗的數據精度越好。
2.漲跌研判的準確率
研究和分析次日開盤價“漲”或者“跌”的準確度相對于當日收盤價的百分比是漲跌研判準確度的關鍵,可以用來衡量本文模型預測的有效性和準確度。因為測試數據的數量是100,所以比較容易能獲得近似百分比。
通過此指標判定之前選股方案和投資決策是否與實際情況相符。
四、BP神經網絡模型應用及評價
(一)基于BP神經網絡模型的預測分析
選取從2019年1月29日到2020年3月26日,總共280個交易日的上證股票數據的5個指標,其中包括當日的開盤價、收盤價、最高價、最低價和成交量。借助于K線+成交量的技術分析,通過前200天數據的學習和訓練,網絡能夠自動擬合日開盤價與前一日量價指數的關系,并對未來80天的數據(即79個預測數據)進行次日開盤價的預測,用真實值驗證預測的準確性。
選擇每日的開盤價、收盤價、最高價、最低價和成交量作為輸入,次日的開盤價作為輸出,以下是BP神經網絡傳導過程圖[6]:
(二)BP神經網絡模型對未來股票市場的預測
利用神經網絡模型對現在指數的波動和之后一年指數的波動進行數據預測,由于疫情原因,搜集到的2020年1—2020年3月的數據有可能會含有新冠疫情因素帶來的影響,令處于新冠肺炎疫情期間的數據為0,反之為1,以此加入神經網絡的訓練集中進行預測。若模型研判當日處于“轉折”點,那就可推斷當天正位于階段“頂部”,因此可做減倉或做空操作。反之,若股指價格處于下跌的情況下,若模型研判當日處于“轉折”點,則可推斷當天正位于階段“底部”,因此可做増倉操作。
從理論上來說,將階段頂部和底部定義為一個區域更為恰當,從實踐的角度來說,微小的差別而導致的僅次于最底部或最頂部的“轉折”點仍然具有很強的使用價值和實際意義。鑒于此,如果我們在預測中適當放松對“轉折”研判正確的標準,例如定義若模型預測的“轉折”點距離實際“轉折”只差1個交易日且“轉折”點處的最高(最低)價據實際值相差0.5%內,仍然將其計為判斷正確。
通過這樣的調整修正,重新編寫程序做統計,得出新的準確性指標如表2、表3所示:
可以發現,股票的風險和回報是可以通過一些特定的參數進行控制的,選股的方案和投資組合的預期收益提供了可以從投資中獲得多少回報的估計。風險評估給出投資方在持有此投資的組合時所應該承擔的風險估計。投資組合的回報和風險都是取決于股票的回報和風險,及其股票在整個投資組合中的組成份額。根據模型分析得出的結果,可以使投資策略更為科學謹慎,個人獲益的概率也會得到相應增加。
五、結論
在實際應用中,若模型研判當日處于“轉折”點,那就可推斷當天正位于階段“頂部”,因此可做減倉或做空操作。反之,在股指價格處于下跌的情況下,若模型研判當日也處于“轉折”點,則可推斷當天正位于階段“底部”,因此可做増倉操作,從而達到投資收益的最大化。相信本模型未來對于人們投資分析、股東權益最大化和監管層的有效監管都能起到極大的幫助,可以為投資者、監管者和上市公司等提供有跡可循的依據。
參考文獻
[1]王霄.基于SVM的滬深300指數量化擇時策略實證研究[D].蘭州大學,2019.
[2]吳桂雯.量化交易中股票擇時的策略研究[D].天津商業大學,2017.
[3]張清潔,錢魏冬.基于量化分析的股票投資策略[J].河北北方學院學報(自然科學版),2020,36(11):50-56.
[4]張筱峰,郭瀝陽.滬深300股指期現市場多階段波動溢出效應研究——基于非對稱BEKK-GARCH模型[J].現代財經(天津財經大學學報),2020,40(03):53-66.
[5]劉慶霞.基于主成分分析和BP神經網絡的股價預測[D].蘇州大學,2017.
[6]趙晨.動態神經網絡在量化投資預測中的應用[D],上海:復旦大學,2014:29-30,38-41.
國家級大學生創業訓練項目(S202010445081X)