崔文喆,李寶毅,于德勝
(天津師范大學 數學科學學院,天津 300387)
在金融投資領域,股票市場占據十分重要的地位.股票價格走勢一直是人們關注的焦點.為了更精確地預測股票價格,人們提出了許多股票價格預測模型,如:自回歸移動平均模型(ARMA)[1]、差分自回歸移動平均模型(ARIMA)[1]、自回歸條件異方差模型(ARCH)[2]、廣義自回歸條件異方差模型(GARCH)[3]、人工神經網絡類模型[4]等.為了比較不同模型的預測性能,相關研究做了大量嘗試[5-10].文獻[5]運用GARCH模型和BP 神經網絡模型對清華同方的收盤價進行實證分析,結果表明:對股票價格序列,從非線性系統的角度建模比從非平穩時間序列的角度建模效果要好.文獻[6]利用深圳股票市場的實際數據,建立BP算法網絡預測模型、ARCH(1)和 GARCH(1,1)預測模型對深成指數每周末收盤價的波動性進行預測,結果表明BP 算法的預測效果最好.文獻[7]建立ARMA 模型和含有一個隱層的BP 網絡模型,以亞泰集團360 個交易日數據為樣本預測未來10 天的收盤價,結果表明相對于BP 網絡模型,ARMA 模型對短期股價預測的精度較高.文獻[9]選取3 支股票價格作為研究對象,對比分析得出相較于其他階數的GARCH 模型,GARCH(1,1)預測有效性最好,且BP 神經網絡模型在隱層節點數為5 時對工商銀行股票收益率數據擬合程度最優,2 種方法均能對股票價格進行短期預測.文獻[10]基于廣義回歸神經網絡模型對股票價格進行預測,并與ARIMA 模型對比,結果表明基于廣義回歸神經網絡的預測模型要優于ARIMA 模型.
本研究采用GARCH 模型和BP 神經網絡模型,利用上海 A 股 30 支股票(6 類,每類各 5 支)2015年6月29日至 2017年6月30日的日收盤價,分別進行短期、 中期和長期預測,并考慮了當日價格波動對預測結果差異的影響.
選取上海 A 股 30 支股票 2015年6月29日至2017年6月30日連續105 周的每日收盤價格,具體股票為:
金融(600016 民生銀行、600030 中信證券、601288農業銀行、601318 中國平安和601788 光大證券);
公用事業(600004 白云機場、600037 歌華有線、600088 中視傳媒、601008 連云港和 603000 人民網);
房地產(600007 中國國貿、600068 葛洲壩、600463空港股份、600708 光明地產和601186 中國鐵建);
綜合(600082 海泰發展、600108 亞盛集團、600371萬向德農、600783 魯信創投和600805 悅達投資);
工業(600010 包鋼股份、600028 中國石化、600066宇通客車、600118 中國衛星和600305 恒順醋業);
商業(600327 大東方、600628 新世界、600694 大商股份、600993 馬應龍和601607 上海醫藥).
采用GARCH 模型和BP 神經網絡模型對以上30支股票分別進行短期(第1 周:2017年7月3日至7月7日)、中期(第 6 周:2017年8月14日至 8月18日)和長期(第 12 周:2017年9月25日至 9月29日)預測,以比較2 個模型的預測能力,同時考慮了當日價格波動對預測結果差異的影響.
GARCH 模型是對ARCH 模型的一些約束條件進行擴展得到的,該模型分為均值方程與方差方程2 部分.均值方程形式為

其中:yt為條件均值,代表被預測的收盤價;yt-i為條件均值的滯后值,代表預測所用的已知收盤價;ut為殘差,ut-j為殘差的滯后值,c 為常數.方差方程形式為

使用 MATLAB R2012b 對 GARCH 進行建模.由于常見的金融時間序列都可以用GARCH(1,1)模型描述[11],因此本研究選擇建立GARCH(1,1)模型對股價進行分析和預測.
運用price2ret 函數將30 支股票的每日收盤價序列轉化為收益率序列.對日收益率序列進行ACF 檢驗和PACF 檢驗;對日收益率殘差序列進行Ljung-Box Q(LBQ)檢驗和ARCH 檢驗;對日收益率平方進行ACF檢驗.結果表明:日收益率序列的ACF 和PACF 檢驗結果顯示日收益率序列的相關性不具有統計學意義(P >0.05);日收益率平方序列的ACF 檢驗顯示平方序列的相關性具有統計學意義(P <0.05);日收益率殘差序列的LBQ 檢驗中邏輯值H=1(P <0.05),表明該序列不是自相關的,ARCH 檢驗中邏輯值 H=1(P <0.05),表明在95%的置信區間下拒絕無異方差的原假設,即該樣本數據的殘差有異方差的特性,可以采用GARCH 模型.
對30 支股票日收益率建立的GARCH(1,1)模型進行LBQ 檢驗和ARCH 檢驗,均有邏輯值H=0 及P >0.05,表明模型擬合效果顯著,所建模型適合,可以使用其進行預測.
使用garchpred 函數對收益率進行預測,再用ret2price 函數將得到的收益率時間序列轉化為價格時間序列即可得到預測的日收盤價.
BP 神經網絡可以設置不同數目的隱層,在不限制隱層節點數的情況下,具有一個隱層的BP 神經網絡模型可以實現任意非線性映射[12].因此,本研究采用3 層網絡結構的BP 神經網絡模型,設置一個隱層,輸入結點數設為15,輸出結點數設為5.在保持模型中其他參數值不變的情況下,通過對比輸出誤差來確定最佳的隱層節點數目[13],通過檢驗得到當隱層神經元數目為25 時,網絡的均方誤差最小.因此使用MATLAB R2012b 對BP 神經網絡模型進行建模,設計一個隱層神經元數目為25 的3 層網絡結構進行股票收盤價預測.
使用MATLAB R2012b 編程對以上2 個模型進行建模,得到6 類30 支股票預測結果與實際收盤價的相對誤差數據(均值±標準差),并運用SPSS 24 軟件對30 支股票每日收盤價2 種模型的預測結果進行配對T 檢驗.
每只股票的相對誤差計算公式為

定義統計量:每只股票預測價格波動比例(以下簡稱波動比例),計算公式為

其中日均價=(日最高價+日最低價)/2.分別計算30支股票的預測價格波動比例(均值±標準差),并運用SPSS 24 軟件對其進行配對T 檢驗,以比較在考慮每日價格波動的情況下2 種模型的預測效果.
在30 只股票中,房地產類股票“600708 光明地產”于 2017年6月30日按“10 轉 3 股派 1.5 元”產生了送轉,公用事業類股票“600004 白云機場”于2017年7月14日按“10 送 4.5 股派 3.7 元”產生了送轉.因此對以上2 只股票送轉后的實際日收盤價、日最高價、日最低價進行校正,以校正后的價格進行預測誤差和預測價格波動比例比較分析.若某只股票按“10轉(送)a 股派 b 元”,則校正公式為

2 種模型的短期預測相對誤差及預測價格波動比例見表1,短期預測相對誤差及預測價格波動比例的配對T 檢驗結果見表2.

表1 GARCH 模型和BP 模型短期預測相對誤差及預測價格波動比例Tab.1 Relative error and price fluctuation ratio of short-term forecast of GARCH model and BP model

表2 GARCH 模型和BP 模型短期預測相對誤差及預測價格波動比例的配對T 檢驗Tab.2 Paired T-test of relative error and price fluctuation ratio of short-term forecast of GARCH model and BP model
由表1 可見:2 個模型30 支股票一周預測總體相對誤差平均值均在2.5%左右;GARCH 模型的一周預測總體波動比例平均值在1.4 左右,BP 神經網絡模型在 1.6 左右;比較相對誤差可以發現,前 2日GARCH 模型的預測效果優于BP 神經網絡模型,后3日及一周總體預測BP 神經網絡模型的預測效果優于GARCH 模型;考慮當日價格波動對預測結果的影響時,前2日GARCH 模型的預測效果優于BP 神經網絡模型,后3日BP 神經網絡模型的預測效果優于GARCH 模型,一周總體預測GARCH 模型的預測效果優于BP 神經網絡模型.由表2 可見,無論是每日預測還是一周總體預測,2 種模型的預測效果的差異均不具有統計學意義(P >0.05),即對于短期預測而言,2 種模型預測效果相當.這是由于股票日收盤價時間序列理論上是非線性的,但在相對較短的時間范圍內也可以看作是線性的,因此雖然BP 神經網絡模型的智能預測精度較高,但在短期預測中線性預測也具有一定的優勢,2 種模型預測效果均較好,差異并不明顯.在6 類股票中,房地產類股票預測誤差相對較大(一周總體相對誤差(%):GARCH 模型為6.77±10.17,BP 模型為 3.81 ± 3.89;一周總體波動比例:GARCH模型為 4.49 ± 7.84,BP 模型為 2.19 ± 2.31),這是由于房地產類股票易受客觀因素的影響,預測難度相對較大.
2 種模型的中期預測相對誤差及預測價格波動比例見表3,中期預測相對誤差及預測價格波動比例的配對T 檢驗結果見表4.

表3 GARCH 模型和BP 模型中期預測相對誤差及預測價格波動比例Tab.3 Relative error and price fluctuation ratio of medium-term forecast of GARCH model and BP model

表4 GARCH 模型和BP 模型中期預測相對誤差及預測價格波動比例的配對T 檢驗Tab.4 Paired T-test of relative error and price fluctuation ratio of medium-term forecast of GARCH model and BP model
由表3 可見:30 支股票一周預測總體相對誤差平均值GARCH 模型在8.4%左右,BP 神經網絡模型在3.4%左右;一周預測總體波動比例平均值GARCH模型在4.6 左右,BP 神經網絡模型在2.2 左右.比較相對誤差可以發現,無論是每日預測還是一周總體預測,BP 神經網絡模型預測效果均優于GARCH 模型(表3),且2 種模型每日預測效果的差異具有統計學意義(0.01 <P <0.05),一周總體預測的差異具有高度統計學意義(P <0.01)(表4).比較波動比例可以發現,考慮當日價格波動對預測結果的影響時,無論是每日預測還是一周總體預測,BP 神經網絡模型預測效果仍優于 GARCH 模型(表3),且 14日、16日、18日預測效果的差異不具有統計學意義(P >0.05),15日、17日預測效果的差異具有統計學意義(0.01 <P <0.05),一周總體預測的差異具有高度統計學意義(P <0.01)(表4).對于中期預測,股票日收盤價序列仍然是非線性的,對于這樣波動頻繁的時間序列,從非線性系統的角度建模效果優于從非平穩時間序列的角度建模,即BP 神經網絡的預測效果優于GARCH 模型.
2 種模型的長期預測相對誤差及預測價格波動比例見表5,長期預測相對誤差及預測價格波動比例的配對T 檢驗結果見表6.

表5 GARCH 模型和BP 模型長期預測相對誤差及預測價格波動比例Tab.5 Relative error and price fluctuation ratio of long-term forecast of GARCH model and BP model

表6 GARCH 模型和BP 模型長期預測相對誤差及預測價格波動比例的配對T 檢驗Tab.6 Paired T-test of relative error and price fluctuation ratio of long-term forecast of GARCH model and BP model
由表5 可見:30 支股票一周預測總體相對誤差平均值GARCH 模型在14.2%左右,BP 神經網絡模型在7.8%左右;一周預測總體波動比例平均值GARCH模型在8.8 左右,BP 神經網絡模型在5.3 左右.比較相對誤差可以發現,BP 神經網絡模型預測效果優于GARCH 模型(表5),每日預測效果的差異不具有統計學意義(P >0.05),一周總體預測的差異具有高度統計學意義(P < 0.01)(表 6).比較波動比例可以發現,考慮當日價格波動對預測結果的影響時,BP 神經網絡模型預測效果仍優于GARCH 模型(表5),每日預測效果的差異不具有統計學意義(P >0.05),一周總體預測的差異具有高度統計學意義(P < 0.01)(表 6).對于長期預測,股票日收盤價序列是非線性的,因而從非線性系統的角度建模效果更好,即BP 神經網絡的預測效果優于GARCH 模型,然而隨著預測周期延后,誤差逐漸積累,預測難度增大,雖然長期預測中BP 神經網絡優于GARCH 模型,但預測精度均不夠理想,需進一步對模型進行改進以增強其適用性.
采用GARCH 模型和BP 神經網絡模型,利用上海A 股30 支股票連續105 周的日收盤價,分別進行短期、中期和長期預測,結果表明:
(1)在短期預測中:無論是否考慮當日價格波動,前2日GARCH 模型的預測效果優于BP 神經網絡模型,后3日BP 神經網絡模型的預測效果優于GARCH模型;無論是每日預測還是一周總體預測,2 種模型預測效果的差異均不具有統計學意義(P >005).
(2)在中期預測中:不考慮當日價格波動時,無論是每日預測還是一周總體預測,BP 神經網絡模型預測效果均優于GARCH 模型,且每日預測效果的差異具有統計學意義(0.01 <P <0.05),一周總體預測的差異具有高度統計學意義(P <0.01);考慮當日價格波動時,無論是每日預測還是一周總體預測,BP 神經網絡模型預測效果仍優于GARCH 模型,每日預測中有3日預測效果的差異不具有統計學意義(P >005),有2日預測效果的差異具有統計學意義(0.01 < P < 0.05),一周總體預測的差異具有高度統計學意義(P <0.01).
(3)在長期預測中:無論是否考慮當日價格波動,BP 神經網絡模型預測效果優于GARCH 模型,每日預測效果的差異不具有統計學意義(P >005),一周總體預測的差異具有高度統計學意義(P <0.01).
(4)總體來看,對于股票收盤價預測,隨著時間推移,2 種模型的預測相對誤差平均值與預測價格波動比例平均值均在逐漸上升,短期、 中期預測效果較好,其中:2 種模型短期預測均可得到較好的效果,BP 神經網絡模型的中期預測效果更優,而2 種模型的長期預測效果均不夠理想.
雖然GARCH 模型和BP 神經網絡模型都是通過對股價序列進行分析從而盡可能地發現規律,但由于方法與思路的不同,其適用領域和預測效果也不盡相同.