程麗娟,馮潔明
(嶺南師范學院 數學與統計學院,廣東 湛江 524048)
在金融市場中,股票市場可以合理配置市場資源,控制市場金融風險.對股票走勢的研究,主要有現代統計學分析法和神經網絡預測法[1-3].孟坤和李麗運用ARMA模型對上證指數日收盤價進行擬合靜態預測[4];陳倩文將ARMA模型和GARCH模型結合對滬深300股指期貨價格進行預測[5].Kim和Shin將神經網絡模型和遺傳算法相結合預測股票價格[6].
筆者選取中國聯通(600050)2020年7月1日至2020年9月18日的股票日收盤價,通過均值-標準差分級法對股票日收盤價進行狀態分級,使用加權馬爾可夫模型對未來3天日收盤價區間進行預測,并使用模糊集理論的級別特征值對收盤價進行預測.為了提高模型的適用性,分別選取2020年7月1日至2020年9月18日及2019年12月2日至2020年2月28日的上證指數和恒瑞醫藥的收盤價對未來3天的數據進行預測,預測效果較好.
使用馬爾可夫模型預測股票時,通常考慮前一時刻股票價格對后一時刻的影響,但前若干天的股票價格也可能對當前時刻的價格有影響.因此,以各階自相關系數作為前若干天對當天狀態的影響權重,最后用各狀態加權求和的概率來預測當天股票收盤價所處的狀態[7].
由加權馬爾可夫模型預測得到股票日收盤價所處的區間,使用模糊集理論中的級別特征值計算出具體的股票日收盤價.對各狀態賦予權重,根據權重公式計算出級別特征值,將級別特征值與預測狀態進行比較,得出股票日收盤價.權重公式為:

其中pi表示第i級別的預測概率,η表示最大概率作用系數,通常η=2[8].級別特征值公式為:

計算股票日收盤價X方法有兩種,方法一為:

其中i與max{pi,i∈S}的i對應,Ti和Bi分別指狀態i對應區間的上下限.
方法二為:

其中i是級別特征值H的整數部分,Ti+1和Bi+1分別是指狀態i+1對應區間的上下限.
筆者選取中國聯通(600050)2020年7月1日至2020年9月18日共58天的股票日收盤價作為研究序列,用加權馬爾可夫模型對其進行預測,數據來源于網易財經網.
(1)這58天的中國聯通股票日收盤價的均值X=5.1821,標準差σ=0.137 7.
(2)根據均值-標準差分級法對中國聯通股票的日收盤價進行狀態劃分(見表1).

表1 中國聯通股票日收盤價狀態劃分
(3)根據(2)得到的狀態分級表,對2020年7月1日至2020年9月18日共58天的中國聯通股票日收盤價序列進行狀態劃分,結果見圖1.

圖1 中國聯通股票天數狀態圖
(4)一步轉移頻數矩陣和一步轉移概率矩陣為:

(5)由一步轉移頻數矩陣可以得到邊際概率值為:p1=7/57,p2=15/57,p3=18/57,p4=7/57,p5=7/57.統計量χ2的值,見表2.

表2 統計量χ2的計算過程
由表2可以得到統計量χ2=72.03>,則該股票的日收盤價序列通過馬氏性檢驗.
(6)各階自相關系數rk和標準化的各階自相關系數wk,見表3.

表3 1~5階的自相關系數和各步長權重
(7)由一步轉移概率矩陣P(1)可以得到2~5階的轉移概率矩陣.
(8)根據前5天的中國聯通股票日收盤價及對應的狀態轉移概率矩陣對2020年9月21日的日收盤價及所處的狀態進行預測,結果見表4.

表4 2020年3月2日中國聯通股票日收盤價預測
由表4可得:max{pi,i∈S}=0.84,其中i=2,即這一天股票的日收盤價在5.04到5.11之間,由歷史資料得知,中國聯通2020年9月21日的日收盤價實際值為5.06,說明預測結果與實際情況相符.把9月21日的日收盤價5.06代入原序列,重復步驟(1)~(8),得到9月22日的股票價格區間.
使用模糊集理論中的級別特征值預測股票的日收盤價.根據公式(1)、(2)計算得到級別特征值為2.951 8.分別使用方法一和方法二得到股票未來3天的預測結果,見表5.

表5 未來3天的股票日收盤價的預測
方法一預測結果比加權馬爾可夫模型預測的區間要小,這是因為方法一計算預測值的公式僅僅與狀態區間的上限或下限有關(見表5).而方法二預測結果的相對誤差明顯比方法一小,說明基于方法二的加權馬爾可夫模型預測效果更好.
由于前文只對中國聯通1支股票進行預測,且選取的數據只包含正常周期的數據,不包含春節假期以及特殊情況的數據,為了提高模型的適用性,筆者還分別選取2020年7月1日至2020年9月18日以及2019年12月2日至2020年2月28日的上證指數和恒瑞醫藥的數據對未來3天的數據進行預測,結果見表6和表7.

表6 上證指數未來3天的股票日收盤價預測

表7 恒瑞醫藥未來3天的股票日收盤價預測
由表6、表7可知,使用加權馬爾可夫模型對股票進行預測,分別對正常周期的數據和疫情期間以及春節的數據進行預測,方法二的預測效果較好.
通過對中國聯通2020年7月1日至2020年9月18日共58天的股票日收盤價序列進行χ2檢驗,得到α=0.05時滿足馬氏性.使用加權馬爾可夫模型預測得到9月21日的收盤價狀態為下跌,股價區間為[5.04,5.11),實際值為5.06元,在預測區間內.使用模糊集理論的級別特征值得到這3天的預測價格與實際價格的相對誤差為0.99%、1.99%和1.80%,說明該模型對股票價格的短期預測效果較好.為了提高模型的適用性,分別選取2020年7月1日至2020年9月18日以及2019年12月2日至2020年2月28日的上證指數和恒瑞醫藥的數據對未來3天的數據進行預測,預測效果較好,說明模型的適應性較強.