


一、引言
改革開放以來,為了解決我國企業的融資問題,特別是國有企業股份制改革問題,我國建立了證券市場。1990年11月,上海證券交易所正式掛牌。隨后,1991年4月,深圳證券交易所獲中國人民銀行批準。兩家證券交易所的成立標志著新中國正式開啟資本市場之門。我國證券市場經過30多年發展、壯大,至今已經形成包括主板、創業板、科創板、北交所在內的多層次資本市場體系。中國上市公司協會披露的2023年12月統計月報數據顯示,截至2023年12月31日,境內股票市場共有上市公司5346家。其中,滬、深、北證券交易所分別有2263家、2844家和239家。在股份類型上,僅發行A股的公司有5113家,僅發行B股的公司有11家,而發行A+B、A+H等多股份類型的公司有222家。按控股類型劃分,國有控股公司占26%,非國有控股公司占74%。行業分布上,制造業、信息傳輸、軟件和信息技術服務業以及批發和零售業上市公司數量居前三名。與此同時,隨著經濟的發展,居民收入大幅提高,有了閑置的資金,投資意愿越來越強烈,股票投資已經成為很多人投資理財的重要渠道。在股票市場上,股票價格以及變化趨勢是投資者盈虧的關鍵,預測股票價格變化成為眾多投資者的“必修課”。
預測股票價格的方法有很多。一是基本面分析方法。該分析方法通過對影響公司內在價值的因素進行分析來預測其內在價值的變化,進而預測受價值驅動的股票價格未來的變化方向。二是趨勢分析方法。該方法認為股票價格的變化是有趨勢的,借助統計技術將股票價格變化生成各種模型,進而推斷股票價格變化的趨勢。這些模型包括各種自回歸模型、移動自回歸模型、差分自回歸模型、GARCH模型等。三是隨機過程分析方法。該方法認為股票市場是個復雜的非線性系統,股票價格受到各種因素的影響,既包括宏觀、行業、公司經營等經濟因素,也包括非經濟因素,特別是交易者非理性等情緒因素,進而認為股票價格的運動是隨機運動。而馬爾可夫模型作為典型的隨機過程分析方法,同時具備非因素與“無記憶性”等特點,因而也被運用到股票價格的預測中。
本文嘗試采用馬爾可夫模型預測股票價格的變化。以往該方法主要應用于個股股價預測,但在目前的市場環境下,個股特別是中小市值的股票價格經常受到人為操縱,采用馬爾可夫模型預測的意義不大。本文聚焦滬深300指數,驗證馬爾可夫鏈預測法在短期內的預測效果,說明該方法的有效性。相較于既有文獻,滬深300指數由滬深市場上市值規模最大的前300只股票組成,更具有預測意義。
二、馬爾可夫鏈預測法的理論基礎
馬爾可夫(A.A.Markov)是俄國著名的數學家。二十世紀初,他在研究中發現,現實世界中有很多這樣的隨機現象,其變化過程與事物過去所處的狀態無關,僅與事物的近期狀態有關。后來的學者把具有這種特性的隨機過程命名為馬爾可夫過程。
(一)馬爾可夫鏈內涵
1. 轉移概率的定義。按照系統的發展,時間離散化為[n] =0,1,2,…。對每個[n],系統的狀態用隨機變量[Xn]表示。設[Xn]可以取[k]個離散值[Xn]=1,2,…,[k],且從初始狀態開始,經過[n]步轉移后,系統處于狀態[i]的狀態概率記為:
[ain=PXn=i] (1)
從[Xn]=[i]到[Xn+1]=[j]的轉移概率記為:
[pij=P(Xn+1=j/Xn=i)] (2)
2. 馬爾可夫鏈的定義。如果[Xn+1]的取值只取決于[Xn]的取值及轉移概率[pij],而與[Xn-1],[Xn-2]…的取值無關,那么這種離散狀態按照離散時間的隨機轉移過程稱為馬爾可夫鏈。
3. 馬爾可夫鏈的特性。根據馬爾可夫鏈的定義,馬爾可夫鏈具有如下性質:
(1)馬爾可夫性。馬爾可夫性也稱無后效性,即[Xn+1]的取值只與[Xn]和轉移概率有關,與前期狀態無關。
(2)平穩分布性。設馬爾可夫鏈轉移矩陣為[p],則存在[π=(π1,π1…)]滿足方程[π=πp] 且[jπj]=1,稱[π=(π1,π2,…)]為該馬爾可夫鏈的平穩分布。
(3)遍歷性。馬爾可夫鏈的遍歷性是指無論系統現在處于哪個狀態,從這個狀態出發,經過足夠長的一段時間,系統達到狀態[j]的概率一定穩定在[η(j)],[j=0,1,…]用數學極限公式表示為:[limx→∞pij=η(j)]。
(4)狀態相通性。馬爾可夫鏈的狀態相通性是指系統無論從哪個狀態出發,經過有限的轉移次數,一定可以達到相同的狀態。
4. 馬爾可夫鏈的基本方程。由狀態轉移的馬爾可夫性和全概率公式可以寫出馬爾可夫鏈的基本方程:
[ai(n+1)=j=1kaj(n)pji],[i=1,2,…,k] (3)
并且[ai(n)]和[pij]應滿足:
(1) [i=1kai(n)=1], [n=0,1,2,…];
(2) [pij≥0], [i,j=1,2,…,k];
(3) [j=1kpij=1], [i=1,2,…,k] 。
記n步狀態概率向量為[an=a1n,a2n,…,akn],轉移概率矩陣為:
[P=pij=p11…p1n???pn1…pnn] (4)
則基本方程的向量形式可表述為:
[a(n+1)=a(n)P] (5)
(二)馬爾可夫鏈預測模型的建立
1. 模型假設。(1)過程的隨機性。即系統從任意一種狀態轉移到另一種狀態的過程是隨機的。(2)過程的馬爾可夫性。系統的轉移概率只與當前的狀態有關,與以前的狀態無關。(3)轉移概率矩陣保持穩定。即認為在一個有限的時間內,轉移概率矩陣保持相對穩定。
2. 模型的建立。實際分析中,往往需要知道經過一段時間后市場趨勢分析對象可能所處的狀態,這就要求建立一個能反映變化規律的數學模型。馬爾可夫市場趨勢分析模型是利用概率建立一種隨機性的時序模型,并用來進行市場趨勢分析的方法。馬爾可夫鏈的基本原理就是利用系統初始狀態概率向量和轉移概率矩陣來預測系統未來某一時期所處的狀態。
設馬爾可夫鏈的初始分布為:
[aj(0)] =[P(X0=aj)],[aj∈I],[j] =1,2,… (6)
其中,[I] ={[a1],[a2]…}為馬爾可夫鏈的狀態空間。
初始狀態轉移向量為:
[a0=a10,a20,…,ak0] (7)
由馬爾可夫鏈的基本方程的向量形式(5)得:
[a(n)=a(n-1)P=a(n-2)P2=…=a(0)Pn]
(8)
上式即為馬爾可夫預測模型,其中P為概率轉移矩陣。由模型可知,系統第[k]期的狀態概率取決于系統的初始狀態概率和轉移概率矩陣的[k]次方。因此,如果已知系統初始狀態概率向量[a(0)]以及轉移概率矩陣[P],則可以求得系統在任何一個時期處于任何一個狀態的概率。
(三)馬氏檢驗
設所研究的對象含有[k]個狀態,用[Nij]表示在[X1,X2,…,Xn]中從狀態[i]經過一步轉移到狀態[j]的頻數,并將[Nijn×n]第[j]列之和除以各行各列的總和所得到的值記為邊際概率[p·j],即[p·j=i=1kNij/i=1kj=1kNij],統計量[X2=2i=1kj=1kNij|logpijp.j|] 服從自由度為[(k-1)2]的[x2]分布。選定了置信度[α],查表得[x2α((k-1)2)],若統計量[X2>x2α((k-1)2)],則認為[Xt]符合馬爾可夫性,否則認為該過程不是馬爾可夫鏈。
三、股票價格預測
本文以滬深300指數價格為例,在新浪財經網上搜集整理數據,通過馬爾可夫鏈進行分析,預測價格走勢。此次研究收集2024年2月19日—2024年4月19日的43個時間序列數據,進行每日收盤價格波動狀態預測。
(一)基于馬爾可夫鏈的股票每日收盤價格波動狀態預測
1. 對價格時間序列數據分類。對股票每日收盤價格增長率進行分類處理,可將 43 組數據分為[-5%,-1%)、 [-1%,-0.5%)、[-0.5%,0%)、[0%,0.5%)、[0.5%,1%)、[1%,5%)6 個狀態空間,分別為S1、S2、S3、S4、S5、S6 ,如表1所示。
2. 建立股票每日收盤價格波動狀態轉移矩陣。根據表1得出價格增長率狀態轉移情況,如表2所示。
進一步可得狀態轉移頻數矩陣[fij]和狀態轉移概率矩陣[pij],如下所示:
[fij=010013003211141100121023111300201320]
[pij=01/5001/53/5003/72/71/71/71/74/71/71/7001/92/91/902/93/9dM1QYESaF+x8aCcmoXQ9yg==1/61/61/63/6002/801/83/82/80]
3. 馬氏檢驗。由狀態轉移概率矩陣[pij] 得到邊際概率值,如表3所示。進一步計算統計量[X2],結果如表4所示。給定顯著性水平 α=0.05,查 [χ2] 分布表可得分位點[χ2α((m-1)2)=χ2α],由于[X2]=48.504>37.652, 因此,滬深300指數價格時間序列滿足馬爾可夫性。
4. 預測股票價格區間。先根據C-K 方程,求出 2-5 階狀態轉移概率矩陣,然后通過各階狀態轉移矩陣計算出相應的狀態轉移向量,進而預測滬深300指數價格增長率變化。
[P(2)=0.1830.0030.1940.3820.1790.0290.1530.3320.1350.1860.0990.0950.0360.1420.2810.1840.1420.2150.1360.1230.1900.3160.1370.0980.0790.2400.1510.0720.1680.2900.1010.2470.1010.1430.1330.275]
[P(3)=0.1070.2620.1180.1370.1340.2420.0800.1650.2110.2000.1430.2010.1380.2320.1720.2320.1220.1040.1100.2280.1500.1680.1400.2040.1300.1460.1970.2820.1390.1060.1210.1320.1930.2550.1560.143]
[P(4)=0.1150.1410.1970.2490.1500.1480.1260.2050.1720.2240.1340.1380.0970.1980.1830.1910.1380.1930.1150.1680.1870.2330.1430.1540.1090.2250.1580.1790.1360.1930.1180.2170.1560.1970.1360.176]
[P(5)=0.1180.2160.1600.1990.1350.1720.1060.1960.1770.2020.1390.1800.1190.1890.1800.2240.1380.1500.1150.2060.1680.2040.1370.1700.1140.1750.1850.2270.1420.1570.1110.1790.1820.2180.1430.167]
2024年4月19日,滬深300指數價格增長率為-0.79%,處于區間[-1%,0.5%),屬于狀態S2,初始狀態向量定義為 [π(0)=(0 0 1 0 0 0)]。則一步概率轉移向量為 [π(1)=π(0)=(0 0 0.428 0.286 0.143 0.143)],由此可以預測出下一個交易日2024 年4 月 22 日(4月20日、21日市場沒有交易)的價格增長率處于狀態 S3,預測概率為 42.8%,即對應的區間為[-0.5%,0%),實際增長率為-0.30%。
可由兩步轉移概率向量 [π(2)=π(0)P(2)=(0.153 ]
[0.332 0.135 0.186 0.099 0.095)] 預測出2024年4月23日的價格增長率所處的狀態為S2,對應的狀態區間為[-1%,-0.5%),實際增長率為-0.70%。
同理,可根據 [π3]、[π4]、[π5]預測出對應的狀態區間,如表 5 所示。
(二)股票指數價格波動預測結果分析
滬深300指數價格波動預測結果表明,馬爾可夫鏈對1—2天短期的價格波動率預測概率較高。隨著預測日期的增加,預測結果與實際存在差異,并且預測概率降低。例如,根據三步轉移概率向量預測,滬深300指數價格在2024 年 4 月 24 日的價格增長率屬于狀態 S3,預測區間為[-0.5%,0%);實際增長率為0.44%,在[0,0.5%)區間中,屬于S4狀態。預測結果與實際增長率存在0.44%的相對誤差,但屬于相鄰的兩個狀態,且預測概率S3的預測概率為21.1%,而真實增長率所屬狀態S4預測概率為20.0%,預測概率相差僅為1.1%,因此,預測結果有一定參考意義。
預測日期在5天的情況下,預測結果與實際誤差較大,并且預測概率較低,且Fq5LNVxw30cuh67P6/l2hDv03hnXux9JUcyGh9V1kiY=有多個預測概率非常接近,預測基本無效。
四、結論與說明
本文選取我國滬深300指數2024年2月19日—2024年4月19日的43個時間序列數據,具有較強的代表性。從模型中可以得到:馬爾可夫鏈對1—2天短期的價格波動率預測準確概率較高,隨著預測日期的增加,預測結果與實際存在差異,并且預測概率降低。
對于這個結論,需要說明如下:第一,根據尤金·砝碼的有效市場理論,在一個強式的有效股票市場,其大盤指數反映所有信息,股票價格是隨機波動的,無法預測;但是,如果市場是弱式有效市場,可以通過分析過去的信息以及現在的信息,即采用傳統技術分析以及基本分析方法預測大盤指數可能的走勢;而市場如果是半強式有效市場,那么股票價格已經反映了過去的信息,基于歷史數據分析的傳統技術分析方法無效,只能通過現狀分析來預測股票價格的變化,馬爾可夫鏈就有了“用武之地”。因為馬爾可夫鏈具有無后效性,即未來價格預測與過去特別是久遠歷史信息關系不大,而與現在以及剛剛過去的部分信息關系密切,可以通過計算狀態轉移概率來預測內部狀態的變化,所以,馬爾可夫鏈預測法只是一種概率預測方法,得到的預測結果僅僅表示大盤指數未來處于某種狀態的概率,而非絕對會處于某種狀態。第二,從預測結果看,我國股市經過多年的演化發展,效率得以提高,基本成為半強式有效市場。因此,基于技術分析的方法來預測股票價格是低效的,理性的投資者應該更多關注當前公司的基本面,進行價值投資。第三,股市大盤指數是受市場上的多種因素影響的結果,如市場多空雙方的力量比較、宏觀經濟政策、行業景氣度以及投資者的心理因素等,因而沒有任何一種方法可以完全準確地預測出每天的大盤指數變化,馬爾可夫鏈預測法也不例外。因此,可以把用馬爾可夫鏈預測的結果和其他因素分析綜合起來作為股票投資決策的判斷依據。
(責任編輯 王 媛;校對 WY,LY)