李嵩松,惠曉峰
(哈爾濱工業(yè)大學管理學院,黑龍江哈爾濱150001)
股票指數(shù)的漲跌可以反映出股票市場的整體走勢,所以對于股票指數(shù)的預測一直是研究人員、機構投資者以及普通股民們最關注的熱點之一.股票指數(shù)的預測方法有很多種:時間序列分析(time series analysis)[1]、多元回歸模型(multiple regression models)[2]、人工神經(jīng)網(wǎng)絡(artificial neural network)[3]和遺傳算法(genetic algorithms)[4]等.其中人工神經(jīng)網(wǎng)絡方法,需要市場指數(shù)、技術指標和市場的基本因素等作為輸入信息,而這些信息是很難界定和選擇的[5],因此影響了該方法的發(fā)展;在遺傳算法中,股票數(shù)據(jù)巨大的噪音和廣闊的維度也使其發(fā)展受到了限制.
相反地,由于馬爾可夫過程具有無后效性特征,該特征能使輸入的數(shù)據(jù)和處理量大幅縮減,并且馬爾可夫過程可以描述一般的股票市場情況[6],因此馬爾可夫預測方法被廣泛應用在股指預測中:HASSAN和NATH運用隱馬爾可夫模型(hidden Markov model)預測了航空公司的股票價格[7];BAUERLE和RIEDER在對股價和利率的最優(yōu)組合研究中改進了馬爾可夫方法[8].近年來,模糊隨機方法(fuzzy stochastic method)被應用在多個領域[9],在股指預測方面,WANG利用該方法提出了一種模糊隨機預測模型[10],并進行了實證研究,得到了令人滿意的預測結果[11].本文引入馬爾可夫鏈的概念到模糊隨機預測模型當中,改進了預測參數(shù),并對滬深300指數(shù)數(shù)據(jù)進行了實證研究.
股票在股票市場上進行交易時,股票價格是在不停變動的,這種情況被認為是一種隨機過程.用隨機變量Xt表示在t時刻的股票價格;Pn用來表示在n=0,1,2,…時,隨機變量Xt上漲或者下跌的概率.如果Xt=n,從時間t經(jīng)過很短的時間變化Δt到時間(t+Δt),對于股票價格上漲或下跌有如下假設:1)股票價格上漲的概率是與Δt成比例的,表示為bnΔt;2)股票價格下跌的概率是與Δt成比例的,表示為dnΔt;3)上漲和下跌是不相關的隨機事件;4)bn和dn是與n成比例關系的,表示為bn=λn和dn=μn,當n=1時,λ和μ分別表示單位時間股票價格上漲或者下跌的概率.
根據(jù)以上假設,可以得到關于Pn(t)的表達式:

由此,Wang等[11]提出了一種實時股票價格模糊隨機預測的模型:


式中:x表示指定時間的目標價格,tn表示指定時間的那一天,y表示在同一天指定時間中的最高價格.
馬爾可夫鏈(Markov chain)是數(shù)學中具有馬爾可夫性質(Markov property)的離散時間隨機過程.該過程中,在給定當前知識或信息的情況下,只有當前的狀態(tài)用來預測將來,過去(即當前以前的歷史狀態(tài))對于預測將來(即當前以后的未來狀態(tài))是無關的.馬爾可夫性質的數(shù)學表達為

式中:隨機變量X0、X1、X2、…、Xn分別表示的是在時間0、1、2、…、n下X的狀態(tài),x為過程中的某個狀態(tài),Xn+1對于過去狀態(tài)的條件概率分布僅是Xn的一個函數(shù),與X0、X1、X2、…、Xn-1都無關.系統(tǒng)在Xn=i這個狀態(tài)的概率用ai(n)表示;系統(tǒng)由狀態(tài)Xn=i經(jīng)過一步轉移到達狀態(tài)Xn+1=j的概率,稱為一步轉移概率,記為pij.狀態(tài)空間S里的隨機過程{Xn,n≥0}如果滿足下列條件,就是一條馬爾可夫鏈:如果i和j都屬于狀態(tài)空間S,那么

并且ai(n)和pij都滿足以下條件:

由于股票指數(shù)的變動是一種隨機過程,并且滿足馬爾可夫鏈的無后效性特征,因此將馬爾可夫鏈的概念引入到模糊隨機預測模型當中,用以改進其中的預測參數(shù).
將股票指數(shù)每日數(shù)據(jù)按小時分成組,用隨機變量Xn來表示在第n小時股票指數(shù)的狀態(tài).Xn=1表示股票指數(shù)上升狀態(tài);Xn=2表示股票指數(shù)下降狀態(tài),其中n=1,2,….yi(n)表示在第n小時股票指數(shù)狀態(tài)上漲(i=1)或下跌(i=2)的概率,即yi(n)=P(Xn=i).用pij表示股票指數(shù)從某小時的i狀態(tài)(Xn=i),轉移到下個小時的j狀態(tài)(Xn+1=j)的概率,即轉移概率pij=P(Xn+1=j|Xn=i).Xn+1只與上一個狀態(tài)Xn和轉移概率pij有關,與之前的狀態(tài)Xn-1、Xn-2、…都無關,因此根據(jù)以上關系式,可以得到如下表達式:

把從一個特定小時的狀態(tài)i到下一個小時的狀態(tài)j的變化率用rij來表示,其數(shù)學表達式為

函數(shù)μ(tn)被定義為

式中:x表示指定時間的股票指數(shù),tn表示指定時間的那一天,y表示在同一天各個指定時間中最高的股票指數(shù).
由此,根據(jù)式(4)和(5)可以得到預測模型參數(shù)r的表達式:

滬深300指數(shù)是由上海證券交易所和深圳證券交易所聯(lián)合編制的,共選取300只A股作為樣本,其中滬市有179只,深市有121只.滬深300指數(shù)樣本選擇的標準為規(guī)模大、流動性好、交易活躍的主流投資股票,覆蓋了滬深市場六成左右的市值,具有良好的市場代表性.因此對滬深300指數(shù)的預測研究對掌握整個A股市場的走勢具有很大幫助.本文選取了滬深300指數(shù)的整點分時(60 min)數(shù)據(jù),數(shù)據(jù)期間為2009年1月1日至12月31日,全年共開市244天,如表1 所示:每天分選 09:30、10:30、11:30、14:00 和15:00共5個時刻,分時數(shù)據(jù)共1 220個.

表1 滬深300指數(shù)60 min整點數(shù)據(jù)Table 1 60 minutes data of HS300 stock indexes
本節(jié)根據(jù)式(4)和(5),將計算出股票指數(shù)上漲或下跌的轉移概率p11、p21、p12和p22.
在表示下一時刻股票指數(shù)上漲或下跌情況的表2中,“1”表示下一時刻股票指數(shù)上漲;“0”表示下一時刻股票指數(shù)下跌,即如果當前時刻的股票指數(shù)大于或等于前一時刻的股票指數(shù),那么就用“1”表示;如果當前時刻的股票指數(shù)小于前一時刻的股票指數(shù),那么就用“0”來表示.例如在表1中,0601在10:30的股票指數(shù)是2 815.88,大于同一天09:30股票指數(shù)2 760.67,因此,在表2中,0601在10:30處用“1”表示股票指數(shù)比上一時刻09:30上漲.
轉移概率p11表示上一時刻股票指數(shù)上漲并且這一時刻股票指數(shù)也上漲的概率,可以通過用表2中指定時間段內(nèi)出現(xiàn)(1,1)的次數(shù)除以這一時間段內(nèi)的數(shù)據(jù)總數(shù)來獲得;p12表示的是上一時刻股票指數(shù)上漲但這一時刻股票指數(shù)卻下跌的概率,可以通過用表2中指定時間段內(nèi)出現(xiàn)(1,0)的次數(shù)除以這一時間段內(nèi)的數(shù)據(jù)總數(shù)來獲得;p21表示的是上一時刻股票指數(shù)下跌但這個時刻股票指數(shù)卻上漲的概率,可以通過用表2中指定時間段內(nèi)出現(xiàn)(0,1)的次數(shù)除以這一時間段內(nèi)的數(shù)據(jù)總數(shù)來獲得;p22表示的是上一時刻股票指數(shù)下跌并且這一時刻股票指數(shù)也下跌的概率,可以通過用表2中指定時間段內(nèi)出現(xiàn)(0,0)的次數(shù)除以這一時間段內(nèi)的數(shù)據(jù)總數(shù)來獲得.舉例說明:假設只計算0601~0605這5天的轉移概率,表2中在09:30~10:30這個時間段內(nèi)出現(xiàn)(1,1)的次數(shù)為4次,數(shù)據(jù)總數(shù)為5個,因此得到p11=4/5=0.8.
表3顯示的是2009年全年244個開市日,按每日4個時段分別計算得到的轉移概率p11,p21,p12和p22.

表2 下一時刻股票指數(shù)上漲或下跌情況Table 2 Stock index rising or falling in the next time

表3 每個時段的轉移概率Table 3 Transition probabilities in each time period
根據(jù)式(7)所定義的μ(tn),舉例說明:0602這一天5個時刻的股票指數(shù)如表4所示,其中最高值出現(xiàn)在14:00這個時刻,股票指數(shù)為2 882.67,即y=2 882.67,因此在09:30 這一時刻的 μ =(2 852.78/2 882.67)2=0.979 369 8.以此類推可以得到每天5個時刻分別的μ值.

表4 μ的部分計算結果Table 4 A portion of
預測模型中的rij表示的是股票指數(shù)從狀態(tài)i到狀態(tài)j的變化率,通過前面計算出的μ值以及式(6)可以分別計算出股票指數(shù)變化率的所有情況r11、r21、r12和r22,計算結果顯示在表5中.
由于已經(jīng)計算出轉移概率p11、p21、p12、p22和變化率r11、r21、r12、r22,根據(jù)式(8),可以計算出預測參數(shù)r,結果顯示在表6中.

表5 股票指數(shù)變化率Table 5 Change rates of stock index

表6 預測參數(shù)rTable 6 Parameter r
根據(jù)預測模型Xn+1=Xner,分別用改進前的預測參數(shù)和改進后的預測參數(shù)對2009年全年的滬深300指數(shù)60 min分時數(shù)據(jù)進行預測,部分預測結果、相對誤差和優(yōu)劣比較情況顯示在表7中.

表7 預測值和相對誤差Table 7 Predicted values and deviations
用改進后的預測模型預測得到的結果中,相對誤差最大值是2.907×10-2,比用改進前的預測模型預測的結果中相對誤差最大值4.023 ×10-2減小1.115 ×10-2;用改進后的預測模型預測得到的結果中,相對誤差最小值是1.549×10-6,比用改進前的預測模型預測的結果中相對誤差最小值1.819 ×10-5減小1.664 ×10-5.在優(yōu)劣比較中,如果用改進后的預測模型預測得到的預測值相對于真實值的相對誤差,小于或等于用改進前的預測模型預測得到的預測值相對于真實值的相對誤差,即改進后的預測模型的預測值優(yōu)于改進前的預測模型的預測值,那么就用“1”表示;相反則用“0”表示.經(jīng)過統(tǒng)計比較,在2009年全年1 220次預測值的相對誤差比較中,共得到864個“1”,有71%的改進后模型預測的預測值優(yōu)于改進前模型的預測值.此外,2009年滬深300指數(shù)的真實值與改進后模型預測值的對比情況用圖1顯示.從圖1中可以看出,采用改進后模型預測得到的預測值與滬深300指數(shù)的真實值十分接近.

圖1 滬深300指數(shù)真實值與預測值Fig.1 HS300 stock index true values and predicted values
通過將馬爾可夫鏈概念和轉移概率引入到模糊隨機預測模型當中,改進了模糊隨機預測模型的預測參數(shù),并以2009年滬深300指數(shù)為樣本進行了實證研究.研究表明,考慮股票指數(shù)上漲或下跌的概率以及從上一狀態(tài)轉換到下一狀態(tài)的轉移概率后,計算得出的預測參數(shù)可以更好地反映出股票指數(shù)變動的真實性;并且得到,改進參數(shù)后的預測模型預測得到的數(shù)據(jù)比未改進參數(shù)的預測模型預測得到的數(shù)據(jù)更接近真實的股票指數(shù)的驗證結果.然而由于股票市場的復雜性和不確定性,很難準確描述股票指數(shù)的變動情況,所以還有很多問題值得進一步研究,比如基本面信息對所提預測模型的影響等.
[1]LENDASSE A,BODT E,WERTZ V.Non-linear financial time series forecasting—application to the Bel 20 stock market index[J].European Journal of Economic and Social Systems,2000,14(1):81-91.
[2]胡蓉.基于多輸出支持向量回歸算法的股市預測[J].云南民族大學學報:自然科學版,2007,3(16):189-192.
HU Rong.Application of multi-output support vector regression in stock market index forecasting[J].Journal of Yunnan NationalitiesUniversity:NaturalSciencesEdition,2007,3(16):189-192.
[3]FILIPPO C.Forecasting price increments using an artificial neural network[J].Advances in Complex Systems,2001,4(1):45-56.
[4]KORCZAK J,ROGER P.Stock timing using genetic algorithms[J].Applied Stochastic Models in Business and Industry,2002,18(3):121-134.
[5]YAO J T,TAN C,POH H.Neural networks for technical analysis:a study on KLCI[J].International Journal of Theoretical and Applied Finance,1999,2(8):221-241.
[6]ZHANG Q.Stock trading:an optimal selling rule[J].SIAM Journal on Control and Optimization,2002,40(1):64-87.
[7]HASSAN M R,NATH B.Stock market forecasting using hidden Markov model:a new approach[C]//Proceedings of 5th International Conference on Intelligent Systems Design and Applications.Washington DC,USA,2005,192-196.
[8]BAUERLE N,RIEDER U.Portfolio optimization with Markov-modulated stock prices and interest rates[J].IEEE Transactions on Automatic Control,2004,49(3):442-447.
[9]LUHANDJULA M,GUPTA M.On fuzzy stochastic optimization[J].Fuzzy Sets and Systems,1996,81(1):47-55.
[10]CHIANG D,CHOW L,WANG Y F.Mining time series data by a fuzzy linguistic summary system[J].Fuzzy Sets and Systems,2000,112(5):419-432.
[11]WANG Y F.On-demand forecasting of stock prices using a real-time predictor[J].IEEE Transactions on Knowledge and Data Engineering,2003,15(4):1033-1037.