劉 璞,王 萌,馬 苓,石盛卿
(河北工業大學 經濟管理學院,天津 300401)
近年來,學者們提出了各種預測方法[1,2],盡管灰色模型和/或它的變體可以獲得良好預測結果,但獲得的最佳預測結果的方法是基于灰色模型和馬爾可夫狀態轉移矩陣,即灰色馬爾可夫預測模型,由我國鄧聚龍教授提出的灰色模型與俄國數學家馬爾可夫提出的馬爾可夫模型很早就被組合起來,很好地解決了灰色預測模型對于數據波動較大的數據預測欠準確的問題[1,3]。為了證明灰色馬爾可夫預測模型預測的準確性,本文引進了現在很流行的一種預測方法——加權加增長率移動平均法,通過一個實例進行了分析,結果表明本文提出的灰色馬爾可夫模型具有較高的預測精度和優良的適用性。建立基于灰色馬爾可夫的制度環境預測模型,通過對歷史數據的分析整合來預測制度環境未來的趨勢,可以獲得非常好的預測結果。
構建灰色馬爾可夫預測模型分為三步:首先根據被測的歷史數據建立GM(1,1)預測模型,此時會得到灰色預測值,根據灰色預測值和實際值的殘差即可以得知各數據所處的狀態;第二步就是根據每個狀態到達另一狀態的步數建立馬爾可夫多步轉移概率矩陣模型,利用距離被測數據最近的幾組數據所處的狀態信息和相對應的多步轉移概率之和即可推測出被測數據所處的狀態;最后根據馬爾可夫模型預測狀態對灰色預測值進行修正即完成預測[4]。
1.1.1 GM(1,1)預測模型
灰色預測就是通過對歷史數據的處理建立灰色預測模型,從中發現其數據波動的規律,從而對系統的未來狀態做出科學預測的一種預測方法[5]。考慮到隨機變量作為灰色變量,首先是對原始數據進行一次累加,預處理后的數據序列比原始數據具有更強的規律性,然后建立灰色微分方程預測預處理后的數據,運用逆累積運算得到原始數據的預測值[6]。
灰色預測模型的建模步驟如下:
(1)給定原始序列:

(2)為削弱時間序列的隨機性,采用一次累加,得到弱隨機數列:

(3)針對上述累加后的數列,采用線性動態模型來進行模擬,建立一階灰色微分方程GM(1,1)預測模型:

其中,待定參數a代表模型的發展系數,b代表模型的灰色作用量,可用最小二乘法求得,即:

(4)將求得的各參數的數值代入式(3)得灰色模型的時間響應函數:

在灰色理論里,GM(1,1)是一個預測模型,表示為一階微分具有單輸入變量。灰色預測不受整個系統的復雜性的影響,針對其中的灰色信息,通過構建灰色模型對原始數據進行有效地預測[7],它可以發現一系列數據中的多個元素的未來發展動態,從而很好地反映總體的未來發展趨勢走向[8]。
1.1.2 馬爾可夫鏈
馬爾可夫鏈是一個特定類型的隨機過程,它可以作為一種預測方法,馬爾可夫預測方法是對預測對象未來所處狀態的預測[9]。應用Markov模型對GM(1,1)模型預測的數據進行處理,以提高預測精度。構建Markov模型的關鍵是劃分狀態和構造狀態轉移矩陣。這種方法非常適合隨機波動較大的時間序列預測,因為它是通過狀態轉移矩陣求得狀態轉移概率,從而對預測對象的未來發展方向進行預測的,該概率本身就反映了隨機因素的影響。
(1)劃分狀態
狀態的劃分并不是隨意的,要遵循一定的準則,基于該預測序列符合多階馬爾可夫模型的特點,本文依照相對變化率來劃分狀態,相對變化率的計算方法是以實際值除以對應預測值再乘以100%。劃分狀態時注意每個狀態所包含的真實值的個數盡量均衡,原始數據較少時,劃分的狀態宜少,原始數據較多時,劃分的狀態不妨多一些,以提高預測精度,視具體情況而定。以(t)=X(0)(t+1)為基準,可以將原始數據序列劃分成若干個相對均等的狀態區間,記為:Ei=[E1i,E2i],i=1,2,3...n 。式中 E1i=(t)×Ai,E2i=(t)×Bi,其中 Ai代表該狀態區間的上限,Bi則代表該狀態區間的下限。
一般情況下,劃分的狀態區間的個數、每個狀態區間所包含的數據個數以及各個狀態區間的上下限(即E1i,E2i),要根據預測對象的實際情況而定,由于y(t)是關于時間t的一次元函數,所以E1i和E2i會隨著時間的變化而變化,即Ei具有動態性。
(2)構造狀態轉移矩陣

(3)確定預測值
首先構建新的概率矩陣,該矩陣的確定方法是選取離被測數據較近的幾組數據,按照遠近分別確定轉移步數為1,2,3...i,然后從上述建立的狀態轉移概率矩陣中挑選出各數據轉移步數所對應的行向量即可構建出新的概率矩陣,其次對新的概率矩陣的每個列向量求和,哪一列的數值最大,那么被測的數據就相應的屬于哪個狀態,狀態確定以后,狀態區間也就確定了,預測值即為該區間的中點,即(t)=(E1i+E2i)/2 ,最終得到了預測序列為:

利用加權加增長率移動平均法求預測值,賦予權數時,對近期數據給予較大的權數,對較遠的數據給予較小的權數,從而彌補簡單移動平均法的不足,同時考慮增長率的變化,可以提高預測精度。具體的計算公式為:

a,b,…n分別為各數據所取得權數,且a≤b≤…≤n,a+b+…n=1,一般可令a,b,…n呈等差級數或等比級數變化,n的取值視具體情況而定,當時間序列數據波動較大時,應取大一些,反之小一些,一般在3~8之間,運用加權加增長率移動平均法時,權重的選擇是一個很重要的問題,它直接影響最后預測的結果,但是一般情況下,選擇權重的方法主要依靠經驗法和試算法,歷史數據中各個時期對預測未來數據的影響值是有區別的,經驗法和試算法是選擇權重的最簡單的方法。一般而言,離預測數據較近的幾組數據更能預示未來的情況,因而設置的權重應大些,但是具體的權重分配帶有很大的主觀性,所以對于預測精度較高的預測應慎重考慮。本文在預測制度環境時,為了既能靈活地反應近期的變化趨勢,又能保證對時間序列的敏感性,步長n設定為3,在綜合考慮各方面因素后,權數取值分別為0.6、0.3、0.1。
通過借鑒戴魁早(2015)[10]、張敏(2013)[11]、王立清(2011)[12]、鄧路(2014)[13]等學者制度環境選取指標的做法,本文主要挑選出使用頻率較高的四項指標進行預測,剩余指標可以參考同等方法進行預測。選用1997—2009年全國各省份的制度環境的總體指標以及三個分項指標的數據(數據來源:采用樊剛、王小魯和朱恒鵬編制的《中國市場化指數一各地區市場化相對進程2011年報告》中的“市場化總體得分”代替“制度環境總得分”,“政府與市場的關系”、“市場中介組織的發育和法律制度環境”、“產品市場的發育程度”作為制度環境的分項指標)作為原始數據列。
以天津市的制度環境的總體得分的數據為例,則:
X(0)={4.53,4.92,4.71,5.36,6.59,6.73,7.03,7.86,7.65,8.28,8.59,9.19,9.43};

用制度環境的實際值X(0)(t)除以對應的預測值(0)(t),得到其相對變化率,由于數據樣本較少,為了得到更精確的預測結果,本文根據相對變化率將制度環境的預測值劃分為4個狀態:

天津市制度環境總體得分GM(1,1)預測數據和原始數據的對比及所屬狀態如表1所示:

表1 天津市制度環境總體得分情況

選擇最近的幾組數據構建新的狀態轉移矩陣見表2:

表2 預測2010年所屬狀態的狀態轉移矩陣表
經分析預測,根據表2可知2010年最有可能所屬的狀態是E3,2010年灰色預測值為10.37,E13=0.9897×10.37=10.26 ,E23=1.0123×10.37=10.50 ,根 據 公 式?′(t)=(E1i+E2i)/2可得2010年灰色馬爾可夫預測值為10.38。
在進行2011年的數據預測時,可以將2010年的數據按照已知量計算,按照上述方法,得出2011—2014年的灰色馬爾可夫預測值分別為10.63、11.69、11.98、13.15。
運用以上方法分別求出全國其他各省份制度環境的灰色馬爾可夫預測值。
同樣選用1997—2009年全國各省份的制度環境的總體指標和三個分項指標的數據(數據來源:采用樊剛、王小魯和朱恒鵬編制的《中國市場化指數一各地區市場化相對進程2011年報告》中的“市場化總體得分”代替“制度環境總得分”[14],“政府與市場的關系”、“市場中介組織的發育和法律制度環境”、“產品市場的發育程度”作為制度環境的分項指標)作為原始數據列。
本文以天津的制度環境的總體指標數據為例,為了既能靈活地反應近期的變化趨勢,又能保證對時間序列的敏感性,步長n設定為3,在綜合考慮各方面因素后,權數取值分別為0.6、0.3、0.1,要求2010年的預測值,運用公式即可求得:Y2010=(0.6×9.43+0.3×9.19+0.1×8.59)×(9.43/9.19+9.19/8.59)/2=9.72
同樣在進行2011年預測時2010年的數據按照已知量計算,按照上述方法,得出2011—2014年的預測值分別為9.85、9.99、10.05、10.12。因為國外的關于制度環境的研究主要側重于經濟自由化程度的測度,聚焦于一個國家的政策,衡量個體不受過分限制和政府干預的使用勞動力和財力的自由度,因此本文在使用加權加增長率移動平均法進行預測時,采用考慮和不考慮中國經濟自由度兩種情況進行制度環境預測。運用以上方法分別求出全國其他各省份制度環境的預測值。
經過查找相關資料,決定采用對比平均相對誤差的大小的方式來驗證這幾種預測方法的精確度,從表3可以看出,灰色馬爾可夫預測的精確度明顯優于其他三種預測方式。為了進一步驗證這一結果的可信性,本文將從全國選擇部分省份對制度環境的數據進行以上處理和預測,所使用的制度環境數據涉及我國東部沿海和中西部內陸14個省份,具體選擇標準是根據中國市場化進程的排名,分階段各選取3~5個省份,14個省份分別是浙江、上海、北京、天津、山東、河南、江西、四川、湖南、黑龍江、山西、云南、貴州、新疆,由于篇幅限制,在這里不展示所有的預測結果,只在14個省份中選擇了3個省份作為代表,分別是浙江、北京、黑龍江,最終結果見表4。

表3 天津市制度環境總體指標的實際值與幾種預測方法的預測值對比

表4 各省份制度環境總體指標實際值與預測值對比
通過對比表5(見下頁)平均相對誤差的數據發現,灰色馬爾可夫的預測結果明顯比其他三種預測模型的預測結果精度高,灰色馬爾可夫預測模型繼承了灰色預測模型的優點,同時又具備馬爾可夫鏈的優勢,兩者優勢的結合,使其預測精度大幅提高,取得了較好的預測效果,具有較強的科學性和實用性。加權加增長率移動平均法在考慮和不考慮中國經濟自由度兩種情況進行制度環境預測時,預測結果沒有太大的變化,說明中國經濟自由度對制度環境的影響不大,在預測我國制度環境未來的變化趨勢時,可以不予考慮。
本文將灰色預測和馬爾可夫預測進行結合,形成灰色馬爾可夫預測模型,將這兩種模型結合起來能夠做到優勢互補,灰色馬爾可夫模型預測法實質上是在灰色預測模型的基礎上,對其偏離值進行了修正,從而彌補了灰色模型預測的不足,因而準確度最高。因此,對于準確度要求比較嚴格的預測,灰色馬爾可夫預測方法是值得推薦的預測方法。
本文最主要的貢獻是為制度環境的預測提出了一個新的方法,即:將灰色馬爾可夫預測方法運用到制度環境的預測中,在以往有關制度環境的研究中,大部分學者都是采用樊綱等編制的《中國市場化指數一各地區市場化相對進程2011年報告》中的數據,但是近幾年樊綱等人不再更新數據,從而對有關學者進行相關學術研究產生了困擾,所以如果能在此基礎上對其進行有效的預測,那么勢必會解決當前研究人員的困境,對我國科學地制定中國市場化進程相關數據有著重要意義,并且灰色馬爾可夫預測模型對預測類似制度環境這種數據的預測問題也有很好的借鑒意義。

表5 14個省份預測值平均相對誤差對比