王燕茹,王凱凱
(江南大學 商學院,江蘇 無錫 214000)
企業景氣指數越來越受到各領域研究的重視,通過科學分析和預測指數未來波動變化,不僅可以從微觀角度指導企業明晰行業趨勢,預先提出應對解決策略;而且對于輔助國家統計部門科學準確地進行預測具有重要的宏觀現實意義。因此,我國不僅將景氣調查作為統計工作的一項重要內容,還將其作為判定整個經濟景氣狀況的重要參數。
現有預測企業景氣指數的方法并不豐富,根據目前參考文獻,學術研究通常使用的預測算法和數學模型有:人工神經網絡(ANN)、BP神經網絡、粗糙集(RS)、遺傳算法(GA)以及支持向量機(SVM)等。本文選用另外一種預測模型——加權馬爾可夫模型對企業景氣指數預測,并通過案例論證此模型的可行性和實用性。
馬爾可夫模型作為分析及預測未來趨勢發展可能性的一種統計方法具有無后效性的特征。即序列是一個隨機過程,且計算得到的各時刻所處的狀態與時刻之前所處的狀態無關。
馬爾可夫鏈:假設存在概率空間(K,F,P )上的隨機序列,其中設時間序列為,狀態空間。如果對任意非負整數 1,m,k


并且式(1)左端要有意義,即假定:

不能為零,但在實際的應用過程中,通常情況下會令式(1)的右端:

通常只考慮齊次,也就是對任意的m,k∈T,有:

式(4)中,pij(m,k)表示是在時間m時刻處于狀態i,然后經過了k步狀態轉移到了狀態 j的概率。同理,當m=1時,即 pij(k)表示為從狀態i經過k步狀態的轉移,到達狀態 j的概率,并且與初始的時刻無關。齊次的馬氏鏈僅由初始狀態分布以及狀態轉移概率矩陣決定。
加權馬爾可夫模型的建立分以下幾個步驟:
(1)確定指數分級標準。即為狀態空間S,確定對應的狀態值。
(2)計算各階自相關系數。這里用rk表示相關系數。

(3)歸一化自相關系數。代表各滯時的馬氏鏈權重,其中m是結合實際情況需要的最大階數,一般取5。然后按照升序排列,建立不同的步長所對應的馬氏鏈的狀態轉移概率矩陣。

(4)分別按照之前某季度的景氣指數作為初始狀態,再結合對應的狀態轉移概率矩陣便可以預測到未來某季度的狀態概率值,其中i∈E ,k=1,2,…,m,k為滯時(即步長)。
(5)最后由不同滯時權重wk與每個狀態的概率,求得加權和將預測概率歸一化,計算狀態特征值其中T為調整因子,這里取T為1。然后再將實際值納入數據列,重復以上步驟,即可預測xi+1的企業景氣指數。
(6)根據馬氏鏈平穩分布、遍歷性特點,進一步計算極限分布Pi,以及每個狀態再現期Ti,其中
以北京市統計局統計年鑒提供的1999—2013年共60個季度的企業景氣指數序列為例,分析并進行預測來說明此方法預測在實際具體應用中產生的效果情況。企業景氣指數資料如表1所示。

表1 北京市1999—2013年60個季度企業景氣指數序列以及對應的狀態
下文主要分析此模型在實際應用中產生的效果是否與實際數據處在同一狀態內,即是否準確實用以及誤差率。首先以1999年第一季度至2013年第二季度共58個季度的景氣指數預測2013年第三季度的指數。如果結果一致,再把2013年第三季度的實測數據資料加入以上序列中,然后預測2013年第四季度的指數狀態。
(1)“馬氏性”檢驗
在對數據序列進行建模預測前,需要先進行“馬氏鏈”檢驗。一般采用χ2統計量檢驗。
設企業景氣指數隨機序列的分布狀態處在m個狀態,然后求得邊際概率,得到一步狀態轉移矩陣邊際概率。其中,當 n的數值充分大時,統計量χ2計算如式(7)所示。


根據所求得的以上兩者所對應邊際概率表以及統計量 χ2值,參照表2和表3的結果。

表2 邊際概率值

表3 統計量計算值
結果表明,求得的統計量數值 χ2是74.2192,根據給定的顯著性水平α取0.05,根據查表可得到分位點的數值。很顯然,統計量值遠大于分位點數值,因此可認為該企業景氣指數序列具有“馬氏性”。
(2)狀態區間劃分方法
在景氣指數預測前期,指數狀態確定是至關重要的環節。由于社會經濟的復雜性,劃分區間較為麻煩,其中涉及模糊理論的概念。參考文獻中在確定指數狀態等級時可以采用的方法主要有經驗統計、有序聚類、模糊聚類、數理統計(3σ法)等,本文中運用數理統計法確定狀態。
經過計算,該序列(1999年第一季度至2013年第四季度)的企業景氣指數均值=130.34。根據國家統計局對企業景氣指數具體劃分的標準確定序列的級別,通常將序列劃分成5個級別,對應馬氏鏈的5個狀態(見表4)。

表4 企業景氣指數分級
依照表4中已確定的分級標準,將表1中的每個季度的景氣指數狀態對號入座,然后計算各階自相關系數rw與不同步長時的馬爾可夫鏈權重wk,結果如表5所示。

表5 各階自相關系數與各個步長時的馬爾可夫鏈的權重
(3)狀態轉移概率矩陣的計算
經過計算,可以求得不同步長的馬爾可夫鏈的轉移概率矩陣,取最大步長為5,即:

(4)計算預測值
依據1999年第一季度至2013年第二季度的企業景氣指數以及對應的各步長的狀態轉移概率矩陣對2013年第三季度的景氣指數所處的狀態進行預測,預測步驟及結果如表6所示。
由表6可知,求得的狀態特征值S=3.0089,這就可以說明2013年第三季度的企業景氣指數處于狀態3(較為景氣),而實際調查統計的企業景氣指數為126,也處于狀態3(較為景氣)區間,所以可以認為與實際情況基本符合。同理,將第三季度的實際值加入到資料序列中,預測2013年第四季度的企業景氣指數所在的狀態,預測結果見表7。

表6 2013年第三季度企業景氣指數預測

表7 2013年第四季度企業景氣指數預測
由表7求得的狀態特征值S=3.0058,即預測的企業景氣指數也是狀態3(較為景氣),并且2013年第四季度的實際景氣指數為124.1,所以與實際情況基本上符合。這充分表明將加權馬爾可夫這一模型應用于預測企業景氣指數還是有效可行的。
(5)馬爾可夫鏈的特征分析
最后根據馬氏鏈具有的自身特征,對其進行分析:因為企業景氣指數的5個狀態之間是相通的,即i?j(i≠j,且i,j∈I ),即遍歷性;無周期規律,即非周期性的;可以構成完整的封閉集合,即狀態空間,所以是不可約鏈。所有的狀態之間在有限狀態集合可以正常返,具有遍歷性的特點,所以根據其遍歷性的定理。在此可以計算極限分布,由以下給出的方程式組求極限分布:

以步長為3(相依性最強)的馬爾可夫鏈進行特征分析,應用式(9)可以求得極限分布值:p1=0.02837,p2=0.08780,p3=0.06134,p4=0.042066以及 p5=0.06730由極限分布便可求出每個狀態的再現期;應用公式,每個狀態的再現期為:T1=35.246,T2=11.389,
本文通過近14年的企業景氣指數統計結果可以看出,企業景氣指數處在中度景氣次數最多,平均2.377個季度出現一次,概率為0.42066,可能性最大;出現最少的是不景氣區間,平均35.246個季度出現,概率為0.02837,可能性最小。
加權馬爾可夫模型預測與實際結果幾乎一致,但因為采用數學模型較為單一,預測結果仍存在不足和缺陷,預測過程不夠全面深入,需要進一步完善數學模型。
(1)本文區間分級采用樣本均方差法,該方法適合數據信息較大,使用范圍廣泛,計算簡單方便。除此之外,還有有序聚類、模糊聚類等描述數值的變化區間,常用的有序聚類有Fisher算法等,至于哪種方法更優越,還有待深入研究。
(2)在今后的研究中,可以考慮加權馬爾可夫模型與其他方法組合混合模型。比如支持向量機(SVM),基于SVM在數據挖掘和分類方面有良好的擬合能力,在時間序列預測被多次采用。還可以結合其他數學模型,比如ARMA模型、ANN模型、SCGM(1,1)模型、灰色模型、粗糙集等。綜合各模型優勢互補,尋找一種在企業景氣指數預測最優的混合模型。
[1]Stock J H,Waston M W.A Procedure for Predicting Recessions With Leading Indicators:Econometric Issues and Recent Experience[J].NBER Working Paper,1993.
[2]Christian K,Karel M.Business Cycle Analysis and VARMA Models[J].Journal of Economic Dynamics and Control,2009,33(2).
[3]吳海民.BP人工神經網絡在我國工業企業景氣指數預測中的應用[J].蘭州商學院學報,2007,23(2).
[4]帥加琴.中國銅工業景氣指數與預警系統研究[D].北京:北方工業大學碩士論文,2015.
[5]彭森.基于粗糙集與支持向量機的工業企業經濟景氣指數智能預測模型研究[D].武漢:華中科技大學碩士論文,2012.
[6]孫才志,張戈,林學鈺.加權馬爾可夫鏈在降水豐枯狀況預測中的應用[J].系統工程理論與實踐,2003,23(4).
[7]姜翔程,陳森發.加權馬爾可夫SCGM(1,1)c模型在農作物干旱受災面積預測中的應用[J].系統工程理論與實踐,2009,29(9).