張虎,胡淑蘭
(中南財經政法大學信息學院統計系,武漢430073)
馬爾可夫轉換模型的極大似然估計的算法
張虎,胡淑蘭
(中南財經政法大學信息學院統計系,武漢430073)
由金融和經濟時間序列,文章引入了馬爾可夫轉換模型并詳細給出其原理——隱藏馬爾可夫模型,以及在條件高斯下的極大似然估計方法。通過引入新的模型——擴張隱藏馬爾可夫模型,對多種狀態轉移的情形下的極大似然估計量的算法進行了改進。
馬爾可夫轉換模型;隱藏馬爾可夫模型;極大似然估計
在金融和經濟時間序列中,通常存在一些時間段,其時間序列的行為與前期相比,有很大的變化。序列隨時間的變動,體現在均值、方差或現值與前期值的相關程度等方面。若序列的行為模式發生一次性根本變化,則稱之為序列“結構性變動”(structural break);若序列的行為模式在變動發生持續一段時間后恢復其原有狀態,甚至轉換為其他行為類型,則后者通常稱為“機制更迭”(regime shift)或“機制轉換”(regime switch)。如果觀察宏觀經濟或金融時間序列足夠長的時間,則可以看到很多變量有許多戲劇性的變化。這種明顯的變化可能源于戰爭、金融恐慌、或政府政策的顯著變化。如果變量的歷史數據已經給出,我們可以根據顯著變化的次數將時間序列劃分成不同階段,然后分別建模。但是變量的顯著變化沒有理由不再發生,機制的變化肯定不能完全視作完全可預見的、確定性事件,此時,用歷史數據分別擬合的模型來進行預測就不恰當了。在計量經濟學文獻中提出了許多更為復雜的非線性門限模型去解決這類序列問題,而實際上在金融領域中產生顯著影響的卻只有兩類,其中之一就是Hamilton(1989,1994)提出的馬爾可夫轉換模型(Markov Switching Model,簡稱為MSM)。馬爾可夫轉換模型在金融領域的應用十分廣泛,當認為序列在兩種行為間來回轉換,而造成機制轉換的“策動變量”不可觀測的時候,可采用馬爾可夫轉換方法。在總體的分布函數或概率函數的數學表達式已知的情況下,通過對樣本的實際觀察取得樣本數據,并在此基礎上通過對樣本統計量的計算,得到總體待估參數的估計值來替代其真實過程。極大似然估計法(Maximum likelihood estimate,簡稱為MLE)是很重要的參數估計方法之一,因為其原理更本質地揭示了通過樣本估計母體參數的內在機理。計量經濟學理論的發展更多的是以極大似然估計原理為基礎的,對于一些特殊的計量經濟學模型,只有極大似然方法才是很有效的估計方法。
馬爾可夫轉換模型的原理是隱藏馬爾可夫模型(Hidden Markov Model,簡稱為HMM),HMM由Baum和Petrie(1966)將其作為由馬爾可夫鏈的概率函數的推廣形式提出來。從本質上看,HMM是一個雙重隨機過程,由兩個部分組成:
(1)隱藏部分(或稱為不可觀察狀態)是馬爾可夫鏈:描述各個狀態之間的轉移,用狀態轉移的概率來描述;
(2)可觀察部分是一般隨機過程:描述狀態與觀察序列間的關系,用觀察值的概率分布來描述。
隱藏馬爾可夫模型的狀態是不確定的或不可見的,也就是說馬爾可夫模型的“機制”(regime),只有通過觀察值序列的隨機過程才能表現出來。觀察到的事件與狀態并不是一一對應的,而是通過一組概率分布相聯系。隱藏馬爾可夫模型起初的應用是在統計和信息的理論領域中,之后再廣泛地應用到生物信息學、遺傳學、語音識別以及金融資產定價、計算計量經濟學等很多領域。目前,在國際上,隱藏馬爾可夫模型在各個領域的應用已經得到廣泛地認可和拓展,其理論部分的研究卻屬于起步的階段,因為理論的研究具有很大的挑戰性和難度。在國內這方面的研究還比較少。
隱藏馬爾可夫模型是定義在某概率空間上的雙重隨機過程(xt,yt),隱藏的轉移狀態st定義在{1,…,M}的隨機變量,服從一階馬爾可夫鏈,滿足馬爾可夫性。當st=1時,稱此時間序列處于最低的機制;相應地,當st=M時,稱此時間序列處于最高的機制。
定義各狀態之間轉移的概率轉移矩陣P為:

如果是僅為兩個狀態的轉移(例如擴張和收縮,正增長與負增長),概率轉移矩陣就可以寫成

隱藏馬爾可夫模型的另一組成部分,行向量yt=(y1,t,…,yp,t),是可以通過觀察得到的時間序列,在信息理論中,yt就是釋放出來的信息量,能夠被直接或間接觀測得到。我們將在t-1時間內所觀察到的信息序列集合表示為It-1=(yt-1,…,y1),根據狀態轉移的馬爾可夫性質有:

觀察值yt是一般的隨機過程,服從于關于轉移狀態條件獨立的某種概率分布規律。比如:yt是服從于st的期望為μ、方差為σ2的條件高斯分布,即yt|st~N(μ,σ2)。當然在復雜的模型下,也會出現一些更一般化或更抽象的分布。
在以上的隱藏馬爾可夫模型的基礎上,下面我們建立一般化的自回歸模型,即馬爾可夫轉換高斯模型:

其中yt是觀察值序列,xt=(x1,t,…,xn,t)表示受轉換機制支配的外生回歸向量,zt=(z1,t,…,zr,t)表示不受轉換機制支配的外生回歸向量,表示為與機制相關的n×r回歸系數矩陣,δ=(δ1,…,δp)表示為與機制無關的r×p回歸系數矩陣。這里:

由Hamilton(1994)的方法,引入投影隨機變量ξt是M×1的向量,滿足,即

我們可以將Σst和βst表示為

那么在給定狀態st=j時,馬爾可夫轉換模型可簡化成:

尋求極大似然估計的解析方法,只能在概率密度函數有明確的解析表達式時使用。最常用的迭代優化算法是從某個初始設定的參數值出發,以得到更好的參數值。這個過程一直重復進行,不斷得到比前一次更好的參數值,直到目標函數在迭代過程中不再優化為止。區分不同算法的主要標準就是它們找到最大值的速度的快慢。

對所有的狀態求和后,有

根據一般極大似然估計的基本原理,可以得到對數似然函數:

那么如何改進計算方法才能使迭代速度更快呢?顯然,對數函數內的求和符號是使迭代速度慢的根本原因,因此對數似然函數形式上的簡化問題歸結于如何轉移對數內的函數求和符號。
我們采用的解決方案是引入第三個變量qt,構成新的模型——擴張隱藏馬爾可夫模型(extended HMM)。在這個模型中,極大似然估計中的似然函數能夠通過第三個變量qt的定義和在聯合概率密度函數的計算中的整合能將對數內的函數求和符號成功地轉移到對數符號外面,有效得簡化了迭代公式,加快了迭代速度,從而目標函數在迭代過程中盡可能最優化。
在隱藏馬爾可夫模型中,引入第三個變量qt,構成新的模型——擴張隱藏馬爾可夫模型(st,yt,qt)。qt定義為給定觀察
序列yt后狀態st的條件概率分布,即:由 Le Gland和Mevel(2000),我們知道,qt會滿足Baum向前方程,qt的表達式是由初始分布,觀察序列yt和參數Θ確定的函數g表示:qt+1=g(yt,qt)。具體表達式見Le Gland和Mevel(2000)。由于觀察序列與初始狀態的相互依賴性,可以進一步得到:qt+1=g(yt,…,y1,q1)。
在擴張隱藏馬爾可夫模型下,聯合概率密度函數的對數似然函數為:

在計算機上實現隱藏馬爾可夫模型或馬爾可夫轉換模型的在各領域的實際模型中的模擬和應用,一般使用GAUSS軟件,我們可以通過以上方法改進GAUSS中的MLE模塊程序來加快計算速度。
[1]Baum,Petrie.Statistical Inference for Probabilistic Functions of Finite Markov Chains[J].Ann.Math.Statist,1966,37.
[2]J.Hamilton.A New Approach to the Economic Analysis of Non-Stationary Time Series and the Business Cycle[J].Econometrica,1989,57(2).
[3]J.Hamilton.Time Series Analysis[M].New Jersey:Princeton University Press,1994.
[4]Le Gland,Mevel.Exponential Forgetting and Geometric Ergodicity in Hidden Markov Models[J].Math.Contr.Signals Syst,2000,(13).
(責任編輯/亦民)
F22
A
1002-6487(2011)06-0026-02
中南財經政法大學振興工程科研基金資助項目
張虎(1963-),男,湖北隨州人,博士,教授,研究方向:數量經濟。