鄭旭東,陳天偉,鄧捷利,段青達(dá),甘 若,王 雷
(1.桂林理工大學(xué)測繪地理信息學(xué)院,廣西桂林541004;2.廣西空間信息與測繪重點實驗室,廣西桂林541004)
目前,大壩變形預(yù)測的方法主要有BP神經(jīng)網(wǎng)絡(luò)法、支持向量機(jī)法、相關(guān)向量機(jī)法、時間序列法等[1]。由于大壩工程的復(fù)雜性,以及外界條件的不確定性,決定了使用單一預(yù)測模型進(jìn)行變形預(yù)測時,難以得到預(yù)測精度和預(yù)測期數(shù)都較為優(yōu)秀的預(yù)測結(jié)果。針對大壩變形預(yù)測中存在的種種問題,部分學(xué)者進(jìn)行了如下研究:王利等使用改進(jìn)灰色模型在大壩沉降預(yù)測中取得相對誤差小于2%的預(yù)測結(jié)果[2];何啟等使用改進(jìn)的加權(quán)馬爾可夫鏈模型得到了平均相對誤差為0.71%的預(yù)測結(jié)果[3];覃邵峰使用改進(jìn)的ARIMA模型在大壩變形預(yù)測中平均相對誤差為0.48%[4]。為了能在實際預(yù)測中盡可能地發(fā)揮單一模型的預(yù)測優(yōu)勢,又能約束各自的缺陷,本文基于信息熵原理提出熵權(quán)法并聯(lián)組合模型。使用灰色—加權(quán)馬爾可夫鏈預(yù)測模型用于解決變形預(yù)測中“少數(shù)據(jù),貧信息”以及灰色模型預(yù)測周期短的問題,同時使用ARIMA模型來提高預(yù)測結(jié)果的精度,利用最大熵原理對兩模型合理組合,得到一個精度更高、更加合理的預(yù)測模型。
1.1.1灰色預(yù)測模型GM(1.1)
灰色理論主要研究“小樣本,貧信息”的不確定系統(tǒng)的問題[5]。建立灰色模型時,為了淡化原始數(shù)據(jù)隨機(jī)性誤差的影響,首先對原始數(shù)據(jù)進(jìn)行累加處理,再用微分方程進(jìn)行建模,最后對模型值進(jìn)行還原,得到預(yù)測值。由于該模型在其他文獻(xiàn)中出現(xiàn)較多,本文不再加以詳述。
1.1.2加權(quán)馬爾可夫鏈預(yù)測
對于一組隨機(jī)變量,在驗證其滿足“馬氏性”后,通過各步長的狀態(tài)轉(zhuǎn)移矩陣,以及其相對應(yīng)的狀態(tài)做出預(yù)測后,利用其各階自相關(guān)系數(shù)能夠描述出各種滯時指標(biāo)值相關(guān)關(guān)系的強(qiáng)弱這一特性[6],對各步長的預(yù)測結(jié)果按照相依關(guān)系的強(qiáng)弱進(jìn)行加權(quán)平均,這就是加權(quán)馬爾可夫鏈預(yù)測法的基本思想。
加權(quán)馬爾可夫鏈預(yù)測的步驟:
(2)“馬氏性”檢驗。
(3)計算各階自相關(guān)系數(shù)rk,k∈E
(1)

(2)
式中,wk為各個滯時(即步長)的馬爾可夫鏈的權(quán)重;m為預(yù)測的最大階數(shù)。
(4)根據(jù)步驟(1)所劃分的狀態(tài),統(tǒng)計出各步長的狀態(tài)轉(zhuǎn)移概率矩陣。

(6)將同一狀態(tài)的各預(yù)測概率加權(quán)求和作為該指標(biāo)值處于該狀態(tài)的預(yù)測概率,即
(3)
則最終該指標(biāo)值的預(yù)測狀態(tài),即max{Pi,i∈E}。
(7)求出級別特征值對預(yù)測值進(jìn)行估算[7]。待該指標(biāo)值預(yù)測完成后,將預(yù)測值加入到原始序列中,重復(fù)步驟(1)~(7)即可完成對下一指標(biāo)值的滾動預(yù)測。
1.1.3灰色—加權(quán)馬爾可夫鏈
灰色預(yù)測模型的優(yōu)點是需要的數(shù)據(jù)信息較少,但其預(yù)測時間較短,而且對于波動性較大的數(shù)據(jù),預(yù)測效果也不盡人意。而馬爾可夫鏈預(yù)測模型是通過統(tǒng)計原始序列得到狀態(tài)轉(zhuǎn)移概率矩陣進(jìn)行預(yù)測,能夠在對變化較大的隨機(jī)序列的預(yù)測中取得不錯的效果,但其需要足夠多的原始數(shù)據(jù)來統(tǒng)計出原始序列的內(nèi)在規(guī)律。故將兩模型進(jìn)行串聯(lián)組合,用馬爾可夫鏈預(yù)測模型對灰色模型的結(jié)果進(jìn)行改正,以提高預(yù)測精度。其具體步驟如下:
(1)將灰色模型的擬合值和實際觀測值進(jìn)行對比,求出相對誤差。
(2)用求出的相對誤差進(jìn)行馬爾可夫鏈建模,由馬爾可夫鏈預(yù)測模型預(yù)測出某時段的相對誤差。
(3)用馬爾可夫鏈預(yù)測模型預(yù)測出的相對誤差對灰色模型的預(yù)測值進(jìn)行改正。
ARIMA模型也寫作為ARIMA(p,d,q)模型,它的實質(zhì)是將ARIMA(p,q)進(jìn)行d階差分得到的。通過這樣的操作,把一個非平穩(wěn)的時間序列轉(zhuǎn)化成一個平穩(wěn)的時間序列,再通過觀察相關(guān)函數(shù)結(jié)尾和拖尾特征得到自回歸階數(shù)p和移動平均階數(shù)q,對時間序列進(jìn)行ARIMA建模,達(dá)到預(yù)測的效果[8]。ARIMA模型為
φ(B)(1-B)dYt=θ(B)et或
φ(B)dYt=θ(B)et
(4)

并聯(lián)組合模型的關(guān)鍵在于對單一模型的確定及單一模型權(quán)重的確定。本文采用熵權(quán)法確定各個單一模型權(quán)重,建立組合模型來預(yù)測大壩變形的數(shù)據(jù)。熵權(quán)法是根據(jù)評價對象的指標(biāo)值構(gòu)成的判斷矩陣來確定權(quán)重的一種方法。如果把信息熵理解為某種特定信息xi出現(xiàn)的概率p(xi),那么信息熵H(x)的定義為
(5)
根據(jù)信息熵的定義可知,我們將特定信息認(rèn)為是單項預(yù)測模型的誤差,如果單項模型的誤差的信息熵越小,其變異程度也就越大,則該單項預(yù)測模型的權(quán)重也越小。反之,模型誤差的信息越大,那么其變異程度越小,則模型的權(quán)重也就越大[9]。
因此,可以利用信息熵原理來確定單一模型的權(quán)重。具體步驟如下:
(1)計算單個模型對應(yīng)時刻的相對誤差權(quán)重
(6)
式中,eij為第i個模型第j時刻的相對誤差。
(2)計算第i個模型相對誤差的熵值
(7)
式中,k=1/lnn,其中,n為選擇的單一模型數(shù)量。
(3)計算第i個模型相對誤差序列的變異程度系數(shù)
di=1-Hi
(8)
(4)計算第i個模型的權(quán)重系數(shù)
(9)
(5)將單一模型的預(yù)測值和求得的權(quán)重加權(quán)求和,獲得組合模型的預(yù)測值
(10)
式中,yi為單一模型的預(yù)測值。
組合預(yù)測模型建模基本流程如圖1所示。

圖1 組合模型建模流程

表1 各模型預(yù)測值對比
本文以某大壩水平變形監(jiān)測點水平徑向位移觀測值為例,數(shù)據(jù)來源于文獻(xiàn)[2,10]。這里取前16期的觀測值作為原始起算數(shù)據(jù),后4期數(shù)據(jù)和預(yù)測數(shù)據(jù)進(jìn)行對比。觀測原始數(shù)據(jù)如圖2所示。

圖2 原始數(shù)據(jù)
將灰色模型預(yù)測得到的前16期的擬合值與實際觀測值對比得到的相對誤差,對相對誤差進(jìn)行馬氏性檢驗,用馬爾可夫鏈模型進(jìn)行建模,預(yù)測得到后4期相對誤差,用此結(jié)果對灰色模型的預(yù)測值進(jìn)行改進(jìn),即可得到灰色—加權(quán)馬爾可夫鏈預(yù)測模型的預(yù)測值;將前16期數(shù)據(jù)進(jìn)行一階差分處理,對處理的數(shù)據(jù)進(jìn)行自回歸系數(shù)與偏回歸系數(shù)分析,確定ARIMA(p,d,q)模型的參數(shù)。經(jīng)分析,確定p=3,d=1,q=3。利用SPSS軟件進(jìn)行ARIMA建模,獲得預(yù)測值。其結(jié)果見表1。
根據(jù)前文介紹的熵權(quán)計算公式以及兩個單一模型的變形值的預(yù)測結(jié)果,可得到灰色—加權(quán)馬爾可夫鏈預(yù)測模型,ARIMA預(yù)測模型在并聯(lián)組合模型中所占的權(quán)重分別為:ω1=0.75,ω2=0.25;再由式(10)求得最終大壩水平徑向位移的預(yù)測值Y={87.837,87.555,87.196,86.862}。
為了更加直觀的表現(xiàn)出3種模型的預(yù)測效果,把3種模型的預(yù)測結(jié)果與實測值的對比用折線圖的形式表現(xiàn),如圖3所示。
表中,模型一是指灰色—加權(quán)馬爾可夫鏈模型,模型二是指ARIMA模型,模型三是指基于熵權(quán)法的組合模型。
從表1、圖3分析相對誤差可得,組合模型預(yù)測效果最好,平均相對誤差約為-0.26%,其次為ARIMA預(yù)測模型,平均相對誤差約為0.27%;加權(quán)馬爾可夫鏈預(yù)測模型相對較差,平均相對誤差為0.46%。單就平均誤差而言,組合模型和ARIMA模型差別不大。為了進(jìn)一步分析3種模型的平穩(wěn)性以及精確度,按照整體評價預(yù)測方法的原則,引入以下評價

(10)

表3 預(yù)測結(jié)果對比

圖3 各模型預(yù)測值與真實值對比
(11)

根據(jù)以上兩種評價指標(biāo),得出預(yù)測評價結(jié)果見表2。

表2 模型的評價指標(biāo)對比
實例分析表明,組合模型的預(yù)測精度最好,與實際觀測數(shù)據(jù)相比較,Theil不等系數(shù)和誤差平方和均優(yōu)于單一的預(yù)測模型,顯示出它在大壩變形預(yù)測精度上的優(yōu)越性;其次,組合預(yù)測模型可以有效的彌補(bǔ)單一預(yù)測模型實際預(yù)測中存在的不足。對于現(xiàn)有的大壩變形預(yù)測模型而言,并聯(lián)加權(quán)模型可以合理的結(jié)合各單一模型的優(yōu)點,提高預(yù)測結(jié)果精度。為避免其偶然性,筆者使用文獻(xiàn)[3]中的數(shù)據(jù)再次進(jìn)行實驗,求得的模型一和模型二的權(quán)重為ω1=0.14,ω2=0.86。由于篇幅限制,在此只對結(jié)果進(jìn)行呈現(xiàn)。其結(jié)果見表3、4。

表4 預(yù)測結(jié)果精度指標(biāo)對比
由表3、4結(jié)果可知,對文獻(xiàn)中的大壩水平位移分別進(jìn)行灰色—加權(quán)馬爾可夫鏈模型,ARIMA模型和組合模型的預(yù)測,得到的預(yù)測結(jié)果從平均相對誤差,誤差平方和,以及Theil不等系數(shù)來看組合模型均為最優(yōu),由此可見基于熵權(quán)法的并聯(lián)組合模型對于大壩變形預(yù)測來說是一種行之有效的預(yù)測方法。
本文針對有限的觀測數(shù)據(jù),結(jié)合灰色理論適用于“小樣本、貧信息”的特點;馬爾可夫鏈能夠準(zhǔn)確擬合波動性較大的數(shù)據(jù)的特點;ARIMA模型能夠挖掘非平穩(wěn)時間序列的內(nèi)部信息,擬合出變化趨勢,從而實現(xiàn)預(yù)測目的,具有建模簡單的特點;并且結(jié)合最大熵的原理對模型進(jìn)行合理的組合,建立了基于最大熵原理的混合預(yù)測模型,通過實例驗證了該模型對于小樣本序列預(yù)測精度較高。具體結(jié)論如下:
(1)基于信息熵原理,建立并聯(lián)組合模型來預(yù)測大壩的形變量,該方法在精度上較單一模型有所提高,并且平衡了單一模型的實測數(shù)據(jù)和樣本數(shù)據(jù)之間在質(zhì)量和數(shù)量上的需求,同時能夠平衡各單一模型的擬合及預(yù)測精度以及普適性等方面的優(yōu)點及缺點。
(2)基于信息熵原理,可對在真實值上下浮動的單一模型的預(yù)測值進(jìn)行合理組合,減少了人為因素,使得組合模型在預(yù)測結(jié)果上更加接近真實值,從而提高了預(yù)測模型的預(yù)測精度以及合理性,為數(shù)據(jù)處理以及大壩變形預(yù)測提供了一條新的途經(jīng)。