王 成 胡添翼,2 顧艷玲 張 磊 姓海濤
(1. 河海大學(xué)水利水電學(xué)院,南京 210098; 2. 上海市政工程設(shè)計(jì)研究總院水利水運(yùn)設(shè)計(jì)研究院,上海 200092;3.中國水利水電科學(xué)研究院,北京 100038;4.中水北方勘測設(shè)計(jì)研究有限責(zé)任公司,天津 300222;5.南京市溧水區(qū)水務(wù)局,南京 211200)
大壩的變形、應(yīng)力和滲流等觀測資料均為典型的時(shí)間序列,故可通過實(shí)測資料來進(jìn)行預(yù)測.近年來,學(xué)者們對大壩安全監(jiān)控模型的研究越來越深入,時(shí)序分析法、灰色系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、小波理論、混沌理論及向量機(jī)等一些新的理論和方法不斷被引入到該領(lǐng)域中.但是,單純用一種模型進(jìn)行分析時(shí)存在較大的局限性,難以全面地揭示時(shí)間序列的發(fā)展變化規(guī)律.針對這個(gè)問題,Bates和Granger在1969年首次創(chuàng)造性地提出了組合預(yù)測理論[1],該理論認(rèn)為不同的模型和方法承載著不同的獨(dú)立有效信息,單一的模型無法體現(xiàn)問題的全面性,需要將同一個(gè)問題不同方面、不同角度的信息結(jié)合起來,以求更好地反映問題的實(shí)際情況,換言之就是采取科學(xué)的方式,實(shí)現(xiàn)不同模型和方法的組合,得到一個(gè)全面綜合的預(yù)測模型,這樣可以達(dá)到取長補(bǔ)短的效果,發(fā)掘出更多的有用信息,預(yù)測效果也必然會得到一定的提高.
在時(shí)序分析法中,ARIMA模型由于簡單性、可行性和靈活性,已經(jīng)成為主要的時(shí)間預(yù)測方法,因其時(shí)間序列變量的未來值被認(rèn)為是變量過去值和隨機(jī)誤差值的線性函數(shù),用于預(yù)測短序列小樣本且具有線性關(guān)系的數(shù)據(jù)時(shí)精度較高,但在處理非線性數(shù)據(jù)時(shí)會產(chǎn)生較大的誤差,效果欠佳;而BP神經(jīng)網(wǎng)絡(luò)模型因其強(qiáng)大的學(xué)習(xí)和數(shù)據(jù)處理能力,能夠挖掘數(shù)據(jù)背后復(fù)雜的非線性關(guān)系,在解決非線性問題時(shí)具有很大的優(yōu)勢,但在處理線性數(shù)據(jù)時(shí)的效果不及ARIMA模型,將兩者進(jìn)行有機(jī)組合即可實(shí)現(xiàn)對絕大多數(shù)變形序列的處理.堯姚等將ARIMA-BP組合模型用于民航旅客運(yùn)輸量的預(yù)測[2],趙杰等將其應(yīng)用于高鐵沉降預(yù)報(bào)的研究[3],趙成柏等將其用于我國碳排放的強(qiáng)度預(yù)測[4],俞凱加等將其應(yīng)用于某心墻堆石壩的沉降量預(yù)測[5],都取得了較好的預(yù)測效果.
大壩變形時(shí)間序列同時(shí)包含了線性時(shí)序和非線性時(shí)序的成分,因此本文將ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型結(jié)合起來,構(gòu)建ARIMA-BP組合預(yù)測模型,旨在發(fā)揮兩者的優(yōu)勢,最大化利用序列的有效信息,從而實(shí)現(xiàn)對大壩變形時(shí)序更好的預(yù)測,實(shí)例表明該模型比單一模型更加有效.
ARIMA模型(Autoregressive Integrated Moving Average Model, ARIMA),全稱是差分自回歸滑動平均模型,通過差分運(yùn)算來實(shí)現(xiàn)數(shù)據(jù)處理,其基本原理是:預(yù)測對象隨時(shí)間的變化會形成一定的數(shù)據(jù)序列,將這個(gè)數(shù)據(jù)序列看作一個(gè)隨機(jī)序列(本文的隨機(jī)序列為壩頂順河向位移數(shù)據(jù)),然后用已知的數(shù)學(xué)模型來刻畫這個(gè)序列,模型和序列匹配成功后就可以根據(jù)時(shí)間序列的過去值和現(xiàn)在值對序列的未來值進(jìn)行預(yù)測[6].在ARIMA模型中,d為非平穩(wěn)時(shí)間序列通過差分運(yùn)算成為平穩(wěn)序列時(shí)所做的差分次數(shù).
ARIMA(p,d,q)模型數(shù)學(xué)表達(dá)式為
(1)
式中,φm(m=1,2,…,p)是自回歸模型的系數(shù),θj(j=1,2,…,q)是移動平均模型的系數(shù),p為自回歸階數(shù),q為移動平均部分的階數(shù),ai為白噪聲序列.
有一點(diǎn)需要注意,使用ARIMA模型對數(shù)據(jù)進(jìn)行運(yùn)算的前提條件是,時(shí)間序列必須滿足平穩(wěn)性的要求.對于非平穩(wěn)的時(shí)間序列,必須通過平穩(wěn)化處理方法使之平穩(wěn),然后才能投入到ARIMA模型中運(yùn)算.檢驗(yàn)序列平穩(wěn)性的方法有圖檢驗(yàn)法和構(gòu)造檢驗(yàn)統(tǒng)計(jì)量的假設(shè)檢驗(yàn)法,下文采用圖檢驗(yàn)法對原始序列進(jìn)行平穩(wěn)性檢驗(yàn).
貝葉斯信息準(zhǔn)則(BIC)與最小艾卡信息量準(zhǔn)則(AIC)可以用來確定模型的自回歸階數(shù)p和滑動階數(shù)q的值.由于BIC準(zhǔn)則比AIC準(zhǔn)則具有更好的收斂性[7],故本文采用BIC準(zhǔn)則計(jì)算模型的階數(shù),其數(shù)學(xué)表達(dá)式為:
(2)
式中,k為參數(shù)的數(shù)量,n為觀察數(shù).模型優(yōu)先選擇BIC值最小組對應(yīng)的p、q值.
BP網(wǎng)絡(luò)是一種多層前饋神經(jīng)網(wǎng)絡(luò),通過信號正向傳播與誤差反向傳播來實(shí)現(xiàn)運(yùn)作,擁有3層結(jié)構(gòu)(輸入層、隱含層、輸出層),每一層均由節(jié)點(diǎn)組成,每個(gè)節(jié)點(diǎn)為一個(gè)神經(jīng)元,上層節(jié)點(diǎn)與下層節(jié)點(diǎn)利用權(quán)值連接,而每層內(nèi)之間的節(jié)點(diǎn)不存在連接,上一層神經(jīng)元的輸出經(jīng)連接權(quán)值的作用,轉(zhuǎn)到下一層神經(jīng)元即成為輸入,逐層轉(zhuǎn)換實(shí)現(xiàn)樣本的計(jì)算.
神經(jīng)元網(wǎng)絡(luò)在學(xué)習(xí)的過程中,首先使網(wǎng)絡(luò)的輸入等于學(xué)習(xí)樣本的輸入,接下來依靠系統(tǒng)的復(fù)雜程度,對樣本進(jìn)行若干次的訓(xùn)練,神經(jīng)元連接的權(quán)值與閾值在訓(xùn)練的過程中被不斷地修改,驅(qū)使網(wǎng)絡(luò)的輸出盡可能接近樣本的輸出,從而滿足一定的訓(xùn)練目標(biāo).整個(gè)過程分為以下4個(gè)步驟:1)輸入模式順傳播即正向傳播;2)輸出誤差逆?zhèn)鞑ゼ捶聪騻鞑ィ?)循環(huán)記憶訓(xùn)練;4)學(xué)習(xí)結(jié)果判別.
BP神經(jīng)網(wǎng)絡(luò)模型優(yōu)點(diǎn)在于良好的非線性組合與強(qiáng)大的學(xué)習(xí)、自適應(yīng)能力,它可使系統(tǒng)輸入與輸出間存在高度的非線性映射關(guān)系,理論上來講每一個(gè)連續(xù)函數(shù)均可以用它來逼近.

ei=k1e1i+k2e2i
(3)

ARIMA-BP組合模型的流程圖如圖1所示.

圖1 組合模型的計(jì)算流程
ARIMA-BP組合模型的建模流程如下:
1)通過對時(shí)間序列進(jìn)行平穩(wěn)性檢驗(yàn),確定差分次數(shù)d,采用BIC準(zhǔn)則確定模型的p、q值,最小二乘法得到模型表達(dá)式的參數(shù),從而完成ARIMA模型的建立,并對大壩順河向位移進(jìn)行擬合預(yù)測.
2)給定輸入向量和期望輸出,通過隱含層和輸出層神經(jīng)元的作用求出實(shí)際輸出,判斷期望輸出和實(shí)際輸出的偏差以及是否達(dá)到最大訓(xùn)練次數(shù)來調(diào)整權(quán)值參數(shù),最后都滿足條件即可輸出預(yù)測值,完成BP神經(jīng)網(wǎng)絡(luò)的建立.
3)利用最優(yōu)加權(quán)法對兩種模型的擬合結(jié)果進(jìn)行計(jì)算,確定模型權(quán)重,檢驗(yàn)組合模型的擬合效果,最后結(jié)合單一模型的預(yù)測值得出組合模型的預(yù)測值,完成組合模型的建立.
某水電站位于云南省和四川省交界的金沙江下游河段上,攔河大壩的壩型為混凝土重力壩,壩頂高程384 m,最大壩高162 m,該水電站是我國第三大水電站,是西電東送工程的主要電力來源之一,該電站的建成還有效解決了三峽的泥沙淤積問題,在國民經(jīng)濟(jì)的發(fā)展中發(fā)揮了重要作用.本文以該壩壩頂某測點(diǎn)的順河向位移(2013年7月4日到2015年12月3日觀測的數(shù)據(jù))為例,首先利用ARIMA模型對數(shù)據(jù)進(jìn)行擬合預(yù)測,BP神經(jīng)網(wǎng)絡(luò)模型對數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練預(yù)測,按照組合原理計(jì)算出兩個(gè)模型的權(quán)重,接著算出組合預(yù)測結(jié)果,然后將3個(gè)模型的結(jié)果放入同一個(gè)表格中進(jìn)行對比,分析得出結(jié)論.表1為壩頂某測點(diǎn)順河向位移的觀測值,圖2為位移測點(diǎn)的時(shí)間序列,其中前92個(gè)數(shù)據(jù)用來擬合,后5個(gè)數(shù)據(jù)用來預(yù)測.

表1 壩頂某測點(diǎn)順河向位移的歷史觀測值

圖2 大壩順河向位移實(shí)測值時(shí)間序列
模型輸入9組參變量[8]:

利用SPSS軟件對壩頂某測點(diǎn)順河向位移建立ARIMA模型,為了使實(shí)測值轉(zhuǎn)化為平穩(wěn)序列,將實(shí)測值進(jìn)行數(shù)據(jù)轉(zhuǎn)化為一次差分值,新實(shí)測值序列xi與原實(shí)測值序列yi之間的關(guān)系可用下式進(jìn)行表述:
xi=yi+1-yi,i=1,2,…,n
(4)
利用圖檢驗(yàn)法對新的時(shí)間序列進(jìn)行平穩(wěn)性檢驗(yàn),新序列對應(yīng)的自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PACF)如圖3所示.

圖3 ACF(左)和PACF(右)系數(shù)圖
由圖3可以看出,ACF和PACF都是截尾的,根據(jù)系數(shù)圖和BIC準(zhǔn)則,選擇最小的BIC值對應(yīng)的模型,所以最終確定測點(diǎn)順河向位移的模型為ARIMA(1,1,2),表達(dá)式為:
zt=-0.586zt-1+0.895at-1+0.414at-2+at
(5)
本文采用的BP網(wǎng)絡(luò)模型選取影響壩頂順河向位移的全部因子數(shù)作為網(wǎng)絡(luò)輸入,即為9個(gè);壩頂?shù)捻樅酉蛭灰谱鳛榫W(wǎng)絡(luò)輸出,即為1個(gè);研究表明,3層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)如果具有S型非線性函數(shù),則網(wǎng)絡(luò)可以任意精度近似任何可微函數(shù),大壩安全監(jiān)測中的變形預(yù)測采用典型的3層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分析即可實(shí)現(xiàn)預(yù)期目標(biāo)[9].在對BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練時(shí),本文分別選取17、18、19、20、21等不同數(shù)量的隱含層節(jié)點(diǎn)數(shù)反復(fù)測試,對比不同隱層節(jié)點(diǎn)數(shù)對應(yīng)的模型誤差,選擇擬合效果最好且沒有過擬合的模型.綜合來看,當(dāng)隱含層節(jié)點(diǎn)數(shù)取為20時(shí),學(xué)習(xí)過程收斂速度最快,因而網(wǎng)絡(luò)結(jié)構(gòu)為9-20-1.將數(shù)據(jù)歸一化處理,設(shè)定好網(wǎng)絡(luò)的參數(shù),部分參數(shù)設(shè)置如下:訓(xùn)練函數(shù)采用LM算法,學(xué)習(xí)函數(shù)采用GDM算法,隱層傳遞函數(shù)采用TANSIG函數(shù),最后將樣本數(shù)據(jù)投入網(wǎng)絡(luò)即可進(jìn)行學(xué)習(xí)訓(xùn)練.
根據(jù)上述理論部分的原理,編譯了相應(yīng)的MATLAB程序,計(jì)算出兩種模型對應(yīng)的權(quán)重分別為k1=0.1,k2=0.9.3種模型的擬合效果對比見表2,3種模型同一日期的預(yù)測值與相對誤差結(jié)果對比分別見表3和如圖4所示,表4列出了3種模型的誤差平方和對比結(jié)果.

表2 3種模型的擬合效果對比

圖4 3種模型預(yù)測值與實(shí)測值比較圖

表3 3種模型的預(yù)測值與相對誤差

表4 模型誤差平方和對比
由表2、表3、表4和圖4的結(jié)果分析可知:組合模型的擬合效果更好,預(yù)測值總體更接近于實(shí)測值,相對誤差總體小于各單一模型的相對誤差,誤差平方和明顯小于各單一模型的誤差平方和,和預(yù)期的目標(biāo)基本一致,與單一模型進(jìn)行對比,預(yù)測精度有了一定的提高,說明了該組合預(yù)測模型能夠用于大壩安全監(jiān)測中的位移預(yù)測問題.
本文提出的基于最優(yōu)加權(quán)法的組合預(yù)測模型,綜合運(yùn)用了ARIMA模型、BP神經(jīng)網(wǎng)絡(luò)模型和線性規(guī)劃的方法,將單一模型的優(yōu)勢進(jìn)行互補(bǔ).工程應(yīng)用實(shí)例表明,本文提出的組合模型可以用來預(yù)測大壩壩頂順河向位移的未來值,預(yù)估大壩的工作性態(tài);對于大壩安全監(jiān)測中不同監(jiān)測量的預(yù)測問題,難于選擇并確定模型的問題可以得到有效的解決.如何將組合預(yù)測模型的使用范圍擴(kuò)大到更多的模型中去,組合的條件以及更完善的組合方法的提出,將是接下來的研究方向.
[1] Granger C W J, Bates J. The Combination of Forecasts[J]. Operations research quarterly, 1969,20(4):451-468.
[2] 堯 姚,陶 靜,李 毅.基于ARIMA-BP組合模型的民航旅客運(yùn)輸量預(yù)測[J].計(jì)算機(jī)技術(shù)與發(fā)展,2015,12(25):147-151.
[3] 趙 杰,花向紅,劉 闖,等.ARIMA-BP組合模型在高鐵沉降預(yù)報(bào)中的應(yīng)用研究[J].測繪地理信息,2015,4(40):54-56.
[4] 趙成柏,毛春梅.基于ARIMA和BP神經(jīng)網(wǎng)絡(luò)組合模型的我國碳排放強(qiáng)度預(yù)測[J].長江流域資源與環(huán)境,2012,6(21):665-671.
[5] 俞凱加,儲冬冬,李 星.ARIMA-BP組合分析模型在某心墻堆石壩沉降量預(yù)測中的應(yīng)用[J].水電能源科學(xué),2015,6(33):72-75.
[6] 屠立峰,包騰飛,李月嬌,等.基于分形插值的ARIMA大壩預(yù)警模型[J].三峽大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,37(1):29-32.
[7] Olivier C, Courtellemont P, Colot O. Comparison of Histograms:a Tool for Detection[J].European Journal of Diagnosis and Safety in Automation,1994,4(03):335-355.
[8] 吳中如.水工建筑物安全監(jiān)控理論及其應(yīng)用[M].北京:高等教育出版社,2003.
[9] 楊 杰,吳中如,顧沖時(shí).大壩變形監(jiān)測的BP網(wǎng)絡(luò)模型與預(yù)報(bào)研究[J].西安理工大學(xué)學(xué)報(bào),2001,17(1):25-29.