黃軍勝,黃良珂,劉立龍,謝劭峰
(1.廣西壯族自治區水利電力勘測設計研究院,廣西南寧530023;2.桂林理工大學測繪地理信息學院,廣西桂林541004;3.廣西空間信息與測繪重點實驗室,廣西桂林541004)
大壩變形受水壓、時效及氣溫等綜合因素影響[1],具有隨機性與非線性的特點,建立大壩變形與影響因子關系的精確模型較為困難。傳統時間序列法和回歸分析法的非線性能力不足,且依賴于初始參數,無法滿足大壩變形預測的高精度要求。針對變形數據非線性特點,文獻[2]利用小波去噪方法對大壩變形數據進行分解,通過多尺度預測分析,有效提高了模型的泛化能力和非線性序列的預測精度。但小波分解不具備自適應的特點,小波函數與分解尺度通過經驗確定,難以實現最優分解。Huang等[3]于1998年提出了一種新的信號處理方法——經驗模態分解(EMD,empirical mode decomposition),該方法將非線性、非平穩信號自適應地分解為有限個相對平穩的分量,即可對數據進行平穩化處理。文獻[4-5]將EMD應用于變形監測、預測中,并通過與小波分解對比,可知EMD的數據處理過程更為簡單直觀,分解的層數由時間序列特征自適應確定,具備更好的自適應能力,為模型預測提供了較好的平穩環境。近年來,BP神經網絡在非平穩時間序列建模的應用中發展很快,其具有良好的非線性映射能力、自適應能力和學習能力[1,6]。但BP神經網絡模型對大壩變形非平穩序列的映射能力不足,且收斂速度慢以及易陷入極值等缺點使預測精度不理想。潘文超等提出一種全局尋優能力強、收斂速度快的果蠅優化算法(FOA,Fruit Fly Optimization Algorithm),算法原理簡單,受參數限制小,且具有魯棒性和辨識精度高等特點[7],能夠優化神經網絡內部結構,有效克服網絡自身缺陷[8,9]。文獻[10]利用FOA優化神經網絡,彌補了神經網絡先天不足,較快較準地找到網絡中最佳平滑因子,與文獻[6,11]利用思維進化算法(MEA)和粒子群算法(PSO)優化神經網絡一樣,雖然都提高了變形預報精度,但在網絡訓練過程中,較難捕捉學習到外部環境非線性變形量的規律,致使仿真精度欠佳。基于上述研究,本文將利用EMD對BP網絡進行外部環境平穩化處理;再利用FOA對BP網絡進行內部優化,即利用FOA的全局尋優能力強、搜索效率高等特點,為BP網絡提供最優初始權值和閾值,克服網絡自身缺陷,從而建立EMD-FOA-BP模型,應用于大壩變形預測。
經驗模態分解(EMD)作為一種常用的信號處理方法,能自適應地將非線性、非平穩時間序列的不同特征逐級分解,得到不同頻率的本征模函數(IMF)和一個趨勢項(B)。分解得到的每個IMF必須同時滿足2個條件[12]:①在待分解信號中,極值點的數目與過零點的數目相等,或最多相差1個;②在任一時刻,上包絡線(局部極大值的包絡)與下包絡線(局部極小值的包絡)的平均值為0。其分解過程如下[13]:
(1)利用三次樣條插值函數,將識別出的原始信號Y(t)所有極值點擬合出上包絡線Vmax(t)和下包絡線Vmin(t)。
(2)計算包絡線的平均值ω1(t),ω1(t)=Vmax(t)+Vmin(t)/2。
(3)令原始信號Y(t)與包絡線平均值ω1(t)做差,可得D(t),D(t)=Y(t)-ω1(t)。
(4)依據IMF的2個條件,得到第1個分量。若D(t)滿足條件,則作為第1個IMF,記為L1;若不滿足條件,則把D(t)視為新原始信號,重復步驟(1)~(3),直到滿足IMF條件為止。
(5)將(4)中所得分量L1從原始信號Y(t)中分離,得到殘差信號B1,B1=Y(t)-L1。
(6)再把B1作為新的原始數據,重復步驟(1)~(5),分解得到若干個IMF,直到Bn成為一個單調函數或者殘余量函數值小于給定的閾值時,停止分解。此時,原始信號Y(t)表示為Y(t)=∑ni=1Li+Bn。
果蠅優化算法意在幫助優化主體尋找最優解,其原理仿效于果蠅,利用靈敏的嗅覺器官感知空氣中某種味道,再利用敏銳的視覺器官到達目標位置。
FOA優化BP網絡的基本思路[9]是以果蠅個體的位置代表BP網絡中的權值和閾值,初次仿真所得誤差的平方和作為適應度函數,再給定每只果蠅隨機方向與距離,計算一次迭代中最佳味道濃度的果蠅位置,通過迭代尋優,得到全局最佳味道濃度的果蠅位置,即BP神經網絡的最優權值、閾值,其表達式過程如下[14]:
(1)初始化果蠅位置,即(Xi,Yi)=(X0,Y0)。
(2)給定每只果蠅能夠搜索到最優位置的隨機方向(XF,YF)和距離m,即(Xi,Yi)=(XF+m,YF+m)。
(3)計算預估最佳位置到原點的距離Di,Di=X2i+Y2i,并計算距離Di的倒數,即味道濃度判定值Si,Si=1/Di。
(4)將上式中味道濃度判定值Si帶入適應度函數F(味道濃度判定函數),得到該果蠅個體所處位置的味道濃度值Ti,Ti=F(Si)。
(5)搜索果蠅群中濃度最佳的果蠅Gbest(Ti取最小值[14]),即Gbest=min(Ti)。
(6)果蠅群利用視覺飛向目標,求解最佳味道濃度的果蠅位置(Xbest,Ybest),即求解本次迭代最優權值、閾值。
(7)重復執行步驟(2)~(5),迭代尋找最佳味道濃度,判斷當前迭代的最佳濃度是否優于前一次的最佳濃度,若是則執行步驟(6),更新最優權值、閾值。
(8)將最優權值、閾值引入BP神經網絡中,進行網絡訓練,實現優化目的。
以不同觀測時間段的大壩變形值組成一個時間序列{X(t),t=1,2,…,m},使用上述EMD對其進行分解得到n個本征模函數IMFi(i=1,2,…,n)和1個余量B。以前w期的大壩變形值為訓練樣本,將各IMF和余量B序列,分別建立經果蠅算法優化的BP神經網絡模型(FOA-BP),然后對后(m-w)期進行仿真。設各分量的預測值為YIMF1,YIMF2, …,YIMFn,和YB,模型預測流程見圖1,則最終的EMD-FOA-BP模型的預測值為Y=YIMF1+YIMF2+…+YIMFn+YB。

圖1 EMD-FOA-BP模型預測流程
本文利用平均絕對誤差(MAE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)進行各模型預測精度評定,分別為
MAE=1n∑nt=1Yt-Y^t
(1)
RMSE=1n∑nt=1(Yt-Y^t)2
(2)
MAPE=1n∑nt=1Yt-Y^tYt
(3)
式中,Yt為實測值;Y^t為仿真所得預測值;n為觀測總期數;t為觀測值對應期數。
以文獻[15]中64期等時間間隔變形數據為試驗數據,其變形趨勢如圖2所示。對大壩原始變形序列進行經驗模態分解,分解結果如圖3所示。

圖2 大壩變形的實測值

圖3 EMD的多尺度分解結果
由圖2的大壩變形時間序列可知,大壩變形呈明顯的非平穩、非線性特征,且伴隨著較強的隨機性。由圖3可知,利用經驗模態分解方法可以把原始時間序列中的高頻和低頻信息量進行逐級分離,有效地分解成相對平穩的分量,便于針對分量特征分別建立預測模型。
為了驗證分析本文提出模型的可行性及實用性,本文將以4種方案進行討論,4種方案分別是①方案1,BP神經網絡預測模型;②方案2,利用遺傳算法優化的BP神經網絡預測模型(GA-BP);③方案3,果蠅算法優化的BP神經網絡(FOA-BP);④方案4,基于EMD和FOA-BP神經網絡的預測模型(EMD-FOA-BP)。本文將前50期的大壩變形量作為以上4種方案的訓練樣本,后14期數據作為仿真樣本。方案1至方案3未對大壩原始數據進行外部環境的平穩化處理,直接進行建模預測;方案4利用 EMD對原始序列進行分解,再將各分量分別建模預測,疊加各預測值作為最終結果。4種模型的位移實測和預測結果對比列于表1,如圖4所示,殘差值結果如圖5所示。
由表1和圖4可知,方案1中BP神經網絡模型的殘差序列波動較大,其中有10期殘差絕對值超過0.4 mm,最大殘差出現在第51期,達到0.793 5 mm;方案2的GA-BP模型預測殘差序列中有4期絕對值超過0.4 mm,且都集中在預測末期,在第64期的最大殘差達到1.045 4 mm。方案1、2對比可知,GA-BP模型的預測精度較方案1的BP模型有所提高,但效果不明顯,且末期預測誤差逐漸增大,說明其長期預測能力不足。方案3 FOA-BP模型的預測殘差序列絕對值超過0.3 mm的只有第61期的0.435 5 mm,表明FOA有效克服了BP神經網絡易陷入局部最優、收斂速度慢等缺點,提高了網絡非線性映射能力,較方案1、2的預測精度明顯提高。方案4 EMD-FOA-BP模型中預測殘差序列絕對值小于0.1 mm的期數占總預測期數的78.5%,最大殘差絕對值僅為0.232 7 mm,較FOA-BP模型的精度又有提高,且總體預測較為穩定,末期精度依然較高。

表1 4種模型的位移實測、預測結果對比

圖4 4種模型的預測值和實際值對比

圖5 4種模型的預測殘差對比
由圖4中各模型預測值與實際值的對比可知:BP神經網絡模型預測值能夠擬合實際值的變化趨勢,說明該模型具有學習擬合的能力,但其精度較低,且在后期與實際值存在較大的預測誤差。FOA-BP模型和GA-BP模型在預測段的前期,兩者的預測精度較高,但在預測段的中后期兩者均出現較大波動,預測值與實際值偏差也較大,說明模型在訓練過程中學習速度跟不上原始序列的變化節奏,導致中后期仿真失效,同樣說明這兩個模型的長期預測能力不足。EMD-FOA-BP模型的預測值與大壩實際變形值吻合程度高,預測效果穩定,在預測段的后期仍然保持高精度預測值,說明EMD對大壩原始序列分解成相對平穩的分量,能夠使模型在訓練中更好的學習信號變化規則,從而提高了預測精度,且還能高精度預測更長期。
表2是4個模型的數據精度評定結果,由各項指標對比可知,EMD-FOA-BP模型預測精度最高,FOA-BP模型次之,而GA-BP模型預測精度又低于FOA-BP模型,BP神經網絡模型相對最差;遺傳算法與果蠅算法均能優化BP神經網絡內部結構,但果蠅算法的優化效果更為顯著,FOA-BP模型的均方根誤差為0.204 3 mm,優于GA-BP模型的0.455 6 mm;在FOA-BP模型優勢的基礎上,利用EMD將大壩變形序列分解出含波動成分、周期成分、趨勢成分的相對平穩分量,實現模型外部環境優化,使分量各自包含相同的變形信息,在一定程度上減少了不同特征信息之間的相互干涉,從而建立EMD-FOA-BP模型,保證了網絡的局部和全局最優,其預測精度明顯優于其他3種方案。
本文利用EMD和FOA分別對BP神經網絡進行外部和內部環境優化,建立EMD-FOA-BP預測模型應用于大壩變形預測中。EMD對非線性、非平穩序列的大壩變形數據實現平穩化預處理,FOA對BP神經網絡中最優權值、閾值的搜索起到明顯作用,實現內部結構優化,有效克服了BP神經網絡收斂速度慢、已陷入極小值等缺點,新模型增強了對非線性、非平穩函數的映射能力。實驗結果表明,EMD-FOA-BP模型的預測精度優于FOA-BP模型、GA-BP模型以及BP神經網絡模型。但是,由于試驗數據有限,EMD-FOA-BP模型在大壩變形預測應用中的可行性有待進一步驗證。