李 明
(河南省水利勘測設計研究有限公司 安徽分公司,合肥 230601)
建立合理有效的大壩安全預報模型,對掌握其性態變化、保證大壩安全運行都具有重要意義。目前,大壩安全監控通常采用統計模型、確定性模型和混合模型[1]。由于建立在觀測誤差的數學期望為零、呈正態發布、各次觀測相互獨立的統計學前提下,因此這類數學模型回歸易失敗、預報精度較低,無法滿足實際工程要求。
人工神經網絡兼具高度容錯性、魯棒性以及出色的非線性逼近性能,被廣泛應用于回歸擬合、聚類、模式分類、優化計算等眾多領域。在大壩安全監控中,可考慮使用人工神經網絡建立高精度監測預報模型。
BP神經網絡,即采用誤差反向傳播算法的人工神經網絡,由輸入層、一個或多個隱含層以及一個輸出層3部分組成[2]。見圖1。

圖1 3層BP神經網絡的結構

BP算法包括信息的正向傳遞過程和誤差的逆向傳播過程。
1) 信息的正向傳遞。公式如下:
隱含層第i個神經元的輸出:
(1)
輸出層第j個神經元的輸出:
(2)
2) 誤差的逆向傳播。按照訓練規則,連接權值與閾值的調整增量應與誤差梯度成比例 ,即:
(3)
式中:η為學習率。
調整隱含層與輸出層之間的權值wij和閾值b2j(即從第i個輸入到第j個輸出):

(4)

(5)
調整隱含層與輸入層間權值wmi和閾值b1i(即從第m個輸入到第i個輸出):

(6)

(7)
BP神經網絡理論依據堅實,推導過程嚴謹,具有實現復雜非線性映射的能力,特別適合求解內部機制復雜的問題。但BP網絡也具有一些難以克服的局限性:
1) 需設參數較多,且參數的選擇并無有效方法。到目前為止,上述參數的選定尚無理論依據,只可通過經驗給出粗略范圍,致使算法穩定差。
2) 訓練過程學習率敏感。若學習率太小,收斂可能很慢;若選得太大,又可能出現學習不穩定的現象。目前,學習率的選擇缺乏簡單有效的方法。
3) 易陷入局部最優。從根本上,BP算法是一種梯度最速下降算法,易出現局部極小值的問題,當位于局部極小值點時,就可能得出錯誤的結果。
4) 初始權值敏感。網絡對初始權值的選取較為敏感,初始權值的改變將影響網絡的收斂速度和精度。
5) 樣本依賴性。當有新學習樣本加入時,將會影響已學習過的樣本。如果樣本集合代表性差、矛盾樣本多、存在冗余樣本,網絡就很難達到預期的性能。
針對BP算法的不足,本文進行以下改進:
1) 采用特征選擇算法精簡模型輸入變量,大幅降低網絡結構的復雜度,有效提升模型的擬合和外延預測能力。對于包含n個樣本、M個變量屬性的輸入變量系X={xi|xi∈RM,i=1,2,…,n}列,本文采用逐步回歸的方法進行特征選擇,設置信度a=0.1,通過式(8)進行輸入變量的引入剔除:若Fp>Fain(1,n-k-1),則將變量xp引入模型,并對模型中已有變量重新進行顯著性檢驗;若Fq (8) (9) (10) (11) 2) 引入增減量因子,構造可變學習率的網絡學習算法。標準最速下降BP法中,學習率是一個不變常數,網絡學習易過擬合。故需引入學習率增減量因子:當誤差以減小的方式趨于目標時,修正方向正確,可以增加學習率,在原基礎上乘以學習率增量因子;當誤差增加超過一定范圍時,說明前一步修正不正確,應減小步長,在原學習率基礎上乘以學習率減量因子。 (12) 式中:kinc為學習率增量因子;kdec為學習率減量因子。 3) 引入動量因子,增加學習算法的穩定性。 (13) 式中:t為訓練次數;η為學習速率;α(0<α<1)為附加動量因子;αΔw(t)為附加動量項。 取某混凝土拱壩15#壩段IP-01測點的徑向位移監測數據為研究對象,建立基于改進BP神經網絡的預測模型,同時構建對應的統計模型,進行對比分析。 根據安全監測原理[1],壩體位移主要受水壓、溫度和時效因素影響,可分解為: δ=δH+δT+δθ (14) 式中:δ為測點位移測值;δH、δT、δθ分別為水壓分量、溫度分量、時效分量。 該壩屬于混凝土拱壩,在水壓作用下產生的位移水壓分量與大壩上游水深的1~4次方有關,選取上游水深作為水壓分量的因子: (15) 考慮到該壩已經運行多年,選用時間周期項模擬壩體溫度場的變化,具體形式為兩組諧波因子: (16) 時效分量應能表征壩體隨時間變化而產生的非線性位移,此處采用多項式附加對數時效因子: δθ=c1(θ-θ0)+c2(lnθ-lnθ0) (17) 式中:時效項模型輸入量為(θ-θ0)、(lnθ-lnθ0)。 基于Matlab平臺,編程實現上述改進BP神經網絡算法。模型輸入、結構和參數設置為: 1) 輸入歸一化。考慮到輸入層的數據具有不同的量綱,宜對輸入數據進行規范化處理,將輸入樣本限制在[0.1,0.9]之間,具體通過mapminmax函數實現。 2) 網絡結構。本文選用的BP神經網絡包含一個隱含層:輸入層根據樣本輸入量的維數,節點數為9;隱含層結點數根據經驗公式,經過多次試算,大致確定為18時訓練過程收斂最快,效果最好;輸出結果為位移監測量1項,確定輸出層結點數為1。因此,該大壩變形預測模型的神經網絡結構確定為9-18-1的形式。 3) 傳遞函數。隱含層使用Logsig,輸出層使用Purelin函數。 4) 訓練參數。訓練方法采用學習率可變附加動量因子的BP算法,據此設定訓練參數:最大訓練次數1 000,學習率為0.01,目標誤差為1e-5,噪聲強度0.01,動量因子0.7,學習率增量因子1.05,學習率減量因子0.8。 5) 初始權值。初始權值選擇極大影響著網絡的學習速度和效果。初始權值過大或過小都會對性能產生影響,通常將初始權值定義為較小的非零隨機值,經驗值為(-2.4/F,2.4/F),其中F為權值輸入端連接的神經元個數。由此初始權值可確定為(-0.3,0.3)。 確定完以上參數后,將歸一化處理后的樣本數據輸入網絡中進行訓練,待網絡收斂,即得到用于大壩變形預測的BP神經網絡模型。 選取2015年7月6日至2017年12月19日共300組數據作為分析資料,其中前240組數據作為學習樣本,后60組數據作為預測樣本,各模型的擬合和預測結果見圖2、圖3,預測精度見表1。 建立的統計模型表達式: (18) 為驗證改進BP神經網絡的混凝土壩變形預測模型有效性,將均方根誤差(RMSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)作為預測效果指標,與上述統計模型進行對比,獲得各模型的擬合、預測結果見圖2、圖3,預測精度見表1。 圖2 模型擬合結果 圖3 模型預測結果 表1 模型預測精度 由圖2可知,改進的BP網絡模型擬合效果較好,擬合結果與實測值幾乎重合;而統計模型結果與實測值前期基本重合,后期出現大范圍的偏差。由圖3所示預測結果可知,改進的BP網絡模型充分發揮了非線性逼近能力,預測值與實測值貼合緊密,具體反映在殘差過程線上就是殘差在坐標零軸上下波動;統計模型預測結果與實測值偏差較大,已不能表征實際位移的變化趨勢。從預測效果指標上看,較傳統統計模型,改進BP網絡模型的誤差分別降低68.75%、75.17%和74.62%。由此,改進的BP網絡模型較統計模型預測效果更好,精度更高;且能直觀、準確反映出位移的變化趨勢,在工程中具有實際意義,建立監控模型時可優先考慮選用。 1) 本文從逐步回歸輸入變量特征選擇、可變學習率和附加動量因子學習算法等角度改進了BP神經網絡模型,并將其用于大壩的變形預測中。結果表明,改進的BP網絡模型擬合和預測精度值均要明顯高于傳統統計模型,且能直觀、準確地反映位移變化趨勢,在工程中具有實際意義;同時也證明了該法用于大壩變形監控中具有一定的實用性與可行性。 2) 為進一步提高BP神經網絡的監測預報能力,可引入優化算法,作如下改進:為減弱早期數據對預測結果的影響,實現對觀測資料的實時更新處理,可在BP神經網絡誤差計算和模型參數中分別引入遺忘因子,對數據影響權重進行動態調整[3];將BP神經網絡與一些優化算法相結合,以實現算法特性的互補,如遺傳-神經網絡算法,利用BP網絡的梯度下降算法,實現最快減少誤差,利用遺傳算法的群體搜索策略,避免過度依賴梯度信息,陷入局部最優[4]。


3 工程實例
3.1 模型輸入量



3.2 大壩變形預測模型的實現
3.3 結果分析




4 結 論