李維華,婁健康,李 星
(1.黃河勘測規劃設計研究院有限公司,河南 鄭州 450003; 2.水利部黃河流域水治理與水安全重點實驗室(籌),河南 鄭州 450003; 3.河南省豫北水利勘測設計院有限公司,河南 鄭州 450046; 4.南京水利科學研究院,江蘇 南京 210029)
為充分開發利用水能資源,我國在西南地區修建了一大批200~300 m 特高拱壩,這些高拱壩普遍位于地質條件惡劣的深山峽谷地區。其運行過程中會承受如極端溫度荷載、超限制水位洪水荷載、地震荷載等多種不利荷載的疊加作用。保障高拱壩全生命周期安全穩定運行是當前大壩安全管理工作的重點。
大壩結構安全監控通過在大壩壩體內部及地基布置大量傳感器,實時感知和評估多種結構相關的物理量,如變形、滲流、應力、裂縫開度等[1]。準確有效預測大壩在多重環境荷載組合作用下的結構響應及行為變化,對于大壩運行維護、安全預警具有重要意義。變形是混凝土壩在多種荷載疊加作用下的真實反映,是安全監控的重點內容。大壩變形預測模型依據方法手段的不同,可分為統計模型和人工智能模型。傳統統計模型主要是將大壩變形分解為水壓分量、溫度分量和時效分量三部分,通過多重線性回歸、逐步線性回歸等統計學方法,依據輸入環境變量預測大壩變形[2]。傳統統計模型只能考慮輸入和輸出變量間的線性關系,而大壩變形是結構性態在環境因子作用下的非線性響應,使得統計模型預測能力受限,很難準確、高效、長期預測變形。
人工智能算法主要是通過人工神經網絡、支持向量機等機器學習算法,充分挖掘大壩監測數據里的信息,實現大壩環境變量和輸出變量的非線性關系精確模擬[3]。許多學者在人工智能算法預測大壩變形方面開展了研究,如:李明軍等[4]提出一種基于改進灰狼優化算法和支持向量機的大壩變形組合預測模型;陳優良等[5]提出一種基于極限學習機和彈性網絡支持的大壩位移預測方法,試驗結果表明該方法可簡化隱含層神經元個數選擇問題,便于參數調整;楊恒等[6]將支持向量機(SVM)和差分自回歸移動平均模型(ARIMA)結合,提出一種時間序列大壩位移預測分析方法,可實現大壩位移變化趨勢的精確預測,具有一定實用價值。然而這些方法普遍存在易陷入局部最優、過擬合、調參過程復雜等缺陷,限制了其應用。此外,這些方法并未考慮大壩變形受多環境因素交叉耦合的影響,因此有必要研究考慮多環境因素交叉耦合影響的大壩變形預測方法。
高斯過程回歸是一種基于貝葉斯理論的機器學習方法,它可為概率回歸預測提供一個靈活簡捷的建模框架。已有許多學者應用高斯過程回歸解決實際工程問題[7-8],高斯過程回歸在解決高維度小樣本問題時優勢顯著,可有效評估監測信號的不確定性行為,精度高、泛化能力強。
協方差函數是高斯過程回歸的重要組成部分,也是高斯過程回歸實現非線性預測的基礎。然而常規線性協方差函數只能處理平穩序列,大壩變形時間序列是一種非平穩時間序列,因此有必要研究組合協方差函數以更好地考慮大壩變形時間序列的非平穩性。
高斯過程回歸是一類隨機變量的集合,任意有限個隨機變量具有一致的聯合高斯分布,典型高斯過程f(x)(x為影響大壩位移的環境因子,如水位、溫度、時效等)可以用其均值m(x)和協方差函數C(x,x′)(x為訓練集的模型輸入,即訓練集對應的環境因子;x′為測試集的模型輸入,即測試集對應的環境因子)來近似描述[9],為了便于簡化,均值函數通常設置為0。
式中:ε為獨立同分布的白噪聲,即ε~N(0,),σn為噪聲標準差,任何有限數目觀測值均可形成高斯過程[9]。
高斯過程的后驗分布可以通過對給定數據訓練集和測試集進行聯合先驗分布來推導:
式中:f?為用于驗證的新輸入數據;X為輸入監測變量;為輸出結果的平均值;v(f?)為驗證集上模型的輸出結果。
此外,高斯過程不僅能給出預測值,還能利用協方差函數估計輸出預測值的置信度。作為一種非參數估計方法,高斯回歸的預測值只取決于輸入變量和觀測值,而模型超參數Θ可視為高斯過程回歸的超參數。最大似然估計是高斯過程回歸的常用參數估計方法,最大似然函數通常可由貝葉斯理論獲得:
參數估計通過最大似然估計獲取。
協方差函數控制模型估計未知函數時數據平滑程度,其選取對模型非線性重建性能影響顯著。最常見的協方差函數是平方指數協方差函數,其主要應用于平穩序列建模,而大壩位移時間序列是一個典型受多因素影響的非平穩時間序列。本研究為進一步提高高斯過程回歸模型對非線性時間序列的建模能力,引入組合協方差函數概念,通過組合Matern 核函數和白噪聲核函數,構造如式(4)所示的非平穩協方差函數,以更好地體現輸入和輸出變量間的非線性關系。其中,白噪聲核函數主要用于解釋信號的噪聲是獨立和正態分布的,式(4)中參數noise_level等于該白噪聲的方差。
式中:k(xi,xj)為協方差函數;xi、xj為第i個和第j個樣本數據;d(xi,xj)為歐氏距離;Kν(·)為修正貝葉斯函數;ν為數據序列的均值;l為修正線性激活函數值。
為量化評估上述方法和現階段常用的多重線性回歸(HST)、隨機森林(RF)和支持向量機(SVR)的預測精度和泛化能力,本文選擇確定系數R2、均方誤差MSE和平均絕對誤差MAE作為大壩變形預測的評價指標。
某混凝土高拱壩,位于黃河上游,壩型為混凝土雙曲拱壩,最大壩高為105 m,水庫正常蓄水位為700 m、死水位為660 m。大壩布置5 組正、倒垂線監測點,其中:PL 為正垂線,用于監測大壩壩體位移;IP 為倒垂線,用于監測大壩壩體相對地基的位移。
本研究選用2014 年1 月1 日至2017 年12 月31日大壩正、倒垂線1 451 個監測樣本數據用于模型建立和驗證,其中2014 年1 月1 日至2016 年12 月31日共計1 086個監測樣本數據用于模型訓練和驗證,2017 年1 月1 日至2017 年12 月31 日共計365 個監測樣本數據用于模型測試和泛化能力評估。圖1 為2014—2017 年水庫水位變化曲線,可以看出庫水位基本呈現以年為周期的規律性變化,平均年變幅為10.425 m 左右。選用3 個典型正垂線監測點PL13-1、PL15-1 和PL16-1 用于評估模型的有效性。3 個典型監測點的位移過程線如圖2 所示。

圖1 2014—2017 年水庫水位變化曲線

圖2 3 個典型監測點位移過程線
利用3 種常用的大壩變形預測分析方法即多重線性回歸、隨機森林和支持向量機方法作對比來驗證本文方法的泛化能力,3 個典型大壩位移監測點位移預測值與實測值對比見圖3~圖5。

圖3 PL16-1 監測點位移預測值和實測值對比

圖4 PL13-1 監測點位移預測值和實測值對比

圖5 PL15-1 監測點位移預測值和實測值對比
可以看出,本文所提的基于組合核函數的高斯過程回歸的預測值與實測值趨勢基本保持一致,而多重線性回歸方法存在一定程度的偏差。這主要是由于高斯過程回歸對非線性關系的擬合能力更強,因此在長序列大壩變形分析上更具優勢。3 種量化評估指標下本文方法和對比方法在測試集上的回歸性能評估結果見表1,可以看出,高斯過程回歸大壩變形預測方法性能優于對比方法,這驗證了其泛化能力。

表1 不同方法測試集性能評估結果

續表1
圖6 為本文方法和對比方法的回歸結果殘差對比圖,可以看出,本文方法的殘差分布更集中,更接近于0,且其超過1.5 倍閾值區間實測值數目顯著少于對比方法的,這說明本文模型的魯棒性更好。

圖6 本文方法和多重線性回歸(HST)、隨機森林(RF)、支持向量機(SVR)方法殘差對比
本文提出基于混合協方差函數高斯過程回歸的大壩變形非線性預測分析方法,可簡捷地建立大壩結構行為預測模型,并給出結果的概率非參數估計。計算結果表明,該方法在大壩典型監測點位移分析中效果較好,確定系數、均方誤差等評估指標均顯著優于現有主流大壩變形預測方法,說明了該方法預測大壩變形具有優勢。此外,該方法可進一步用于識別潛在大壩監測數據異常信息,可為大壩結構性態評估與風險鑒定提供參考。