陳旭東,侯陣陣,郭進軍,2
(1.鄭州大學黃河實驗室,河南鄭州 450001; 2.南京水利科學研究院,江蘇南京 210017; 3.國家大壩安全工程技術研究中心,湖北武漢 430010)
我國是一個大壩工程建設大國,截至2019 年年底,共修建各類水庫大壩9.8 萬余座。 水庫大壩在發電、防洪、供水等方面發揮巨大作用的同時,其安全問題日益突出[1],對水庫大壩安全監測提出了更高要求。 變形是反映大壩在各種因素影響下綜合運行性能的最直觀、最重要的指標,建立大壩變形預測模型對于大壩長效運行及除險加固具有重要意義。 混凝土壩變形預測模型有統計模型、確定性模型和混合模型等[2]。 常用的統計模型有靜水季節時間(HST)模型和靜水溫度時間(HTT)模型[3-4]。 HST 模型基于諧波函數描述溫度效應,其難以揭示溫度周期性變化導致的大壩變形細節特征[5]。 而HTT 模型考慮了壩體溫度變化的滯后效應,但合適的溫度滯后期長度還有待探討[6]。 雖然統計模型在實際工程中得到廣泛的應用,但其不可避免的缺點是統計系數沒有物理意義。相反,確定性模型可以通過力學解析法或有限元、邊界元、離散元等構造環境自變量與大壩變形效應量之間的確定性關系式,反映大壩的具體物理特征,但是確定性模型中溫度分量和時效分量的有限元計算相當復雜[7]。 混合模型可以結合統計模型和確定性模型的優點,即先采用有限元法計算部分分量,再結合統計方法建立各分量之間的聯系。
在大壩變形預測方法中多元線性回歸簡單易行,但其難以處理變量間的非線性關系,易影響模型的預測精度與穩定性[5]。 隨著人工智能技術的發展,支持向量機(SVM)[8]、長短期記憶(LSTM)網絡[9]等用于構建大壩預測模型,提升了模型預測效果。 然而,機器學習模型在應用過程中普遍存在參數難以選取、易陷入局部極值以及過擬合等問題[10]。 隨機森林回歸(RFR)算法[11]能有效解決多參數之間的非線性映射問題,具有預測精度高、訓練速度快等優勢。 RFR 訓練過程中需要進行參數選取,許多學者[12]采用默認參數或網格搜索算法尋找最優參數,但該方法帶有主觀性,而參數選取是否合理會直接影響大壩變形預測結果。 麻雀搜索算法(SSA)[13]相較于其他智能優化算法具有較強的探索能力,在短時間內能找到全局最優點。 本文利用SSA 算法的優勢,對RFR 模型進行參數優化,利用有限元模型(FEM)計算水壓分量,考慮壩體溫度變化及其滯后效應,最終構建基于長期氣溫模擬的混凝土壩變形預測混合模型(SSA-RFR-FEMHTT 模型),模擬大壩的運行性能,以期為保障大壩穩定高效運行提供技術支撐。
大壩變形包括由水庫水位和壩體溫度波動引起的可逆變形以及由壩體混凝土蠕變、堿骨料反應等非彈性效應引起的不可逆變形[2]。 大壩變形預測統計模型形式如下:
式中:δ為位移矢量,δH為水壓分量,δT為溫度分量,δθ為時效分量。
1)水壓分量。 庫水壓力是大壩承受的主要環境荷載之一,水庫蓄水后庫水壓力作用在壩體上會使壩體產生變形。 根據壩體和基巖的彈性模量,用有限元法計算上游庫水深度相應的大壩變形量,并對兩者進行多項式擬合,得到計算水壓分量δH的公式如下:
式中:ai為擬合系數;H為庫水深度;n為H最大指數,對于重力壩n取3,對于拱壩n取4。
2)溫度分量。 大壩長期運行后,壩體溫度的改變主要受外界氣溫的影響,同時考慮到壩體混凝土溫度滯后效應,采用若干段前期平均實測氣溫作為溫度因子計算溫度分量δT,公式為
式中:Ti(p~q)為第i個前p天到前q天的平均實測氣溫,b0為回歸常數,bi為回歸系數。
壩體溫度存在季節性和周期性變化,為反映不同時間序列長度的氣溫變化對大壩變形的影響,本文利用長期的氣溫數據,劃分S1(2 個月)、S2(6 個月)、S3(1 a)和S4(2 a)4 個溫度變量集計算混凝土壩變形的溫度分量。 溫度因子選擇見表1。

表1 混凝土壩溫度效應模擬變量集
3)時效分量。 時效分量描述了大壩運行過程中因壩體混凝土材料徐變、壩基巖體蠕變以及自生體積變形等因素引起的不可逆變形。 對正常運行的大壩,時效分量變化規律為初期變化急劇、后期漸趨穩定。據此規律,采用線性函數和對數函數的線性組合能較好地描述時效分量δθ:
式中:d1、d2為擬合系數,θ為測點監測的某個時間,θ0為測點監測的初始時間。
麻雀搜索算法[13-14]是基于麻雀種群覓食和反捕食行為的一種新型智能優化算法,麻雀覓食過程就是算法尋優過程,該算法尋優能力強、收斂速度快。 在麻雀覓食過程中,發現者主要負責尋找食物以及提供覓食的區域和方向;加入者會不斷監視發現者,在發現者周圍覓食;警戒者主要負責偵察預警,當麻雀種群遭遇危險時,會進行反捕食行為。
設麻雀種群由n只麻雀組成,則麻雀種群可以表示為X=[x1x2…xn]。 發現者位置更新如下:
加入者位置更新如下:
警戒者位置更新如下:
式中:Xk
best為當前全局最優位置;β為步長控制參數,服從標準正態分布;fi為適應度;fg、fw分別為當前最優、最差適應度;C為[-1,1]內隨機數;ε為常數,避免分母為0。
隨機森林回歸(RFR)模型主要和決策樹(DT)、集成學習算法有關,決策樹是基本組成單元,集成學習算法是將多棵決策樹整合成森林的核心。
1)決策樹。 決策樹是一種簡單高效的學習算法,廣泛應用于分類和預測。 一棵決策樹的結構包括一個根節點、若干個內部節點和若干個葉子節點。 無論是分類決策樹還是回歸決策樹,都是從根節點開始自上而下對節點屬性進行劃分,生成倒置的樹狀結構。 決策樹學習效率高,但在決策樹構建過程中,每個特征處都會進行一次分裂,樹的深度較大,導致最終決策樹復雜度較高,且決策樹存在易過擬合、預測精度低等問題。
2)集成學習算法。 集成學習算法的基本理論是將眾多弱學習器結合在一起,生成一個強大的學習器。該算法可以充分利用單個弱學習器所提供的信息,集成后的學習器具有較高的精度,并且可以確保輸出結果的穩定性。 集成學習算法主要有Bagging 和Boosting,這兩種方法的共同點是均需重新放回抽樣,不同的是Bagging 抽取訓練集無須考慮權重,Boosting則需要考慮權重;另外,Bagging 中每一個訓練過程應彼此獨立,而對于Boosting 的訓練過程是基于上一次訓練結果的。
3)RFR 算法。 RFR 是集成學習算法發展過程中產生的一種組合算法,RFR 算法基于Bagging 方法將多棵分類回歸樹(CART)整合成森林,并將每棵CART輸出結果{h(x,θt),t=1,2,…,n}的平均值h(x)作為預測值:
式中:x為自變量,θt為服從獨立分布的隨機變量。
4)RFR 模型超參數。 RFR 模型包含眾多的超參數,有些蘊含在CART 中,有些來源于RFR 算法本身。這些超參數對于RFR 模型的預測結果具有不同程度的影響,因此需要對超參數進行調優,以提高模型擬合度和泛化能力。 為減少超參數調優的工作量,忽略部分影響較小的超參數,利用SSA 優化算法對影響較大的超參數進行調優。 待調優的超參數包括CART 的棵數和深度,這兩個參數影響著RFR 模型的復雜程度和擬合能力。
RFR 模型建立與計算流程見圖1,具體步驟如下:1)通過Bootstrap 隨機抽樣方式在原始數據樣本中獲取多個子樣本集;2)基于每個子樣本集,從特征集合中選取子特征集來構建CART;3)使每棵CART 能最大限度生長,直至滿足終止條件;4)將每棵CART 預測結果按式(8)進行集成后作為RFR 模型預測值。

圖1 RFR 模型建立與計算流程
在考慮混凝土壩物理特征和外界氣溫的情況下,采用SSA 算法優化的RFR 模型建立混凝土壩變形預測混合模型,具體建模流程見圖2,步驟如下:1)建立大壩有限元模型,模擬不同水位的大壩變形,得到上游水位與壩頂垂直變形關系曲線,對該曲線進行多項式擬合,得到水壓分量表達式;2)確定溫度和時效影響因子,將其與上一步驟中的水壓分量結合作為混凝土壩變形影響因子;3)將訓練集數據輸入SSA-RFR 模型,通過SSA 優化算法迭代尋優,得出RFR 模型的最優參數組合;4)將預測集數據輸入參數優化后的RFR模型,得到預測結果;5)選用平均絕對誤差(MAE)、均方根誤差(RMSE)和相關系數(R)3 個指標對混凝土壩變形預測混合模型的預測效果進行評估。

圖2 混凝土壩變形預測混合模型構建流程
以安徽省某混凝土壩為例進行實踐應用,擋水壩為同心圓變半徑的混凝土重力拱壩。 死水位101.0 m,正常蓄水位119.0 m,校核洪水位124.6 m,總庫容28.25×108m3。 壩頂高程126.3 m,最大壩高76.3 m,壩頂弧長419.0 m,壩頂寬8.0 m,最大壩底寬53.5 m。 水電站管理部門在16 個壩段的壩頂設置垂直變形測點(見圖3),并利用高程控制網監測壩體垂直變形,同時每月手動測量一次壩頂變形。 以18#測點為例,使用1981 年9 月16 日—2018 年12 月12 日的450 組垂直變形數據(下沉為正、上抬為負)進行分析,將前360組(1981 年9 月16 日—2011 年6 月13 日)數據作為訓練集,后90 組(2011 年7 月12 日—2018 年12 月12日)數據作為預測集。

圖3 某混凝土壩測點分布
采用有限元分析軟件ABAQUS 建立大壩有限元模型,考慮到壩體與地基的相互作用,基巖選取范圍為大壩上游方向與下游方向的基巖長度均取壩高的2 倍長度,大壩底部向下延伸的長度取壩高的1.5 倍長度,左邊及右邊基巖邊界到大壩的長度均取壩高的1.5 倍長度。
為了使壩體整體及拱端等部位的變形更加貼近實際情況,大壩有限元模型的邊界條件如下:對壩基巖體上下游基巖面方向的位移進行約束,對壩基巖體底面采用固定約束邊界條件,對壩基巖體左右基巖外側面方向的位移進行約束。 該有限元模型共劃分等參單元200 856 個,節點214 351 個,有限元模型見圖4。

圖4 某混凝土壩有限元模型
首先利用有限元方法計算初始日壩體測點在水壓荷載作用下的變形并將其作為初始變形,再根據上、下游實測水位,計算壩體在不同水壓荷載作用下各測點的變形值,最后得到各測點在不同水壓荷載下水壓分量相對于初始日的變形值。 根據有限元計算結果,通過多項式擬合得到混合模型水壓分量的擬合表達式為
基于上述有限元計算結果,根據18#測點的實測數據,采用SSA-RFR 算法對目標拱壩進行建模和預測分析。 對訓練集數據進行歸一化處理,利用SSA 算法對RFR 模型的決策樹棵數和決策樹深度進行尋優。SSA 算法迭代次數設為100,種群數設為20。 溫度變量集為S2 的RFR-FEM-HTT 模型和考慮不同溫度變量集的SSA-RFR-FEM-HTT 模型的超參數取值見表2,SSA 算法迭代收斂過程見圖5。

圖5 SSA 算法迭代收斂過程

表2 各變形預測混合模型超參數尋優值
基于SSA 尋優算法得到的最優參數組合分別構建混合模型,并輸入預測集數據進行預測。 為驗證模型預測性能的優劣,在相同訓練集數據的基礎上構建基于多元線性回歸(MLR)的HST、HTT 預測模型,同樣對預測集數據進行預測。 各變形預測模型對應的擬合曲線見圖6。 7 個模型均取得了較好的訓練效果,SSA-RFR-FEM-HTT 模型相較于SSA-RFR-HTT、MLR-HST、MLR-HTT 模型擬合效果更優,考慮不同溫度變量集的SSA-RFR-FEM-HTT 模型的擬合效果也有所不同。

圖6 各變形預測模型的擬合結果
7 個模型的預測效果比較見表3。 由表3 可知,相較于MLR-HST 模型,采用實測氣溫計算溫度分量的大壩變形預測混合模型的平均絕對誤差、均方根誤差均較小、相關系數均較大。 原因是MLR-HST 模型用諧波函數描述大壩變形溫度分量,忽略了壩體溫度的周期性差異與局部波動導致的大壩細微變形。 相對而言,采用實測氣溫計算溫度分量的HTT 模型考慮了壩體溫度實際變化及其滯后效應,更貼近大壩實際荷載情況。

表3 各變形預測模型性能比較
對基于4 個不同溫度變量集的SSA-RFR-FEMHTT 模型的模擬效果進行比較。 由表3 可知,以S2 溫度變量集(6 個月)為溫度因子的SSA-RFR-FEMHTT(S2)模型的預測性能最優。 大壩已經運行超過40 a,不考慮混凝土水化熱影響,壩體溫度和水溫的變化主要受外部氣溫變化的影響。 同時,大壩內部壩體溫度變化相對于外部氣溫變化存在滯后,最佳溫度變量集與大壩的體積和類型有關。 在本研究中目標混凝土壩以S2 溫度變量集為溫度因子的模型模擬精度最高,即目標混凝土壩溫度效應滯后6 個月最為合理。因此,選擇S2 作為長期氣溫的代表變量集。 同時可知,RFR-FEM-HTT 模型和SSA-RFR-FEM-HTT 模型的預測結果都好于MLR-HST、MLR-HTT(S2)模型的,但相比于RFR-FEM-HTT 模型的,SSA-RFR-FEMHTT 模型的預測值與實際值更接近,預測效果更佳。
SSA 算法參數優化前后模型預測性能對比見表4。參數優化后,與RFR-FEM-HTT(S2)模型相比,SSARFR-FEM-HTT(S2)模型的預測性能有所提高。 其原因是采用SSA-RFR-FEM-HTT 模型預測時,SSA 算法對RFR 模型的超參數決策樹棵數和深度進行全局尋優,解決了RFR 存在的參數選擇敏感問題,進一步提高了模型的預測精度,由此也驗證了所建立的SSARFR-FEM-HTT 模型的合理性和科學性。

表4 參數優化前后模型預測性能比較
綜上,SSA-RFR-FEM-HTT 模型的3 項評價指標明顯優于MLR-HST、MLR-HTT、RFR-FEM-HTT 模型的,表明SSA-RFR-FEM-HTT 模型預測性能更高、穩定性更好。 原因主要有三點:一是考慮壩體溫度變化的滯后效應,采用合適的氣溫數據序列長度分析壩體溫度變化對大壩變形的影響;二是結合有限元方法建立混合模型,能夠較好地反映大壩的具體物理特征,減少不確定因素的影響;三是利用SSA-RFR 算法解決多參數之間的非線性映射問題,有效模擬大壩變形與環境影響因素之間的函數關系,實現對大壩變形性態的準確預報。
應用麻雀搜索算法優化隨機森林回歸算法解決混凝土壩變形過程中多參數之間的非線性映射問題,建立了考慮混凝土壩物理特征、溫度變化和變形非線性特征的混凝土壩變形預測混合模型。 考慮到壩體溫度的滯后效應,合適的氣溫數據變量集可以更加精準地預測混凝土壩的變形過程,通過分析得出目標混凝土壩溫度變量集氣溫序列長度為6 個月時,模型的預測精度最高。SSA-RFR-FEM-HTT 模型相較于RFR-FEM-HTT 模型或統計模型預測精度更高,表明建立變形預測混合模型時考慮混凝土壩物理特征、溫度變化以及變量非線性關系時,可以顯著提高模型的預測性能。