鄺賀偉 張 研,* 景小青
(1.廣西建筑新能源與節能重點實驗室,桂林541004;2.桂林理工大學土木與建筑工程學院,桂林541004;3.中國水利水電第四工程局有限公司,西寧810007)
隨著我國建筑規模的擴大和施工技術的提高,樁基礎因施工便捷、質量可靠、承載能力強等優點被廣泛應用到工業建筑、道路橋梁、邊坡防護等工程[1-3]。在樁基礎中靜壓管樁因施工效率高、抗震性能好、工程造價低、環保性價比高等明顯優勢不斷得到推廣和應用[4]。靜壓管樁單樁極限承載力是衡量樁基礎穩定性和檢測施工技術的重要指標之一,準確掌握單樁極限承載力相關數據對工程方案設計、技術標準制訂、施工人員安全等具有重要意義。
以往獲取靜壓管樁單樁極限承載力都是在施工現場測試獲得,此過程費時、費力,且試驗樁有限,很難單準確獲取單樁極限承載力,成為眾多學者關注的熱點;為此,學者們開展了一系列試驗,試圖總結當中規律建立單樁極限承載力的經驗公式。如:邵艷等[5]針對PHC管樁加固工程采用靜壓樁的載荷試驗,給出了靜壓管樁單樁極限承載力的經驗公式;王俊林等[6]利用靜壓管樁的單樁極限承載力試驗,探討單樁極限承載力與最終壓力關系分布關系,并給出極限承載力求取公式。經驗公式雖能建立主要影響因素與承載力之間的對應關系,然而考慮的因素相對簡單,很難涵蓋多種影響因素,并且經驗公式存在主觀性強、適用性低等不足。因此,亟待提出更加經濟、精確、高效的靜壓管樁單樁極限承載力預測方法。
隨著計算機技術的不斷成熟,人工智能機器學習方法廣泛應用到樁基工程當中[7-8]。然而,機器學習方法在靜壓管樁單樁極限承載力相關方面應用較少,史永強等[9]運用主成分優化的神經網絡模型對靜壓管樁單樁極限承載力進行預測,建立單樁極限承載力與內摩擦角、樁側土的含水率、液性指數、樁的長徑比、重度等13個影響因素的非線性映射關系,并與實測值比較突出該模型的優勢。然而神經網絡本身仍存在著一些不完善之處,如:對學習樣本依賴性過強,當樣本過少時,預測精度難以保證;當樣本過多時,泛化能力差。有必要尋求更加合理的智能方法對單樁極限承載力進行預測。
相關向量機方法(Relevance Vector Machine,RVM)是近年來流行的機器學習方法[10],它是基于馬爾科夫性質、貝葉斯理論、最大似然理論方法和自動相關決定先驗的提出的,避免了核函數必須滿足Mercer條件,具有更好的稀疏性,提高了模型預測效率[11]。然而當輸入樣本影響因素(即樣本維數)較多的時候,會降低RVM模型學習效率,增加計算成本。為此,本文采用主成分分析法[12](Principal Component Analysis,PCA)進 行降維,選取貢獻率較高的獨立因素,通過RVM模型建立獨立因素與單樁極限承載力之間的非線性映射關系,提出基于PCA-RVM的靜壓管樁單樁極限承載力預測方法,為靜壓管樁單樁極限承載力的獲取提供了一條新途徑。
PCA作為因子分析最常用的一種方法,將多個因素通過降維的方式篩選出貢獻率最大且無相關的少數主要影響因素,排除一些多余的因素信息,增強模型預測精準度。設數據集共有樣本n個,每個樣本的影響因素有p個,構建n×p階矩陣。

對矩陣協方差計算時,為避免量綱不一致造成的影響需要對其進行標準化處理。

標準化處理后的矩陣特征方程為|λ-IR|=0,求特征根λ1≥…λn≥0,根據特征根計算出對應的正交單位化特征向量為e1,e2,…,en。
計算各影響因素貢獻率即累計貢獻率,第i個影響因素貢獻率為,前q個因素的累積貢獻率為,其中λ1,λ2,…,λn為對應的影響因素。
RVM基于貝葉斯原理運用到回歸問題時。要求在權值ω上,定義超參數α影響的獨立先驗概率[13]。同時,基于先驗參數結構下的相關決策理論來除去不相關聯的點,可獲得稀疏化模型。設訓練的樣本集為{xn,tn|n=1,…,2,N},xn表示輸入訓練樣本輸入,tn表示目標輸出且獨立分布。建立xn與tn函數關系:


式中:xc為核函數中心;σ為高斯核寬度。
假設tn為相互獨立分布,訓練集的似然函數:

隨著參數大量引用,在最大似然估計ω和σ2時可能會產生過適應現象,為避免類似現象發生,我們可以附加強制條件在一些參數上。假設參數ωn服從均值為零、方差為的高斯條件概率分布:

其中,α是決定權值ω的先驗分布的N+1維超參數。超參數α和噪聲參數σ2服從Gamma先驗概率分布:

若RVM參數先驗概率分布為P(ω,α,σ2|t),則訓練樣本后驗概率分布如下:

由于后驗概率分布P(ω,α,σ2|t)通過積分不能夠直接算出,故分解為

通過式(12)可得出權向量ω的分布為

運用RVM進行訓練樣本的學習,找出超參數α和σ2。在后驗分布概率基礎上找出最優值αMP和,假設待測樣本為x*,則預測值t*分布如下:

其中,預測概率分布計算中,函數是兩個高斯正態分布相乘得到,所以關于t*的預測分布也服從高斯正態分布,即:

靜壓管樁處于地下深層,單樁極限承載力影響因素選擇時經常會遇到不確定性、隨機性等一系列問題。運用PCA分析各影響因素之間的關系及因素與單樁極限承載力之間的相關性,采用降維的方法優選最主要因素變量剔除無關因素,再對主要因素加以分析采用RVM建立預測模型是本文采用的思路。根據文獻[9]綜合選取樁側土的含水率w、塑性指數Ip、孔隙比e、壓縮模量Es、黏聚力c、內摩擦角φ、重度γ、發揮上覆土層側摩阻力的樁段長度L1、樁端進入持力層長度L2、樁端持力層的標貫數N、樁的長徑比L/D、靜壓管樁施工終壓力Pu、液性指數IL等13個常規數作為靜壓管樁單樁極限承載力Qu影響因素,隨機選取28組樣本進行訓練,剩余的6組作為預測樣本(表1)。對表1標準化處理后的34組數據的13個影響因素進行主成分分析,得到相關系數矩陣如表2所示。

表1 靜壓管樁單樁極限承載力數據集Table 1 Data set of ultimate bearing capacity of static pressure pipe pile

表2 相關系數矩陣Table 2 Correlation coefficient matrix
由表2可知,影響單樁極限承載力的w、Ip、e、Es、c、φ、γ、L1、L2、L/D、Pu、IL等13個影響因素之間的相關性絕對值都在0到1之間,且前6個因素之間的關系比較密切。基于PCA基本原理可計算出每個因素具體影響狀況及貢獻率,如圖1所示。

圖1 各因素貢獻率及累積貢獻率Fig.1 Contribution rate and cumulative contribution rate of each factor
圖1 可知,樁側土的含水率w、塑性指數Ip及孔隙比e各自貢獻率最大,壓縮模量Es、黏聚力c和內摩擦角φ其次,其余因素貢獻率較少甚至可以忽略。前6個因素的累計貢獻率累積89.13%超過了85%,說明其包含了13個因素代表的信息量。建立基于單樁極限承載力Qu與w、Ip、e、Es、c、φ等6個因素關系的PCA-RVM的預測模型,新的6×34矩陣數據代替了原來的13×34矩陣數據,有效降低了模型維數,優化了相關因素,提高了運算效率和模型預測的準確率。
本文通過主成分分析法對文獻[9]選取的13個影響因素轉化成6個因素變量。依據PCARVM回歸預測模型的原理,建立了基于6個因素變量的PCA-RVM相關性模型,如圖2所示。

圖2 基于PCA-RVM的靜壓管樁單樁極限承載力模型Fig.2 Ultimate bearing capacity model of static pressure pipe pile based on PCA-RVM
(1)根據主成分分析后的主要因素變量數據,并對其進行分析與整理,其中影響單樁極限承載力的6個因素變量為輸入,單樁極限承載力為輸出,先對其進行標準化處理。

式中:a i,b i為標準化后的值;x i為第i個影響因素。

(2)基于標準化處理后的6×34組數據,選取前28組數據作為學習訓練樣本,用于模型的擬合訓練學習;剩余6組數據作為預測樣本,用于模型預測效果的檢測。
(3)建立PCA-RVM預測模型,以模型訓練28組數據樣本預測值和實測值的誤差對比作為精度依據,通過調整迭代次數、超參數尋求符合精度要求的PCA-RVM模型參數。訓練誤差曲線如圖3所示。

圖3 樣本訓練結果Fig.3 Sample training results
(4)將PCA-RVM模型對6組樣本預測的結果與相應實測值進行多個指標的對比分析(平均相對誤差、均方差等),驗證PCA-RVM預測模型的精確度及可靠性。
本文引用上述建立的PCA-RVM模型對工程實例進行分析和預測,并在相同條件下與文獻[9]所提出的BP神經網絡在靜壓管樁單樁極限承載力中的預測結果進行對比。初始化程序,綜合考慮并選取具有較強的局部插值能力的高斯核函數作為PCA-RVM模型核函數。為了提高PCA-RVM預測模型的精度,分別選取高斯核寬度值0.3、0.4、0.5、0.6、0.7,并用不同高斯核寬度值預測結果的平均相對誤差進行比較,如圖4所示。
由圖4可知,選取高斯核寬度σ=0.6時得到的平均相對誤差最小。故選用核寬度σ=0.6,初步擬定迭代次數為1 000。基于訓練樣本及選取的核寬度參數建立預測模型,對預測樣本數據進行預測,如表3所示。

圖4 不同核寬度的平均相對誤差Fig.4 Mean relative errors of different kernel widths
由表3可知,在2種模型預測結果中可以得出,PCA-RVM模型預測結果最大相對誤差絕對值僅有1.16%;GABP模型最大相對誤差達到9.09%。為更直觀對比2種模型預測結果的分布特征,如圖5所示。

表3 不同方法的預測結果比較Table 3 Comparison of prediction results of different methods

圖5 不同方法預測結果Fig.5 Prediction results of different methods
由圖5可知,PCA-RVM模型每個預測值均比文獻[9]中BP神經網絡模型預測值更接近真實值,PCA-RVM模型的預測精度更高;而BP神經網絡模型的預測值明顯偏離了實測值,尤其是29、31、34號誤差過大。為了進一步對比2種預測模型的整體精度和離散狀況,分別計算平均相對誤差ARE和均方差FMSE,來評判預測結果的可信賴程度和離散程度,公式如下:

式中:n為樣本數量;y i為實際值;y'i為預測值。
直觀表示ARE和FMSE的具體數據如表4所示。

表4 平均相對誤差及均方差Table 4
由表4可見,本文提出的PCA-RVM預測模型平均相對誤差為0.54%,均方差為20.02;BP預測模型平均相對誤差為6.20%,均方差為200.22。PCA-RVM模型均比BP神經網絡預測模型更有優勢。本文提出的PCA-RVM模型整體精度高、離散性小、可信度強。
(1)靜壓管樁單樁極限承載力影響因素眾多,極限承載力與影響因素之間存在著錯綜復雜的非線性映射關系,本文提出的PCA-RVM預測模型能夠準確篩選出因素變量并建立相對應的回歸預測模型,把復雜的問題簡單化,利于解決實際問題。
(2)實例表明,PCA-RVM模型預測極限承載力得出的結果均優于BP神經網絡預測模型。說明了PCA-RVM模型選取因素變量簡單準確,參數優化好、精確度高、離散度小、稀疏特性強,對學習少量數據進行預測的問題上具有明顯的優勢。
(3)PCA-RVM模型在實際工程應用中,學習資料的廣泛性利于篩選出貢獻率較大的影響因素,總結更完整的非線性關系,提高PCA-RVM模型的精確度與廣泛性;也可以結合靜壓管樁施工現場的實際狀況及工程師提出的寶貴意見合理調整參數和因素,可以極大改善PCA-RVM模型適用性。