梅瀚雨, 王 騎,2, 廖海黎,2, 劉珉巍
(1.西南交通大學 橋梁工程系,成都 610036;2.西南交通大學 風工程四川省重點實驗室,成都 610036)
現代橋梁結構向跨度更大、更柔的方向發展,這將使得其結構剛度小、阻尼低而對風荷載的敏感性逐漸增加。在大跨度橋梁抗風設計過程中,顫振性能是尤為關鍵的設計控制因素。對于流線型箱梁而言,由于其各方面氣動性能優越(顫振、渦振等)且制造工藝成熟,目前已在多座大跨度橋梁中使用[1-4]。一般地,在橋梁設計初期,設計者可利用自由振動風洞試驗或數值模擬計算流體力學(computational fluid dynamics, CFD)方法可以較為準確地評估橋梁斷面的顫振性能。然而,目前風洞試驗的成本較高、試驗周期長,CFD技術仍存在精度不夠、計算成本較大等問題。另一方面,基于Scanlan等[5]提出的線性自激氣動力理論并結合斷面的顫振導數,也可以在橋梁設計初步階段較為快速地掌握其氣動性能,但此類顫振分析方法推廣至工業領域仍存在一定的障礙,例如:顫振導數的獲取仍無法擺脫風洞試驗。盡管公路橋梁抗風設計規范[6]或目前已有的一些快速預測流線型向量顫振臨界風速的方法[7]較為便捷,但此類簡化計算公式仍然存在參數識別困難、精度不足等問題。
機器學習方法是一種基于數據驅動的數據挖掘方法,近年來被學者廣泛應用到風工程領域。顧明等[8]在2003年利用神經網絡預測了某大跨屋蓋表面平均風壓;Jung等[9]利用神經網絡識別了多種斷面形式的顫振導數;Lute等[10]在2009年利用支持向量機識別了橋梁斷面顫振導數并計算了顫振臨界風速,相比于簡化公式的計算結果,該方法在3座已建成橋梁上的預測精度更高;Wu等[11]利用基于元胞機優化的人工神經網絡預測了橋梁斷面在紊流下的加速度響應時程,其結果并不理想,究其原因在于人工神經網絡模型不能有效挖掘輸入時間序列的隱含信息;Yu等[12]利用Elman神經網絡對短期風速進行了多步預測;李維勃等[13]利用徑向基函數對冷卻塔風場進行了重構;Huang等[14]基于BP神經網絡并結合本征正交分解(principal components analysis,POD),對建筑高層表面風荷載進行了預測;Li等[15]基于現場實測數據,利用決策樹模型和支持向量機回歸對大跨度懸索橋渦激共振事件分別進行了模態分類的模型構建和渦振響應回歸模型的構建,其預測精度較高,該研究結果對于結構健康監測系統有極大的實用價值;李喬等[16]在2003年利用人工神經網絡系統識別了橋梁斷面的靜力三分力系數,但由于當時人工神經網絡模型的發展未得到充分的重視,其模型本身仍存在較大的提升空間,例如激活函數的選取、數據預處理的方式等。陳訥郁等[17]基于同濟大學既有大跨度橋梁試驗數據成果并利用人工神經網絡,識別了扁平箱梁和倒梯形箱梁的三分力系數和顫振導數,其結果表明:人工神經網絡模型對于三分力系數的預測精度符合預期,但對顫振導數的預測精度較差。
以上研究成果表明,機器學習算法可以有效地與風工程學科進行交叉,且研究結果對工程設計有較高的參考意義。然而,以上眾多的研究均只考慮了單個機器學習算法,實際上,不同的算法所擅長的問題各不相同。另外,數據預處理、模型訓練方法、算法超參數調優等問題的處理方式也不夠完善。考慮到流線型箱梁斷面相比于其他類型斷面(例如:桁架梁、Π型梁等)更具有整體性,斷面的試驗模型更易于制作,且斷面信息較易于量化描述,基于此,本文旨在利用機器學習算法所具有的強大的非線性映射擬合能力以及預測能力(或泛化能力),分別采用4種典型的機器學習方法實現流線型箱梁斷面的顫振臨界風速預測,包括支持向量機回歸模型、神經網絡回歸模型、隨機森林回歸模型和高斯過程回歸模型,并基于評價結果進行最終的模型比選。本文結果表明:利用支持向量機回歸建立的預測模型最優,且在實際橋梁斷面上的預測精度最高。通過與現有規范中的顫振簡化計算公式進行比較發現,本文的機器學習算法更為便捷,且其精度更能夠滿足工程設計需求。相比于前有的研究而言,本文的研究更具系統性,模型的選擇和實現過程更為全面。因此,在本文建立的流線型箱梁斷面顫振臨界風速數據庫的基礎上,機器學習方法,尤其是支持向量機回歸方法,能夠在不進行風洞試驗或者數值模擬計算的前提下,快速獲取給定流線型箱梁斷面顫振臨界風速,且精度能夠滿足工程設計要求,這對于橋梁設計初期的抗風設計具有參考意義。
本次試驗以15種不同尺寸的典型流線型箱梁斷面作為研究對象,斷面長度L和寬度B分別均為1 100 mm和400 mm。選取了3種高度H=36 mm, 44 mm, 57 mm、即寬高比B/H分別為11, 9和7的三組斷面,標記為FA組,FB組和FC組,每組斷面設置5種不同的斜腹板傾角θ,分別為24°, 21°, 18°, 15°, 12°,未安裝邊緣欄桿的三組施工態斷面(裸梁,記為Group1)如圖1所示,從上至下標記為FA1~FA5;安裝有邊緣欄桿的成橋態斷面(記為Group2)以及欄桿詳圖如圖2所示(以FA1斷面示例,其余斷面均在相同位置安裝相同尺寸的欄桿)。需要說明的是:欄桿的設置是為了交通安全需求考慮,其尺寸外形大同小異,本文的欄桿源于某大跨橋梁實際欄桿,具有普遍性。

圖1 流線型箱梁斷面(Group1)示意圖

圖2 欄桿模型詳圖(mm)
采用傳統的彈簧懸掛節段模型系統進行動力試驗,模型端部安裝端板以保證二維來流,安裝在風洞中的模型如圖3所示。在 XNJD-2 風洞中進行了均勻流下節段模型自由振動風洞試驗,試驗過程中直接升高風速直至斷面顫振發散以記錄顫振臨界風速Ucr。試驗測試了不同斷面在5個不同風攻角α=0°,±3°,±5°的顫振臨界風速。

圖3 安裝在風洞中的節段模型
目前,特征參數的選取仍然依賴于先驗知識的涉及。根據彎扭耦合顫振機理[18-19],流線型箱梁斷面的顫振臨界風速除了與斷面的氣動外形有直接關系,還與一系列動力參數有關(這里僅考慮二維情況),例如:模態頻率、阻尼比、等效質量等。

(1)

另一方面,與動力系統相關的參數包括豎向和扭轉頻率fv和ft,豎向和扭轉阻尼比ξv和ξt,單位長度等效質量M和質量慣性矩Im。在節段模型風洞試驗過程中,針對不同的模型選擇不同的動力參數,以使機器學習算法感知范圍更廣,進而使得預測模型獲得更強的魯棒性。限于篇幅,部分試驗模型動力參數見表1所示。

表1 動力試驗參數
一般地,原始訓練數據中,不同維度特征的來源及量級和量綱不同,會造成特征值的分布范圍過大,訓練效率較低。因此,必須先對樣本數據進行預處理,才能獲得較為理想的結果。本文選取標準歸一化方法,將每一維度的特征都處理為符合標準正態分布。對于每一維度特征x,標準歸一化后的新特征值可表示為
(2)
式中,μ(x)和σ(x)分別為每一維度特征值的均值和標準差。在標準歸一化后,每一維度特征值都將服從標準正態分布。
值得注意的是:實際橋梁斷面一般為對稱結構,故頂點B和G、C和F、D和E坐標所暗含的信息是相同的。為了達到減少冗余輸入信息和輸入特征維度的目的,提高模型的泛化能力和收斂速度,只保留A、B、C和D點坐標作為輸入特征。
綜上:本文選取的Group1施工態斷面輸入特征包括4個頂點坐標,即8個特征,以及6個與動力參數相關的輸入特征,總共14個輸入特征。由于Group2的成橋態斷面上的欄桿均設置相同尺寸,故輸入特征維度與Group1相同,為14。Group1和Group2的輸出目標均為顫振臨界風速Ucr,即維度為1。
支持向量機回歸(support vector regression,SVR)是基于支持向量機(support vector machine,SVM)分類模型發展起來的一種建立在統計學原理基礎上的機器學習算法,廣泛應用于統計分析或回歸分析。其策略是基于間隔最大化(或添加懲罰參數C的軟間隔最大化)并形成一個求解凸二次規劃的問題,利用核技巧將輸入特征空間映射到更高維的特征空間,進而利用線性回歸方法來達到可以解決非線性問題的目的。該算法的優點在于最終的決策函數只由少數的支持向量所確定,且計算復雜度取決于支持向量的個數,這就使得該模型具有較好的魯棒性。然而,SVR模型對于具有大規模訓練樣本的問題難以實施。相關的算法介紹及推導可參考文獻[20-21]。本文選取高斯徑向基函數(radial basis function,RBF)作為核函數(式3)
(3)
式中:K(x,x′)為核函數;γ為超參數;‖·‖為平方歐幾里得距離。
近年來發展迅猛的深度學習策略(deep learning)在人臉識別、機器翻譯等領域應用廣泛[22-23],其核心思想正是基于神經網絡算法(neural network,NN),主要包括全連接前饋神經網絡、卷積神經網絡、循環神經網絡等。神經網絡模型具有極為強大的非線性映射能力,且隨著訓練樣本、網絡層數和神經元個數的增加,模型的性能逐漸提升,但這也導致了其參數規模過大、模型復雜度較高、模型訓練成本較高等問題。本文選取回歸分析最為常用的全連接神經網絡對該問題進行處理。構造如圖5所示的神經網絡架構,輸入神經元維度為20,包含兩層隱含層,每層隱含層有64個神經元(為簡潔起見,圖中只包含8個隱含神經元),激活函數σ(x)為ReLu函數,如下式所示。最后連接到含有一個線性激活函數的輸出神經元以輸出顫振臨界風速Ucr。利用梯度下降法最小化如下損失函數(式5)并利用反向傳播算法更新每個神經元的權值,最終獲得最優回歸模型。

圖5 全連接神經網絡示意圖

(4)
(5)

隨機森林回歸(random forest regression,RFR)是屬于集成學習的一種機器學習算法[24],其大致思路是訓練多個決策樹(decision tree)模型(弱模型)并打包組成一個強模型。基本思想是在訓練階段利用自助抽樣從輸入訓練數據集中劃分多個不同的子訓練集來依次訓練多個不同決策樹,并在預測階段將內部多個決策樹的預測結果取均值得到最終的結果。相比于弱模型來說,該最終結果具有更強的魯棒性和穩定性,且該算法對超參數的選取不敏感,對特征選擇的依賴性較低,因此較為容易得到性能良好的模型。然而,隨機森林方法容易在噪聲較大的數據集上產生過擬合現象,即:在訓練集上表現較好,在測試集上表現較差。同樣地,本次模型訓練將式(5)作為該模型的損失函數。
高斯過程回歸(Gaussian process regression,GPR)是基于統計學理論和貝葉斯理論發展起來的一種機器學習方法[25],較為適用于處理高維度、小樣本和非線性等復雜的回歸問題,但當特征維度較高時,該算法表現性能較差。高斯過程回歸的基本思想是假設任意有限個隨機變量均滿足高斯分布,其性質完全由均值函數和協方差函數確定。一般地,為簡化計算,將均值設為0,協方差函數可以選擇與SVR中相同的RBF核函數,通過極大似然估計可以實現對核函數中超參數的計算,并最終得到預測值。
本次訓練的Group1和Group2斷面數據集大小均為75,對兩組數據集進行獨立地建立機器學習模型。在劃分數據集的過程中,數據的分布會顯著影響最終的評估結果。一般地,訓練集應與測試集互斥,即測試樣本完全獨立于訓練集。將數據集按7 ∶3比例隨機劃分為訓練集和測試集(“留出法”)。其中,訓練集用來對模型進行訓練,測試集用來對模型進行最終的性能評價。因此,訓練集大小為52,測試集大小為23。
在數據量充足的情況下,利用經過多次隨機劃分的數據集進行訓練和評估,“留出法”足以獲得較好的模型構建。然而,考慮到數據樣本量較小,且期望最大化利用數據樣本,本次研究將以上留出法所得的訓練集再一次劃分為k個子集,其中k-1個子集用于訓練,剩余子集(驗證集)用于模型的超參數調整。即:總數據集劃分為訓練集、驗證集和測試集。顯然,模型總共經過k次訓練和k次驗證,基于k次訓練的平均結果進行超參數調整并取最優參數組合作為最終模型的參數。此過程即為包含了“k折交叉驗證法”的三步評估過程[26]。本文中取k=5。
機器學習模型的參數取值直接影響到模型最終的表現性能,而機器學習算法中需要優化的參數較多,手動進行調整過于繁瑣。常用的自動參數優化方法包括網格搜索法、隨機搜索法、自助抽樣等。本文采用網格搜索法進行參數優化,即:人為給定參數搜索范圍并進行遍歷搜索,選取最優的參數組合。4種機器學習模型具體的超參數搜索空間如表2所示。

表2 超參數搜索空間
為了對4種算法的預測性能進行評估和對比,使用平均相對誤差(average relative error, ARE)和最大相對誤差(maximum relative error, MRE)2種評價指標,具體表達式如式(6)所示。
(6a)
(6b)

基于Python平臺,本文實現了以上4種機器學習算法并對測試集進行結果測試。測試集T的大小為23,記為T1~T23。圖6和圖7給出了不同機器學習算法在相同測試集上的預測結果。圖8和圖9給出了不同機器學習算法測試集上的平均相對誤差(見式6(a))和最大相對誤差(見式6(b))。

圖6 不同機器學習算法施工態斷面(Group1)預測結果

圖7 不同機器學習算法成橋態斷面(Group2)預測結果
從圖6和圖7可以看出,4種不同的機器學習算法在兩組斷面(施工態和成橋態)顫振臨界風速的預測上整體表現性能較好。結合圖8(a)和圖9(a)來看,SVR在測試集上的預測ARE均最低(2.42%和5.43%),而神經網絡算法性能較差,ARE高達5.27%和13.84%。由圖8(b)和圖9(b)的MRE來看,誤差趨勢基本與圖8(a)和圖9(a)保持一致。

圖8 施工態斷面(Group1)預測結果相對誤差

圖9 成橋態斷面(Group2)預測結果相對誤差
經發現,以上4種算法最大誤差基本都出現在FB2斷面(斜腹板傾角21°),且風攻角均為5°。探究其可能的原因有二:①大攻角引起的氣動外形突變較大,由此導致的氣動性能(顫振臨界風速,施工態:8.54 m/s,成橋態: 4.71 m/s)與其他工況差異明顯;②構建訓練集所用的采樣空間(即各個特征參數所覆蓋的范圍)不足以反映斷面特性和動力參數與顫振臨界風速之間的非線性映射關系,即存在局部變異點,進而導致機器學習算法無法深度感知該工況的特性。
總而言之,以上機器學習算法在兩組斷面(施工態和成橋態)的數據集學習結果均表現良好,尤其是SVR算法。對于其他3種算法而言,盡管預測精度不如SVR,但均在施工態斷面(Group1)上有較好的表現性能。
為了進一步展示機器學習算法在流線型箱梁顫振性能評估上的優越性,以下對比了JTG/T 3360-01—2018《公路橋梁抗風設計規范》中給出的3種不同顫振臨界風速評估簡化公式計算結果,包括Van der Put公式,Selberg公式和項海帆公式,如下所示
(7a)
(7b)
(7c)

利用測試集中不同工況的動力參數,基于以上式(6),可計算出測試集中對應工況0°±3°攻角下的顫振臨界風速,并基于此得到顫振臨界風速的平均相對誤差。表3給出了3種顫振臨界風速評估公式計算測試集工況所得的結果。

表3 規范中顫振評估公式計算結果平均相對誤差
以上結果可以看出:3種不同的顫振臨界風速計算公式預測結果較為一般,Van der Put公式計算Group1的結果平均相對誤差最小,為16.08%;對于Group2,項海帆公式計算的結果平均年相對誤差最小,為22.24%。顯然,簡化計算公式的結果與本文基于機器學習算法的預測結果相比,仍存在不小的差距。
為進一步驗證本文提出的方法在實際橋梁上的表現性能,本文搜集了部分已建成橋梁成橋態斷面風洞試驗測得的顫振臨界風速結果,并基于其斷面尺寸和動力參數,利用本文提出的SVR算法進行預測。表4給出了4座已建成橋梁在3個不同風攻角下的顫振臨界風速預測結果的平均相對誤差。從表中可以看出,0°攻角下的顫振臨界風速預測精度較高,均在4%以下;而對于±3°而言,其誤差均在6%以下(僅蘇通大橋超過6%,為6.02%)。由此可以說明:本文基于SVR的快速預測顫振臨界風速算法具有較高的預測精度,可推廣應用于實際橋梁顫振臨界風速預估。

表4 SVR預測已建橋梁顫振臨界風速的平均相對誤差
至此可以看出,機器學習算法可以非常有效地預測不同流線型箱梁斷面的顫振臨界風速,且以支持向量機回歸最佳。該算法相對于規范提出的簡化計算公式而言,精度有較大幅度的提升,且在實際橋梁斷面上表現性能較好。值得一提的是:本文訓練模型的數據集大小僅為75,若能夠收集到更多的以建或在建橋梁風洞試驗結果并進行模型訓練,該機器學習策略將可以有效地預測不同斷面的顫振性能,進而可以提供橋梁設計者較高精度的流線型箱梁斷面氣動性能評估結果。
值得一提的是,本文所選取的流線型箱梁斷面只包含施工態和設置了欄桿的成橋態,均未設置其他諸如檢修車軌道、中央穩定板等附屬設施,且未考慮欄桿透風率、檢修車軌道高度、中央穩定板高度等因素的影響。文獻[27-28]:以上措施會對流線型箱梁氣動性能產生較大的影響。顯然,增加以上輸入特征維度將可以全面地考慮附屬設施對顫振臨界風速的影響。進一步地,機器學習方法可拓展到渦振響應預測、抖振響應預測等典型橋梁風致振動問題當中。這也是此類智能算法的優勢所在。
本文基于4種機器學習算法(SVR,NN,RFR,GPR),提出了快速預測流線型箱梁斷面顫振臨界風速的智能化策略。
(1)設計了預測流線型箱梁顫振臨界風速的4種不同機器學習算法、訓練方法及參數調優方法,基于風洞試驗測得的兩組斷面顫振臨界風速作為訓練數據集,在測試集上的預測結果表明支持向量機算法在流線型箱梁斷面顫振臨界風速預測的問題上表現最優(平均相對誤差施工態為2.42%,成橋態為5.43%),神經網絡模型最差(5.27%和13.84%),其余2種方法次之,且平均相對誤差均在5%和10%以下。
(2)對比公路橋梁抗風設計規范提供的3種快速計算顫振臨界風速的簡化公式計算結果和已建橋梁風洞試驗結果可以發現,本文提供的機器學習方法精度遠超過規范計算結果,且在實際橋梁上表現性能較好。
(3)作為基于數據驅動的預測方法,數據集的大小是提高機器學習方法精度的關鍵,未來可考慮擴展訓練集并全面考慮諸如欄桿、導流板等附屬結構對氣動外形的影響,以達到更高精度的預測效果,進而滿足工程設計需求并推廣至工程應用。
(4)機器學習方法在諸多復雜非線性問題上的解決能力是較優的,但本文在算法實現過程中發現:建立良好的預測模型仍然需要注意模型類型的選取、數據集的質量、模型超參數的選取等問題。另外,機器學習方法屬于“黑箱模型”,目前仍缺乏可解釋性,且特征參數的選取較為依賴先驗知識的干涉,這在推廣機器學習算法至橋梁風工程領域時需要格外注意。