









摘要:為更準確地預測橋梁未來的健康狀況,文章深入探討了運營階段橋梁監測系統中的數據預測問題,并提出了一種橋梁數據預測組合模型。首先,通過Pearson相關性分析,得出不同位置處相同類型的3個傳感器之間存在較強的相關性??紤]到這種強相關性可能引發共線性問題,采用嶺回歸(RR)方法建立各傳感器數據之間的關聯。其次,引入時間序列分析中的ARIMA(自回歸積分滑動平均模型)預測方法,將其與嶺回歸方法相結合,實現對橋梁未來運行數據的預測。為了驗證組合模型的有效性和準確性,將組合模型的預測數據與單一的ARIMA預測數據以及真實數據進行了誤差分析。分析結果表明,組合模型的預測性能優于單一的ARIMA模型,驗證了其在實際應用中的可靠性和準確性。該研究不僅為橋梁健康監測提供了新的思路和方法,也為確保橋梁的安全運行提供了有力保障。
關鍵詞:傳感器;預測;嶺回歸;時間序列分析;共線性
中圖分類號:U446.3" " " "文獻標識碼:A" " " 文章編號:1674-0688(2024)05-0069-05
0 引言
橋梁在交通運輸和人們日常出行中發揮著極其重要的作用。當前,無論是在橋梁的施工階段還是運營階段,實時監測橋梁的應變值已經成為評估橋梁健康狀態的重要依據,因此眾多專家和學者針對橋梁應變對橋梁結構安全性、穩定性的影響進行了廣泛的研究。隨著橋梁的建造和使用,荷載和環境的共同作用會導致橋梁性能下降,降低其適應性和安全性,并縮短其使用年限。橋梁結構健康狀態評估的關鍵在于構建高精度的預測模型,并根據監測數據進行準確預測[1],這對于安全預警和后續的橋梁維護至關重要。結合大數據分析方法,有效處理大量監測數據以評估橋梁健康狀況并發出預警,進而確定合適的養護時間進行及時維護,已成為該領域的重要研究課題。田壯等[2]運用BP(反向傳播)神經網絡模型,針對大跨徑橋梁結構創建了高效的響應預測元模型。實驗證明,該模型能有效替代復雜的有限元分析方法,不僅保持了高準確度,還顯著提升了響應分析的速度與效率。郭永剛等[3]為監測橋梁運營健康狀況,設計了一套新穎的集成模型,用于橋梁撓度的前瞻性預測,以優化橋梁維護計劃和管理決策。聶小沅等[4]融合了灰色系統理論與神經網絡模型,將其應用于橋梁耐久性預測中,顯著增強了預測的準確性,為橋梁耐久性的評估與管理提供了強有力的技術支撐。
時間序列分析為解決橋梁性能監測與預測問題提供了新思路,時間序列指的是按時間順序對不同時間點所統計的某一指標值進行排序的數值序列,如每日氣溫、蔬菜價格或某地區年度財政收入。通過建模分析時間序列,有助于了解數據的內在結構,從而預測該數據未來一段時間內的數值。在對時間序列數據進行建模分析時,需要考慮數據的隨機波動、變化趨勢等相關特征。不同的時間序列預測模型對相同數據的估計值差異很大。因此,本文采用相對穩定的ARIMA模型對橋梁的應變值進行預測。在同一橋梁的不同位置,可以測得多組傳感器數據,這些數據之間通常存在不同程度的相關性。這種相關性分析在數據整理和融合 [5-6]、數據清洗、結構健康監測與評估[7-8]等多個領域都有廣泛的應用。本文利用Pearson相關性分析方法對橋梁不同位置之間的應變值進行相關性分析[9],并采用ARIMA預測方法與嶺回歸方法相結合的方式預測橋梁未來的運行數據。本文的研究成果對橋梁狀態預警具有重要意義。
1 研究方法
嶺回歸是機器學習方法中的一種常見技術,本文利用嶺回歸解決可能出現的過度擬合問題。然而,嶺回歸主要用于處理樣本內的數據,不能進行數據預測。相比之下,ARIMA模型能很好地預測未來數據,但受一些外在因素的干擾,單一ARIMA模型預測的數據與真實值相比,往往存在較大的誤差。因此,本文結合應用嶺回歸與ARIMA模型,解決橋梁健康預測數據的問題。首先,利用嶺回歸模型解決不同位置傳感器數據之間的共線性問題,并建立各傳感器之間的嶺回歸方程;其次,利用ARIMI模型對訓練集數據進行預測;最后,將ARIMA模型預測出的數據帶入嶺回歸方程中,從而得到待求傳感器的預測數據。
1.1 嶺回歸
嶺回歸是一種用于處理多重共線性問題的線性回歸技術。在本案例中,模型的矩陣利用公式(1)表示:
[y1y2?yi=1x11x12…x1k1x21x22…x2k??? ?1xi1xi2…xikβ0β1?βk+ε1ε2?εi] (1)
其中:[yi]為目標變量,即因變量,為1號傳感器測量的應變值; [xi1、xi2]為特征變量,即自變量,為2號、3號傳感器測量的應變值; [εi]為隨機誤差項; [β0]為截距; [β1、β2…βk]為回歸系數。公式(1)記為
y=xβ+ε" " " " " " " " " " " " " " " " " " "(2)
嶺回歸通過在損失函數中增加一個正則化項,可以解決過度擬合問題,其公式表示如下:
[Loss=i=1nyi?β0?j=1pβjxij2+λj=1pβ2y" ]" " (3)
其中:n為公式(1)矩陣行數;p為公式(1)矩陣列數;[yi]為1號傳感器測量的應變值;[xij]是指第i個1號傳感器應變值的第j個自變量;[β0],[β1],…,[βP]是回歸系數;[λ]是嶺回歸超參數,用于控制正則化的強度。[ ]
嶺回歸通過引入正則項,限制回歸系數的增長,從而在一定程度上緩解了共線性問題。
1.2 ARIMA模型
ARIMA是用于擬合時間序列數據的統計模型,它可根據自身的過去值“解釋”給定的時間序列,因此可以通過方程式預測未來趨勢。ARIMA模型是一個綜合性的模型,主要由以下3個部分組成[10]:自回歸(AR)、差分(I)和移動平均(MA)。這些部分共同構成了ARIMA(p,d,q)模型,其中p是自回歸項的數量,d是差分階數,q是移動平均項的數量。
(1)自回歸階數表示模型中采用時間序列數據本身的滯后期數,一般用p 表示。 對應此模型的公式表示如下:
[yt=c+?1yt?1+?2yt?2+…+?pyt?p+?t" ] (4)
其中:c為常數,yt為待求傳感器應變值的當前值,yt-1為傳感器上一個時間的應變值,yt-2為上兩個時間的值,[?]為自回歸系數,p為模型中具有的系數數量,[?t]為誤差項,即白噪聲。
(2)差分是使序列成為平穩序列的差分過程,階數一般用d表示。
(3)移動平均表示模型中采用的誤差滯后期數,一般用q表示。對應此模型的公式如下:
[yt=c1+θ1?t?1+θ2?t?2+…+θq?t?q+?t" " "](5)
其中:c1表示常數,yt指待求傳感器應變值的當前值,[θ1],[θ2],…,[θq]對應每一個白噪聲的參數。
ARIMA模型的具體公式如下:
[1?i=1p?iLi1?LdXi=c+1+i=1qθiLiεi](6)
其中:p為自回歸項,q為移動平均項,d為時間序列平穩時所做的差分次數,L是滯后算子。
1.3 誤差分析
在進行誤差分析時,通過以下檢驗指標,將真實值分別與嶺回歸和ARIMA組合模型的預測值、單一ARIMA模型的預測值進行對比。
均方誤差(MSE):
[MSE=1ni=1nyi?yi2]" " " " " " " " " "(7)
均方根誤差(RMSE):
[RMSE=MSE=1ni=1nyi?yi2]" " " " " (8)
平均絕對誤差(MAE):
[MAE=1ni=1nyi?yi]" " " " " " " " " " " " (9)
平均絕對百分比誤差(MAPE):
[MAPE=1ni=1nyi?yiyi×100%]" " " " " " " (10)
1.4 RR-ARIMA組合方法
首先,利用嶺回歸方法得到1號、2號、3號傳感器的回歸表達式;其次,利用ARIMA模型分別對1號、2號、3號傳感器的數據進行預測,從而得到3個傳感器在單一ARIMA模型下的預測值;再次,將嶺回歸和ARIMA模型相結合,基于組合模型(RR-ARIMA)得到1號傳感器的預測值;最后,將單一ARIMA模型的預測數據和RR-ARIMA組合模型的預測數據,分別與測試集真實值進行誤差分析,從而得到最終的結果。具體流程如圖1所示。
2 案例分析
2.1 工程實例
為驗證上述方法的真實性和可靠性,本文以廣東省中山市岐江河特大橋工程為依托進行實例驗證。該工程位于粵港澳大灣區核心走廊帶,穿越中山市主城區岐江河,上層為中山—開平高速主線,下層為中山南外環市政道路,是中開高速項目的關鍵工程。岐江河特大橋主橋是雙層橋面簡支鋼桁鋼拱橋,其跨度為153 m。主梁采用全焊接雙層桁架設計,主桁間距為37.3 m。拱肋形狀設計為二次拋物線,矢高為37.5 m。上下兩層橋面均設有雙向2%的橫坡。主橋的主桁采用三角形桁架,中心距為37.3 m。上層橋面行車道寬35 m,下層橋面行車道寬 33 m。主桁梁上、下弦桿均采用箱形截面,腹桿采用箱形和“工”字形兩種截面設計;拱肋同樣采用箱形截面,并在橫向設置風撐連接。在橋梁健康監測數據的選擇中,本文提取該橋梁上的3個應變傳感器的數據進行深入分析。其中,1號傳感器位于左拱肋1/2的位置下方,2號傳感器位于左拱腳中部,3號傳感器位于左拱肋的下方。提取7月1日至7月29日各個應變傳感器的1 865個數據進行異常值處理,應變傳感器數據圖如圖2所示。
從圖2可以看出,橋梁應變數據具有明顯的趨勢性,數據普遍不穩定,3個不同位置的傳感器數據之間存在很強的相關性,傳感器相關系數熱力圖見圖3。
由圖3可知,橋梁上不同位置放置的相同類型的3個傳感器的應變數據之間的相關性均超過80%,顯示出很強的相關性。鑒于這種高度的數據共線性,其對分析結果可能產生顯著影響。嶺回歸在解決共線性問題時,能夠提供更穩健和可靠的估計,因此可以采用嶺回歸解決由傳感器數據共線性引起的問題。
2.2 嶺回歸
將應變測量值數據集按照7∶3的比例劃分訓練集和測試集,利用訓練集數據建立待求1號傳感器數據與2號、3號傳感器數據之間的嶺回歸模型。嶺回歸嶺跡圖見圖4,嶺回歸模型得到的相關參數見表1。
表1列出了本次模型的參數結果及檢驗結果,包括模型的標準化系數、t值、F檢驗的結果、R2及調整R2等指標。嶺回歸的結果顯示:基于F檢驗的顯著性P值為0.000***,水平上呈現顯著性,表明自變量與因變量之間存在回歸關系。同時,模型的擬合優度R2為0.943,表明模型表現優秀。設1號傳感器的數據為y,與已知其余2號、3號傳感器的數據建立的嶺回歸表達式為
y=-834.841+0.972x2+0.89x3" " " " " " " " " " " "(11)
2.3 ARIMA模型預測
對1號、2號、3號傳感器進行ARIMA預測,相關參數見表2、表3和表4。
由表2、表3、表4可知,1號、2號、3號傳感器的AMIMA模型的擬合優度接近1??梢?,1號、2號、3號傳感器的ARIMA模型較為優秀。將1號、2號、3號傳感器的訓練集通過ARIMA模型進行檢驗以及殘差分析,可以確定3組xi的預測測試集。
2.4 RR-ARIMA模型預測
將2號、3號傳感器的單一ARIMA模型的預測結果帶入嶺回歸模型中,即可得到1號傳感器訓練集預測值。將組合模型訓練集預測值、單一ARIMA模型訓練集預測值與真實值進行誤差分析,結果見表5。
根據表5中的數據,嶺回歸與ARIMA結合應用的組合模型在訓練集上的預測表現要優于單一的ARIMA模型,具有更小的預測誤差和更高的預測精度。因此,在評估在役橋梁的性能監測和健康狀態預測時,該組合模型被證明是一種更為精確的方法。
3 結論
本文針對運營階段橋梁性能預測提出了一種結合嶺回歸和ARIMA的組合模型,旨在通過預測傳感器應變數據實現對橋梁健康狀態的準確預測。實驗得出以下結論。
(1)橋梁健康狀態預測受眾多因素的影響,一直是一個很難解決的問題。隨著人工智能技術的不斷發展和算法精度的提高,橋梁健康狀態的預測準確性也在不斷提高。
(2)鑒于各類算法預測模型眾多,不同模型的預測結果差異顯著,本文采用模型的組合策略,使預測數據更加平穩、精確。
(3)本文利用橋梁傳感器數據之間的線性關系建立嶺回歸方程,并結合ARIMA模型對橋梁未來一段時間內的數據進行預測,最終得到更為準確的橋梁預測數據。相較于單一模型,其預測誤差明顯減小。
綜上,通過組合不同模型,可避免單一模型可能產生的較大數據誤差,從而增強橋梁在短期內健康狀態的預見性。
4 參考文獻
[1]諶楨文,常軍.SSA-SARIMA組合模型的橋梁健康狀態預測[J].蘇州科技大學學報(工程技術版),2023,36(4):8-12.
[2]田壯,樊啟武,王昌杰.深度學習在橋梁響應預測與健康監測中的應用[J].鐵道工程學報,2021,38(6):47-52.
[3]郭永剛,張美霞,王凱,等.基于CEEMDAN-VMD-PSO-LSTM模型的橋梁撓度預測[J].安全與環境工程2024,31(3):150-159.
[4]聶小沅,李德建.基于BP神經網絡與GM(1,1)模型組合算法的橋梁耐久性預測[J].鐵道科學與工程學報,2015,12(4):839-844.
[5]聶慶科,孫廣,郝永攀,等.多源異構監測數據融合方法及應用[J].科學技術與工程,2022,22(13):5348-5357.
[6]樊學平,楊光紅,尚志鵬,等.考慮適用性的大跨橋梁主梁動態可靠性融合預測[J].吉林大學學報(工學版),2022,52(1):144-153.
[7]吳文廣,曹成斌,劉興旺,等.基于移動區間關聯性趨勢的兩線三區預警體系研究[J].鐵道建筑,2021,61(12):71-75.
[8]薛國華,李明慧,韓宇軒,等.橋梁結構健康監測基于相關性分析的多源數據預測算法研究[J].鐵道建筑,2022,62(11):73-79.
[9]梁皓涵,王志強,崔鵬.基于皮爾森相關系數的自適應SLIC超像素分割算法[J].軟件工程,2024,27(3):30-35.
[10]胡鑫.基于時間序列ARIMA模型的邊坡強降雨穩定性預測分析[J].珠江水運,2024,(4):74-76.
*中央高校基本科研業務費專項“基于健康監測的公路橋梁預警技術研究“(ZY20230202);廊坊市科技計劃項目“基于橋梁結構健康監測的多位一體性能指標協同評估預警研究“(2022011066)。
【作者簡介】曹星宇,男,河南安陽人,在讀碩士研究生,研究方向:橋梁監測預警;桂成中,男,湖北黃岡人,博士,副教授,研究方向:橋梁抗震加固;張江廣,湖南衡陽人,在讀碩士研究生,研究方向:橋梁監測預警。
【引用本文】曹星宇,桂成中,張江廣.基于嶺回歸和ARIMA法的在役橋梁性能監測與預測評估[J].企業科技與發展,2024(5):69-73.