彭漱墀
(韶關市防洪管理中心,廣東 韶關 512000)
隨著我國水利建設的發展和現實需求,水工建筑物種類和數量越來越多,對可以反映水工建筑物實際情況的預測模型需求也隨之提高,研究人員為此進行了一系列研究。萇登侖[1]通過三維軟件Inventor建立了三維水工建筑物模型,以解決實際工程中的問題。陳星豪、李裕勇[2]建立了水工建筑物安全決策模型,該模型能夠高效地對水工建筑物進行評測。崔偉等[3]將非等時距灰色模型應用在實際工程中,通過該模型對建筑物的沉降進行了預測,模型驗證表明該模型誤差較小,能較好地預測建筑物沉降。
本文基于神經網絡算法中的LSTM算法,建立水工建筑物安全監控深度模型,從數據處理、網絡結構和外延預測3個方面對監控大數據進行優化。結合某水工建筑物實例,驗證模型的有效性,從不同角度對比LSTM模型與其他模型在水工建筑物安全監控預測方面的差異。
相對于信息技術行業其他領域而言,水工建筑物的大數據安全監控有一定的獨特性,主要包含以下幾點:
1) 就容量而言。單一水工建筑物安全監控的數據監測量為小規模數據集,而對多個水工建筑物項目進行長期監控的數據量則較為龐大。
2) 就種類而言。水工建筑物安全監控的數據主要來自監測儀器,為結構化數據格式。數據演變形式較為復雜,存在一定的周期性,有可能出現突變、噪聲等事件。
3) 就采集效率而言。通常采樣是以天為單位,雖然監測儀器采集的頻率較高,但仍舊受到系統制約。此外,在短期內,數據采集的較為密集,間隔時間短;而在后期采集間隔則增加,采集頻率降低。
4) 就數據真實性而言。水工建筑物監控數據通常通過儀器進行采集,在儀器不發生故障的前提下,通常采集到的數據具有較高的質量,比較能反映真實情況。
對水工建筑物在施工和工作階段進行監測所獲得的數據主要為結構化時序數據。傳統的神經網絡算法在相鄰兩層節點進行互連,但是同層節點相互獨立,因此在機器學習時難以反映數據內在的延續性。
循環神經網絡是在原本的基礎上,引入時序概念,節點間通過隱性連接,在時序數據方面表現出較好的適應性。但在循環神經網絡算法中,若進行高迭代計算,則容易出現網絡不穩定問題,甚至網絡無法收斂。LSTM為“長短期記憶網絡”,是一種改進后的循環神經網絡,克服了循環神經網絡在高迭代算法中不穩定問題,而且在間隔較長的時序數據計算中具有較強預測能力,是目前較為流行和先進的深度學習算法之一。
本文基于LSTM深度學習算法,構建水工建筑物安全分析模型。該模型可適用于多種類型的水工建筑物,主要建立過程包括數據處理、網絡結構和預測方法。
通過對原始觀測數據進行必要處理,如清洗、降噪和變換等,可以提高水工建筑物安全監控模型的外延能力。前端數據處理主要包含數據清洗、降噪平滑和數據變換3個步驟。
在數據清洗中,通過差值補填和異常檢測手段對監測數據中的局部缺失值和異常值進行處理,進而獲得修正后的序列。
在原始監測數據中,通常會存在一定程度的噪聲,因此需要進行降噪平滑處理。具體為先將輸入序列進行正序濾波處理,然后將處理后的序列進行逆轉后再次通過濾波器,最后再進行逆轉輸出后獲得降噪平滑序列。
在數據變換中,對上述平滑序列歸一化處理。通過歸一化處理,可以避免梯度更新誤差,也能提高求得最優解的效率。
經過數據前端處理后,將處理后的數據劃分成訓練集、驗證集和測試集,然后通過下述措施對網絡拓撲結構進行改進和優化。
1) 通過并聯方式對深層網絡LSTM1和LSTM2進行搭建。LSTM1為一元時序預測,通過監測數據對目標量進行預測。LSTM2是一種多元回歸預測算法,通過多個影響因子與目標量之間的聯系來構件模型,然后依據該模型進行參數求解。
2) 參數調試和優化。通過試算和隨機搜索等方式,對各參數進行調整,以獲得最優參數集。
3) 在計算時序數據時,會存在一定的歷史冗余數據,這將導致模型復雜性增加,提高模型的計算難度和降低精確度。因此,通過驗證集對網絡結構進行多次評估驗證,選取有效的記憶區間。
4) 為防止由于測試集過少而出現的過度擬合問題,需要對網絡深度和訓練周期進行控制,同時通過標準化和正則化約束模型參數,以期對模型的泛化能力進行提高。
外延預測方法主要為直接多步預測(DMP)和滾動單步預測(POP)。直接多步預測是目前較為常見的外延方法,應用較廣,可以一次返回多個預測值,效率較高。滾動單步預測是通過不斷迭代的方式進行預測,對上一步驟的計算結果作為當前步驟的輸入值,不斷進行滾動迭代,實現間接多步預測。而對于較為穩定的預測模型,沒有必要進行較高頻次的更新學習,可在周期性迭代過程中設定更新時間進行控制。
通過上文建立的水工建筑物安全監控模型,選取某大壩進行應用實測數據與濾波后的數據對比情況,主要包括鋼筋應力變化、裂縫開合度變化、應變數據情況、水位變化情況。結果表明,濾波之后的數據與原數據趨勢較為一致,在數值方面基本相同,去掉了原始數據中的跳點和壞點。差異表現較為顯著的是水位情況,見圖1。從圖1中可以看出,水位的原始監測數據存在較大的波動,因此濾波之后的曲線與原數據差異較明顯,但變化趨勢基本一致,且濾波之后的數值與其周圍原始數據的平均值較為接近,因此濾波數據也是較為合理的。

圖1 監測儀器數據記錄與濾波數據對比(水位應變)
為了增加模型預測效果的對比性,選用SRSM模型和BPNN模型作為LSTM模型的對照。在機器學習工程中,將各模型參數調制最優,然后對鋼筋應力、裂縫開合度、結構應變和水位數據進行預測。
表1為3個模型在鋼筋應變、裂縫開合度、應變和水位預測中的誤差值。誤差值選用3個標準進行統計,分別為均方誤差(MSE)、平均絕對誤差(MAE)和平均絕對百分比誤差(MAPE)。從表1可以看出,SRSM、BPNN和LSTM 3個模型中,誤差最小的為LSTM模型,誤差結果由小到大排序為LSTM、BPNN和SRSM。

表1 不同模型預測結果誤差統計
本文基于神經網絡算法中的LSTM算法,建立了水工建筑物安全監控模型,從數據處理、網絡結構和外延預測3個方面對模型進行了優化。結合某水工建筑物實例,驗證了模型的有效性,從不同角度對比了LSTM模型與其他模型在水工建筑物安全監控預測方面的差異。結論如下:
1) LSTM模型不僅能準確預測水工建筑物參數隨時間變化的數值和趨勢,也能在一定程度上反映參數的波動情況,體現出良好的預測效果。
2) 與其他模型相比,深度學習模型可以應用于不同場景。同一場景而言,深度學習預測效果更佳。
3) SRSM、BPNN和LSTM 3個模型中,誤差最小的為LSTM模型,誤差結果由小到大排序為LSTM、BPNN和SRSM。