姚晨明,姚磊
(長江重慶航道工程局,重慶 400010)
航道的船舶適航水深的維護需要對口門浮泥進行清淤,但是這些浮泥受潮波流影響堆積位置是不斷變化的,需要從清淤和適航水深兩個方面入手,歷史的疏浚數據包含了疏浚數據的變化特征,預測口門段清淤時機及清淤部位對于保證航道的通航能力,以合理調配清淤船舶和時段,節約工程成本有著重要的工程意義。
港口的疏浚數據特征具有一定的規律性,根據施工日報表的數據項,及現場施工的經驗判斷,對于主航道和回淤嚴重的口門區域會進行周期性疏浚,疏浚工作涉及接移管線的操作,船舶在相隔工作日期內不會有較大的位置變化,開挖標高也在一定的范圍內變動,本研究的目標即根據歷史清淤記錄進行未來的疏浚地點預測及提醒。
因疏浚工作的周期性及規律性,潮汐等水文環境、泥沙淤積也具有季節性和周期性,具有時序特征,因此采用時間序列模型進行數據預測,預測目標為經緯度和開挖標高。本研究選擇擅長提取時序特征的長短期記憶網絡LSTM(Long Short Term Memory)模型進行預測任務。本技術的研究依托于鹽城港濱海港區中電投煤炭碼頭疏浚工程,以施工日報表提取的數據作為數據集,利用前一天或幾天的零點坐標、開挖標高數據預測下一個(當前)時刻的對應數據。采用時間序列模型,經緯度和開挖標高作為輸入項,
根據調研結果,本研究可獲得的數據主要是施工日報表和相關CAD 文件,因此本研究分析主要依托施工日報表、施工進度圖來獲取原始數據。考慮到需要根據歷史的數據來預測當下時刻的值,因此可以將這個任務視作監督學習問題并對輸入變量進行歸一化處理。考慮歷史數據表示上一個時間段的經緯度位置和開挖標高,所以在數據的使用方式上本研究用t-5,t-4,t-3,t-2,t-1,t次的施工數據通過模型進行特征分析和提取,然后對輸出的t+1 結果與其真實數據進行對比來分析誤差。數據的分布形式如圖1所示。

圖1 數據集樣本示例
由于初始數據中存在一些異常數據和缺失數據,因此需要進一步對數據進行清洗以確保數據的合理性。在選取全部施工日報字段后,獲得2018年10月13日-2022年1月31日區間有效的數據共639 條,因部分數據存在多個零點坐標和開挖標高的情況,經過分析處理后形成1438 條數據。對于異常值處理,異常值集中在施工時間、零點坐標、浚前標高、開挖標高字段,當出現多個值的情況,標點括號半角全角混用的問題,全部分割后再做處理。由于數據庫端浚前標高、開挖標高錄入多值情況,所以數據拆分為多獨立值處理。對于缺失值處理,刪除缺失值較多的數據,并清理冗余數據,這里采用KNN 方法和中值插值方法對數據進行填充,對比后發現中值插值方法進行浚前標高和開挖標高的數據填充。剔除異常值以及填充缺失值之后,處理后的數據分布如圖2所示,港池區域數據集中度符合預期,便可進行下一步的模型訓練。

圖2 數據清洗后的分布
在網絡結構方面,本文設計了一個三層的LSTM 網絡,如圖3所示,其結構基于python 的keras 框架,分別由LSTM 層,dropout 層,dense 層以及activation 層依次構成。數據維度從初始的時序的240 維度降維為最終的時刻的3 維輸出,也就是利用前15 天經緯度坐標和開挖標高數據預測下一個(當前)時刻的對應數據。

圖3 網絡模型結構
模型搭建完后,對于網絡的訓練過程所涉及參數的調整,確定網絡模型的激活函數為relu 函數。每一層網絡節點的舍棄率默認值設定為0.3。對于訓練的誤差計算方式使用均方誤差(mean squared error)。網絡參數的迭代更新方式采用RMSprop(Root Mean Square propagation)算法。權衡實驗環境的內存效率和內存容量后,本文設置模型訓練的輪次數為1000,數據批次數為64。
接著進一步開始在數據集基礎上對模型進行訓練,由于訓練時輸入LSTM 網絡的數據維度關系到LSTM 層的參數,本文以15 個時間節點所對應的特征數據作為輸入預測后續1 個時間點。訓練過程的中的損失函數值變化曲線如圖4(a)所示,模型驗證集的在1000 輪次內達到收斂,訓練集的函數值穩定在0.0008 附近,這表明模型訓練達到預期效果。
當模型訓練采用經度、緯度、開挖標高3 個維度數據作為輸入時,對應的模型測試準確率為96.13%,這表明本研究提出的方法能夠實現在歷史疏浚數據上進行較高精度的疏浚標高參數的預測。在項目實際應用過程中,為達到更長時間的預測效果,當采用預測6 個后續時刻坐標和標高方式來訓練模型時,其預測值和真實值的誤差值在0.0011 附近,如圖4(b)所示,實現了更長時刻的預測應用效果。此外,本文將預測數值在GIS系統中可視化顯示,其效果如圖5所示,實現了較好的應用效果。

圖4 模型訓練過程指標曲線

圖5 預測位置GIS 平臺展示
本研究通過對疏浚數據收集和清洗做成數據集,構建了LSTM 網絡模型后,模型的訓練誤差降到了0.0008,這模型能夠充分提取分析歷史疏浚數據的時序特征,并在此基礎上通過歷史時刻的數據預測當前時刻的疏浚位置和標高,實現了96%的預測準確率,這對于港區疏浚施工參數預測有著較好的應用價值。
