王蔚 關放


摘 要耙吸挖泥船的自動化程度與日俱增,需要分析處理的采集數據也較為繁多,如果數據在傳輸過程中出現丟失和延遲的問題,會對后續的分析和預測建模產生較大的影響。本文針對這一問題,討論各種可行的解決方法。
關鍵詞數據丟失;數據延遲;延遲校準
0 引言
耙吸挖泥船在施工作業時會產生大量的數據,在集中傳輸這些數據時,會由于部分數據丟失或者傳輸延遲,導致數據不可用的問題,造成數據分析困難,預測建模不準確。對于數據丟失問題,本文將闡述利用“去除”和“補充”兩大方法的優劣及應用場景;而對于數據延遲,本文將著重分析如何對數據延遲進行校準并同步。
1 數據丟失的處理方法
1.1 去除法
去除法是最原始的方法,也是較為有效的方法之一。此方法是將丟失的數據整個去除,該方法操作簡便,處理便捷,效果明顯。耙吸挖泥船在施工作業時,采集并記錄的數據非常龐大,小到吃水傳感器的數據,大到主機、推進器的數據,實際在某時刻丟失的數據占整個數據的量非常之小,采用去除法對數據庫的整體性影響較小,對后續數據分析和預測建模幾乎不會產生很大的干擾。但是,這種方法也存在其局限性,如果在耙吸挖泥船施工作業中,某一傳感器由于損壞或者傳輸線路不暢,導致丟失數據過多,在整個數據庫占比較大時,采用去除法就會存在很大的缺陷,這會導致數據的整體性遭到破壞,分析的價值大大降低,并導致數據分析的結果不能反映真實的情況,數據對后續的預測建模沒有了參考價值。
1.2 補充法
補充法是利用給定的值去補充丟失的數據,使得數據庫逐步完善,達到可以分析利用的程度。通常情況下,該方法通過統計學相關知識,根據前后數據或者歷史數據,為當前的丟失的數據補充一個合理的數值。具體分為以下幾種方法:
1.2.1 手動輸入法
耙吸挖泥船在施工作業時,有經驗的操作人員,在分析多個疏浚作業過程的數據后,對丟失的個別數據,可以通過經驗判斷出比較準確的數值。這樣由人工輸入的數據一般比較合理,產生的數據曲線也比較平滑。然而,正常情況下,該方法會占用大量的處理時間,當數據丟失較多,或者人工經驗相對欠缺時,該方法就不是那么適用了。
1.2.2 均值估計法
耙吸挖泥船在施工作業時的傳輸數據大多數都屬于數值型的數據,非數值型的數據均值估計法是不能適用的。均值估計法一般有兩種方法,一種是將采集到的所有數據進行平均,這種方法比較簡單直接,處理方便且速度快。第二種方法是條件平均,參與平均計算的數據不是從整個數據庫選取,而是按照相似數據進行平均操作,這種方法在實際操作中也是簡單而且行之有效的。這兩種方法本質上是一樣的,都是通過對數值取平均值,從而推斷實際的數值,盡管兩者所采集的數據有所不同。
1.2.3 回歸分析法
采集過往耙吸挖泥船施工作業時的數據,然后根據這些數據,建立回歸模型,當某個傳感器的數據缺失時,將其他數據放入回歸模型,從而計算出該丟失數據的值。采用這種方法,預測數據的精確性很大程度上依賴所選取得回歸模型的準確性,所預測的數據會產生不必要的誤差,而且這種誤差往往很難避免。
1.2.4 統計模型法
基于統計學知識,可以將丟失的數據看作是具有隨機性的數據,通過采集到的大量數據,可以確定出數據參數分布的統計模型,并且假設模型的準確性,通過該統計模型去確認丟失數據的數值。采用該方法需要最大化所采集數據的量,只有在大樣本的條件下才能保證推斷出的數據準確性。但這種方法很容易使得估計得數值能夠達到局部最優,但沒有達到全局最優,且收斂速度比較慢,計算會相對比較復雜。
2 數據延遲的校準方法
由于耙吸挖泥船的密度計安裝在泥泵的出口位置,與耙頭處吸入泥漿的實時密度必然產生一定延遲,而控制耙頭處的實時泥漿密度對于提高施工作業效率更有參考意義。下文針對耙吸挖泥船吸入泥漿密度延遲的問題,展開討論,并作完整分析。
2.1 測量延遲
3 結語
本文介紹了耙吸挖泥船在傳輸數據時出現丟失時的解決方法,并給出了數據延遲的校準推導。經過上述方法處理后的數據可以較好地應用于后續的數據分析及建立預測模型。如今越來越倡導耙吸船的智能化,而智能化離不開大量的數據支撐,只有做好前期的數據積累,未來耙吸挖泥船的智能化步伐才能越走越快。
參考文獻
[1]張燕.國內外大型耙吸挖泥船的關鍵技術發展研究分析[D].哈爾濱工程大學,2010.
[2]王柳艷,田雨,俞孟蕻.耙吸挖泥船耙頭密度估計器研究與分析[J].中國港灣建設,2014(11):69-72.
[3]錢廣亭.基于模型預測控制的耙吸挖泥船疏浚機理優化的研究[D].江蘇科技大學,2012.
[4]張朔.數據驅動的耙吸式挖泥船疏浚作業模型及優化[D].上海交通大學,2011.