曹現剛,姜韋光,張國禎
(西安科技大學 機械工程學院,陜西 西安 710054)
隨著煤炭行業的智能化發展,煤炭企業的管理方式正在逐漸由粗放型轉變為精細化管理,中國大中型煤礦企業由設備產生的數據規模已經達到了PB級別[1]。煤礦設備種類繁多,采煤機作為綜采三機之一,集成機電液為一體,實現了煤礦采集的機械化與自動化,其在工作過程中產生的設備運行狀態數據成為了監測煤礦開采狀態的重要依據。然而采煤機的工作環境復雜且惡劣,其運行狀態數據的采集會受到諸多因素的影響,使得采集來的數據會出現大量的噪聲點與缺失值[2],從而導致數據的質量不足以滿足后續的數據分析工作。因此對采煤機運行狀態數據的清洗工作必不可少[3]。
嚴英杰等[4]為提升輸變電設備運行狀態數據質量,利用時間序列分析對數據進行了清洗建模并驗證了其有效性。韓福霞等[5]構建電力信息系統工程監理實時分析預測模型,為滿足其實時性,使用了Storm平臺與模型相結合的方案。吳克河等[6]提出基于Storm 平臺和ARIMA模型的預測平臺,分析不同類型電網時序數據的特點,預設模型參數以降低預測時間。馬宏偉等[7]搭建了一種基于MapReduce的煤礦綜采設備運行狀態大數據清洗模型,該模型的采用雙MapReduce協同工作,并將清洗結果按時間排序。綜上所述,當下有關數據清洗的研究以及Storm的應用多處于電網設備這一背景之下,即便與煤礦設備相關,也偏重于研究非實時清洗技術。……