張 怡
(成都理工大學 工程技術學院,四川 樂山 614000)
在礦山安全管理中,越來越注重智能化管理方法的應用,以及時發現礦山中存在的安全隱患,且及時預警。礦井火災事故是煤礦安全的一個重大隱患,一旦發生,會造成不可估計的損失。因此需要加強礦井火災事故預測,消除事故隱患。其中數據挖掘是在海量數據中提取有用信息,及時掌握相關數據信息中的異常數據,實現對礦井火災事故的有效預測[1-2]。為提升礦井火災事故預測精確性,本文基于Apriori算法分析其相關影響因素,實現火災預警,并結合預警情況制定應急對策,以免發生重大事故、造成嚴重損失。
數據挖掘是在數理模式下實現對海量存儲數據的分析,在隱含數據中獲取具有規律性及潛在價值的信息,所以數據挖掘也稱知識發現。數據挖掘過程包含數據準備、規律尋找以及規律展現。數據挖掘是知識發展流程的重要組成部分,由大量特定挖掘算法構成,在此過程中挖掘算法的應用即為提取有效模式[3]。
數據挖掘算法由輸入、輸出以及算法處理組成。通常,將歷史數據輸入數據庫中,通過算法輸出發現規律,實現對數據的處理。相對而言算法處理更加復雜,包括具體的算法過程。在實際中也有專門屬性歸納方法,可以在不同類型挖掘任務下實現對數據挖掘方法的劃分[4]。本文基于挖掘任務視域,在挖掘算法的對比分析下,選擇與礦井火災事故預測密切相關的關聯規則算法Apriori算法。
Apriori算法是傳統生成布爾型關聯規則的頻繁項集挖掘算法之一,是逐層搜索下構建的迭代算法。這一算法基于靜態數據信息,實現對有價值數據挖掘的關聯規則分析。應用中的基本思路為:
1)掃描數據庫,統計分析所有單個項目支持度,可提取大于或等于給定最小支持度項目組,構建頻繁項集L1。
2)再次對數據庫實施掃描,遞歸獲取最終頻繁項目。通過簡化,主要為以下3個步驟:①連接步驟,在與k-1頻繁項集連接后建構k項候選集。在連接過程中基本條件為:保證前k-2項相同,同時第1個k-1項集的第k-1項<第2個k-1項集的第k-1項;②刪除步驟,在Apriori算法下一一剪去k項候選集。在剪枝中基本規則為:如果k項候選集中任意非空子集不是頻繁集,可以剪去這一候選集k項集;③計數步驟,針對數據庫實施掃描,實現對數據庫中k項候選集存在次數實施累加。其中計數中如果在交易記錄中存在有這一候選集,那么次數上加1。之后依照給定的最小支持度閾值即可構建k項頻繁集[5-6]。
這里選擇頂尖數據挖掘平臺TipDM進行模型構建。TipDM平臺在應用中可以從各種數據源中獲取數據,完成數據挖掘模型的構建。模型輸入包括建模專家樣本數據輸入以及建模參數輸入兩部分?;緟翟O置見表1。

表1 建模參數設置
建模仿真過程見圖1。

圖1 建模仿真過程
在Apriori算法應用過程中,需要注重數據收集,盡可能提升數據的實效性以及準確性。具體過程包括:①將感應器及數據收集系統設置在井下巷道及采掘工作面上;②所采集數據及時傳輸到計算機分析終端,以實現對數據的分析;③結合分析結果,在關鍵位置發布結果;④依照分析結果,由管理人員實施預警處理;⑤結合預警事項及相關規范,實現對礦井現場防治[7]。
4.2.1 數據采集
以某礦井為例,以2019年3月監測數據作為原始數據,每小時實施一次監測,構建原始數據庫。數據庫中數據記錄達到2 900條,實現對5項參數的監測。其中采掘深度-150~-120 m的相關參數見表2。

表2 原始監測數據
4.2.2 數據預處理
礦井監測原始數據所構建的數據庫中包括大量實施數據,其特點為異構性、隨機性、多維性以及不完全性。然而監測所得原始數據并非有效挖掘數據,因此還需對其深入分析。為便于實施數據挖掘,提升數據有效性,先對數據實施預處理,在分析過程中從1開始進行排序,相應的預處理規則見表3。在礦井危險等級評估中依照我國《煤礦安全規程》[8]中的相關規定實施分級,分別為較弱、中等以及嚴重,本次研究分別以1、2、3替代,關聯規則下實施轉換所得事務見表4。

表3 數據預處理規則

表4 轉換后事務表
4.2.3 Apriori算法下的數據挖掘
登錄TipDM平臺后,選擇Apriori算法,將以上所得數據導入平臺中,即可得到相應的關聯規則,見表5。

表5 關聯規則表
4.2.4 結果研究
通過以上分析可以發現,礦井火災事故發生的影響因素主要為瓦斯含量以及日產量。管理人員在分析中發現出現高瓦斯濃度情況,需要加強對礦井火災事故的預防,結合這一情況實施監控指揮,可有效預防礦井火災事故的發生。以此實現對礦井火災事故隱患的有效預測分析,最大化消除相關隱患。
Apriori算法在礦井火災事故預測分析中具有一定可行性,主要優勢為:礦井火災多因素特性和Apriori算法規則具有良好的契合性;可以及時發現礦井火災事故隱患,便于早期實施火災防治[9];應用Apriori算法可實現對相關安全因素較為準確的評估。但在實際應用中,也存在一定的不足,例如礦井中通常日常數據量非常大,因此在應用中無法保證數據實效性及真實性。另外在數據設計中,因數據不斷擴大,存在較多數據關聯頻繁項,在此情況下管理者也需及時更改報警數據規約模型參數,以能夠取得良好的預測效果。
基于Apriori算法實現了關于礦井火災事故的預測分析,通過數據挖掘分析研究可以發現瓦斯濃度以及日產量是礦井火災事故預測的主要參數,結合相關因素關聯關系實現對礦井火災事故的預測分析,構建相應的預警系統,有助于提升礦井火災事故預測預警準確性,進而有助于降低礦井火災事故發生率。雖然以上研究證明Apriori算法在礦井火災事故預測中具有一定使用價值,但在礦井火災事故預測分析中,數據挖掘針對性及其準確性直接影響關聯規則算法應用效果。想要實現對礦井火災事故的有效預測和分析,也需要針對Apriori算法應用中存在的不足實施改進,以提高Apriori算法在煤礦風險預測中的應用價值。