李春霞 孟凡強



[摘 ? ?要] 為了挖掘采煤工作面安全監測數據潛在的價值,應用關聯規則數據挖掘技術,構建基于大數據挖掘采煤工作面安全預警管理方法。該方法以工作面多源大數據為基礎,通過挖掘數據間關聯關系,實現采煤工作面安全風險的識別與預警,并以山東某礦綜采工作面安全監測數據為例,關聯規則挖掘結果表明,采用關聯規則挖掘的專家系統可對采煤工作面進行安全預警。
[關鍵詞] 采煤工作面;安全預警;專家系統;關聯規則;安全管理
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 23. 053
[中圖分類號] F270.7 ? ?[文獻標識碼] ?A ? ? ?[文章編號] ?1673 - 0194(2020)23- 0129- 03
0 ? ? ?引 ? ?言
采煤工作面作為煤炭的主要生產場所,空間狹窄,環境復雜,設備多,作業人員集中,是一個復雜的社會技術系統[1]。應用系統工程分析方法,全面分析采煤工作面的風險因素,建立采煤工作面安全預警專家系統,可對風險進行預警。
1 ? ? ?一般專家系統
一般傳統采煤工作面安全預警專家系統由知識庫、數據庫、推理機、解釋器、知識獲取系統與人機接口組成。知識庫、推理機作為系統的核心,用來存儲采煤安全專家經驗知識和已知的事實、產生式規則等[2],系統結構如圖1所示。
知識獲取是構建知識庫的核心,由于受領域專家知識或知識工程師技能局限性影響,所獲取的知識存在不完整、片面性或者不準確問題,導致知識庫構建過程中推理結論不準確[3]。
數據挖掘(Data Mining,DM)從大量的、不完全的、模糊的數據中,提取隱含的有價值的信息,是從數據中發現模式算法的最好方式[3]。為此,文章主要是研究將數據挖掘技術用于專家系統中,改善采煤工作面安全預警專家系統中的知識獲取“瓶頸”問題[4],以便更好地實現采煤工作面安全預警管理。
2 ? ? ?采煤工作面安全預警多元數據源
采煤工作面安全預警需要對測量的參數進行選擇和采集,直接測量的參數包括工作面環境參數,如瓦斯濃度、風速、風量、CO濃度等[5-6];此外,還有視頻、維護維修管理等大量的非結構化數據[7]。
多元數據來源主要包括:
(1)初始數據庫。包括采煤工作面各類知識清單及各項規章制度、資料、文件等。知識清單如采煤作業系統知識、運輸系統知識、通風系統知識、供電系統知識、排水系統知識、輔助作業系統知識;頂板管理知識、瓦斯與粉塵治理知識、水災防治知識、火災危害知識、機電事故知識、運輸事故知識以及放炮事故風險知識[5]。
(2)運行數據庫。采煤工作面運行數據庫由采煤工作面環境、設備運行、頂板壓力等狀態信息構成。如前所述,這些信息通過自動化監測傳感器收集。
(3)管理數據庫。包括工作面日常維護、維修以及相關的維護設備材料、事故處理和管理人員等數據[8]。管理人員數據主要包括維修人員的學歷、專業水平、個人技能、工作年限、崗位職責等。
(4)其他相關數據庫。與采煤工作面有關但還不能確認的相關聯數據。
3 ? ? ?基于關聯規則挖掘的采煤工作面安全預警專家系統
文章采用關聯規則分析方法。
數據挖掘的技術路線是對工作面全部安全生產數據進行關聯性深度挖掘[8],分別取得工作面正常工作模式對應的數據指標及工作面存在風險時對應的數據指標,將收集到的數據進行對比,從而對工作面安全狀況作出預測判斷。
3.1 ? 數據預處理
海量數據的預處理是采煤工作面安全預警的一個重要步驟,一般包括結構化處理、數據清洗與集成、選擇與變換[7,10]。
(1)結構化處理:工作面日常維護、維修以及相關的維護設備材料、事故處理和管理人員等數據多以文本形式存儲,數據挖掘模型難以對這些非結構化信息直接處理,需要對這些文本進行結構化處理,形成結構化數據。
(2)數據清洗與集成:在收集到的原始數據通常存在大量的異常數據,如關鍵指標偏離期望值、關鍵屬性信息缺失、錯誤類型數據等。采用平滑噪聲數據、填補遺漏缺失數據、剔除異常數據進行處理,并將數據結構標準化處理。
(3)數據選擇與變換:根據業務需求選擇數據信息,然后進行數據格式化處理,統一編碼,形成安全預警數據庫,以備數據挖掘使用。
3.2 ? 風險預警信息關聯規則挖掘
設項集I={i1,i2,…,in};TR是事物的集合;TR?奐I,并且TR是一個{0,1}屬性集合。設X是一個項集,且X?哿TR。關聯規則是形如X?圯Y的蘊含式,其中X?哿I,Y?哿I,且X∩Y=φ,X—規則的條件(前件),Y—規則的結果(后件)[11]。
(1)支持度:關聯規則對事物TR的支持度(support)定義為同時包含有事物X、Y的交易數與所有交易數之比,描述為:
support(XY)=P(X∪Y)(1)
反映了項集X、Y在事物集TR同時出現的概率。
(2)置信度:關聯規則對事物TR的支持度(confidence)定義為包含有事物X、Y的交易數與包含X交易數之比,描述為:
confidence(X?圯Y)=P(X|Y)(2)
反映了數據集中出現項集X的同時又出現項集Y的條件概率。
關聯規則的支持度和置信度分別反映了所發現規則的有用性和確定性,一般的用戶可以定義兩個閉值,分別為最小支持度閾值和最小置信度閾值。當挖掘出的關聯規則的支持度和置信度都滿足這兩個閉值時,就可以認為這個規則是有效的,否則就是無效的規則[10]。
3.3 ? 基于關聯規則挖掘的專家系統
圖2是按照上述方法構成的基于關聯規則挖掘的專家系統。從結構上看,該系統同樣包含知識庫、推理機、解釋器等傳統專家系統所具有的功能模塊,但二者實現方法有很大區別。數據挖掘專家系統的知識獲取包括領域專家解決實際問題的案例、安全隱患歷史數據等。經過挖掘算法學習訓練后的數據,以數據挖掘模型的形式存在于專家系統中。在推理時,由診斷程序和控制知識自動完成整個診斷推理的流程,增強了工作面安全隱患診斷的“智能”性。當診斷完成后,解釋系統給出推理的全過程。
4 ? ? ?應用實例
以山東某礦綜采工作面安全監測數據為例,利用關聯規則挖掘技術,挖掘不同工作時間段與監測數據之間的關聯關系。根據該礦地質構造、賦存條件分析,影響工作面安全預警的因素主要是瓦斯、一氧化碳、通風、溫度等。所有安全監測數據與重要操作事件參數均存入關系數據庫。
截取2017年1-4月部分數據,原始資料如表1所示。
應用數據挖掘算法計算,并對瓦斯、一氧化碳、工作面溫度關聯規則進行可視化處理,如圖3所示。由圖可知,早6:00-8:00時間段內,工作面溫度高,風速低。原因是該時間段為夜班、早班交接時,夜班工人正在升井,早班工人還沒到崗,井下值班領導、安全人員沒有到位,工作面無人監管,出現通風機停止或風門沒關閉等現象,導致工作面通風不好,這樣很可能會導致瓦斯等有害氣體濃度升高,容易發生事故。
5 ? ? ?結 ? ?論
應用大數據挖掘技術的采煤工作面安全預警專家系統,構建采煤工作面安全預警方法,以工作面安全監測、安全管理數據為基礎,通過挖掘數據間的關聯關系,實現工作面安全風險的識別與預警,對預防煤礦事故的發生起到積極作用。
主要參考文獻
[1]張志建.采煤工作面生產的安全管理與技術措施[J].內蒙古煤炭經濟,2014(10):73.
[2]王文杰,葉世偉.人工智能原理與應用[M].北京:人民郵電出版社,2004.
[3]李雄飛,董元方,李軍.數據挖掘與知識發現[M].北京:高等教育出版社,2010.
[4]邢平平,施鵬飛.農業專家系統中的數據挖掘及其應用[C]//第四屆全國農業知識工程學術會議,1999-01-01.
[5]中國法制出版社.煤礦安全規程[M].2016年修訂版.北京:中國法制出版社,2011.
[6]姜福興.采煤工作面頂板控制設計及其專家系統[M].北京:煤炭工業出版社,2010.
[7]王新浩,羅云,李桐,等.基于大數據的特種設備宏觀安全風險預警方法研究[J].中國安全生產科學技術,2018(4).
[8]趙丹,陳帥,潘競濤.礦井監控預警診斷系統研究[J].中國安全科學學報,2015,25(4):63-69.
[9]程翔,甘拯.基于大數據挖掘的安全監測資料分析模型技術研究[J].低碳世界,2016(28):101-102.
[10]郭宇棟,李生林.大數據關鍵技術在基建營房綜合管理系統中的應用[J].物流技術,2016,35(5):169-175.
[11]Bahn S. Workplace Hazard Identification and Management:The Case of an Underground Mining Operation[J].Safety Science, 2013,57(8):129-137.
[12]戴紅,常子冠,于寧.數據挖掘導論[M].北京:清華大學出版社,2015.
[13]趙長明.智能分揀技術在公安應急物資倉儲智能化建設中的運用[J].中國管理信息化,2020(9):187-188.