呂月穎,季嘉琪,陳修杰,王文浩,苗德俊
(山東科技大學 安全與環境工程學院,山東 青島 266590)
近年來煤礦安全形勢有很大改善,百萬噸死亡率逐年下降,但煤礦事故仍時有發生,整體安全形勢依舊嚴峻,其中人因因素在事故致因中的比例約70%。國內外有關學者在人因管控方面從微觀層面的神經機制[1]角度到宏觀層面上安全監管機制[2]分析均有研究,但現有研究往往忽略行為產生的誘發規律,制定管控策略治標不治本。因此,有必要在宏觀的基礎上,對人因規律進行研究,協助資源合理配置,提高人因管控效率。對事故原因進行深層次研究是預防事故發生的重要手段之一[3]。事故報告作為在事故發生后專業人員考察事故現場搜集資料形成的細節還原度、可信度以及真實性普遍較高的文本數據,可作為事故人因研究的文本數據。葉貴等[4]、李鈺等[5]充分利用結合建筑事故報告,對建筑行業安全預控提供參考。在計算機技術的發展下,利用文本挖掘技術研究事故報告成為可能。目前,數據挖掘技術在各個領域延伸[6]。趙明靜[7]借用關聯規則分析等研究城市物流公共安全事故,預測風險等級并提出風險防控機制,借助關聯分析溯源事故原因。利用數據挖掘技術研究事故致因機理和隱患風險已成為事故致因研究新方法。為此,通過收集2015 年到2021 年的煤礦事故報告,借用數據驅動的方法,自然語言分析技術和機器學習技術研究導致事故發生的人因因素,按照分層思想由大到小、從上至下,進行人因關聯規則挖掘,為提高礦山安全水平提供數據支撐。
在國家應急管理局網站、各省份煤礦安全生產網等網站進行事故報告收集處理,繼而開展煤礦人因關聯規則研究。分析流程如下:①對事故報告進行Gephi 網絡分析,分析煤礦事故現狀;②運用WordCloud 分析確定監督、管理、生產3 個層面上事故人因管控方向,LDA 分析深度挖掘煤礦事故人因;③采用Apriori 算法[8]挖掘煤礦事故人因間的強關聯模式,探究事故發生的人因規律性。
事故報告涵蓋煤礦事故中所存在的主要不安全行為。通過收集、人工查閱處理后,共獲得符合要求的事故報告391 篇,事故報告數據整理見表1,篇幅有限,只體現部分數據。
表1 事故報告數據統計(部分)Table 1 Accident report statistics(department)
將事故報告中的事故時間、等級、類型、省份、地點和工種進行Gephi 網絡分析,事故報告網絡聯絡如圖1。
圖1 事故報告網絡聯絡圖Fig.1 Incident reporting network contact diagram
1)事故等級。一般事故占總事故等級的79.54%,頂板事故在事故類型中占比30.4%;根據網絡圖節點連接,一般事故相比其他類型事故事故地點更加多樣,如綜采工作面、采煤工作面、掘進工作面、主斜井、井底車場等;較大事故主要發生在綜采工作面、采煤工作面、掘進工作面等地;重大事故發生地點主要是在各類工作面以及主斜井和運輸巷道。頂板事故在一般、較大事故中尤為突出,根據事故回溯,重視“問頂敲幫”等措施可以在一定程度上避免一般頂板事故的發生,而在預防重大煤礦事故發生時,瓦斯事故是重點關注事故類型。
2)事故類型。通過事故報告網絡分析,確定管控地點以各類工作面為主,瓦斯事故由于其在重大、特別重大事故中的高占比,成為重點管控對象,一般事故以及頂板事故事故因其在事故等級和事故類型分析中出現較頻繁成為日常監督管理重點。
WordCloud-LDA 分析前需先進行文本分詞,將文本分解為若干個獨立的詞語,為提升分詞效果,在基礎詞典基礎上,擴充專用詞典及停用詞詞典,將“勞動組織”、“違規施工”等分至專用詞典,“僅有”、“全部”、“其它”等分至停用詞詞典。根據文本分詞形成的高頻詞匯和逆文檔概率對報告中的直接原因、間接原因進行WordCloud-LDA 研究。
2.2.1 WordCloud 分析
1)直接原因詞。直接原因詞云圖如圖2,圖中字體的大小代表出現頻率的多少。工作面作為事故主要發生地點在圖中著重突出;應力、支架、頂板等詞比較突出,表明頂板事故在事故類型中比例較大;而違章、違規、違反、操作、不當等點明事故人因具體形式。
圖2 直接原因詞云圖Fig.2 Direct causes word cloud
2)間接原因詞。間接原因詞云圖如圖3。管理、現場、落實、不到位、教育、生產、履行、培訓等詞說明在間接原因中主要存在監督、管理層面不足。
圖3 間接原因詞云圖Fig.3 Indirect cause word cloud
綜上所述,直接原因多數與生產層面人因息息相關,間接原因往往涉及到煤礦管理、監督層面人因管控不足,因此明確煤礦事故人因需從監督、管理、生產層面3 個層面展開管控。
2.2.2 直間接原因主題分析
進一步對直接間接原因文本挖掘,利用Python語言針對分詞結果進行LDA 主題分析,并從直接原因及間接原因中分析出7 個主題和4 個主題,通過對主題的分析研究歸納總結其主題含義,并由此來獲取相應的人因因素,結果如下:
1)直接原因。危險現象重視不足、專業技能不足、違章違法操作、現場管理人員違章指揮、應急不足、無安全措施、爆破作業不標準。
2)間接原因。安全生產管理落實不到位、安全管理制度執行不到位、安全思想教育培訓不到位、日常監督檢查不嚴。
WordCloud 分析確定3 個層面事故人因管控方向,LDA 分析深度挖掘直接、間接原因文本后,參照事故人因理論、煤礦事故報告,構建由監督層面、管理層面、生產層面3 個一級因素,以及安全監督計劃制定不科學、缺乏有效的安全監管機制等22 個二級因素的煤礦事故人因因素體系。煤礦事故人因因素體系見表2。
表2 煤礦事故人因因素體系Table 2 Human factors system for coal mine accidents
在煤礦事故人因因素體系上添加事故類型、事故等級2 個參數進行關聯分析,事故等級從一般事故至特別重大事故,由L1~L4表示;事故類型中頂板、運輸、其它、放炮、水災、火災、瓦斯及機電事故由T1~T8表示。確定每件事故是否存在所判因素,若存在當前因素則編碼為“1”,若不存在則編碼為“0”,為減少主觀評判影響,本數據由3 位統計者同時進行統計,如有差異,則通過分析來決判差異部分。
按 照[S1,S2,…,S6,E1,E2,…,E8,P1,P2,…,P8,L1,L2,L3,L4,T1,T2,…,T8]將每一個事故報告其轉變為1 個長度為34 的一維矩陣形成391×34 的矩陣—煤礦事故人因矩陣集MAHCS(Mine Accident Human Causes Set),每1 行代表1 個具體事故的人因信息。
對MACLS 進行關聯分析。選擇2 組最小的支持度和置信度閾值,分別為0.1、0.2,Apriori 算法推算出583 575 條規則。
依托于置信度和支持度,在設定的置信度基礎上,選取滿足提升度大于1 的數據,結合事故數據報告分析,從事故等級和事故類型2 個角度選取一般事故和頂板事故進行關聯規則分析研究,從規則中分別提取出后項為L1、T1的關聯規則,依照提升度,提取關聯規則。一般事故關聯規則見表3,頂板事故關聯規則見表4。
表3 一般事故關聯規則Table 3 General accident association rules
表4 頂板事故關聯規則Table 4 Roof accident association rules
規則1~規則3 為:管理層安全思想教育不到位時,生產中職工常出現不安全心理、違章違法操作,對危險現象重視不足等問題,容易發生一般事故;規則4 為在管理層安全思想不到位,生產中制定的安全技術措施實施管控不到位情況下,職工較容易產生不安全心理以及違章違法行為,導致一般事故發生;規則5 為當日常檢查不嚴,對職工安全教育管控不到位的前提下,當生產時存在違章違法操作時,通常伴隨一般事故的發生。
規則1~規則3 指出:管理層面出現隱患排查、整改跟蹤不力,技術措施制定、管控不到位、安全檢查人員、設備配備不充分,安全思想教育不到位等問題時,職工往往會對危險現象重視不足且經常出現違章違法操作,并最終導致頂板事故的發生;規則4、規則5 表明管理制度、技術措施、思想教育以及相關設備人員不足的情況下,違章違法操作問題出現的頻次也會增多。
綜上所述:針對事故人因的管控應從監督、管理、生產3 層面同時展開,日常監督不斷、制度指定、措施實施、思想在線、人員遵章守紀的情況下層層管控[9-10]。
在深入研究文本數據挖掘方法和事故誘發機制基礎上,對事故報告文本數據進行WordCloud-LDA分析,構成由監督-管理-生產3 個一級因素,安全監管計劃制定不科學,缺乏有效的安全監管機制等22 個二級因素組成的煤礦事故人因因素體系。通過煤礦事故人因矩陣集的Apriori 關聯分析,從不安全監督、不安全管理和不安全生產3 個層面針對一般事故及頂板事故,找出人因因素間的規律性,為相應職工管控措施的實施提供了依據和基礎。