李 琰,岳雪嬌,陳俠君
(西安科技大學管理學院,陜西西安 710054)
煤礦安全事故的發生主要是由于物的不安全狀態和人的不安全行為引起的,但隨著煤礦作業機械化程度的不斷提高,作業中機器設備出現故障的概率逐漸降低,由礦工的不安全行為造成的煤礦安全事故風險的概率持續上升[1]。2020 年全年發生煤礦安全事故共122 起,死亡人數共225 人,其中造成事故發生最為突出的原因仍然是礦工安全紅線意識不強和存在違法違規的不安全行為。因此,深入探究礦工不安全行為隱含關聯對礦工安全生產管理尤為重要,是識別和把控煤礦事故發生的有力舉措[2]。國內外學者對于礦工不安全行為已經進行了大量的相關研究,1996 年,Donald 等[3]最先從人格特質的研究角度出發發現礦工的人格特點與事故的發生之間密切相關。目前對礦工不安全行為的研究主要集中在單方面和多方面影響因素的研究,從單方面研究來看,國外學者認為礦工工作環境與工作壓力[4]、不安全心理狀態[5]以及煤礦倒班制度[6]都會對礦工不安全行為產生消極影響。從多方面因素研究來看,學者大都通過利用構建模型的方式來探究影響因素,但傳統的方法存在諸多局限性,對于影響礦工不安全行為的因素討論較為分散。近年來,相關研究將數據挖掘技術應用于煤礦安全管理過程中,力求實現煤礦企業安全可視化管理[7]。2013 年,田水承等[8]首次構建了礦工不安全行為數據庫,對工作環境與礦工不安全行為之間的關聯性進行了初步分析。現有研究雖從不同角度對礦工的不安全行為進行了分析,但并未對礦工不安全行為之間的動態交互進行深層次和系統性的研究。基于以上研究,認為礦工的不安全行為應該是一個相互影響相互作用的整體系統,找到行為之間相互關聯相互影響的特征來發現礦工不安全行為存在的關聯性與必然性,從而針對找出的關聯規律來提出相應的解決對策措施。為此,從不安全行為的特征分析出發,結合不安全行為內容本身對煤礦企業不安全行為管控記錄數據進行分析,利用關聯規則算法從大量不安全行為記錄中得到礦工不安全行為的強關聯規則和關鍵因素;深入挖掘礦工不安全行為隱藏關系,為礦工不安全行為的治理提供更具針對性的意見,進而有效地控制不安全行為的發生率。
以我國某西部煤礦企業年的不安全行為管控表內44 070 條管控記錄作為數據源,剔除掉無用、空白數據,從不安全行為發生的內容描述、所處時間段、所處部門單位等角度用統計性數據分析礦工不安全行為規律,以期用頻次來解釋不同類型的礦工發生不安全行為的數量區間,得到不同約束條件下的最為突出的特征。
煤礦不同類型的作業區域中自然條件、設備設施、作業人員和管理水平有很大差異[9],因此需要對不安全行為的具體描述性內容進行統計,從而明確常出現的礦工不安全行為類型,深化認識礦工不安全行為。經統計剔除掉偶發行為,提取礦工不安全行為描述內容頻數的前25 項,得到的不安全行為描述頻次分布如圖1。
圖1 礦工不安全行為描述及數量分布Fig.1 Description of unsafe behavior and quantity distribution of miners
由圖1 可見:25 種高頻不安全行為中發生次數超過1 000 次的有7 種行為,超過2 000 次的有3種行為;其中頻數最多的不安全行為是“不佩戴安全帽”高達3 872 次,頻率為8.78%,其次是“遲到、早退”和“疲勞上崗”分別達到了3 771 次(占比8.56%)與2 033 次(占比4.61%);上述不安全行為出現的頻率遠超過了其他不安全行為,占全部不安全行為總數的1/4。究其原有主要還是員工欠缺對風險的規避意識,沒認識到“佩戴安全帽”與“按時上下班”的重要性。所以,應該加大對這些行為的管理,可以通過提高安全教育、安全宣傳力度,增加員工的安全意識,也可以通過階梯式遞增懲處力度,增加不佩戴安全帽,遲到、早退和疲勞作業的經濟損失,從而樹立礦工“安全無小事”的安全意識。
班次頻數分布情況如圖2。對于不同班次的行為特征中“8 點班”發生的不安全行為數量最為突出,遠超過了其他的班次點,超過了時間段總和的1/2,“16 點班”和“0 點班”次之,“2 點班”最少,可見,礦工工作的所處班次與不安全行為之間存在顯著關聯關系。因此,需要重視班次與工人狀態的交互,加強“8 點班”的作業行為管理,防止不安全行為事故的發生。
圖2 班次頻數分布Fig.2 Distribution of shift frequency
煤礦企業根據其企業的特殊結構特征,每一個部門單位員工的不安全行為都易成為煤礦事故的直接或者間接原因。各單位不安全行為統計前10 項頻數及比率見表1。
表1 各單位不安全行為頻數及比率Table 1 Frequency and ratio of unsafe behaviors of each unit
不安全行為發生超過了4 000 次的單位只有1個安全管理部門,其次超過了2 000 次的單位部門有運轉隊以及連采隊與綜采隊。安全管理辦公室本身就是對礦工不安全行為管理的部門,自身卻發生了不安全行為,這極易影響其他礦工的心理,因此安全管理辦公室以身作則的態度是煤礦安全生產的必要保證。由此可見,應加大對安全管理部門的硬性規章要求,對安全管理部門人員的招聘尤為重要,其決定了對其他單位的不安全行為進行管控效果。而連采隊、綜掘隊、通風隊、運轉隊和綜采隊等是煤炭生產的重要環節,其作業環境具有線路長、環節多的特點,作為煤礦生產中的重要一環,其順暢運轉是煤礦安全生產的必要保障[10]。由此可見,若能對這些部門的不安全行為加強管理,將有效提高煤礦企業的安全生產率。
將不安全行為危險等級進行分類是為了對不安全行為危險性進行把控,加深對不安全行為危險程度與嚴重程度的認識。不安全行為危險等級耦合情況統計分析如圖3。特別重大風險的不安全行為僅有26 次,所占比重僅為0.06%,中等風險的不安全行為最多,有21 927 次屬于這個級別的不安全行為,占比高達49.76%,接近所有等級不安全行為統計總頻數的一半,而中等危害的行為同樣存在造成人身傷害等安全事故,因此需要各級管理人員突出重點的監督檢查,基于經濟和行政雙重管理。
圖3 不安全行為風險等級分布Fig.3 Distribution of unsafe behavior
預警情況表現了企業對不安全行為管控力度的準備情況和負責態度,預警能在礦工在安全意識缺乏時,達到一個點醒、提醒的作用,從外部約束礦工的意識。煤礦企業礦工不安全行為發生時,有25 878次沒有預警,可見煤礦企業對不安全行為的重視程度還有待提高,企業監測預警信息系統的建設還需要進一步優化。
綜上,以上分析只是對不安全行為自身行為內容和各要素做了獨立的特征統計分析,明確了每一類特征的頻數分布以及關鍵要素,為了進一步明確各要素之間的相關性及事件鏈,需要對礦工不安全行為內容描述以及各個要素間進行關聯規則數據挖掘。挖掘出礦工不安全行為的潛在致因以及要素間的潛在關系,為礦工不安全行為管制提供數據支撐和指明實踐方向,使礦工行為管理措施更具針對性。
因為關聯規則法在實際運用的過程中具備有利條件,所以,當下關聯規則挖掘是數據挖掘中最常用且最活躍的分支之一,關聯規則挖掘是指用于發現事物之間存在的關聯關系的一個過程。關聯規則的內涵是指2 個不存在交集的非空集合A 和B 如果有A?B,那么A?B 就是1 條關聯規則。關聯規則中包含1 次完整條目鏈的集合稱為“事務”,每1個“事務”內的每1 個特征都代表1 個項,其中包含至少一個項的集合被稱為項集。
支持度是關聯規則中表示項目出現的頻次與總項目數間的比例關系的數據,支持度越高的項出現的頻率也越高,即:
式中:Support 為支持度;Count 為項數;D 為項數總和。
頻繁項集是指支持度大于等于最小支持度閾值的項集。置信度是指出現了“項A”的同時,出現“項B”的概率,亦可稱之為“項A”發生時,“項B”發生的概率,即:
式中:Confidence 為置信度。
強關聯規則是指支持度與置信度均大于或者等于設定的最小支持度和最小置信度的關聯規則。關聯規則挖掘的算法包括Apriori、PF-growth、Eclact等,由于數據量適中,選用Apriori 算法具有簡單且直觀的特點,能夠滿足當前挖掘數據和挖掘目標的需要。因此,利用Apriori 關聯算法對礦工不安全行為管控記錄數據進行關聯規則數據挖掘分析。
首先根據數據集生成候選項數據庫,并設置好最小支持度和最小置信度;過濾掉不符合最小支持度的項,生成頻繁項集,再組合形成新的項集集合,直到無法篩選出滿足最小支持度的新項集。而后,根據最終頻繁項集集合數據、計算頻繁項集集合所含項之間的置信度,篩出小于最小置信度的項集,生成關聯規則,并選出符合置信度和支持度閾值的強關聯規則。
然而,只依賴支持度和置信度指標有可能產生誤差,因為在置信度滿足條件時,置信度與原有的支持度相比,支持度可能反而會下降,這說明2 個項目之間產生了排斥作用,因此需要增加提升度(lift)這一指標來判斷所挖掘的關聯規則是否有效,提升度代表了規則的可靠性,即:
式中:Lift 為提升度,Lift=1 說明了條件間不存在關聯,相互獨立,Lift<1 說明了條件是相互排斥的,規則的可靠性隨Life 值得增大而增大。
在進行礦工不安全行為的特征關聯關系挖掘之前,需要對前期采集的不安全行為管控數據進行數據清理,將數據轉換成事務項候選集形式,然后利用關聯規則算法,進一步探索不安全行為發生的單位、班次、不安全行為描述內容和不安全行為危險等級之間的關聯性,得到滿足需求的關聯規則,最后進行規則的提升度評價,選取最優規則并加以解釋。從而協助管理者和安全部門進一步了解礦工不安全行為,并據此做出更為有效的決策。
以我國某西部煤礦企業1 年的不安全行為管控表內44 070 條管控記錄作為數據源,通過礦工不安全行為項目集的首次篩選,得到礦工不安全行為的因素頻繁結果,生成一階頻繁項目集。按照頻繁程度從高到低的排序方式從中提取出支持度排序的前10 項規則,其中,單項頻率最高的項目為不同班次中的“8 點班”,達到了24 852 次;“中等”風險排第2名,有21 927 次;“一般”風險排第3 名,出現了16 218 次;不同班次中的“16 點班”和“0 點班”出現的頻次分別排名第4 名和第5 名;“重大”事故風險出現頻次排第6 名;行為內容描述中的“不系安全帽”和“遲到、早退”分別排名第7 名和第9 名;各個單位中出現頻數最多的為“安全管理辦公室”,排在前10項規則中的第8 名;單項頻繁前10 項中最低的是行為內容描述中的“精神恍惚、疲勞上崗”,也高達2 033 次。支持度反映了礦工不安全行為影響因素中單項事務的頻繁程度,為了加深礦工不安全行為形態的印象,所以需要將頻繁項目進一步處理。
為了能夠更深入地提取出礦工不安全行關聯規則的總體規律和重要規則共性,基于上述的礦工不安全行為頻繁項集,利用關聯規則分布矩陣進一步分析礦工不安全行為間的關聯關系,分布分析可視化結果可以通過圓形的顏色深淺和大小來觀測關聯性。圓形顏色的深淺程度指提升度大小,顏色越深則提升度越大;圓形大小指支持度大小,圓越大支持度越大。由關聯規則分布矩陣結果可得到如下結論:“井下在崗睡覺、脫崗”、“精神恍惚、疲勞上崗”、“遲到、早退”“不戴安全帽、超速行車”這4 類行為都極易造成不安全行為事故的發生。其中“井下在崗睡覺、脫崗”的行為事務項具有重大風險,極易直接引發事故;“精神恍惚、疲勞上崗”;“遲到、早退”現象出現的頻次相對較低,屬于一般的不安全行為,集中出現于8 點班次;“不戴安全帽、超速行車”行為屬于中等的不安全行為,容易出現在8 點班次;生產辦,機電信息中心是引發中等危害不安全行為的主要單位;一般和中等的不安全行為極易在8 點班次發生,且發生頻率屬于所有事務項中最高。
為了能夠更深入地提取出各礦工不安全行為中最優關聯規則,并找到關鍵要素,在軟件中將橫坐標設置為支持度(support),縱坐標設置為置信度(confident)和提高度(lift)對上述關聯規則提升度進行計算并離散可視化處理,得到礦工不安全行為關聯規則分布散點圖。再對強關聯規則的提升度進行計算提取出提升度最優的10 項關聯規則如圖4。圓形顏色的深淺程度指提升度大小,顏色越深則提升度越大;圓形大小指支持度大小,圓越大支持度越大。
圖4 礦工不安全行為最優強關聯規則Fig.4 Optimal strong association rules for miners’unsafe behaviors
在這10 條最優強關聯規則中有7 條規則與一般的不安全行為強相關,它們分別是“串崗”、“會車不減速、不變光、不避讓”、“停車駕駛員離開不熄火、不取鑰匙、不關車門”、“不了解工作崗位上崗”、“駕駛員不系安全帶”、“作業人員未隨身攜帶資格證書上崗”、“不參加班前會上崗”。“0 點班,井下在崗睡覺”、“井下在崗睡覺”與“脫崗”都與重大行為強相關。據此,得到如下信息:包含駕車的不安全行為在時空分布上都存在關聯程度較高的組合狀態,極易在此狀態下發生一般危害性不安全行為;而“井下在崗睡覺”與“零點班”高度組合,且“井下在崗睡覺”和“脫崗”是容易造成人身危害事故的重大危害行為。
以上行為大多數都會直接造成安全事故的發生,故在日常安全管理工作中必須對駕駛員的工作狀態和工作內容進行嚴格的預防與控制,要加強針對“單位”、“班次”以及“工作內容”方面的深度監管,如在生產辦、機電信息中心等工作單位安設檢查監督人員和設施;在0 點班次的工作前和工作中都要對礦工的工作狀態和精神狀態進行嚴格把控,例如在0 點班次工作前組織礦工進行“提神醒腦操”讓礦工工作精神和意識達到最佳狀態;同時安全管理工作要意識到安全教育培訓的重要性,讓礦工充分了解不安全行為導致事故發生的危害性和風險性。
以西部地區煤礦企業不安全行為管控數據表作為礦工不安全行為特征關聯性分析的數據源,首先,對礦工不安全行為相關的要素進行了頻次分析,初步認識了礦工不安全行為的具體特征形態;其次,再基于關聯規則中的Apriori 算法對礦工不安全行為指標及相關要素進行關聯分析,得到強關聯規則;最后,基于強關聯規則得出不同不安全行為的主要關聯性。相比于傳統的分析方法,使用的關聯規則算法不僅對礦工不安全行為影響因素進行了定量分析而且定性地指出在不同情況下具有不同特征的不安全行為發生的可能性,能夠對礦工不安全行為治理提供科學可靠的支持,可為安全監管部門提供合理的監管建議與數據支撐。