馬明煥,王新浩,許曉輝,羅 云,楊 凌
( 1.國網(wǎng)吉林省電力有限公司,吉林 長春 130000;2.中國地質(zhì)大學(北京) 工程技術學院,北京 100083;3.國網(wǎng)吉林省電力有限公司 延邊供電公司,吉林 延吉 133000)
安全生產(chǎn)事故隱患排查治理作為遏制重特大事故、實現(xiàn)安全生產(chǎn)超前預防的主要措施途徑,對提升企業(yè)安全生產(chǎn)保障水平具有至關重要的作用[1-2]。近年來,隨著企業(yè)事故隱患排查治理信息系統(tǒng)和政府事故隱患排查治理網(wǎng)絡管理平臺逐漸建立完善,大量事故隱患數(shù)據(jù)信息被科學地記錄和存儲[3-4]。然而,大多數(shù)企業(yè)僅應用這些數(shù)據(jù)指導隱患整改工作,缺乏對數(shù)據(jù)的有效利用。收集存儲能力增強與數(shù)據(jù)分析利用水平欠缺之間的矛盾,嚴重制約企業(yè)安全管理水平的提高。挖掘安全管理數(shù)據(jù)中的潛在價值,指導隱患排查治理工作的優(yōu)化提升,將成為企業(yè)安全發(fā)展的關鍵。
目前,隱患排查治理方面的研究主要集中在隱患管理體系構建、長效機制完善和排治措施優(yōu)化3個方面[5-7],數(shù)據(jù)挖掘技術在事故隱患排查治理方面的應用尚處于起步階段。部分學者嘗試用Apriori,Eclat等關聯(lián)規(guī)則算法對煤礦[8]、石化[9]、地鐵[10]等領域的風險因素進行關聯(lián)規(guī)則挖掘,以此進行關聯(lián)因素預警。但上述應用均采用傳統(tǒng)支持度計數(shù)方式挖掘頻繁項集,某些重大事故隱患往往因出現(xiàn)頻率較低、支持度不滿足閾值而被剪枝,無法形成有趣規(guī)則[11]。此外,專家學者在研究過程中,大多將隱患數(shù)據(jù)定義為靜態(tài)數(shù)據(jù),或將不同時序的隱患數(shù)據(jù)置于同一數(shù)據(jù)集,忽視對關聯(lián)規(guī)則變化趨勢的分析,不符合隱患動態(tài)變化的特點。基于上述分析,本文應用并優(yōu)化數(shù)據(jù)流滑動窗模型、等價類變換算法和變化挖掘算法等數(shù)據(jù)挖掘技術,構建1種關聯(lián)隱患預警方法,挖掘各類隱患間關聯(lián)規(guī)則和變化模式,指導企業(yè)進行針對性排查和整改。

圖1 關聯(lián)隱患預警流程Fig.1 Associated hidden danger prediction process
關聯(lián)隱患預警方法主要包括:隱患數(shù)據(jù)挖掘、隱患預警信息發(fā)布、關聯(lián)隱患排查治理、效果評價及反饋4個環(huán)節(jié),如圖1所示。首先,以歷史隱患數(shù)據(jù)為基礎,通過隱患數(shù)據(jù)流窗口模型、加權等價類變換算法和隱患變化模式3項數(shù)據(jù)挖掘技術,獲得隱患關聯(lián)規(guī)則數(shù)據(jù)集與隱患變化模式數(shù)據(jù)集;其次,將數(shù)據(jù)集映射到用戶實時錄入的隱患排查數(shù)據(jù)中,發(fā)現(xiàn)關聯(lián)隱患及其變化模式,發(fā)布關聯(lián)隱患類型、存在可能性及變化模式等預警信息;然后,企業(yè)按預警信息進行針對性隱患排查治理;最后,對預警準確率、關鍵隱患出現(xiàn)頻率等情況進行評估反饋,以此調(diào)節(jié)數(shù)據(jù)窗口長度及隱患權重。
數(shù)據(jù)流是一系列連續(xù)而有序的


圖2 隱患數(shù)據(jù)流滑動窗口Fig.2 Hidden data stream sliding window
等價類變換算法[13]是采用垂直數(shù)據(jù)格式挖掘頻繁項集的深度優(yōu)化算法,該算法在概念格理論的基礎上,利用基于前綴的等價關系將搜索空間(概念格)劃分為較小的子概念格,各子概念格采用自底向上的搜索方法獨立產(chǎn)生頻繁項集,進而根據(jù)支持度、不平衡比等約束條件產(chǎn)生關聯(lián)規(guī)則。
為適應隱患重要性不同特點,在等價類變換算法的基礎上,引入隱患權重概念,設計加權等價類變化算法,改變傳統(tǒng)的支持度計算方式;通過對管理隱患、重大事故隱患等關鍵隱患設置高權重,提升關鍵隱患支持度,增加關鍵隱患規(guī)則數(shù)量。隱患權重相關概念如下:
對于事故隱患類型集合H={h1,h2,…,hn},其中h1,h2,…,hn為隱患類型,為表征各隱患的重要性,對各隱患設置權重系數(shù),記為wj,其中0 定義1 :設隱患排查活動集合I={Ix,Iy,…,Iz},其中Ix={ha,hb,…,hn}為1次隱患排查活動,ha,hb,…,hn為此次隱患排查活動發(fā)現(xiàn)的隱患類型,Ix的權重記W(Ix) 定義2:隱患集合X的加權支持度為Wsup(X) 定義3:關聯(lián)規(guī)則X?Y的加權支持度為Wsup(X∪Y) 傳統(tǒng)等價類變換算法具有遞推性質(zhì),即若一隱患集合的支持度不滿足最小支持度的要求,則此隱患集合與其他隱患集合做并運算后得到的集合也不滿足最小支持度的要求。在加入隱患權重概念后,傳統(tǒng)支持度計算方式發(fā)生變化。因此,需驗證該性質(zhì)是否仍然成立,即證明:X與Y為2個隱患集合,若X?Y,且X≠φ,則必有Wsup(X)≥Wsup(Y)成立。 由上述推導證明得:加入權重概念后,傳統(tǒng)等價類變換算法的遞推性質(zhì)仍然有效,可極大減少搜索空間,提高運算效率。 變化挖掘[14-15]主要是比較不同時間段的關聯(lián)規(guī)則集合,分析前后差異,給出變化模式的類型,從而掌握事件的變化情況。為提升對隱患數(shù)據(jù)分析的適應性,在傳統(tǒng)變化挖掘算法基礎上,重新定義隱患變化模式。 以72家安全管理性質(zhì)相似的企業(yè)為例進行應用實踐分析,上述企業(yè)在2013年進行了3個階段的安全生產(chǎn)標準化評審檢查,由于數(shù)據(jù)錄入傳輸?shù)确矫鎲栴},最終收集到164次檢查數(shù)據(jù),共包括28 957條隱患信息,分為組織管理、設備設施和環(huán)境衛(wèi)生3大類839種。其中第一階段68次16 391條隱患信息,第二階段46次7 436條隱患信息,第三階段50次5 130條隱患信息。 圖3 隱患窗口劃分Fig.3 Hidden danger window partition 根據(jù)企業(yè)安全生產(chǎn)標準化評分標準,對隱患設定權重,隱患權重與該隱患所屬類型的總分值成正比,總分值越大,權重越大。 為計算權重對關鍵隱患支持度的影響,將加權算法和傳統(tǒng)算法的頻繁1項集按支持度由大到小排序。 表1 企業(yè)隱患關聯(lián)規(guī)則及變化模式 圖4 隱患重要度變化Fig.4 The change of hidden danger weight 隱患及其并發(fā)現(xiàn)象可以看做是復雜網(wǎng)絡圖,節(jié)點代表隱患,連線代表隱患間的關聯(lián)關系,隱患排查治理可以看作是消除網(wǎng)絡中的節(jié)點與連線。關聯(lián)規(guī)則就是發(fā)現(xiàn)點與點之間的關系,根據(jù)已知點找到其他關聯(lián)點;變化模式是分析點、線的變化情況,找到對應隱患的變化情況,從而進行針對性管理,如圖5所示。 圖5 關聯(lián)規(guī)則Fig.5 Visualization of association rules 圖中節(jié)點的顏色代表隱患類型,紅色為組織管理類、藍色為設備設施類、綠色為環(huán)境衛(wèi)生類(此處通過灰度區(qū)別),節(jié)點編碼表示隱患具體信息(為保持圖像簡潔隱去隱患節(jié)點編碼);節(jié)點的大小代表節(jié)點的支持度,節(jié)點越大支持度越大。節(jié)點間連線為2節(jié)點關聯(lián)關系,連線顏色為關聯(lián)規(guī)則前項的顏色,連線粗細代表關系強弱,關系越緊密連線越粗。 1)t1觀測點:對比圖5(b)與圖5(a)發(fā)現(xiàn),T2階段 基礎管理類隱患中的職業(yè)安全健康培訓和應急管理、基礎設施類隱患中的動力配電柜和金屬切削機床以及環(huán)境類隱患中的廠區(qū)環(huán)境和車間環(huán)境等9類隱患與其他隱患連線比例增加,占總連線數(shù)的48.6%,其中職業(yè)安全健康培訓和金屬切削機床類較為突出,分別增加45.7%和27.5%;與表1中隱患多為衰減模式和關系變化模式相對應。根據(jù)變化模式的定義,認為培訓指導階段對該類隱患的整改治理強度較弱,導致隱患持續(xù)存在,最終出現(xiàn)圖5(b)中連線比例增加的現(xiàn)象。因此,t1時刻進行隱患排查治理時,應酌情優(yōu)先檢查上述部位,并適當加強整改治理力度。 2)t2觀測點:將圖5(c)所示階段與前2個階段對比發(fā)現(xiàn),隱患節(jié)點與連線數(shù)量進一步減少,反映出企業(yè)經(jīng)過3個階段標準化達標工作,隱患數(shù)量減少,整體安全水平提高。但與圖5(b)相比,T3階段管理類隱患相關節(jié)點和連線比例增加。反映在變化模式上,即表1中組織管理類規(guī)則分別占新增模式和意外條件模式的100%和97.8%,表明企業(yè)在標準化建設過程中,對基礎設施、環(huán)境健康等問題的治理效果較好,但忽視對基礎管理的優(yōu)化,導致危險源管理、班組安全管理等基礎管理類隱患不斷出現(xiàn)。因此,t2時刻企業(yè)應適當改變安全生產(chǎn)策略,遏制組織管理類隱患發(fā)展勢頭。此外,環(huán)境類隱患中的車間環(huán)境、倉庫環(huán)境相關節(jié)點與連線仍然較多,多為關系變化模式和意外結果模式,應優(yōu)化該類隱患整改措施,防止其他關聯(lián)隱患出現(xiàn)。 表2 隱患預警情況 進行10次模擬運算,統(tǒng)計不同最小置信度條件下,預警隱患數(shù)量與準確率,計算平均值,如圖6所示。 圖6 準確率變化趨勢Fig.6 The trend of accuracy 隨置信度水平提升,2時點隱患預警準確率均由65%提升至100%。且當置信度為0.70時,預警隱患的類型分別占總類型的39.9%和29.9%,能較好預警事故隱患。結合2.2分析發(fā)現(xiàn),t2時間點預警隱患類型相對減少,與企業(yè)安全生產(chǎn)水平提高相關,并通過圖5(c)中節(jié)點和連線數(shù)量減少反映出來。結合此階段管理類隱患比例上升且多為新增模式的情況,企業(yè)可根據(jù)自身安全狀況、經(jīng)濟條件的各方面因素,適當提升相關隱患權重,降低最小支持度閾值,增大隱患預測數(shù)量,增強管理類隱患的關注程度。 1)應用滑動數(shù)據(jù)窗模型、加權等價類變換算法和隱患變化挖掘算法等數(shù)據(jù)挖掘技術,構建1種關聯(lián)隱患預警方法,通過挖掘隱患間關聯(lián)關系和變換模式,獲取關聯(lián)隱患類型、出現(xiàn)頻率和變化趨勢等預警信息,指導隱患排查治理工作優(yōu)化提升。 2)以72家安全管理性質(zhì)相似企業(yè)的164次隱患排查數(shù)據(jù)為例進行應用實踐分析,結果表明該方法能挖掘隱患間的關聯(lián)規(guī)則和變化趨勢,指導隱患排查治理策略制定,且隱患預警準確率隨置信度不斷提高。 3)該算法以歷史隱患數(shù)據(jù)為運行基礎,對于企業(yè)隱患數(shù)據(jù)較少,且無同類企業(yè)數(shù)據(jù)借鑒情況,數(shù)據(jù)挖掘效果不佳,下一步需要研究如何增強數(shù)據(jù)挖掘算法對稀疏隱患數(shù)據(jù)的挖掘能力。 [1] 魏利軍,方來華.基于移動互聯(lián)網(wǎng)及云服務的安監(jiān)執(zhí)法與隱患排查系統(tǒng)研究[J].中國安全生產(chǎn)科學技術,2014,10(S1):136-140. WEI Lijun, FANG Hualai. Study on safety supervision law enforcement and hidden trouble inspection system based on mobile Internet and cloud service[J]. Journal of Safety Science and Technology,2014,10(S1):136-140. [2] 張亞麗,王廷春,王秀香,等.中國石化管道及罐區(qū)隱患排查治理監(jiān)管系統(tǒng)研究與應用[J].中國安全生產(chǎn)科學技術,2016,12(4):185-191. ZHANG Yali, WANG Tingchun, WANG Xiuxiang, et al. Research and application of supervision and management system on hidden trouble checking and governing for pipeline and tank area in SINOPEC[J]. Journal of Safety Science and Technology,2016,12(4):185-191. [3] 張冬陽.信息化助力風險分級管控與隱患排查治理工作[J].中國安全生產(chǎn)科學技術,2016,12(S1):296-299. ZHANG Dongyang.Study on risk management and control with classification and potential hazards identification and control assisted by informatization[J]. Journal of Safety Science and Technology,2016,12(S1):296-299. [4] 歐陽秋梅,吳超.安全生產(chǎn)大數(shù)據(jù)的5W2H采集法及其模式研究[J].中國安全生產(chǎn)科學技術,2016,12(12):22-27. OUYANG Qiumei, WU Chao. Research on 5W2H acquisition method and mode of big data for work safety[J]. Journal of Safety Science and Technology,2016,12(12):22-27. [5] 王榮.事故事件與排查隱患——《企業(yè)安全生產(chǎn)標準化基本規(guī)范》解讀[J].中國安全生產(chǎn)科學技術,2011,7(9):216-220. WANG Rong. Accident events and investigation potential dangers—interpretation for the basic norms of enterprise work safety standardization[J]. Journal of Safety Science and Technology,2011,7(9):216-220. [6] 朱紅.國內(nèi)外石油化工企業(yè)隱患治理工作探討[J].中國安全生產(chǎn)科學技術,2013,9(4):115-118. ZHU Hong. Discussion on hidden dangers treatment plan of petrochemical enterprise at home and abroad[J]. Journal of Safety Science and Technology, 2013,9(4):115-118. [7] 宇仁茂.煤礦重大隱患特性及其治理體系的分析研究[J].中國安全生產(chǎn)科學技術,2014,10(S1):153-157. YU Renmao. Analysis on the characteristics of coal mine and its hazard management system[J]. Journal of Safety Science and Technology,2014,10(S1):153-157. [8] 張長魯.煤礦事故隱患大數(shù)據(jù)處理與知識發(fā)現(xiàn)分析方法研究[J].中國安全生產(chǎn)科學技術,2016,12(9):176-181. ZHANG Changlu. Study on big data processing and knowledge discovery analysis method for safety hazard in coal mining[J]. Journal of Safety Science and Technology,2016,12(9):176-181. [9] 胡瑾秋,張來斌,伊巖,等.基于貝葉斯估計的煉化裝置動態(tài)告警管理方法研究[J].中國安全生產(chǎn)科學技術,2016,12(10):81-85. HU Jinqiu, ZHANG Laibin, YI Yan, et al. Research on dynamic alarm management method of refining device based on Bayesian estimation[J]. Journal of Safety Science and Technology,2016,12(10):81-85. [10] 郭聖煜,駱漢賓,滕哲,等.地鐵施工工人不安全行為關聯(lián)規(guī)則研究[J].中國安全生產(chǎn)科學技術,2015,11(10):185-190. GUO Shengyu, LUO Hanbin, TENG Zhe, et al. Research on association rules of unsafe behavior for metro construction worker[J]. Journal of Safety Science and Technology,2015,11(10):185-190. [11] Han J, Kamber M. Data Mining: Concepts and techniques[J]. Data Mining Concepts Models Methods & Algorithms Second Edition, 2006, 5(4):1-18. [12] GEHRKE J, KORN F, SRIVASTAVA D. On computing correlated aggregates over continual data streams[J]. SIGMOD Record, 2001, 30(2): 13-24 [13] Zaki M J. Scalable algorithms for association mining[J]. IEEE Transactions on Knowledge & Data Engineering, 2000, 12(3):372-390. [14] Song H S, Kim J K, Kim S H. Mining the change of customer behavior in an internet shopping mall[J]. Expert Systems with Applications, 2001, 21(3):157-168. [15] Chen M C, Chiu A L, Chang H H. Mining changes in customer behavior in retail marketing[J]. Expert Systems with Applications, 2005, 28(4):773-781.

1.3 隱患變化模式

2 應用實踐分析
2.1 企業(yè)隱患數(shù)據(jù)挖掘






2.2 事故隱患預警


2.3 應用效果評估

3 結論