[摘 要]本文應用模糊綜合評價法得到煤礦本質安全等級和指標體系,應用模糊聚類算法確定主關鍵條件屬性集,使用模糊數據挖掘出評估對象中煤礦本質安全等級同評估指標之間的規則知識,以一個實例為對象建立的煤礦本質安全模糊數據挖掘驗證了該方法的可行性。[關鍵詞]煤礦本質安全;模糊數據挖掘;模糊聚類
doi:10.3969/j.issn.1673-0194.2009.12.026
[中圖分類號]F270.7;F224.0;TP311.5[文獻標識碼]A[文章編號]1673-0194(2009)12-0073-05
數據挖掘可以揭示出非常有價值的信息,而這些信息不是通過一般的查詢所能察覺到的。但是數據倉庫的容量越大,系統復雜性越高,相應的精確度就越低, 也就是說模糊性越強, 因而僅僅靠復雜算法和推理并不能完全發現知識,而且單純的數據挖掘可能會
導致“尖銳邊界”等問題。因此,本文考慮將由模糊算法和數據挖掘結合起來的模糊數據挖掘技術引入到煤礦本質安全評價系統中。
1 煤礦本質安全模糊綜合評價模型
煤礦本質安全管理綜合評價指標體系涉及人、機、環境、管理四大單元,評價對象的某些評價因子往往帶有一定程度的模糊性,即具有非線性特征。它沒有十分明確的界限和清楚的外延,不存在絕對的十分精確的肯定與否定。煤礦本質安全管理具有不確定性因素多,模糊性大,動態變化復雜等特性,人們的認識不同,對這些因素的褒貶程度也不盡相同,很難直接用統計學的方法確定這些因素的具體數值。
模糊綜合評價法在利用評價矩陣計算各指標的隸屬度時,取評價指標與隸屬度的乘積的最大值,采用這樣的方式有可能會丟失評價信息。此外,此評價結果得到的只是各級別的評價結果的隸屬度,評價結果不夠直觀。因此,對此算法進行了改進,在利用評價矩陣計算各指標的隸屬度時,按矩陣運算的方法進行。對于最后得到的評價結果的隸屬度進行量化,得到直觀的評價值。這樣能極大限度地保留原始的評價信息,并通過了隸屬度的量化,讓評價結果更加直觀。改進的模糊綜合評價法的具體實現方法如下:
步驟1:確定評價因素集。
在表1層次中,分別用t1,t2,t3,t4來表示人員的不安全因素、機具的不安全因素、環境的不安全因素、管理的不安全因素,則得評價因素集T={t1,t2,t3,t4}。類似地,在分指標層中分別用u101,u102,…,u412,u413來表示操作不安全性,現場指揮的不安全性,…,沒有有效的本質安全文化,其他管理的不安全因素,則得評價因素集U={u101,u102,…,u412,u413}。
確定指標集對應的權重集Q={q1,q2,…,qm},按照層次分析法和BP網絡法,求得了各指標和分指標的權重。再求其平均值,就得到各指標和分指標的綜合權重,如表1所示。
步驟2:確定評語集。
對指標采用5級評語:煤礦本質安全管理Ⅰ(v1)、煤礦本質安全管理Ⅱ(v2)、煤礦本質安全管理Ⅲ(v3)、煤礦本質安全管理Ⅳ(v4)和非煤礦本質安全管理(v5)五個檔次,并用評語集V={v1,v2,v3,v4,v5}表示。
確定評語集對應的數值集N={n1,n2,n3,n4,n5}。
步驟3:建立隸屬函數,確定隸屬度。
構造隸屬度子集Ri={ri1,ri2,ri3,ri4,ri5},其中:ri(i=1,2,…,m)指評價因素集中第i個指標對應評語集中每個v1,v2,v3,v4,v5的隸屬度。
根據指標的不同性質,隸屬函數分為兩種情況:定量指標的評價和定性指標的評價。
(1)定量指標的單因素評價隸屬函數。
ui的取值范圍與評語集vj相對應的5個區間(-∞,60] 、(60,70] 、(70,80] 、(80,90] 、(90,∞] 。若將ui看成是某個區間上的普通集合,則會造成兩個區間邊緣點數值相差不大,而評語相差一個級別的不合理現象,為了消除這種不合理現象需作模糊化處理。具體做法是:設在中間區間的中點其隸屬函數取最大值1,而在相鄰兩區間的中點其隸屬函數取最小值0,連接1與0,得ui對評語等級vj的隸屬函數μvj(ui)。
(2)定性指標的單因素評價隸屬函數。
對于定性指標的單因素評價較難以量化,常采用模糊統計的方法。即讓參與評價的各位專家按預先劃定的評價標準給各評價因素劃分等級,然后依次統計各評價因素屬于等級vj的頻數Mij,其隸屬函數如下:
μvj(ui)=Mijn
其中:Mij是u1∈v1的次數;n是參與評價的專家人數;μvj(ui)是隸屬函數。
為指標ui的單因素評價,它是評語集V上的模糊子集。
步驟4:計算評價矩陣。
對于每一個評價指標ti都可以得到一個隸屬度子集Ri,那么m個Ri構成一個T×V域上的
計算T的用隸屬度表示的評判值:
步驟6:如還有上一級評價指標,則用下一級求得的所有評判值S構成新的評價矩陣R,并重復步驟4和步驟5,直至最高一級,則可得到模糊綜合評價的結果S。
步驟7:利用
S×N=(S1,S2,…,s5)
n1n2n5
,可以得到模糊綜合評價的量化結果。
2 模糊數據挖掘
中國的煤礦經過幾十年的安全管理和生產肯定有海量的安全評價數據,這些數據已經成為煤礦管理部門管理和決策的寶貴資源,從這些數據中發現有價值的信息成為一項非常艱巨的任務。實際上,在挖掘過程中要想把這些數據精確地分類是不可能的,也沒有必要。現實的分類往往伴隨著模糊性,所以用模糊理論來進行聚類分析,然后再進行預測,會顯得更自然,更符合客觀現實。這就是本文提到的模糊數據挖掘。對煤礦本質安全評價數據倉庫的不同層次進行不同規則的推斷,以得出對決策有用的規則,有利于領導的決策。運用模糊理論來進行數據挖掘的具體步驟如下。
在搜集了大量煤礦本質安全數據資料的情況下,建立待分類的樣本集U,把要分類的對象稱為樣本如
,則U=u1,u2,u3,…,un為樣本集。具體定性本質安全評價指標量化后的屬性數據稱為樣本指標,設有m項指標,這可用m維向量描述樣本,用集合表示為:
u1=(xi1,xi2,xi3,…,xim)
,得到原始數據矩陣為
,由于采集到的數據往往不是[0,1] 閉區間的數據,根據模糊矩陣的要求,通過下面兩個公式將數據變換壓縮到區間[0,1] 上。
(1)平移標準差變換。
x′ik=xik-xksk(i=1,2,…,n;k=1,2,…,m)(1)
是平均值。此時得到的標準化數據x′ik也不一定全在[0,1] 閉區間之內,還必須進行下面的變換。
(2)平移極差變換。
2.2 建立模糊相似矩陣
標出衡量被分類對象間相似程度的統計量。設論域U={u1,u2,u3,…,un},其中每個元素為一個樣本,建立U上的模糊相似矩陣:
計算rij的方法很多,在這里采用夾角余弦法,即:
2.3 聚類分析
常用聚類分類有3種方法:傳遞閉包法、最大樹方法和編網法。傳遞閉包法用計算機容易實現,本文用平方法依次求:
R→R2→R4→…
,當第一次出現Rk#8226;Rk=Rk時,Rk就是模糊相似矩陣 R的傳遞閉包t(R),即t(R)=Rk。再讓λ由大變到小,就可形成動態聚類圖。
3 應用研究
3.1 評價指標體系的建立
煤礦本質安全管理是指在一定經濟技術條件下,在煤礦全生命周期過程中對系統中已知規律的危險源進行預先辨識、評價、分級,進而對其進行消除、減小、控制,實現煤礦人-機-環境系統的最佳匹配,使事故降低到人們期望值和社會可接受水平的風險管理措施與辦法。本質安全管理的重點是對危險源的管理,對其辨識過程應考慮人、機、環境、管理等4個方面的不安全因素。煤礦本質安全評價二級指標體系模型,如表1所示。
3.2 煤礦本質安全的模糊數據挖掘
為探究煤礦本質安全評估數據庫中評估等級同評估項目之間的規則知識,以及這些規則對煤礦本質安全工作的影響,先選取中國某一產煤區,采用現場調查和問卷調查方式對隨機抽取的10個煤礦2007年安全等級的評估進行討論,找出評價指標同安全等級之間的規則知識。為使問題簡單化,用上面的模糊綜合評價法編制的程序分別計算10個煤礦4項一級指標的量化得分和煤礦安全評估等級,得到的數據如表2所示。
用F統計量確定最佳閾值λ≥0.711,此時關聯強度最大,得主條件屬性為{t1,t4}。其中,t1為人員的不安全因素,t4為管理的不安全因素。可見,對于煤礦本質安全評估數據庫經過用模糊聚類方法進行分析得出,對于煤礦安全等級T這一結論屬性而言,主條件屬性集為{t1,t4}。
下面用粗糙集知識來進一步考察由主條件屬性集得到的分類規則。
基于安全等級這一結論屬性集T的記錄值,可將表2劃分為5類,分別用集合
當mi(i=1,2,…,10)作為分類條件,Kj(j=1,2,3,4,5)作為分類結論條件時,歸納總結后可得如下的分類規則:
綜合以上4條規則分析如下:當人不安全因素得分
t1≥90
時安全等級T一定為“本安Ⅰ”;人不安全因素t1得89~80分時安全等級T一定為“本安Ⅱ”;人不安全因素t1得79~70分時安全等級T一定為“本安Ⅲ”;人不安全因素t1得69~60分時安全等級T一定為“本安Ⅳ”。從以上分類規則可知人不安全因素(t1)為互信息最大的特征屬性。即凡是注重人不安全因素的煤礦,安全等級高,因此人不安全因素要放在煤礦本質安全首位,即煤礦要以人為本,注意人的安全教育和培訓等。
由于該地區為國家新興煤礦能源基地,煤礦生產裝備現代化水平較高,且該地區地質條件簡單,水、瓦斯、煤塵等環境因素引起安全隱患較少,故在本質安全評估指標體系中,人不安全因素和管理不安全因素兩方面非常重要,每個煤礦都應引起高度重視。顯然這與已有的研究成果和實際相吻合。
通過對煤礦本質安全管理綜合評價,可以確定煤礦某一時期的安全生產狀況,用于指導下一時期的安全管理工作, 其結果可作為煤礦本質安全管理評價的依據, 可以改善目前的安全管理狀況。
4 結束語
本文使用模糊數據挖掘發現煤礦本質安全等級同評價指標之間的規則知識,依據該規則知識對挖掘結果進行有效的評價,并且在分析、預測方面有著很大的優勢,從而可以幫助煤礦管理決策者找到影響該地區煤礦安全的關鍵因素。
主要參考文獻
[1] 梁保松,曹殿立.模糊數學及其應用[M] . 北京:科學出版社, 2007: 67-78.
[2]洪月華. 基于模糊綜合評價的課堂教學質量數據挖掘[J] . 計算機科學,2008, 35(2): 154-170.
[3]杜春宇,陳東科,杜翠鳳,等. 煤礦本質安全管理綜合評價體系模型與應用[J] . 重慶大學學報,2008, 31(2): 197-201.
[4]王金國. 構建本質安全型礦井對策研究[J] . 煤炭工程,2007(6): 8-10.