999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

主成分聚類分析在礦井安全評價應用中的思考

2011-01-23 01:35:38王德青
中國礦業 2011年1期
關鍵詞:分類評價方法

王德青

(江蘇省有色金屬華東地質勘查局, 江蘇 南京 210007)

在礦山開采過程中,如何對礦井的安全狀況進行全面的分析和評價,采取合理的防范措施降低安全風險以確保安全生產,是礦山企業一直關注的熱點問題。由于礦山開采是一個復雜的系統,存在的各種風險,有害因素也不盡相同,因此對礦井安全的科學評價關鍵,在于找到適合不同礦井、不同危險因素的安全評價方法。根據多年的實踐和總結,筆者認為,對礦井安全的科學評價需要滿足:①從整體出發,在全方位考慮影響礦井開采安全因素的基礎上,構建科學的安全評價指標體系;②不斷地創新安全評價方法,以適應新的礦井安全評價需要。作為《中國礦業》的忠實讀者,筆者一直關注發表在期刊上的關于礦井安全評價文章,如《中國礦業》2009年第2期刊登的論文《主成分聚類分析法在煤礦安全評價中的應用》(以下稱《王文》),提出一種基于主成分因子得分的聚類方法,不妨稱作主成分聚類分析。通過相關文獻的分析比較,筆者發現,主成分聚類的思想可取,但該方法的理論論證及方法改進有待進一步深化。鑒于以上認識,筆者略作拙文,提出主成分聚類的改進方法,以期與王旭、霍德利兩位作者商榷,共同促進礦山安全評價的進步。

1 主成分聚類分析的理論基礎及改進

主成分聚類分析,顧名思義即主成分分析和聚類分析的結合使用。主成分分析和聚類分析作為兩種基本的處理復雜數據集的數值分類技術,在自然科學和社會科學研究領域均有廣泛的應用,并有許多成功應用的例子。盡管這兩種方法很有用,但它們都有自己的適用場合和需要滿足的條件。如果忽略方法使用的前提條件,盲目地將二者結合使用,不僅不能取得理想的分類效果,反而可能因為錯誤的分類結果影響決策的正確制定。主成分分析本質上是一種線性變換,其目的是通過線性變換,將原始指標組合成相互獨立并能充分反映總體信息的指標,從而在不丟失重要信息的前提下,避開指標間共線性問題,相當于從空間上轉換看數據的角度,突出數據變異的主要方向,歸納重要信息。聚類分析是研究“物以類聚”問題的一種統計方法,目的在于使同類對象之間的同質性和不同類對象之間的異質性最大化。但是,當變量存在共線性時,如果直接聚類分析,會放大變量的作用,使得分類結果不科學[1]。由主成分的性質[2]知,主成分變量之間是線性不相關的,因此可以將主成分與聚類分析結合起來,即先做主成分分析,再提取若干主成分對樣本進行聚類分析[3],即《王文》提出的主成分聚類分析。筆者認為,主成分的方差貢獻率是遞減的,也即主成分的重要性存在差異,而傳統的距離公式將參與聚類分析的變量等權對待,不能體現主成分重要性的差異,因此主成分聚類分析的分類結果有待進一步商榷。顯然地,如果兩個樣本第一主成分變量之間相似性,相對這兩個樣本的其他主成分變量之間的相似性更高,則這兩個樣本聚為一類的可能性較大。鑒于主成分變量重要性的不同,筆者認為可,賦予不同的主成分變量不同的權重來體現這種差異。因此,《王文》提出的主成分聚類分析可作如下的改進:

(1)加權歐氏距離主成分聚類。如果變量之間是正交的,則歐氏距離有明確的空間距離概念,而主成分公因子之間是正交的,因此改進的主成分聚類分析采用歐氏距離定義樣本之間的相似性。但是,主成分公因子的重要性是不同的,第一主成分的方差貢獻率最大,因此主成分重要性的差異必須得到體現。本文定義如下的加權歐氏距離公式:

(1)

式中,Fk為主成分公因子;αk為公因子Fk的方差貢獻率。下同。

(2)加權主成分因子綜合得分聚類分析。由于主成分方法提取的公因子之間信息不重疊,并且每個主成分公因子的重要性由其方差貢獻率體現。因此,可以根據各公因子的方差貢獻率比重作為權重加權匯總,得出各個樣本的綜合得分,即:

(2)

將各樣本的公因子得分值Fk代入式(1) 、式(2),以式(1) 、式(2)的計算結果為基礎,按傳統的聚類分析便可將樣本分類。需要說明的是,為了達到數據簡化的實際意義,并不需要提取全部的主成分公因子,但當樣本之間相似性較高,少數幾個公因子不能有效地將樣本分類時,需要提取全部的公因子。

改進的主成分聚類分析與傳統聚類分析的核心區別,在于考慮了聚類分析過程中常見的變量共線性對分類的強影響;在于最大程度地綜合使用剔除共線性、線性化變換、剔除弱影響項等手段,有效降低最終分類模型誤差;在于指標的賦權科學、合理。改進的聚類分析,每一步都有充分的理論保證其合理性、必要性,有著同類復雜分類問題下的普遍適應性。

2 各種分類方法的實證比較

2.1 樣本選取及數據來源

本文將兩種改進的主成分聚類分析方法,用于礦井安全水平的分類問題研究,通過比較新方法的分類結果與《王文》的聚類分析結果,目的在于論證兩種改進的主成分聚類分析方法的科學性,解釋不同礦井安全水平的差異,以發現安全工作中的盲點。為了最大程度地增強對比的效果,本文直接采用《王文》的數據為處理數據。需要說明的是,本文并未選擇全部的7個主成分公因子,而是選取方差貢獻率較大的前3個主成分公因子。公因子命名及原始數據如表1所示。

表1 公因子命名及方差貢獻率[3]

2.2 數據分析過程

本文使用SPSS(12.0) 統計軟件作為分析工具,先對3個主成分公因子原始數據進行標準化處理,然后調用SPSS(12.0)中的聚類分析程序,采用組間聯結系統聚類法[3],分別按加權主成分因子綜合得分和加權歐氏距離兩種方法進行聚類分析。為了增強可比性,本文亦對礦井進行了直接聚類分析,結果見圖1~圖3、表2。

圖1 直接聚類分析譜系圖

圖2 主成分因子綜合得分聚類譜系圖

圖3 加權歐氏距離聚類譜系圖

表2 各種聚類方法分類結果比較

2.3 結果評價

基于表2中各種聚類方法的分類結果發現,4種聚類分析的分類結果存在較大差異。圖1及表2第一列為直接聚類分析的結果,不難發現,直接聚類分析對礦井的區分度不大,分類效果不佳,難以結合分類結果分析礦井的安全問題。《王文》的分類結果與直接聚類分析的結果相差不大,結合綜合排名發現,6#礦井的聚類分析結果排序與其綜合排名先后順序顛倒。圖2、圖3及表2的四、五兩列為兩種改進的主成分聚類分析結果。由圖2、圖3聚類分析譜系圖及聚合系數可知,改進的主成分聚類分析對礦井的區分度增強,尤其是加權歐氏距離聚類分析對礦井安全水平差異區分度最大。為了形象地對八個礦井的安全水平進行分析,本文繪制礦井安全水平的雷達圖,如圖4所示。在繪制雷達圖時,為了繪圖方便和圖示清晰,本文對公因子數據進行了0~1化處理,并添加了間隔軸。

兩種改進的主成分聚類分析結果都顯示,4#礦井和6#礦井單獨成一類。結合這兩個礦井的原始指標數據和主成分因子得分數據不難發現,4#礦井的各項指標數據都是八個礦井中最好或接近最好的,特別是4#礦井的自然災害管理公因子在八個礦井中排名第一,并且與其他礦井的差距較大,領先地位明顯。由于自然災害管理公因子的方差貢獻率遠大于其他兩個公因子,因此4#礦井在此公因子上的領先優勢,提升了其在八個礦井安全評價中的排名。盡管6#礦井的F2、F3兩個公因子排名都是第一,但是6#礦井的自然災害管理公因子卻排名第六,因此6#礦井是安全管理極不平衡的典型礦山,影響了其安全評價的綜合排名。1#、5#、7#、8#礦井為第三類,這四個礦井的三個公因子取值均處于八個礦井中的平均水平,屬于各項安全管理比較平衡的礦井。2#和3#礦井為第四類,這兩個礦井的公因子取值均是八個礦井中最低或接近最低的,兩個礦井的綜合排名也是最后兩位,屬于安全管理落后的典型代表,必須引起管理部門的足夠重視。鑒于自然災害管理公因子的方差貢獻最大,體現了礦井安全管理的主要方面,因此,在經濟能力受限的條件下,2#、3#和6#礦井應集中主要精力加強自然災害安全方面的管理,這也是抓住了工作的重心。

圖4 礦井安全水平主成分得分雷達圖

3 結語與建議

礦井安全評價是以安全系統工程理論為基礎,合理選擇評價方法,對礦井已經存在和潛在的危險有害因素進行識別和分析,并提出合理可行的安全技術和安全管理對策措施的系統工程,目的是把生產過程中的不安全因素和作業場所的隱患消滅在萌芽階段。由于同一類事物之間具有更多的近似特性,分門別類地進行研究,要遠比在一個復雜多變的集合中更清晰明了。因此,科學地

將不同類型的礦井分類,不僅大大減少了安全評價數據處理的工作量,而且可以準確發現危險因素所在,及時地為安全生產管理和決策提供合理的參考依據。

礦井的安全評價,是一項動態的、復雜的系統工程,安全評價的數據分析量大、不確定因素多。基于傳統統計技術建立的聚類分析假設條件較多,實際應用中面臨諸多的局限,因此對傳統聚類分析的改進是迫切需要解決的問題。盡管主成分聚類分析克服了傳統聚類分析無法處理共線性變量的缺點,但主成分聚類的距離公式等權對待主成分公因子,不能體現主成分重要性的差異。本文提出的兩種改進方法,彌補了主成分聚類指標賦權不科學的不足。實證分析表明,改進的主成分聚類相對原始的主成分聚類分類效果更佳,理論更充分。但是,強調對傳統聚類方法的改進,并不是說傳統聚類分析方法不重要。應該注意到,傳統聚類分析無論是理論推導還是實際應用方面都是比較成熟的,當礦井安全評價數據滿足傳統聚類方法的條件時,分類問題應該首選傳統聚類方法。

[1] 朱建平.應用多元統計分析[M].北京:科學出版社,2006.

[2] 何曉群.多元統計分析(第二版)[M].北京:中國人民大學出版社,2008.

[3] 王旭,霍德利.主成分聚類分析在煤礦安全評價中的應用 [J].中國礦業,2009,18(2):86-89.

[4] 王德青.統計分類方法的比較 [J].中國統計,2008(9):44-45.

[5] 汪文雄,等.基于因子與聚類分析的中國建筑業產業競爭力研究 [J].數理統計與管理,2008,27(2):329-337.

[6] 王慶豐,等.基于因子與聚類分析的縣域經濟發展研究 [J].數理統計與管理,2009,28(3):495-501.

[7] Sharma S. Applied Multivariate Techniques [M].John Wiley & Sons,Inc.,1996.

猜你喜歡
分類評價方法
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
分類算一算
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
基于Moodle的學習評價
保加利亞轉軌20年評價
主站蜘蛛池模板: 久久精品国产精品国产一区| 日韩美女福利视频| 久久狠狠色噜噜狠狠狠狠97视色| 污视频日本| 成年人免费国产视频| a级毛片免费播放| 日本在线亚洲| 国产亚洲精品97AA片在线播放| 中国国产A一级毛片| 国产成人喷潮在线观看| 真实国产精品vr专区| 欧美日韩中文国产va另类| 中文国产成人精品久久一| 精品久久久久久成人AV| 91精品啪在线观看国产| 日韩无码黄色| 色妞www精品视频一级下载| 国产精品免费电影| 亚洲九九视频| 日本亚洲欧美在线| 亚洲视频在线观看免费视频| 中文字幕永久视频| 久草国产在线观看| 精品国产免费观看| 4虎影视国产在线观看精品| 国产色伊人| 一级香蕉人体视频| 91国内视频在线观看| 国产视频欧美| 伊人丁香五月天久久综合| 欧美 国产 人人视频| 亚洲欧美另类视频| 日韩在线播放中文字幕| 亚洲综合精品香蕉久久网| 呦女精品网站| 免费网站成人亚洲| 91久久精品国产| 中文一区二区视频| 亚洲AⅤ永久无码精品毛片| 五月婷婷激情四射| 亚洲天堂久久新| 97久久人人超碰国产精品| 波多野结衣一区二区三区四区视频| 亚洲无码37.| 国产av剧情无码精品色午夜| 国产精品白浆无码流出在线看| 欧美成人午夜视频免看| 亚洲无码高清一区| 97精品久久久大香线焦| 欧美69视频在线| 久久无码av三级| 国产成人一区免费观看| 99精品在线视频观看| 亚洲大尺度在线| 亚洲精品无码不卡在线播放| 欧美精品1区2区| 国产精品亚洲专区一区| 国产人妖视频一区在线观看| 99ri国产在线| 亚洲无码在线午夜电影| 日本五区在线不卡精品| 伊人蕉久影院| 国产在线第二页| 国产一在线| 精品少妇三级亚洲| 欧美日韩一区二区在线播放| 久久情精品国产品免费| 国产原创自拍不卡第一页| 中国丰满人妻无码束缚啪啪| 69综合网| 一本久道久综合久久鬼色| 无码国内精品人妻少妇蜜桃视频| 日韩最新中文字幕| 久久精品丝袜| 朝桐光一区二区| 热re99久久精品国99热| 国产一级在线播放| 亚洲无码91视频| 精品人妻一区二区三区蜜桃AⅤ| 在线中文字幕日韩| 玖玖精品视频在线观看| 高清码无在线看|