高巖


摘要:起重機的檢驗數據挖掘系統是利用數據挖掘技術而開發的系統,為檢驗起重機的安全運行提供了一種有效的策略模型。系統通過采用決策樹分類的方法,可以有效實現起重機故障的診斷,并利用關聯規則對起重機的缺陷和失效進行線性分析。通過系統運行結果表明,該系統具有一定的實際使用價值。
關鍵詞:起重機械,數據挖掘,關聯規則,決策樹分類
引言:在特種設備分類中,起重機械是一種被廣泛使用的設備,其安全運行在工程建設中顯得非常重要。因此,特檢院會針對其安全進行測驗,從而掌握大量的安全性檢驗故障、缺陷、失效等相關數據。錢起重機械檢測檢驗還是傳統工人儀器進行檢驗及記錄,人工判斷設備是否正常,這種傳統的檢測方法,不能適應現在經濟高速發展的趨勢。隨著我國經濟的高速發展,起重機的使用量也隨之大量增加,對其應用的環境也在不斷地更新,隨著任務的不斷增多,其安全性檢查任務也隨之增多,檢驗條件也變得苛刻,因此,怎樣快速高效地找出起重機的故障位置及原因,并找出它們之間的關聯性,提出改進和預防措施,對保障起重機的日常工作,提高其運行的可靠性,有著重要的實際意義。
數據挖掘是從數據和其他信息庫中獲得大量有效的數據,把這些數據變成可理解形式。容積檢驗中,利用數據挖掘技術,可以對,起重機進行檢驗決策,故障診斷,部件管理等。本文介紹了利用決策樹分類和關聯的規則等數據挖掘技術,從而開發出了起重機檢驗數據挖掘系統,包括系統的功能及結構數據庫的設計,數據的預處理,數據挖掘技術和運行結果。在系統中用決策樹的算法實現對起重機的故障診斷,用關聯規則算法,實現對故障缺陷失效的相關性分及預測。是開發系統的目的在于為檢驗起重機的安全運行提供一種有效的決策模型。
一、系統用到的數據挖掘技術
1.關聯規則簡介
數據挖掘技術的關聯規則,需要找到其中的兩個重要參數,既支持度和置信度,前者用來衡量關系規則中的統計重要性,后者用于衡量關聯規則中可信程度,一般有用的關聯規則都是支持度和置信度較高。
2.決策樹分類簡介
數據挖掘技術中決策樹是整個系統的核心,它通過大量的訓練集得出規則,中找出潛在的對決策有價值的信息,并用在計算模型中。決策樹分類的核心理念,是用信息增益作為決策屬性分類判別能力的度量,進而進行決策點屬性的選擇。
二、系統的結構和功能
系統在結構上分為五個部分,包括數據倉庫、決策樹、關聯規則、圖形用戶界面。要用戶需要分成三類,特檢院檢驗員、一般用戶、特檢院系統管理員。
1.系統結構
根據實際需求分析,系統實現的主要功能有,特檢院檢驗員,能夠儲存不同的起重機檢驗設備數據,從而方便相應的數據操作和管理工作。
系統結構,主要包括檢驗信息的錄入功能,刪除和修改及更新數據,關鍵字的查詢功能,特檢院系統管理人員對檢驗數據進行化處理,形成相應的初始化數據庫,當輸入正確參數據,據進行分類挖掘相關性的挖掘。從而最終形成規則庫,特檢院系統管理員可以針對不同情況對規則庫,進行修改,刪除以及查詢。當用戶輸入相應參數時,系統會根據規則庫里面的規則,對故障進行分類,對設備的缺陷進行預測,并通過顯示器傳達給用戶。系統還可以,具有一定的安全機制,對數據的信息的訪問進行授權處理,防止隨意刪改。
2.系統功能
系統采用雙核1.3G內存2g閃存,Windowsxp操作系統。
三、設計系統的關鍵技術
1.數據庫的設計
數據庫的設計是整個系統的基礎。由于使用關聯規則和決策樹對預處理數據與結果不同。所以在設計數據庫表示,分別為這兩個設計了不同表。六個不同的表格,分別存放了用戶信息數、檢驗數據、關聯規則預處理數據、決策樹數據預處理數據、關聯規則所得的規則及決策數所得的決策樹。
2.起重機檢測數據預處理
數據庫中原始數據通常都有一個共同的特點,即都有大量不完整的、不一致的數據。數據預處理一般都是推導數據的缺失,消除重復數據。你的目的是把數據挖掘過程中的數據進行干凈、簡潔、準確的處理。從而使開發的系統中,能夠提高數據挖掘效率和準確性。在預處理中通常會參考以下原則;嗯,可能的賦予屬性明確的含義;統一數據源的編碼屬性值;處理空缺值等。
3.兩個算法在系統中的實現
兩個算法的實現過程可以簡單的描述為,對于給定布爾數據集以及最小支持度和最小置信度,先用給定的找出頻繁項集,后列出滿足最小置信度的關聯規則。為實現這個系統,系統設計了類和接口。最小支持度和最小置信度是由用戶任意設定,傳入類或者實現接口中,每一個類或者實現接口都具有一定的功能,算法功能是通過這幾個類和實現接口之間相互協作的結果。
四、系統的運行結果分析
通過提供的檢驗數據作為訓練集數據,分別對其進行了缺陷失效等關聯規則分析和故障決策樹分類,并由關聯規則得出結果,形成的規則庫普通用戶可以對起重機械做一些故障分類,即在十個檢驗項目中輸入故障參數,系統就會自動給出起重機的故障類型。
結束語:
通過使用數據挖掘技術,建立數據倉庫,是系統可以對起重機的檢驗數據進行編輯,選取適當的參數,對其進行預處理,系統通過決策樹分類和關聯分析,對體重機機械的故障分類和缺陷、失效預測都具有一定的實際意義。系統具有自主學習能力,隨著數據的不斷更新,系統預測和分類的準確性將不斷提高,使體重機械檢驗數據挖掘系統具有一定的實際應用意義。
參考文獻:
[1]楊明;吉根林;姜志峰;楊萍;孫志揮;;一種基于關聯規則的最小屬性約簡模型[A];第二十屆全國數據庫學術會議論文集(研究報告篇)[C];2003年
[2]江西省上饒市特種設備監督檢驗中心 胡小龍 熊柏根;如何降低起重機械安全事故發生率[N];中國質量報;2009年
[3]江西省上饒市特種設備監督檢驗中心 胡小龍 熊柏根;如何降低起重機械安全事故發生率[N];中國質量報;2009年
[4]李炳燃;張金哲;;數據挖掘在設備故障診斷專家系統知識獲取中的應用[J];科技信息;2011年20期
[5](加)韓家煒 坎伯(Kamber,M.)著;范明等譯.數據挖掘:概念與技術[M].計算機科學叢書,2001.08