劉克明(國家新聞出版廣電總局724臺,陜西寶雞 722400)
數據挖掘技術在設備預防性維護中的應用探討
劉克明(國家新聞出版廣電總局724臺,陜西寶雞 722400)
數據挖掘技術理念,對大功率中短波發射機的科學維護、規范運行具有非常廣闊的應用前景和現實意義。
數據挖掘 發射機 運行 維護
隨著西新工程多年的建設,我國以100KWPSM、150KWPSM、500KWPSM和DX為主的四種大功率中短波發射機的廣播機型全面普及,經過多年的運行和維護,取得了大量的維護經驗,各維護單位也十分重視維護經驗的積累和交流,切實的提高了設備的維護水平和發射機運行穩定性,但是傳統的維護水平已經進入一個相對較高的穩定的平臺期,以往的單純依靠經驗積累的傳統維護方法,短期內難以再有明顯的提高,但是我們卻忽視了一些對我們很有價值的東西,這就是我們在日常維護和設備運行中積累的大量的數據,隨著近年來大規模的信息化建設,播音設備全面的計算機化、網絡化,很多維護單位已經積累了數以TB計的設備運行和維護的數據,但是擁有大量的數據與擁有許多有用的知識完全是兩回事,這些數據除過極少量的部分被工作人員拿來進行維護管理參考外,大多數都被擱置或沉睡在數據庫中,沒有發揮出應有的效益,如何有效的發現這些數據的價值呢?數據挖掘技術無疑給我們指出了一條道路,特別是對我們的預防性維護工作有很好的指導和借鑒意義,下面我們就來對數據挖掘技術理念在預防性維護中的應用作一探討。
數據挖掘就是從大量的數據中挖掘出有用的信息,即從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中發現隱含的、規律性的、人們事先未知的,但又是潛在有用的并且最終可理解的信息和知識的非平凡過程。這個定義包括好幾層含義:數據源必須是真實的、大量的、含噪聲的;發現的是用戶感興趣的知識;發現的知識要可接受、可理解、可運用;并不要求發現放之四海皆準的知識,僅支持特定的發現問題。原始數據可以是結構化的,如關系數據庫中的數據;也可以是半結構化的,如文本、圖形和圖像數據;甚至是分布在網絡上的異構型數據。發現知識的方法可以是數學的,也可以是非數學的;可以是演繹的,也可以是歸納的。發現的知識可以被用于信息管理,查詢優化,決策支持和過程控制等,還可以用于數據自身的維護。因此,數據挖掘是一門交叉學科,它把人們對數據的應用從低層次的簡單查詢,提升到從數據中挖掘知識,提供決策支持。這里所說的知識發現,不是要求發現放之四海而皆準的真理,也不是要去發現嶄新的自然科學定理和純數學公式,更不是什么機器定理證明。實際上,所有發現的知識都是相對的,是有特定前提和約束條件,面向特定領域的,同時還要能夠易于被用戶理解。最好能用自然語言表達所發現的結果,把先進的數據挖掘技術理念引入到大功率發射設備的運行和維護中,為設備維護和管理人員提供有價值的潛在信息,這樣就能更好的保證設備的運行質量。無疑對我們提高設備運維的科學化、系統化有著非凡的意義。
數據挖掘的處理對象是大量的數據,這些數據一般存儲在數據庫系統中,是長期積累的結果。但往往不合適直接在這些數據上進行知識挖掘,需要做一些準備工作,也就數據的預處理。數據預處理包括數據的選擇(選擇相關數據)、凈化(消除噪音、冗余數據)、推測(推算缺值數據)、轉換(離散型數據與連續型數據之間的轉換)、數據縮減(減少數據量)等。
數據挖掘的過程可能需要多次的循環反復,每一個步驟一旦與預期目標不符,都要回到前面的步驟,重新調整,重新執行。數據挖掘是一個多領域技術人員合作的過程,也是一個在資金上和技術上高投入的過程,但我們可以在日常的設備運行和維護中借鑒數據挖掘的理念,在反復過程中,不斷地趨近事物的本質,不斷地優化問題的解決方案。
數據挖掘非常清晰的界定了它所能解決的幾類問題,數據挖掘的應用就是把這幾類問題演繹的一個過程。
分類問題屬于預測性的問題,但是它跟普通預測問題的區別在于其預測的結果是類別而不是一個具體的值。例如:發射機倒頻時發生故障,一般判斷可能為調諧類故障,那么這個問題就屬于分類問題;但是如果根據各種信息直接判斷為調諧電容擊穿,那么這個問題就屬于后面要說到的預測問題。調諧類故障我們一般認為主要在倒頻時發生,不會馬上造成直接性的停播,分類問題在故障處理中有著重要的意義,根據基本現象作出預測性的判斷,在故障處理中起著方向性的作用。
聚類問題不屬于預測性的問題,它主要解決的是把一組數據劃分幾個分組的問題。劃分的依據是聚類問題的核心,也就是分類條件、屬性。聚類的問題很容易與分類的問題混淆,但分類問題與聚類問題是有本質區別的:分類問題是預測一個未知類別的數據于哪個類別,而聚類問題是根據選定的條件,對一組數據進行劃分,它不屬于預測問題。聚類問題在我們日常維護工作中也是一個非常常見的的問題,例如根據發射機的幾大系統構成進行的故障分類,不同系統的故障均有可能造成設備停機,但故障原因歸屬的系統不同就應該劃歸不同的系統故障分類,如一樣是高末調諧電容引起的故障,如果是電容擊穿打火我們就應該將故障劃歸為射頻系統類故障,但如果是調諧電容抱死造成調諧不到位則應劃歸為調諧類故障,需要選擇若干個明確區分條件對已有的數據進行劃分:條件一致的數據聚為一類,不同的數據分屬于不同的類。聚類的方法層出不窮,比較直觀的就是依據積累的經驗和已知問題、條件進行分類,這些方法也是我們日常工作中最常使用的方法,而依據數據挖掘理論,運用數學方法對隱含其中的知識進行挖掘才是我們更加需要探索的方向。
說起關聯問題,最典型應該是大家都知道的沃爾瑪超市“啤酒和尿布”的故事,這個典型的案例給了我們一個啟示:世界上的萬事萬物都有著千絲萬縷的聯系,尋找和發現這種關聯,可以給我們帶來一些意想不到的收獲。
關聯分析要解決的主要問題是:一組數據發生后,哪些數據必然同時發生或發生幾率比較高?例如:我們常見的DF100型PSM短波發射機,1PS6R33燒毀故障,一般均伴隨著1A9的濾波電容的擊穿,細心的維護人員從這種多次出現的伴生現象,分析電路,得出結論,原來1A9的濾波電容才是這個故障的“元兇”。現在我們從原因看結果視乎覺得一切都理所應當,邏輯明晰,但這個故障更大的價值不在于故障本身,而是發現這個故障的過程給我的啟迪,從數據挖掘的視角看,這就是典型的數據關聯的問題,我們因為多次的關聯找到了故障的根本原因。所以說在研究問題的過程中,分析的重點就是所有數據之間關聯性。
此處說的預測問題指的是狹義的預測,并不包含前面闡述的分類問題,因為分類問題也屬于預測。一般來說我們談預測問題主要指預測變量的取值為連續數值型的情況。例如:估計下一年度的播音量、預測下一年度的備件需求、規劃調整檢修周期等等,預測問題的解決更多的是采用統計學的方法。
數據挖掘技術是一項龐大的應用工程,也是一項新興學科,很多行業也均在積極的嘗試階段,在過去,我們常用的知識獲取方法是由有經驗的維護人員把積累的經驗和知識經過分析、篩選、比較、綜合、再提取出知識和規則。然而,由于維護人員本身所擁有知識的局限性,所以很多時候就難以收到理想的結果。但借鑒數據挖掘技術的理念可以給我很大的幫助,對大功率中短波發射機的科學維護、規范運行具有非常廣闊的應用前景和現實意義。