侯利勤
摘要:隨著信息化在現代化廣播發射電臺科學發展中的地位和作用越發重要,信息化已經是廣播發射電臺推進管理創新的迫切需要,是廣播發射電臺全面可持續發展的不竭動力。數據挖掘技術對信息化的現代化廣播發射電臺的管理、運行和維護工作有十分的現實意義。
關鍵詞:數據挖掘 運行 維護
中圖分類號:TN913.33 文獻標識碼:A 文章編號:1007-9416(2014)10-0043-01
隨著各類信息化系統在廣播發射電臺的大量普及和應用,積累和產生了大量的信息數據,這些信息數據包含著很多對我們有用的數據。深入的分析和利用這些數據對我們了解和掌握發射機的參數有著很大作用。數據挖掘概念的引入無疑對廣播發射電臺的科學維護、規范運行具有重要的意義。
1 數據挖掘的定義
所謂的數據挖掘就是從大量隨機的,繁雜的,有噪聲的數據中提取隱含在其中我們事先不知道,但是對我們有作用的信息和數據的過程。近年來,各行業信息量的激增,引發了諸多學者對數據挖掘方法的探索。
我們所說的數據融合、數據分析以及決策支持都屬于數據挖掘。數據挖掘要求數據源必須是大量真實包含噪聲的;通過挖掘產生的對于我們可以接受的有用數據必須是我們需要的,他不需要是定理式的通用數據,關鍵是為我們的決策產生作用。原始數據的呈現可以是結構化像關系數據庫中的數據;或者是半結構化的文本、圖形和圖像數據;甚至還有分布在網絡上的異構型數據等多種存在的形式。發掘數據的方式也是多樣的。可以是演繹的,也可以是歸納的。發現的數據我們可以用來優化我們的查詢數據,也可以支撐我們的決策或者是對數據自身的維護。因此,數據挖掘是一門交叉學科,他為我們對數據低層次的查詢應用,提升到挖掘內容,為我們的決定提供支撐。這里所說的知識發現,不是傳統意義上的科學定理和科學的公式,實際上,所有發現的知識都是相對的,是有特定前提和約束條件,面向特定領域的,同時還要能夠易于被用戶理解。最好能用自然語言表達所發現的結果,這無疑對我們提高設備運維的科學化、針對性和實用性有著非凡的意義。
數據挖掘技術的意義是可以幫助我們從繁雜冗余的數據庫里,快速的找的可以為我們所用的隱含的的有價值的信息。數據倉庫和數據挖掘都是決策支持新技術,但他們有著完全不同的輔助決策方式。數據倉庫中存儲著大量的輔助決策的數據,為不同的用戶隨時提供各種輔助決策的隨機查詢、綜合信息或趨勢分析信息。數據挖掘是利用一系列算法挖掘數據中隱含的信息和知識,讓用戶在決策中使用。
因此,可以簡單地說,數據挖掘主要目的是從大量的信息數據里面挖掘的我們可以用的信息。
2 數據挖掘系統的主要組成
采用數據挖掘的廣義觀點:數據挖掘是從存放在數據庫、數據倉庫或其它信息庫中的大量數據挖掘有趣知識的過程。基于這種觀點,典型的數據挖掘系統具有以下主要成分:
知識庫:這是領域知識,用于指導搜索,或評估結果模式的興趣度。這種知識可能包括概念分層,用于將屬性或屬性值組織成不同的抽象層。用戶確信方面的知識也可以包含在內。可以使用這種知識,根據非期望性評估模式的興趣度。領域知識的其它例子有興趣度限制或閾值和元數據。
數據挖掘引擎:這是構建數據挖掘系統的基礎組成部分,有計算的功能模塊組成,可以為我們提供像事物關聯,分類,演變和偏差之類的分析過程。
模式評估模塊:通常,該部分使用興趣度度量,并與挖掘模塊交互,以便將搜索聚焦在有趣的模式上。它可能使用興趣度閾值過濾發現的模式。模式評估模塊也可以與挖掘模塊集成在一起,這依賴于所用的數據挖掘方法的實現。對于有效的數據挖掘,建議盡可能地將模式評估推進到挖掘過程之中,以便將搜索限制在有興趣的模式上。
圖形用戶界面:該模塊在用戶和挖掘系統之間通訊,允許用戶與系統交互,指定數據挖掘查詢或任務,提供信息、幫助搜索聚焦,根據數據挖掘的中間結果進行探索式數據挖掘。此外,該成分還允許用戶瀏覽數據庫和數據倉庫模式或數據結構,評估挖掘的模式,以不同的形式對模式可視化。數據挖掘涉及多學科技術的集成,包括數據庫技術、統計、機器學習、高性能計算、模式識別、神經網絡、數據可視化、信息提取、圖象與信號處理和空間數據分析。通過數據挖掘,可以從數據庫提取有趣的知識、規律、或高層信息,并可以從不同角度觀察或瀏覽。發現的知識可以用于決策、過程控制、信息管理、查詢處理等等。因此,數據挖掘被信息產業界認為是數據庫系統最重要的前沿之一,是信息產業最有前途的交叉學科。
3 數據挖掘的主要任務
數據挖掘的任務主要對數據進行關聯分析以及聚類,預測,偏差等一些分析以此來得出對自己有幫助的數據。
3.1 關聯分析
關聯規則:兩個或兩個以上變量的取值之間存在某種規律性,就稱為關聯。數據關聯是數據庫中存在的一類重要的、可被發現的知識。關聯一般分為簡單關聯、時序關聯和因果關聯三種。對關聯分析為的是找到事物內部存在的關系。常用支持度和可信度兩個閥值來衡量關聯規則的相關性,并且同時輔助以興趣度、相關性等參數,從而使得所挖掘的規則更符合我們需求。
3.2 聚類分析
聚類是把數據按照相似性歸納成若干類別,同一類中的數據彼此相似,不同類中的數據相異。聚類分析可以建立宏觀的概念,發現數據的分布模式,以及可能的數據屬性之間的相互關系。
3.3 分類
分類就是找出一個類別的概念描述,它代表了這類數據的整體信息,即該類的內涵描述,并用這種描述來構造模型,一般用規則或決策樹模式表示。分類是利用訓練數據集通過一定的算法而求得分類規則。分類可被用于規則描述和預測。
3.4 預測
預測是通過以往存在的歷史數據對事件的方向進行預估,通常會先建立模型,并有模型來對未來數據特征進行預測,預測的結果追求精度和不確定性,統計結果采用方差來度量。
3.5 時序模式
時序模式是指通過時間序列搜索出的重復發生概率較高的模式。與回歸一樣,它也是用己知的數據預測未來的值,但這些數據的區別是變量所處時間的不同。
3.6 偏差分析
偏差的數據中也包含著很多對我們有用的信息。發現這些異常對我們判斷事件非常有價值。分析這些偏差最簡練的方法就是尋找數據和設定的參照之間所存在的差別。
4 實踐嘗試
在我們的實際設備運行維護中,根據設備器件的壽命、故障次數和時間、每天的動作次數、經驗的更換周期(磨損情況)等情況計算決策出更換該器件的具體時間或時間段。該功能可以很好的解決器件損壞的不確定性、未知性,在損壞之前更換淘汰該器件,為器件的更新提供科學的決策服務,減少更換的隨意性和盲目性,提高決策的科學性,用科學的手段和方法來確保不間斷播出;同時根據器件的故障率、更換頻次、器件的使用率、備用個數、實際每年消耗數等情況,科學的、智能的生成每年的備件采購計劃,可以收獲很好的經濟效益。
備件的科學制定,對發射臺的資金優化使用有很大的幫助,完全靠人工、經驗的定備件,容易造成:有的備件幾乎不損壞,而庫房又有大量的儲備,造成資源、資金的浪費;有的備件損壞率高,有時可能被使用殆盡,要臨時訂購,不利于安全播音等情況的發生,所以以科學的需求為基礎,科學的制定備件采購計劃是必要的,對維護工作、電臺的運行有很大的好處。
現行的檢修工作,多數靠的是經驗的總結,缺少更多的科學根據和數據支持,發射機的維護工作是變化的,不是一成不變的,不同的季度,不同的時間段,不同的發射機,有不同的情況和特點,都應有不同的檢修策略,通過對現有數據采用合適的算法,統籌結合多種因素,可以形成動態變化的檢修項目和時間,更具科學性、規范性、針對性。提供科學的檢修周期安排,根據積累的故障點、一年里不同時間故障部位的不同、同一類型故障出現的頻率、經驗的檢修周期、器件的損壞更換周期等情況科學的分析出檢修的周期,什么器件在什么時間需要檢修、檢查,提出科學的決策建議,維護人員根據決策建議可以更合理的安排檢修工作。實現檢修記錄的無紙化,把檢修發現的問題,都詳細的記錄,這些檢修信息不僅可以用來優化檢修周期,也優化備件的智能提醒更換功能、故障的預警預報功能,使這些功能更加精準。
5 結語
數據挖掘涉是及多學科技術的集成,包括數據庫技術、統計、機器學習、高性能計算、模式識別、神經網絡、數據可視化、信息提取、圖象與信號處理和空間數據分析。通過數據挖掘,可以從發射臺站日常運行產生的大量數據中提取對我們需要的科學維護和運行管理的有用的知識或是規律等信息,并能幫助我們在不同角度觀察和挖掘,用發現的知識來協助我們來進行信息管理,運行控制,故障判斷查詢處理等。鑒于此,做好數據挖掘對信息化背景下的現代化廣播發射電臺的管理、運行和維護工作有十分的現實意義。