(北安市機構編制數據中心,北安 164099)
數據挖掘是基于計算機科學,通過統計、在線分析處理、情報檢索、機器學習、專家系統和模式識別等方法對大數據高度自動化地分析每個數據,從大量數據中尋找其規律的技術。數據控制具有聚類、概念描述、關聯分析、趨勢預測等功能,其常用的方法有分類、回歸分析、Web數據挖掘等。數據挖掘技術側重于應用,數據挖掘在網絡管理中應用具有重要現實意義。數據挖掘技術分為數據層、表示層以及應用層邏輯架構方式。網絡管理中用戶可以將WEB技術作為基礎,應用兼容Browser的操作系統實現用戶端和應用服務器間數據信息相互交流。服務器在接收客戶端應用層的查詢指令和數據集成訪問請求時,將客戶端和應用服務器進行高效連接,調用應用服務器或靜態頁面響應請求,經用戶合法性身份核實認證后對應服務器提出請求,激活查詢任務應用,采用接口處理實現數據交換。
網絡是通信媒介和為人們提供綜合服務的分布式信息處理平臺,網絡管理技術是伴隨著計算機、網絡、通信技術發展的,網絡管理是指監測、控制和記錄電信網絡資源的性能和使用情況,以使網絡有效運行,為用戶提供一定質量水平的電信業務。網絡管理包括對故障管理、配置管理、性能管理、安全管理、計費管理。常見的網絡管理方式有SNMP管理技術、RMON管理技術和WEB的網絡管理,數據挖掘被應用于網絡管理能有效監視、測試、配置、分析、評價和控制數據流,有效增強信息檢索系統的能力,及時報告和處理故障,提升實時運行性能和和服務質量,促進網絡系統高效運行。
數據挖掘在不同領域的應用步驟是不同的,數據挖掘在網絡管理中需要針對不同需求實施有針對性的流程規劃設計。數據挖掘網絡管理實現流程為在表示層中,使用人員運用WEB瀏覽器HTML文件發出HTYP命令,WEB服務器接受并響應請求,經由翻譯處理轉換成應用服務器可以處理的命令,實現與數據庫的對接,生成查詢西方世界如果傳輸給客戶端;在應用層中服務器在初步分析處理后組建分析模型,采用科學算法自動生成有價值信息;基于數據挖掘技術形成的網絡告警數據庫中,包含著反映網絡管理規律的有價值信息,運用故障分析管理模塊對網絡運行情況進行評估協助網管人員分析故障信息、快速故障定位,挖掘告警關聯規則,強化告警分析和故障診斷,快速發現、做出故障決策和預測以排除故障,確保網絡安全。
數據挖掘是一個完整的過程,數據挖掘主要分為數據準備、規律尋找和規律表示解釋三個步驟。網絡管理中數據挖掘應用程序一般有以下幾步:
清晰定義業務問題,對數據進行有預見性的挖掘,防止數據挖掘盲目性。
數據準備分為數據選擇、數據預處理、數據轉換工作。網絡管理中的數據挖掘要檢索與網絡管理相關的內部和外部數據信息,依據需求確定挖掘操作的類型,濾除掉數據的無用、冗余和無法判別的資料,保留可用有效數據,進行數據的整合歸集、壓縮、倉儲等數據預處理,提升數據分析準確率;數據挖掘中由于人類和計算語言表達的不同,要將針對挖掘算法建立分析模型將數據進行集成轉換成計算機可識別的格式、形式。
對依據挖掘算法進行轉換的數據進行完善,運用數據探勘引擎系統功能對相關數據的關系進行有效分析、判別、群組分析;運用用戶接口溝通用戶互動、搜索,根據樣式評估判斷數據關聯性和有用性。數據的完整程度、專業人員支持的程度對數據挖掘有效性具有制約影響。常用的數據探勘工具有支持文本、網絡、圖像或是鏈接開放式數據挖掘的Rapidminer開源式框架;用于數據挖掘任務的算法的集合WEKA;具有自由開源信息匯整能力,支持數據查詢、處理、分析和流程規劃管理能力的KNIME圖形接口。Rapidminer不需要程序語言的編輯能力,通過簡潔易懂的圖形接口設計流程,使用者可自由配置操作接口具有較強的擴展性,通過擴充元件協同系統內部運作;WEKA具有四種模式、約五百種功能可供使用者選擇;KNIME平臺可自由配置操作接口,在同一時間開戶不同視窗滿足不同功能服務。
網絡管理中要視挖掘操作條件而選用合適的分析方法,可視化技術可以應用到網絡數據挖掘應用中;在挖掘中將分析所得有效數據集成到業務信息系統組織結構中可以提升網絡管理應用水平。
綜上所述,數據挖掘是一個系統完整的流程,運用數據挖掘能為網絡管理系統提供更好的指導,高效利用網絡資源,降低運營成本,保證網絡安全,提升網絡管理質量。網絡管理中要建立網絡管理系統,推廣數據挖掘應用,實現數據資源共享,為用戶提供高質量、可靠服務。