(北安市機構編制數(shù)據(jù)中心,北安 164099)
數(shù)據(jù)挖掘是基于計算機科學,通過統(tǒng)計、在線分析處理、情報檢索、機器學習、專家系統(tǒng)和模式識別等方法對大數(shù)據(jù)高度自動化地分析每個數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術。數(shù)據(jù)控制具有聚類、概念描述、關聯(lián)分析、趨勢預測等功能,其常用的方法有分類、回歸分析、Web數(shù)據(jù)挖掘等。數(shù)據(jù)挖掘技術側重于應用,數(shù)據(jù)挖掘在網(wǎng)絡管理中應用具有重要現(xiàn)實意義。數(shù)據(jù)挖掘技術分為數(shù)據(jù)層、表示層以及應用層邏輯架構方式。網(wǎng)絡管理中用戶可以將WEB技術作為基礎,應用兼容Browser的操作系統(tǒng)實現(xiàn)用戶端和應用服務器間數(shù)據(jù)信息相互交流。服務器在接收客戶端應用層的查詢指令和數(shù)據(jù)集成訪問請求時,將客戶端和應用服務器進行高效連接,調(diào)用應用服務器或靜態(tài)頁面響應請求,經(jīng)用戶合法性身份核實認證后對應服務器提出請求,激活查詢?nèi)蝿諔茫捎媒涌谔幚韺崿F(xiàn)數(shù)據(jù)交換。
網(wǎng)絡是通信媒介和為人們提供綜合服務的分布式信息處理平臺,網(wǎng)絡管理技術是伴隨著計算機、網(wǎng)絡、通信技術發(fā)展的,網(wǎng)絡管理是指監(jiān)測、控制和記錄電信網(wǎng)絡資源的性能和使用情況,以使網(wǎng)絡有效運行,為用戶提供一定質(zhì)量水平的電信業(yè)務。網(wǎng)絡管理包括對故障管理、配置管理、性能管理、安全管理、計費管理。常見的網(wǎng)絡管理方式有SNMP管理技術、RMON管理技術和WEB的網(wǎng)絡管理,數(shù)據(jù)挖掘被應用于網(wǎng)絡管理能有效監(jiān)視、測試、配置、分析、評價和控制數(shù)據(jù)流,有效增強信息檢索系統(tǒng)的能力,及時報告和處理故障,提升實時運行性能和和服務質(zhì)量,促進網(wǎng)絡系統(tǒng)高效運行。
數(shù)據(jù)挖掘在不同領域的應用步驟是不同的,數(shù)據(jù)挖掘在網(wǎng)絡管理中需要針對不同需求實施有針對性的流程規(guī)劃設計。數(shù)據(jù)挖掘網(wǎng)絡管理實現(xiàn)流程為在表示層中,使用人員運用WEB瀏覽器HTML文件發(fā)出HTYP命令,WEB服務器接受并響應請求,經(jīng)由翻譯處理轉(zhuǎn)換成應用服務器可以處理的命令,實現(xiàn)與數(shù)據(jù)庫的對接,生成查詢西方世界如果傳輸給客戶端;在應用層中服務器在初步分析處理后組建分析模型,采用科學算法自動生成有價值信息;基于數(shù)據(jù)挖掘技術形成的網(wǎng)絡告警數(shù)據(jù)庫中,包含著反映網(wǎng)絡管理規(guī)律的有價值信息,運用故障分析管理模塊對網(wǎng)絡運行情況進行評估協(xié)助網(wǎng)管人員分析故障信息、快速故障定位,挖掘告警關聯(lián)規(guī)則,強化告警分析和故障診斷,快速發(fā)現(xiàn)、做出故障決策和預測以排除故障,確保網(wǎng)絡安全。
數(shù)據(jù)挖掘是一個完整的過程,數(shù)據(jù)挖掘主要分為數(shù)據(jù)準備、規(guī)律尋找和規(guī)律表示解釋三個步驟。網(wǎng)絡管理中數(shù)據(jù)挖掘應用程序一般有以下幾步:
清晰定義業(yè)務問題,對數(shù)據(jù)進行有預見性的挖掘,防止數(shù)據(jù)挖掘盲目性。
數(shù)據(jù)準備分為數(shù)據(jù)選擇、數(shù)據(jù)預處理、數(shù)據(jù)轉(zhuǎn)換工作。網(wǎng)絡管理中的數(shù)據(jù)挖掘要檢索與網(wǎng)絡管理相關的內(nèi)部和外部數(shù)據(jù)信息,依據(jù)需求確定挖掘操作的類型,濾除掉數(shù)據(jù)的無用、冗余和無法判別的資料,保留可用有效數(shù)據(jù),進行數(shù)據(jù)的整合歸集、壓縮、倉儲等數(shù)據(jù)預處理,提升數(shù)據(jù)分析準確率;數(shù)據(jù)挖掘中由于人類和計算語言表達的不同,要將針對挖掘算法建立分析模型將數(shù)據(jù)進行集成轉(zhuǎn)換成計算機可識別的格式、形式。
對依據(jù)挖掘算法進行轉(zhuǎn)換的數(shù)據(jù)進行完善,運用數(shù)據(jù)探勘引擎系統(tǒng)功能對相關數(shù)據(jù)的關系進行有效分析、判別、群組分析;運用用戶接口溝通用戶互動、搜索,根據(jù)樣式評估判斷數(shù)據(jù)關聯(lián)性和有用性。數(shù)據(jù)的完整程度、專業(yè)人員支持的程度對數(shù)據(jù)挖掘有效性具有制約影響。常用的數(shù)據(jù)探勘工具有支持文本、網(wǎng)絡、圖像或是鏈接開放式數(shù)據(jù)挖掘的Rapidminer開源式框架;用于數(shù)據(jù)挖掘任務的算法的集合WEKA;具有自由開源信息匯整能力,支持數(shù)據(jù)查詢、處理、分析和流程規(guī)劃管理能力的KNIME圖形接口。Rapidminer不需要程序語言的編輯能力,通過簡潔易懂的圖形接口設計流程,使用者可自由配置操作接口具有較強的擴展性,通過擴充元件協(xié)同系統(tǒng)內(nèi)部運作;WEKA具有四種模式、約五百種功能可供使用者選擇;KNIME平臺可自由配置操作接口,在同一時間開戶不同視窗滿足不同功能服務。
網(wǎng)絡管理中要視挖掘操作條件而選用合適的分析方法,可視化技術可以應用到網(wǎng)絡數(shù)據(jù)挖掘應用中;在挖掘中將分析所得有效數(shù)據(jù)集成到業(yè)務信息系統(tǒng)組織結構中可以提升網(wǎng)絡管理應用水平。
綜上所述,數(shù)據(jù)挖掘是一個系統(tǒng)完整的流程,運用數(shù)據(jù)挖掘能為網(wǎng)絡管理系統(tǒng)提供更好的指導,高效利用網(wǎng)絡資源,降低運營成本,保證網(wǎng)絡安全,提升網(wǎng)絡管理質(zhì)量。網(wǎng)絡管理中要建立網(wǎng)絡管理系統(tǒng),推廣數(shù)據(jù)挖掘應用,實現(xiàn)數(shù)據(jù)資源共享,為用戶提供高質(zhì)量、可靠服務。