摘要 傳統Kmeans算法在初始聚類中心選擇時具有較大隨機性,是影響聚類分析結果的關鍵因素。利用信息熵輔助選取聚類中心,提出一種信息熵與Kmeans融合算法,并以此為基礎構建一種網絡入侵檢測模型,除完成異常入侵檢測外,可使聚類中心隨網絡變化而動態更新,提高入侵檢測效果。通過對比試驗,證明了該方法的可行性及有效性。
關鍵詞 信息熵;Kmeans算法;入侵檢測
中圖分類號 S126;TP393.0 文獻標識碼 A 文章編號 0517-6611(2014)17-05671-02
Abstract Traditional Kmeans algorithm had randomness in selecting initial cluster center, which was the key factor that influenced the clustering results. Using information entropy to auxiliary select the cluster center, an algorithm combining information entropy with Kmeans was put forward, and a network intrusion detection model based on the algorithm was constructed, this model can detect the abnormal intrusion and make the cluster center change along with the network changes dynamically, which can improve the intrusion detection effect. Experiment results show that this model is feasible and effective.
Key words Information entropy; Kmeans algorithm; Intrusion detection
網絡入侵檢測是一個從網絡中的關鍵節點收集與網絡狀況及網絡行為相關的數據,對其進行分析以從中發現異常行為特征并提供預警的過程[1-2],以此達到監控網絡行為和防御網絡入侵的目的。由于入侵行為往往具有較大的不確定性,因此利用聚類分析技術提取數據中隱藏的信息,對識別未知入侵行為具有重要意義。李文華研究了基于模糊C均值FCM聚類的網絡入侵檢測模型[3];張國鎖等針對FCM在處理大數據集時的局限性,提出了改進的FCM聚類算法并將其應用于入侵檢測[4];羅敏等研究了基于Kmeans聚類算法的無監督入侵檢測模型[5];李賀玲針對數據分布不均勻的問題,提出了改進的Kmeans算法并進行了試驗分析[6]。上述方法均針對算法在可處理數據大小上進行研究改進,未涉及算法核心部分。為此,筆者針對Kmeans聚類算法,考慮到數據初始簇中心的選取是影響該算法聚類結果的主要因素,研究利用信息熵輔助確定聚類中心,并建立一種基于信息熵與Kmeans融合算法(IEKmeans)的網絡入侵檢測模型,結果表明,基于此改進算法的入侵檢測模型具有良好的入侵檢測率。
4 結論
該研究基于網絡入侵數據的特征和現有入侵檢測研究存在的問題,提出了一種基于信息熵與Kmeans融合算法的網絡入侵檢測模型,結果表明,該模型可行,且較傳統Kmeans算法而言,提高了入侵檢測的檢測率,降低了誤警率。但該算法及模型的實現,尚未考慮算法的執行效率問題,下一步應研究在盡可能短的時間內完成入侵檢測的實現方法。
參考文獻
[1] 陳小輝.基于數據挖掘算法的入侵檢測方法[J].計算機工程,2010,36(17):72-76.
[2] 李洋.Kmeans聚類算法在入侵檢測中的應用[J].計算機工程,2007,33(14):154-156.
[3] 李文華.基于聚類分析的網絡入侵檢測模型[J].計算機工程,2011,37(17):96-98.
[4] 張國鎖,周創明,雷英杰.改進FCM聚類算法及其在入侵檢測中的應用[J].計算機應用,2009,29(5):1336-1338.
[5] 羅敏,王麗娜,張煥國.基于無監督類的入侵檢測方法[J].電子學報,2003,31(11):1714-1716.
[6] 李賀玲.數據挖掘在網絡入侵檢測中的應用研究[D].長春:吉林大學,2013:26-30.
[7] 杜強,孫敏.基于改進聚類分析算法的入侵檢測系統研究[J].計算機工程與應用,2011,47(11):106-108.