龍穎 袁明蘭 胡雪
摘要:針對正常上網所產生的網絡流量遠遠大于攻擊、入侵等非正常手段產生的異常流量的特點,通過對傳統(tǒng)FCM算法進行改進,引入新的聚類中心矩陣計算方法來計算落入平均半徑范圍內的流量數(shù)據(jù)的對象數(shù)量,根據(jù)該數(shù)量更新聚類中心矩陣,對流量數(shù)據(jù)進行聚類,并識別出網絡異常流量。對改進FCM算法、傳統(tǒng)FCM、HCM的效果進行比較分析發(fā)現(xiàn),改進FCM雖然處理時間較HCM長,但對噪聲抑制較好,錯分率較低。
關鍵詞:FCM;流量檢測;聚類
隨著網絡帶寬逐漸增加、存儲介質的容量逐漸增大、服務器計算能力逐漸增強,促使了數(shù)據(jù)產生的成本越來越低,從而造成網絡數(shù)據(jù)急劇膨脹。如何快速、準確對網絡流量進行識別和分類是網絡入侵檢測中亟待解決的問題。基于模糊集的FCM算法作為一種無監(jiān)督的分類方法,表現(xiàn)了樣本與樣本之間的聯(lián)系,建立了數(shù)據(jù)樣本對類別的不確定性描述,已廣泛應用于機器學習、數(shù)據(jù)挖掘、圖像分割、海量數(shù)據(jù)分析等領域。在網絡流量檢測中,往往基于以下假設,即網絡正常流量的數(shù)量遠遠大于異常流量,異常流量在數(shù)據(jù)中將會呈現(xiàn)出比較特殊的性質,F(xiàn)CM能通過識別正常類別比例來確定異常的類別。
因傳統(tǒng)FCM對初始數(shù)據(jù)敏感,對于含噪數(shù)據(jù)的識別效果不佳,迭代次數(shù)增加后算法處理時間迅速增加,錯分率有所上升。HCM算法運行速度快,但錯分率較高。本文算法聚類中心矩陣是通過多次迭代生成的,在對噪聲的抑制上比傳統(tǒng)FCM和HCM表現(xiàn)好。
通過理論分析和實驗發(fā)現(xiàn),在模擬實驗環(huán)境下,基于改進FCM算法的網絡異常流量檢測具有聚類速度較快,分類好的特點,算法魯棒性較好,能正確、及時發(fā)現(xiàn)網絡異常流量,為網絡異常流量實時檢測提供技術支持。
參考文獻:
[1]劉麗珍,宋瀚濤,陸玉昌.無標記訓練樣本的Web文本分類方法[J].計算機科學,2006(03):200-201+211.
[2]宋國權,李金鋒.基于聚類算法的腦部MR圖像分割[J].中國醫(yī)療設備,2017,32(01):26-29.
(作者單位:1.重慶應用技術職業(yè)學院,2.重慶商務職業(yè)學院,3.山東省醫(yī)學科學院附屬醫(yī)院)