郭凱龍 黃隨 孫光虎
摘要:在當前的發展階段下,互聯網高度普及,網絡在很大程度上承載了現代社會的商務活動、娛樂活動以及社交活動等,可以說現代社會生活與網絡息息相關。在互聯網高速發展的過程中,網絡安全問題也日益凸顯,針對這一問題要重視對網絡異常行為的檢測,從而及時排除網絡風險提升網絡穩定性,而傳統的網絡異常行為檢測技術已經難以滿足現階段大規模的數據存儲以及處理需求,在這種情況下就需要引入大數據技術,借助大數據技術在數據處理分析方面的優勢,進一步提升網絡異常行為檢測的準確率以及效率,這對于網絡的健康發展,以及安全互聯網環境的構建具有重要的意義。
關鍵詞:大數據:網絡異常行為:檢測
現代社會大數據,云計算以及人工智能技術先后崛起,相關技術的應用在很大程度上推動了互聯網的發展,在全球范圍內網絡數據量以及數據類型正在快速增加,而這也表明了大數據時代已經來臨。在大數據時代下互聯網的普及率進一步提升,但是網絡安全問題也愈發嚴重。在互聯網空間每天都在產生大量的惡意程序,非法網絡行為在很大程度上侵犯了用戶隱私,并導致重大的經濟損失。在互聯網高速發展的過程中,不僅需要重視拓展互聯網相關技術的應用場景,同時也需要從構建安全網絡環境的角度出發,加強技術的應用,通過將大數據技術引入到網絡異常行為檢測中,從而及時發現存在風險的網絡行為,這對于用戶隱私的保護,以及安全網絡環境的構建具有重要的意義,因此有必要對基于大數據的網絡異常行為檢測技術進行深入研究。
1大數據以及網絡異常行為檢測概述
總的來說,大數據主要包括結構化數據以及非結構化數據,其中非結構數據為大數據的主要構成。依據IDC相關調查數據,非結構數據占企業數據的九成以上,而這些數據正在以每年50%以上的速度增加。大數據是互聯網發展到一定程度上的產物,在大數據時代下,云計算技術脫穎而出,成為驅動互聯網領域進步的重要動力,在相關技術不斷發展應用的過程中,技術本身的適用性也在不斷提升,成為促進行業發展創新,促進產業轉型的重要因素。
在互聯網安全領域,可以將網絡異常行為檢測分為兩種類型,分別是基于主機的網絡異常行為檢測以及基于網絡的網絡異常行為檢測。基于主機的網絡異常行為檢測需要對主機日志以及主機操作進行分析,但是該檢測方法具有一定的滯后性,難以實現依據網絡情況進行動態檢測;基于網絡的網絡異常行為檢測,主要對網絡行為分為正常的網絡行為以及異常的網絡行為,傳統的檢測方法難以實現較高的檢測準確率,尤其在當前的發展階段下,網絡數據量激增,需要對大量的網絡數據進行處理,這就導致網絡行為檢測需要花費大量的時間,難以滿足大數據時代網絡安全的需求。針對這一問題可以將大數據技術引入到網絡行為檢測中,從用戶行為角度出發,建立相應的網絡行為模型,從而及時準確的檢測網絡異常行為。
2基于大數據的網絡用戶異常行為檢測方法設計
2.1對用戶異常行為進行識別
當前,網絡用戶數量不斷增加,網絡用戶在參與網絡的過程中會產生大量的用戶請求,而用戶請求往往具有很強的突發性以及隨機性。但是從網絡用戶的行為模式來看,對于特定用戶來說,所生產的網絡請求是有跡可循的,具有一定的規律性。因此建立在大數據平臺基礎上的網絡行為識別需要著重對以下兩個問題進行分析,分別是如何判斷用戶身份是否可信;其次如何對用于的異常網絡行為進行界定。以上兩個問題也是在應用大數據技術進行網絡行為檢測過程必須要解決的。針對以上問題可以應用挖掘方法來構建識別網絡用戶行為的框架圖。網絡用戶行為框架圖主要包含云基站端以及用戶端,在云基站中建立網絡用戶行為數據庫,并對數據庫中的相關行為進行分類,實現檢測的主要原理是將用戶數據與數據庫行為數據進行對比,從而對用戶數據進行分類。在該框架中,云基站主要用于處理用戶行為信息,優勢在于能夠高效率的計算機大量的非結構數據。終端用戶在訪問網絡的過程中,需要對用戶的網絡行為進行分類處理,而這個過程需要結合用戶的訪問目的如社交,購物等,根據用戶在網絡中處理的不同事務,將用戶行為劃分為網絡資源尋找類型行為,社交類型行為以及網絡商務活動用戶行為等。
2.2行為分析技術應用
基于數據網絡異常行為分析技術的應用的主要目的在于及時發現用戶的網絡異常行為,從而及時采取措施,保護用戶的隱私安全降低網絡風險。為了實現更為高效準確的異常行為檢測,需要將行為分析技術應用與異常行為檢測中。在這個過程中,需要應用大數據技術對大量的異常行為數據進行分析總結,從而建立主動行為屬性表,通過將用戶網絡行為與主動行為屬性表進行對比,從而實現對用戶行為的準確判斷,及時發現用戶的網絡異常行為,該行為檢測模式具有比較高的復雜度,因此在只具有主動攻擊的情況下會降低一個維度,從而減少計算的復雜性。
需要注意的是該檢測模式的應用需要在真實的網絡環境中,準確地判斷聚類個數,靈活的應用聚類算法,在應用聚類算法的過程中先添加一個比較因子T,分別找出所有樣本代表的最小值,如果最小值大于T,將其作為新的代表,使T為數據集的最佳聚類個數,該算法的優點在于,不需要提前決定T,可以在一定的范圍內調節聚類的個數,利用cost=Tnew-Told(1)這一公式獲得T的變量值,其中Tnew代表方差和,Told為聚類的代表對象,通過聚類算法計算網絡的變化值,并進行記錄,將可能存在的異常的網絡數據進行篩選,依據所篩選的數據進行訓練,提升檢測機制的效率。在完成機器訓練后,系統具有較高的自動識別能力,能夠針對大量網絡數據進行分析處理,從而及時發現用戶的網絡異常行為,采取有針對性的措施,提升網絡環境的安全性。
總結:
在當前的發展階段下,互聯網高度普及,依托互聯網能夠實現線上交易,網絡社交以及各種網絡娛樂活動,但是互聯網以及相關技術在大規模應用的過程中,所產生的網絡安全問題也值得關注,傳統網絡行為檢測方式存在諸多弊端,在這種情況下,就需要重視大數據技術在網絡行為檢測中的作用,依托大數據優勢,進一步提升網絡行為檢測的效率以及準確性,這對于互聯網的安全穩定發展具有重要的意義。
參考文獻:
[1]李錚,傅陽.一種基于深度學習的網絡異常行為檢測方法[J].網絡安全技術與應用,2020(08):66-68.
[2]倪東.大數據環境下的網絡異常行為檢測與分析[J].九江學院學報(自然科學版),2020,35(02):87-91.
[3]劉建蘭,覃仁超,何夢乙,熊健.基于大數據技術的網絡異常行為檢測模型[J].計算機測量與控制,2020,28(03):62-66+71.