◆林丙梅
論數據挖掘技術在計算機網絡病毒防范中的應用
◆林丙梅
(天府新區航空旅游職業學院 四川 620860)
就當前的網絡運行環境來看,計算機網絡病毒是威脅系統運行的重要因素之一,為進一步提升計算機網絡病毒的防范效果,有必要加強對數據挖掘技術的合理運用。基于此,本文對數據挖掘技術展開研究,從其技術原理與構成出發,圍繞規則庫、數據收集、數據處理、數據分析等方面的應用加以討論,保證數據挖掘技術可以在計算機網絡病毒的防范中有效發揮作用,為構建和諧網絡運行環境奠定堅實基礎。
數據挖掘技術;計算機網絡病毒;防范
隨著現代化社會經濟的發展,計算機網絡技術也發生著巨大的變化,但在技術創新的同時,計算機網絡病毒也隨之而來。在計算機系統運行的過程中,網絡病毒常常會在很大程度上威脅著其運行安全,進而給人們的正常生活帶來阻礙。為避免計算機內部保存的數據信息受到損害,用戶應不斷加強對數據挖掘技術的研究與應用,進而起到良好網絡病毒防御效果,幫助人們解決計算機網絡病毒所造成的危害。
計算機網絡病毒在運行的過程中并不是一個獨立的源文件,而是需要隱藏在其他的文件當中。例如,人們在通過Word編輯一段文字并保存以后,如果受到病毒的侵犯,那么整體文件的格式就會從DOCX格式文件轉換為可執行文件。在這樣的情況下,自身編碼存放的位置也會發生相應的改變,相較于DOCX格式文件,其存放位置將會受到限制,主要是隱藏在程序之中,進而就會轉換成病毒的母體。在病毒母體運行以后,病毒自身的副本鏈接就會隨著各個被感染的文件不斷向外擴散,到一定程度的時候就會突然發作,最終實現篡改資料、損害文件以及破壞系統的目的。不同的計算機網絡病毒在運行的過程中也會體現出不同的特征,例如比較小的病毒可能只有二十條指令,而大的可能會超過幾萬條;有些病毒在入侵之后會迅速繁殖;而有些則會長時間地潛伏;部分病毒在發作的時候只會顯示一個信息,但部分則會入侵所有硬盤以達到損害文件的目的[1]。
數據挖掘技術也可以稱之為KDD技術,該技術實施的主要目的在于通過特定的算法幫助用戶從海量的數據信息之中挖掘到其中有價值的部分。在數據挖掘技術應用的過程中,往往會涉及模糊識別、機器學習、統計學等多方面專業知識,并依照數據準備、規律探尋以及規律展現的流程完成數據挖掘的全過程。與此同時,系統在識別數據挖掘之后會進一步帶動相關引擎發動,對所需要的信息展開進一步檢索與規律探求。結合數據挖掘技術的應用實際來看,其重點過程在于完成數據的預處理,進而完成鏈接數據表、數據凈化以及整合變量等方面的工作。在此過程中,相關工作人員應不斷加強對數據預處理工作的關注與管理,進而為數據分析工作的順利開展奠定堅實基礎。
數據挖掘技術實施的主要目的是通過相應的算法完成對數據的分類與分析,并對數據之間的潛在關系加以有效分析。總體來說,數據挖掘技術在實施的過程中主要針對的是計算機網絡病毒的威脅性與傳播性,進而也提升了技術應用的復雜程度,保證可以針對病毒不同層面的威脅進行攻克。從功能模塊的角度上來看,數據挖掘技術主要可以分為以下幾個環節:第一是數據收集模塊,數據收集也是實施數據挖掘技術的重要基礎,只有順利完成數據收集工作才能為后續的分析過程奠定基礎。值得關注的是,應針對其中重要、特定信息展開系統化整理;第二是完成數據的預處理,提前對數據進行處理與轉換可以大大提升后續數據信息的識別概率,并在短時間內完成相關內容的獲取。在完成數據預處理的情況下,可以顯著提升數據信息的收集效率與轉換效率,進而使得數據可以更容易被接收,并實現提升準確程度的目的;第三是規則庫模塊,也就是通過該模塊完成對網絡病毒的識別,并針對其具體信息以及特性實施相應的數據挖掘技術;第四是數據挖掘模塊,也是整個系統當中最為核心的模塊,通過完成對相關數據的分析整理來得到整體的結果分析;第五是決策模塊,在此模塊中需要結合得出的匹配信息來完成網絡病毒識別,在信息匹配度比較高的情況下基本可以順利完成網絡病毒的判斷;而在匹配度比較低的時候則需要將這類新型病毒單獨列出來。
總的來說,數據挖掘技術并不是單一的技術分類,在實際實施的過程中,主要通過決策樹技術、神經網絡技術以及回歸技術來實現挖掘作用的開展。其中,決策樹技術是當前十分常見的一種數據挖掘技術,其原理是將數據樣本集合成一個根,并通過層層分析來得出最終的結論;神經網絡技術主要是通過積累的經驗知識來獲取學習能力,并有效完成知識的運用;而回歸技術最為常見的就是線性回歸,而在數據運行的過程中往往使用的都是邏輯斯蒂回歸,進而延伸出響應預測、分類劃分等內容[2]。
計算機網絡病毒在入侵計算機的時候往往會破壞其內在系統,進而造成信息竊取與損壞,而數據挖掘技術的應用可以保證在網絡病毒入侵的同時進行信息截取,并有效完成相關數據的收集、處理與分析過程,避免計算系統被病毒破壞,提升整體運行過程中的可靠性與穩定性。因此相關人員有必要進一步加強對數據挖掘技術的分析與研究。
規則庫作用的發揮主要集中與系統開發的過程中,通過計算機系統來完成網絡數據信息的挖掘,并結合相應特征對數據信息的內容進行挖掘。在此基礎上,規則庫的應用可以進一步完成相關規律的獲取以及數據的深度分析。與此同時,規則庫可以最大限度地將計算機網絡病毒當中的重要信息數據規律及其內容進行截取與分析,為后續數據挖掘工作的有效開展奠定基礎。在進行病毒防御的時候應用規則庫可以顯著提升病毒的識別速度并有針對性地實施相應的解決措施。除此以外,這種類型的應用還有助于開展數據分類與系統完善,進而給予防御系統以更加穩定的支持。
數據收集環節的應用主要是以計算機網絡技術為核心,并在人們日常使用計算機網絡技術的過程中完成對網絡信息以及資源的全面收集。數據挖掘技術的實施主要包括數據收集、整理、分類等多個環節,因此該技術也被廣泛應用于社會發展的各個領域之中。在通過數據挖掘技術進行計算機網絡病毒防御的過程中主要通過數據信息收集技術來確定病毒的傳播方式。通常情況下,病毒會以代碼的形式來對計算機系統進行入侵,這主要是由于需要借助某些計算機程序來完成整個入侵過程。因此就需要數據挖掘技術在海量的信息數據當中精準找到與病毒有關的程序代碼,并加以分析。雖然計算機網絡病毒在運行過程中體現出功能多、模塊多的復雜特征,但數據挖掘技術可以按照不同的模塊與層次完成病毒識別,并可以從網絡中獲取大量數據,進而實現對病毒信息的整理與分類。
在進行計算機網絡病毒防御的時候應用數據處理技術可以有效完成數據的合理篩選,進而找出與病毒有關聯的代碼并加以整理,最后通過相關技術完成數據格式的轉換。一般來說,網絡病毒并不會以文字和數字的方式攻擊計算機系統,因此要想有效破解病毒,就需要先完成病毒代碼的轉換,進而才可以得出病毒的實際類型[3]。而數據處理技術的應用主要就是為了轉換病毒的代碼形式,并對數據源信息、源IP位置等內容進行有效處理,進而完成對病毒IP的定位以及病毒路徑的封鎖。與此同時,數據處理技術還可以將已經收集到的數據轉化為其他形式,顯著縮短破解病毒所需要的時間,促進數據挖掘整體效率與準確性的進一步提升。
在進行數據分析的過程中,主要體現在對不同分析方法的有效應用,現階段最常見的方法包括序列分析、異類分析、分類分析以及聚類分析。其中,序列分析主要指的是在進行數據信息處理的過程中,系統需要結合隨機數據序列中的規律展開分析,并與已經存在的病毒數據序列進行比對;異類分析主要是針對存在明顯不同數據展開分析,也就是發現特殊環節與分析特殊環節的過程。其中值得注意的是,在發現特殊環節的時候往往會得到與常識不相符的結果,因此在對其展開深入分析的時候需要加強對更高價值信息數據的關注,進而顯著提升病毒甄別的實際效果;在實施分類分析之前需要先將其設定為不同類別,隨后結合個體的不同特點進行歸類處理,并通過建立對應的模型來映射數據庫內有關數據,實現對其的合理分類;在開展計算機網絡病毒防御的時候應用聚類分析可以有效分解數據挖掘過程中截獲的數據包,并充分結合不同的標準完成類型劃分。在這樣的情況下,雖然已經完成了不同組別的劃分,但在各組別內部的不同數據也呈現出了不同的特點,對于不同組別來說,其數據特點也是不相同的。而聚類分析方法的應用可以顯著將數據分布的疏密情況加以識別,并通過全區分布方式將各個數據之間的本質屬性關系聯系起來,這樣可以大大提升計算機網絡病毒的識別效率,為創建一個良好的網絡環境打下基礎。
綜上所述,在開展計算機網絡病毒防御的過程中,數據挖掘技術在優化數據獲取、提升信息安全等方面都發揮了十分關鍵的作用,同時也進一步成為未來實現數據安全管理的核心因素。因此在日后的管理過程中,應充分發揮數據挖掘技術的重要作用,不斷加強對規則庫、數據收集、數據處理以及數據分析等應用流程的優化,為網絡安全體系的構建提供穩定的技術支撐,提升計算機網絡系統運行的穩定性。
[1]薛慧敏.計算機網絡病毒防范中數據挖掘技術的應用[J].九江學院學報(自然科學版),2020,35(03):81-83+128.
[2]王亞熙,黃家祺.淺析數據挖掘技術在計算機網絡病毒防御中的應用[J].網絡安全技術與應用,2020(09):61-62.
[3]王曼.計算機網絡安全病毒防御中的數據挖掘技術應用探析[J].科技創新導報,2020,17(20):112-114.