邢翀
[摘 要]隨著社會的發展和信息技術的進步,在這個信息化的時代下,計算機的應用頻率越來越高。伴隨計算機應用產生的各種軟件也都不盡相同,計算機和網絡的出現改變了人們傳統的交流方式,人們可以不需要通過面對面的方式也可以實現在虛擬網絡中的交流。信息化時代的到來催生了電商平臺的發展,人們可以通過網上購物、付款的方式,實現方便快捷的線上購物。雖然網絡豐富方便了我們的生活,但是網絡安全漏洞問題同時會危及我們的信息、財產安全,提升網絡環境的安全性,創造干凈、安全的網絡空間,已經成為信息化時代下我們信息工作者的重要任務,解決網絡安全問題刻不容緩。本文首先介紹了計算機文本挖掘技術和網絡安全問題的相關概念和現狀,其次分析了計算機文本挖掘技術的工作原理,最后闡述了計算機文本挖掘技術在解決網絡安全問題中的應用。通過計算機文本挖掘技術,完善計算機漏洞自動分類技術,打造一個無垃圾信息的網絡環境,大大提升了網絡空間的安全性。
[關鍵詞]計算機文本挖掘技術;計算機漏洞;總動分類技術;研究
[中圖分類號]TP393.08 [文獻標識碼]A
1 計算機漏洞
1.1 計算機漏洞的概述
計算機漏洞是指在系統設計、實現、維護或者運營過程中造成的可被非授權人員非法利用的軟硬件缺陷。計算機漏洞的出現很容易導致網絡系統被攻擊,造成各種各樣的網絡安全事故,是眾多信息安全事故的罪魁禍首,計算機漏洞的出現和快速繁殖是由于黑客的盛行,黑客主要是通過對網絡系統的薄弱環節進行攻擊,攻克系統后會形成幾個少量的計算機漏洞,然后黑客又通過這幾個少量的漏洞之間進行相互滲透,達到通過非法手段獲得操作權限的目的,從而逐漸實現對目標系統的攻陷,非法地對操作系統進行控制,甚至是對系統目標的完整性進行破壞。計算機漏洞問題的出現歷史已經較為久遠了,應該說是計算計漏洞是伴隨著網絡的出現而產生的,有網絡的地方不可避免的就會出現計算機漏洞,計算機漏洞并不可怕,可怕的沒有及時發現計算機漏洞,缺乏對計算漏洞的及時、有效管理,因此,為了防范網絡風險,保護個人隱私和財產安全,及時防范和及時補救計算機漏洞的工作是不可或缺的。
1.2 解決計算機漏洞問題的必要性
計算機漏洞的出現已經是在很久之前了,在過去的十幾年前,就已經發現計算機漏洞的出現,一旦漏洞出現,在此后的十幾年中會以極其迅猛的速度發展,可以說計算機漏洞問題已經成了計算機用戶界的災難。有具體數據指出,截止到今年年底,全世界被公布的漏洞數量已經53526個。由于計算機信息化的發展程度越來越深化,用戶對計算機的智能化、人工化要求的增加,導致計算機漏洞發展更加迅速,據不完全統計,目前計算機漏洞的出現個數每天甚至能夠達到20個之多。因此,解決計算機漏洞問題,保護用戶信息隱私和財產安全已經成為當務之急。
1.3 計算機漏洞處理工作的復雜性
“紙上得來終覺淺,絕知此事要躬行”,計算機漏洞補救工作是一項非常艱巨的任務,工作的艱巨性體現在兩個方面,一是計算機漏洞補救工作需要耗費大量的人力、物力、財力,后期的維護成本也相對較高,是一項資源消耗量巨大的工作,計算機漏洞技術作為一項高端的網絡操作技術,對操作人員的要求非常高,操作人員不僅要有善于及時發現計算機漏洞的敏銳性,而且還應該具有及時修補漏洞的技術,不具備專業的網絡技術,就算已經進行了修復措施,還是無濟于事,甚至非官方的漏洞補丁還會增加其他計算機漏洞的風險,等等。同時,還要求工作人員最好有預測漏洞的能力,做到防范風險于未然,定期檢查系統防御較為薄弱的部分,及時找到安全的官方補丁。另外,在對網絡連續性要求較高的大企業、公司等等,由于計算機漏洞的出現需要進行修復,修復的過程造成了計算機工作的不連續性,極易導致公司數據的丟失或損壞,在修復階段還會暫停工作,可見漏洞修補的時間成本也較為高昂。
1.4 計算機漏洞產生的原因
計算機漏洞的出現很容易導致網絡系統被攻擊,造成各種各樣的網絡安全事故,是眾多信息安全事故的罪魁禍首,計算機漏洞的出現和快速繁殖是由于黑客的盛行。為了防范網絡風險,保護個人隱私和財產安全,及時防范和及時補救計算機漏洞的工作是不可或缺的,因此,為了實現對計算機漏洞的控制,首先我們來了解一下計算機漏洞產生的原因:
1.4.1 系統復雜性
首先系統漏洞的誘發原因最主要的就是系統的復雜性造成的,由于網絡系統的復雜性,造成難以全面地掌控系統安全,極易產生系統的風險性。通過復雜的系統,計算機病毒極易入侵系統,造成大規模的系統漏洞。因此,系統的復雜性是導致計算機漏洞產生的原因之一。
1.4.2 基礎操作系統的設計缺陷
操作系統是硬件系統的靈魂,是所有應用軟件的基礎環境,操作系統在計算機系統中扮演著重要的角色,因此操作系統的設計缺陷極容易造成計算機漏洞的出現,例如對操作系統的設計有缺陷,會造成操作系統管理員權限的失控,當系統漏洞出現時,會出現管理員權限被非法侵入等一系列的系統漏洞。
1.4.3 用戶的使用與配置錯誤
用戶的使用也很容易造成系統漏洞的出現,如用戶對計算機系統的陌生,輕易地點擊帶有木馬病毒的陌生鏈接或者是設置用戶密碼的內容較為簡單,極易破解,等等,這些缺少防范意識的操作很容易導致計算機漏洞的出現。
1.4.4 常見的代碼
常見的代碼設計是最初的漏洞產生的原因以及定義范圍,這一原因同基礎操作系統的設計缺陷原因類似,都是由于前期的系統設計問題遺留的隱患,如不能有效地避免這些設計缺陷,會加大后期計算機使用過程中的漏洞出現概率。如在代碼的設計時,設計過程較為簡單,缺少針對用戶登錄時的有效驗證:不對用戶輸入進行全面有效的驗證,可能會被攻擊者利用來執行惡意代碼,最常見的緩沖區溢出、注入都是利用這一方式。
1.4.5 設備熟知度
設備的熟知度也是導致計算機漏洞出現幾率較大的一個因素,由于在系統設計過程中,程序員運用了較為簡單常見的通用代碼或者是軟件,一個完全陌生的設備與一個在日常使用中比較常見的軟件相比,產生計算機漏洞的概率較高的一方一目了然,在系統設計時,采用簡單常見的設備極容易造成系統密碼被破譯,產生系統漏洞的結果。
有網絡的地方不可避免的就會出現計算機漏洞,計算機漏洞的出現是不可避免的,只要及時防范和及時補救計算機漏洞的工作到位,就可以規避風險把損失降到最小。只有充分研究造成計算機漏洞的原因,才能從源頭上把握計算機漏洞的補救原理,以不變應萬變。
2 計算機文本挖掘技術的概述
2.1 計算機文本挖掘技術的概念
計算機文本挖掘技術簡單來說就是對計算機中文本信息的處理,因此,文本挖掘技術的主要操作對象即計算機中的文本信息,這一技術在計算機的數據處理中處于非常重要的位置。詳細來說,計算機文本挖掘技術就是從海量的文本信息中挖掘、識別有用的信息,是從抽象內容提取出具體、可理解信息的過程,在文本挖掘這個核心階段中,挖掘結果最終體現為文本分類、文本聚類、關聯分析、趨勢預測等,其中海量的信息包括各類文本信息,如期刊中的文本信息、網頁中的文本信息、基于文本信息構建的數據庫,等等。這些文本信息應該在計算機執行文本挖掘技術之前進行人工處理,如對文本信息的去噪處理、分詞處理、停詞處理、特征表示、特征提取等等,這樣在執行文本挖掘技術時,會降低處理難度,提升處理的準確性和效率。
2.2 計算機文本挖掘技術的重要意義
通過計算機文本挖掘技術,挖掘網絡中有價值、安全的信息,實現對網絡信息垃圾的分類并攔截,打造一個無垃圾信息的網絡環境,大大提升了網絡空間的安全性。
3 基于文本挖掘的計算機漏洞自動分類技術
3.1 RISOS分類法
該種分類方法主要是從漏洞產生,是從攻擊的角度進行的漏洞分類,出現的年代已經較為久遠,無法識別到最近出現的一些較為新型的計算機漏洞,對于后面出現的新類型的漏洞已經不適用于此種分類方法了,屬于較為傳統的計算機漏洞自動分類技術。
3.2 PA分類法
該分類法是由美國提出的,該種分類方法是對傳統的、僅包含操作系統漏洞的分類法的改進和綜合,是在原有的傳統分類法基礎上又加入了對操作系統中應用程序漏洞的分類,改進后的分類法按照漏洞產生的原因將漏洞分為四類:域名錯誤、校驗錯誤、命名錯誤、串行化錯誤。
3.3 SIAM分類法
第三種分類方法較之前兩種都比較先進,出現的時間相對較晚,該分類方法主要是對平臺上軟件執行級漏洞的詳細信息進行歸納和分類。其優點顯而易見就是適用對象更加廣泛,適用面更加寬廣,但缺點是仍屬于一種較為初級的分類方法,不涉及高層軟件設計相關的漏洞和缺陷,應用面還停留在初級平臺上。
3.4 venter分類法
該種分類方法共包含個不同的類別:密碼破解與嗅探、網絡系統信息收集、后門、特洛伊木馬與遠程控制、遠程連接與服務的非授權訪問、用戶權限提升、電子欺騙與冒充、配置錯誤、拒絕服務與緩沖區溢出、病毒與蠕蟲、硬件細節、軟件細節與升級以及安全政策違反。
3.5 Anday Gray分類法
該分類方法是在吸取前人工作成果的基礎上提出的,包括十個類別的漏洞分類體系,在分類過程中考慮了漏洞起源、引入時間、位置、執行環境、質量影響、發現方法、滲透場景、修復步驟等因素。該分類法的優點在于其具體實現為了滿足不同的人在不同的環境下的分類要求,會針對不同的漏洞分析需求而改變。
3.6 Eric Knight分類法
該分類方法首次提出從軟件設計、協議實現、系統脆弱性和人為因素等多個方面對系統安全漏洞進行分類和評估,改變了傳統漏洞分類方法僅僅考慮某一單一因素的思路,大大增加了分類方法的涵蓋范圍,使得大部分漏洞都可以在這個分類機制下進行分類,對每個類別之間的區別進行了詳細的定義,因此在實際應用具有較大的意義。
隨著經濟的發展和社會的進步,人類已步入信息社會時代,計算機廣泛地應用于人們生活的各個方面。為了適應現代網絡安全問題的要求,計算機文本挖掘技術的掌握工作顯得尤為重要。計算機漏洞的出現是導致網絡安全問題的首要原因,通過對漏洞的自動分類技術研究,一方面可以維護網絡環境的安全穩定,另一方面可以有效打擊網絡犯罪,保護人民的個人隱私和財產的安全。因此,應將基于文本挖掘的計算機漏洞自動分類技術作為首要任務,通過計算機漏洞自動分類技術,大大提升網絡空間的安全性。
[參考文獻]
[1] 文翰.面向信息檢索的 Web 文本挖掘方法研究[D].廣州:華南理工大學,2012.
[2] 劉智勇.基于云計算的文本挖掘算法研究[D].成都:電子科技大學,2011.
[3] 范并思.社會科學信息分析中的文本挖掘[J].圖書情報工作,2012(08).
[4] 周雪忠,吳朝暉.文本知識發現:基于信息抽取的文本挖掘[J].計算機科學,2003(01).
[5] 鄭雙怡.文本挖掘及其在知識管理中的應用[J].中南民族大學學報,2005(04).
[6] 韓客松,王永成.文本挖掘、數據挖掘和知識管理——二十一世紀的智能信息處理[J].情報學報,2001(01).