999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習技術的網絡安全防護

2018-03-30 03:25:32劉金鵬
網絡空間安全 2018年9期
關鍵詞:機器學習網絡安全人工智能

劉金鵬

摘 要:信息化時代,互聯網在社會生活生產中的地位愈發重要。網絡安全事關社會穩定、國家安全。網絡安全技術與機器學習技術的結合,為網絡安全技術的發展提供了新的思路和方向,是值得深入探討和研究的。論文旨在針對現今機器學習技術在網絡安全領域的應用和研究進行介紹。主要探討了循環神經網絡用于探測網絡攻擊數據,聚類算法用于排查異常輸入, 強化學習應用于網絡安全性檢測的技術原理,實現的可行性等內容,并對未來可能的發展方向做一展望。

關鍵詞:網絡安全;機器學習;人工智能

中圖分類號:TP309 文獻標識碼:A

Abstract: In the information era, The Internet plays a more important place in our live and our work. The security of the network is concerned with the Social stability and national security. The combination of network security and the Machine Learning technology provides new research directions for the network security protection, which is worthy to be discussed and researched. This article aims at an overview of the application of network security technology based on Machine Learning, and give an outlook on the development of Machine Learning in the future.

Key words: network security; machine learning; artificial intelligence

1 引言

近年來,隨著計算機相關技術的高速發展、數據量的爆發式增長,以及計算機運算能力的逐步提升,基于機器學習技術的人工智能得到了長足發展的基礎。基于機器學習的新算法的出現,更加推動了人工智能應用的大爆發。國家也將人工智能技術提高到國家發展戰略的重要高度。2017年國務院印發《新一代人工智能發展規劃》(國發〔2017〕35號文件),提出了面向2030年我國新一代人工智能發展的指導思想、戰略目標、重點任務和保障措施,部署構筑我國人工智能發展的先發優勢,加快建設創新型國家和世界科技強國。目前,人工智能技術在圖像識別、自然語言處理、語音翻譯、視頻內容識別等方面都有了實際的應用場景,并取得了良好的效果。因此,探索在網絡安全領域使用基于機器學習的人工智能技術具有重要的現實意義。

2 概述

2.1 機器學習與人工智能

人工智能技術是一個較為寬泛的范疇,泛指由人工制造出來的系統所表現出來的智能。通常所說人工智能,是指通過普通電腦實現的智能,其有很多不同的研究方向和分支。機器學習是人工智能的一個分支,是實現人工智能的一種途徑。它以數據,或者稱為“知識”為基礎,以“學習”為手段解決人工智能中的問題。機器學習在近30多年已發展為一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算復雜性理論等多門學科。其最基本的做法,是使用算法來解析數據、從中學習規律,然后對真實世界中的事件做出決策和預測。機器學習與傳統意義上為解決特定任務而編寫的軟件程序不同。傳統軟件是由程序員使用計算機語言來描述給定的輸入與預期的輸出之間的數學或邏輯關系;而機器學習是用大量的數據來“訓練”一個數學模型,使其通過各種算法從數據中學習到給定輸入與預期輸出之間的關系,從而能夠對新給出的輸入數據做出正確的響應,完成預期的功能。

2.2 網絡攻擊

自上世紀80年代互聯網技術誕生以來,網絡為人類提供了工作生活工作的便利。同時,隨著網路技術的高速進步,也伴生著針對互聯網的各種網絡攻擊技術的發展。近年來,各類網絡安全事件和網絡攻擊事件頻發。如2016年10月由惡意軟件控制的僵尸網絡發起的拒絕服務(DDoS)攻擊,造成美國東海岸大范圍斷網;2017年5月爆發的勒索病毒軟件,造成全球數十萬用戶電腦資料被加密。網絡攻擊已經逐步從黑客個人對技術的嘗試性挑戰,發展為帶有明確經濟政治目的的行為。網絡空間的安全關系著社會的穩定和國家的安全,因此網絡安全受到國家、學術界及工業領域的高度重視。

網絡攻擊從攻擊目標上分類,大致可分為四個類型:拒絕服務攻擊(DDoS)、利用型攻擊、信息收集型攻擊(Information Gathering)、假消息攻擊,如表1所述。

表1所述攻擊方式,雖然大部分都有有效的防御手段,但攻擊技術每天都在不斷的發展,即使對于已知的攻擊方式也有百密一疏的時候,因此網絡安全是一個需要長期重視的課題。

3 人工智能技術在網絡攻擊探測方面的應用場景

3.1 深度學習用于分析網絡訪問數據流

深度學習是機器學習的一個分支,它使用由非常多個神經元組成的多層網絡結構來擬合目標函數。只要神經元的個數及網絡的層次足夠多,理論上可以擬合任意函數。神經元是神經網絡中的基本運算單元,由線性運算和非線性運算部分組成。例如,圖1為一個神經網絡中的神經元。

其中,a1、a2、a3為這個神經元的輸入。他們可能是整個神經網絡的輸入數據,也可能是神經網絡中上一層神經元的輸出數據作為這個神經元的輸入。w1、w2、w3分別為a1、a2、a3的權重,Z是這個神經元的輸出。他們之間的關系為:

g稱為激活函數,實現非線性變化。如果沒有激活函數,純線性運算的神經元相互疊加后,依然還是線性運算,不具備擬合非線性函數的能力。常用的激活函數有Relu、Tanh、Sigmoid等。

通過多個神經元多層次的疊加所組成的神經網絡模型有較強的擬合能力,但其輸入數據之間通常是沒有時間的先后關系的。而網絡中傳輸的數據流,通常與時間的先后有關。例如,某個IP對80端口的http協議發送POST請求是否是一種試探性的攻擊,并不能單獨從這一次請求的數據中確定,通常需要根據此IP之前的行為來推測。如果之前曾連續數百次向80端口發送http協議的POST請求,且POST內容相近,則懷疑可能是某種錯誤注入或掃描的嘗試。這種需要考慮輸入數據的時序關系的場景,就較適合使用循環神經網絡(RNN)。

循環神經網絡將t時刻的網絡隱藏層輸出數據作為中間數據,在t+1時刻連同t+1時刻的輸入數據一同傳送給神經網絡,從而實現t+1時刻的輸出會受到t時刻輸入數據影響的效果。以此類推,t+2時刻的輸出數據也受到t+1時刻及t時刻的輸入數據影響,即,t+n時刻的輸出取決于t+n時刻及t+n之前所有輸入的影響,如圖2所示。

當黑客試圖攻擊一臺服務器時,經常會對直接暴露在互聯網上的服務器進行掃描,以收集必要的信息。例如,對服務器的端口進行掃描,以獲知服務器上都開啟了哪些服務,其中是否有可以利用的缺陷或漏洞;或通過向某服務端口發送各種請求,分析其響應數據,根據特征來判斷運行該服務的軟件或操作系統的版本信息,進而嘗試通過該系統的某種特殊的漏洞來進行攻擊。由于掃描操作的實質還是攻擊者向服務器發送合法的請求,通過服務器的響應來判斷或猜測服務器的信息。作為服務器端的軟件,很難將正常用戶的合法請求和攻擊者發來的用以探知服務器信息的合法請求區別開來。

然而,攻擊者對服務器的掃描,必然和普通用戶的訪問是存在差異的。只是很難用編程的方式清晰的描述出這種差異,這時候,就是最適合深度神經網絡發揮作用的場景了。此時可以將網絡中的數據流作為循環神經網絡的數據輸入。由于循環神經網絡的特性,可以很好地根據接受到的數據序列,判斷當前的數據流屬于什么操作(正常訪問或惡意攻擊),進而根據分類結果進行采取必要的防范措施。

例如,圖3是使用Nmap工具對一臺服務器掃描的log。

圖4是從服務器端看到的數據流。

可以看到,攻擊者依次對目標服務器的每一個端口請求連接,然后發現了一些開啟的端口。這時使用循環神經網絡,對這個過程進行學習。學習后神經網絡將能夠根據當前數據的特征,預測次操作是正常訪問還是網絡攻擊。

例如,發現某IP地址連續對1、2、3、4、5端口發起連接請求,神經網絡根據學習過的數萬組數據判斷,此IP準備進行網絡攻擊的概率為5%。(可以簡單理解為:神經網絡學習過的數據集里,所有掃描過1、2、3、4、5端口的操作中,只有5%在后續操作中表現為網絡攻擊,其余都是正常訪問。)進而,該IP地址進一步掃描完5000個端口后,神經網絡判斷此IP企圖網絡攻擊的概率增加到70%。根據神經網絡給出的概率,管理員可以酌情進行干預,如確認權限、延時響應甚至拒絕訪問等。

3.2無監督學習用于發現未知的攻擊方式

使用有監督的深度學習,雖然可以很好的甄別出攻擊者對服務器的攻擊操作,但仍有兩個缺點。

第一,有監督學習需要大量的有標記數據作為樣本提供給深度學習網絡。而標記數據的過程需要大量人工參與,涉及到人力和資金投入。如圖5所示,人工標記數據的過程容易成為整個工作的瓶頸。

第二,有監督學習由于是根據既往的數據歸納總結規律,因此必然無法識別新的攻擊手段,如圖6所示。

即使對于已有的網絡攻擊模式,由于樣本數量和學習時間及資源的限制,有監督學習也不可能學習到自從互聯網問世到現在的所有攻擊手段,只能夠針對常見的、高發的、危害性較大的攻擊方法進行學習。因此如果攻擊者使用較為少見的攻擊方式,有可能無法被識別。

相對于有監督學習,無監督學習模式則沒有上述問題。無監督學習是指模型直接從無標簽的數據中歸納總結規律的算法,如圖7所示。無監督學習通常用于完成數據的分類,異常數據點的檢測等任務。常見的無監督學習算法有主成分分析(PCA)、聚類(Cluster Analysis)、自編碼器(Autoencoder)等。

以常見的SQL注入攻擊為例。如果程序員在Web開發時,沒有過濾敏感字符,或過濾規則不夠完備,導致攻擊者可以通過正常的輸入用戶名、密碼之類的輸入框,輸入通過精心設計的字符串,繞過Web界面,直接執行數據庫或系統的命令,從而獲取服務器重要信息甚至獲得管理員權限。

假設某網站Web頁面使用Php語言編寫,其中有頁面根據用戶名查詢用戶信息。在數據庫中查找用戶的語句如下:

$query = "SELECT * FROM users WHERE username = ",$iName

其中,$iName是輸入參數,通過Post方法傳入,其值為用戶輸入的用戶名。

對于一個正常的用戶操作,輸入用戶名“bob”,最終傳輸給數據庫的查詢指令是這樣的:

SELECT * FROM users WHERE username = bob

但是如果攻擊者輸入的用戶名為:bob OR 1=1,且網頁沒有做任何過濾,就對導致最終傳給數據庫的查詢指令為:

SELECT * FROM users WHERE username = bob OR 1=1

這里,WHERE后面是一個“或”關系的兩個表達式,任意一個為真則整體表達式為真。而1=1是永遠為真的,這就導致數據庫返回了所有用戶的信息,而不只是要查詢的bob用戶。

那么我們如何利用非監督學習來預防這樣的攻擊呢?我們先來列出一些用戶可能在這個頁面輸入的用戶名:

Kimmy N

Nancy1992

Tom

Linkg_ding

PolKKND

Frank

bob OR 1=1

ZhangYN

Cdkids october

Alice

Kiya

當這些輸入的用戶名放在一起時,即使沒有相關專業知識的人一眼看過去,也會感覺到bob OR 1=1這一項與其他項的差異較大。我們根據類似的原理,使用無監督學習進行孤立探測排除其中的差異項。

孤立探測有多種算法,基于高斯概率模型,基于距離算法,基于聚類的算法等等。我們以聚類算法舉例,聚類算法用來對數據進行分類,是一種統計分析方法。通常將每項數據映射為多維空間的點,通過迭代計算質心點位置對所有數據盡進行分類。例如,二維平面上有n個數據點如圖8所示。

在圖中任意取兩個點A和B,計算每個數據點到點A和點B的歐式距離。距離A點近的分為A類,距離B點近的分為B類,如圖9所示。

全部分類之后,計算所有A類點的質心點A1,所有B類點的質心點B1,移動A、B兩點,另A=A1.B=B1,然后重復分類過程。如此迭代n輪之后,A,B兩點將不再移動,最終分類結果如圖10所示。藍色點為一類,紅色點位另一類。可以看到算法正確的將兩個數據異常點與其他數據區分開來。以上為聚類算法中較為簡單的K-means聚類。這里為了直觀使用了二維數據,同理可擴展到N維數據。在實際應用中,數據通常是較大維度的。如何將原始數據映射為n維數據點,也是我們需要仔細考慮的過程。

就上面說到的SQL注入攻擊來說,可以將用戶名映射為n維數據點,然后使用聚類算法,將最新輸入過的1000個用戶名使用K-means算法分為兩類。(這里1000個僅為舉例,實際根據分類的精準度和運算速度來取合適的值)由于K-means算法的特點,分類不會失敗,無論數據分布情況如何,總能分為兩類。我們可以根據分類后的數據情況來判斷,通常情況下,沒有異常數據點的話兩類數據點的個數應該大致相同。如果有異常數據點,則異常點將被分做一類,其余數據一類。這樣,我們就可以在沒有任何先驗數據的前提下,對攻擊者的注入式攻擊進行預警,而且這種預警是動態的,他并不關心什么樣的輸入才是攻擊,而只管找出“和大多數不一樣”的輸入。

3.3 強化學習對網絡安全性的測試

強化學習是通過構建一個智能體(Agent),使其與環境(Environment)進行交互,并從中學習的一種學習方式。智能體可以獲得環境的當前狀態,并根據當前狀態進行動作(Action)。智能體的動作將影響環境下一時刻的狀態。隨著環境狀態的改變,智能體將得到反饋(Reward)。如果環境朝著期望的狀態改變,智能體將得到正向反饋,反之得到負反饋。通過與環境的這種反復交互,期望智能體最終能夠習得根據環境做出最優解的動作,以獲得最大回報,如圖11所示。

Agent可以通過學習策略函數π來獲得在給定狀態s時,動作集上的函數分布。

或者也可以學習值函數V,根據給定狀態s和動作a,獲得未來狀態優良度的評估,從而間接輔助選擇動作a,使得所選擇的a導致未來狀態向良性發展。

學習值函數或策略函數的實現方式可根據實際情況選擇不同的方法。對于整體系統較為簡單,狀態S有限的環境,可以使用Q-table方式實現。對于較復雜的系統,人們將其與機器學習相結合,使用深度神經網絡來擬合策略函數或者價值函數。強化學習常被使用在游戲領域及自動化控制領域,如無人車、機器人等。

強化學習同樣屬于無監督學習過程,它不需要事先準備帶有標簽的數據,而是自己從環境中總結規律。這對于自動化控制領域是一個劣勢,因為要從真實的物理環境中學習,時間成本會大大增加。(當然現在也在探索使用電腦模擬物理環境進行學習的技術,可以一定程度上提高學習速度。但由于模擬環境畢竟與真實環境有差異,最終還是需要在真實環境中學習。)但對于網絡安全領域,環境本身就是數字化的。網絡的吞吐量,服務進程運行狀態,資源占用等情況,都可以輕易的提供給神經網絡進行學習,學習時間上并沒有比其他學習方式有明顯差異。

強化學習已有被用來進行網絡攻擊的案例。從另一方面想,也可以利用強化學習來檢測網絡的安全性,排查服務器的漏洞。使用深度神經網絡模型進行學習,以服務器狀態作為環境狀態,以攻擊服務器獲取權限或影響其正常運轉作為目標進行訓練。神經網絡學習的過程,也就是它尋找服務器漏洞的過程。深度神經網絡可以反復不停的試探對目標的攻擊,并且,它的試探并不是無目的的遍歷,而是逐步根據服務器給出的響應,總結規律,有方向有目標的嘗試攻擊目標。

使用強化學習的優勢還體現在可以隨著服務器軟件版本的升級而隨時改變自身的攻擊策略,持續發揮作用。每次神經網絡的動作都會得到響應的反饋,如果服務器的軟件更新升級,得到的響應不同,反饋數據也會不一樣。這將會導致神經網絡參數更新,使其自動調整行為以適應新的環境。這避免了有監督學習中,在數據分布特征變化的時候必須重新訓練網絡的問題。

4 結束語

機器學習、神經網絡等人工智能技術已在眾多領域中發揮作用,深入到我們生活工作的方方面面。同時,我們也看到人工智能技術現有的一些局限性。例如其可解釋性差,很多時候雖然可根據統計學原理確定人工智能的預測或判斷是有效的,但具體到針對某一組數據的預測或判斷,我們難以準確了解其做出預測或判斷的依據。因此,目前在需要高可靠性的領域,人工智能模型通常只作為參考,而不起決定作用。

將機器學習、神經網絡技術應用在網絡安全領域,對于提高網絡安全性,減少網絡維護成本,有著積極的意義。人工智能與各傳統行業的結合,已經產生出很多可觀的成果。在網絡安全領域應用機器學習技術,必將為網絡安全技術帶來新的發展方向,引領網絡安全進入新的發展階段。另一方面,應用人工智能技術進行網絡攻擊的手段也已出現。未來,網絡攻擊與防御將是兩方人工智能技術的比拼。因此,將機器學習應用于網絡安全中是有益且有必要的,機器學習必將引領網絡安全技術獲得長足的進步。

參考文獻

[1] 周志華,王玨.機器學習及其應用2009[M].北京:清華大學出版社,2009.

[2] 張蕾,崔勇,劉靜,江勇,吳建平.機器學習在網絡空間安全研究中的應用[J].計算機學報,2018.

[3] 伊恩·古德費洛,約書亞·本吉奧.深度學習[M].北京:人民郵電出版社.

[4] Alpaydin E.Introduction to Machine Learning (Adaptive Computation and Machine Learning)[M].MIT Press,2004.

猜你喜歡
機器學習網絡安全人工智能
網絡安全
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
網絡安全人才培養應“實戰化”
人工智能與就業
IT經理世界(2018年20期)2018-10-24 02:38:24
上網時如何注意網絡安全?
數讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
基于支持向量機的金融數據分析研究
下一幕,人工智能!
南風窗(2016年19期)2016-09-21 16:51:29
主站蜘蛛池模板: 国产一级α片| 亚洲婷婷丁香| 色窝窝免费一区二区三区| a级毛片网| 最新亚洲人成无码网站欣赏网 | 亚洲水蜜桃久久综合网站| 全裸无码专区| 国产国产人在线成免费视频狼人色| 久久综合婷婷| 久久久久久尹人网香蕉 | 亚洲天堂精品在线观看| 久久精品人妻中文视频| 青青草综合网| 色综合婷婷| 久久精品日日躁夜夜躁欧美| 国产精品成人观看视频国产| 四虎成人在线视频| 国产欧美日本在线观看| 色妞永久免费视频| 久久久久免费看成人影片| 午夜视频在线观看区二区| 国产欧美视频一区二区三区| 国产精品一区二区不卡的视频| 亚洲欧美国产高清va在线播放| 色婷婷电影网| 在线播放真实国产乱子伦| 久久夜夜视频| 亚洲国产欧美中日韩成人综合视频| 婷婷丁香色| 91人妻日韩人妻无码专区精品| 国产免费黄| 人妻一本久道久久综合久久鬼色| 伊人婷婷色香五月综合缴缴情| 本亚洲精品网站| 色精品视频| 波多野结衣国产精品| 手机在线免费不卡一区二| 无码又爽又刺激的高潮视频| 欧美啪啪精品| 黄色在线不卡| 国产精品三级专区| 国产产在线精品亚洲aavv| 日本91视频| 99精品福利视频| 人妻出轨无码中文一区二区| 国产亚洲精品91| 免费xxxxx在线观看网站| 在线视频亚洲欧美| 亚洲黄色网站视频| 欧美人在线一区二区三区| 国产91丝袜| 欧美色99| 中文字幕首页系列人妻| 狠狠综合久久| 国产欧美视频综合二区| 国产精品男人的天堂| 亚洲天堂日本| 国产在线视频欧美亚综合| 午夜精品福利影院| 欧美亚洲一区二区三区在线| 免费无码网站| 免费看a毛片| 欧美中文字幕在线二区| 中文字幕 欧美日韩| 999精品在线视频| 黄色网址免费在线| 欧洲亚洲欧美国产日本高清| 欧美性天天| 国产精品福利在线观看无码卡| 国产日韩欧美在线视频免费观看 | 亚洲va在线观看| 国产国拍精品视频免费看 | 色综合天天视频在线观看| 欧美精品在线观看视频| 亚洲啪啪网| 18禁高潮出水呻吟娇喘蜜芽| 精品视频第一页| 四虎成人精品在永久免费| 伊人色天堂| 五月婷婷激情四射| 狠狠亚洲五月天| 欧美精品v日韩精品v国产精品|