賈焰,方濱興,李愛平,顧釗銓
(1.哈爾濱工業大學(深圳) 計算機科學與技術學院,深圳 518055;2.廣州大學網絡空間先進技術研究院, 廣州 510006;3.國防科技大學計算機學院,長沙 410073)
網絡空間是構建在信息通信技術基礎設施之上的人造空間,用以支撐人們在該空間開展各類與信息通信技術相關的活動。網絡空間已經成為繼陸、海、空、天之后的第五大活動空間,網絡空間安全是國家安全的重要組成部分,網絡空間頻頻發生的安全事件,已經嚴重影響了社會穩定和人民生命財產的安全,維護網絡空間安全已成為事關國家安全、國家主權和人民群眾合法權益的重大問題。
近年來,隨著大數據、云計算、人工智能等新型信息技術的飛速發展,網絡空間安全領域的一些難題得到解決,但是新技術也逐步被不法分子利用,造成了網絡空間中新的安全問題與挑戰。以人工智能技術為例,人工智能技術既能用于提升網絡空間安全能力,也能引發新的安全問題,即人工智能的“賦能效應”和“伴生效應”[1]。
傳統網絡安全領域檢測網絡攻擊主要依靠規則、模式匹配等方式,從流量數據、日志數據中檢測符合一定規則和模式的數據。然而,隨著網絡安全數據量的飛速增長,基于規則、模式匹配的檢測方式效果差,很難發現復雜的攻擊事件[2]。人工智能技術可以從大量的數據中自動學習,挖掘數據中蘊含的規律,近年來已被用來解決網絡安全問題,例如,麻省理工學院計算機科學與人工智能實驗室和創業公司PatternEx共同開發的AI2網絡安全入侵檢測平臺,可以準確預測85%以上的網絡攻擊[3];為了有效檢測惡意Powershell,通過將Powershell轉換為文本數據,構造卷積神經網絡大大提升了檢測率[4]。
人工智能技術同樣可能被惡意利用,引發網絡空間中新的安全問題,即人工智能技術的伴生效應。人工智能技術應用于漏洞挖掘時,能發現系統中存在的多個漏洞,從而導致系統更容易被攻擊;人工智能應用于大規模網絡攻擊時,攻擊者可以自適應生成攻擊程序,通過大量的客戶端實現智能化、自動化的網絡攻擊;人工智能應用于復雜的網絡攻擊時,攻擊者可以隱藏攻擊行為、攻擊路徑等,從而使得防御者更難發現和檢測此類攻擊;人工智能技術也可應用于對網絡攻防的博弈,人工智能技術自身存在脆弱性,攻擊者可以攻擊部署在系統中的智能模型,造成防御模型失效;人工智能技術還可能被用來竊取用戶的重要數據,通過對系統中各類數據的深度挖掘,關聯分析、還原出用戶的重要數據,從而引發更為嚴重的安全問題。
網絡空間安全是一個攻防博弈的過程。當新的安全問題出現時,防御者需要針對性地予以解決。人工智能時代,由于智能化的提升,網絡空間安全面臨著更加嚴峻的風險與挑戰,而人工智能技術也正是防御者維護網絡空間安全的武器。如何基于人工智能技術提升網絡空間安全的主動防御能力、應對人工智能時代網絡空間安全的新風險與新挑戰已成為一個十分迫切的問題。
本文在中國工程院 “新一代人工智能安全與自主可控發展戰略研究”重大咨詢項目的支持下,分析了人工智能時代網絡空間安全面臨的風險與挑戰;介紹了人工智能技術的優勢與特點,以及其如何應用于網絡空間安全;同時介紹了基于人工智能的網絡空間安全防御關鍵問題及技術;最后針對網絡空間防御提出了發展對策與建議。
人工智能技術使得網絡漏洞更容易被挖掘,各種惡意軟件可以更便捷地生成和應用,從而造成網絡空間面臨更嚴峻的安全威脅。
美國國家漏洞數據庫(NVD)、國家信息安全漏洞庫(CNNVD)等歷年來披露的漏洞越來越多,涵蓋的設備、軟件系統等也越來越多。人工智能技術的發展為漏洞的挖掘和利用提供了便利。模糊測試是一種自動化或半自動化的軟件測試技術,構造隨機、非預期的畸形數據,測試并監控程序執行過程中可能產生的異常及漏洞的可利用性。此類模糊測試技術又可以分為白盒、黑盒、灰盒模糊測試等,能高效地挖掘和利用程序漏洞[5]。漏洞自動利用一般而言包括信息提取、漏洞識別、路徑發現、狀態求解及代碼生成[6],通過從可執行文件、源碼等輸入數據中提取有用的信息,利用路徑發現與狀態求解獲取利用案例,并生成漏洞利用的程序或數據,實現漏洞的自動化利用。
美國國防部高級研究計劃局(DARPA)于2013年發起全球性網絡安全挑戰賽,旨在推進自動化網絡防御技術的發展,即實時識別系統缺陷和漏洞,并能自動完成補丁和系統防御等。2016年,美國在拉斯維加斯舉辦了信息安全界的頂級賽事 Defcon CTF [7],1支名為Mayhem的機器奪旗賽(CTF)戰隊與另外14支人類頂尖的CTF戰隊進行角逐,機器戰隊一度超過兩支人類戰隊,開創了自動化攻防的新局面。自動化攻防是網絡空間安全面臨的新挑戰,自動化的網絡攻擊手段將加劇網絡空間的安全威脅與挑戰。
在人工智能時代,大規模的網絡攻擊越來越頻繁。大規模網絡攻擊的形式主要包括拒絕服務攻擊 (DDoS)、域名解析服務器(DNS)劫持等。大規模網絡攻擊的目標也從傳統的網絡系統,延伸到物聯網、工業設備、智能家居、無人駕駛系統等。
2016年10月,美國多個公司的服務器遭到大規模分布式拒絕服務攻擊,據報道,此次攻擊涉及數百萬互聯網地址和惡意軟件的大規模攻擊,而這些攻擊的來源主要是被Mirai僵尸網絡感染的連網設備。近年來,此類大規模僵尸網絡驅動的分布式DDoS可以利用數以萬計的被感染的物聯網設備,通過這些設備向受害網站發送大量流量,實現攻擊。2018年,美國曾組織專家討論了針對無人駕駛汽車的攻擊,其中包括大規模網絡攻擊可能造成的危害,并建議提前進行規劃演練。人工智能技術還可生成可擴展攻擊的智能僵尸網絡。美國飛塔(Fortinet)公司在其發布的2018年全球威脅態勢預測[8]中表示,人工智能技術未來將被大量應用在蜂群巢網絡(Hivenet)和機器人集群(Swarmbots)中,能夠利用大規模互連的設備或機器人集群同時識別和應對不同的攻擊媒介,并利用自我學習能力實現前所未有的大規模自主攻擊。
人工智能技術使得網絡攻擊的成本越來越低,可利用的攻擊武器和資源越來越多,從而導致大規模的網絡攻擊越發頻繁。
傳統的網絡攻擊行為一般會在系統中留下痕跡,容易被追溯;攻擊行為的目標和意圖比較明確,容易被發現。人工智能時代,利用智能化技術可以對復雜的攻擊行為進行隱藏,如通過不同的終端設備實施攻擊,在不同的時間發動攻擊等。
傳統的惡意代碼、惡意程序在發布以后,這些代碼和程序的攻擊目標、攻擊意圖往往是確定的,作為網絡空間中的防御者,可以通過逆向工程、網絡監聽等方式分析得知攻擊的目標和意圖。然而,在人工智能技術的助力下,惡意代碼、惡意程序可以通過內嵌深度神經網絡模型,實現在代碼開源的前提下,依然確保攻擊目標、攻擊意圖、高價值載荷三者的高度機密性,從而大幅度地提升了攻擊行為的隱蔽性。2018年8月,國際商業機器公司(IBM)研究院在Black Hat USA 2018大會上展示了AI-Powered Malware—DeepLocker [9],借 助 人工智能技術實現了目標識別精準性和攻擊載荷機密性,能有效對抗人工逆向分析。
高級持續性威脅(APT)攻擊是一種集合了多種攻擊方式的復雜攻擊。攻擊者往往會花很長時間對目標網絡進行觀察,針對性地搜集信息,并有針對性地發動攻擊。這些攻擊行為可以分布在很多設備上,不同攻擊行為之間也可能存在很大的時間間隔,結合人工智能技術可以對攻擊行為進行更好的設計和組合,從而躲避防御者的檢測,保持攻擊行為的高隱蔽性。
網絡空間安全是一個攻防博弈的過程。人工智能技術在處理海量、多源異構數據方面具有巨大的優勢,攻擊者會使用人工智能技術構造規模更大、隱蔽性更強、后果更嚴重的攻擊,而防御者則會利用人工智能技術去提升網絡攻擊檢測的準確率,提高網絡攻擊檢測效率,降低網絡攻擊誤報率等。在這個過程中,人工智能技術促使網絡空間的攻防博弈程度愈演愈烈。
在惡意軟件識別方面,基于生成對抗網絡(GAN)的MalGAN算法可以使用一個替身檢測器來適配黑盒惡意軟件檢測系統,該算法生成的惡意代碼能夠繞過基于機器學習的檢測系統[9]。類似的,為了躲避PDF惡意軟件檢測器,基于遺傳算法的對抗機器學習方法可以在保留自身惡意行為的前提下,繞過機器學習分類器的識別,讓惡意檢測器將其識別為良性樣本[10]。
此外,由于人工智能技術自身存在脆弱性,例如,圖像識別神經網絡容易被生成的和原樣本高度相似的對抗樣本迷惑,造成錯誤識別[11];推薦系統容易被個別關鍵詞影響,造成推薦結果被人為干預 [12]。當缺乏解釋性的人工智能技術用于網絡攻擊或防御時,另一方則可利用模型自身的脆弱性發動防御或攻擊,引發新一輪的網絡攻防博弈。
數據是一項重要的資源和資產,大型企業特別是互聯網企業擁有著大量的用戶數據,這些企業的系統一旦被攻擊,很容易造成大規模的數據被竊取或破壞。除了互聯網企業,很多傳統企業也擁有重要的數據,而傳統企業的安全意識不足,攻擊者更容易通過技術手段從中竊取用戶和企業的重要數據。人工智能技術則加劇了該情況的出現,攻擊者利用人工智能技術能更加容易地竊取重要數據,或者破壞企業的核心數據。
在數據發布過程中,用戶的數據很有可能由于匿名保護等程度不夠,攻擊者通過多種攻擊方式可以獲取到用戶的數據,如偏斜攻擊等。成員推斷攻擊可以用于獲取訓練數據集的關鍵信息,攻擊者可以判斷某條信息是否存在于目標模型的訓練數據集中,從而實現針對重要數據的竊取。攻擊者通過訓練出多個模仿目標模型的影子模型,利用影子模型的識別結果去判斷目標模型的訓練集中是否包含某敏感數據[13]。類似的,模型倒推攻擊可以通過模型的輸出反推訓練集中某條目標數據的部分或全部屬性值,攻擊者在僅獲得模型參數的情況下,就能夠使用基于生成對抗網絡的方式實現模型反演,重建出訓練數據,造成數據被竊取[14]。
人工智能發展迅速,隨著海量數據的積累、算法算力的大幅度提升,人工智能已成為目前最為熱門的研究方向之一。
人工智能主要包括三大學術流派:符號主義、連接主義、行為主義。其中符號主義是一種基于問題、邏輯和搜索的高級符號處理體系,通過將信息和行為抽象到基于符號規則的系統中,并利用計算機邏輯推理模擬人類的抽象思維,代表性的成果包括專家系統、知識圖譜[15]、多維數據關聯與智能分析(MDATA)模型[16]等。連接主義采用基于網絡連接機制和學習算法進行建模,典型的成果包括感知機、深度神經網絡[17]等。行為主義則認為智能是通過對環境反饋的自主感知做出相應的行為。
網絡空間安全相關的數據體量大、數據種類多、數據增長快,傳統的分析技術在處理此類數據時效率低、準確率低。人工智能在處理海量數據、多源數據、動態數據等方面具有顯著的優勢,能助力于網絡空間安全,提升網絡防御能力。
網絡空間安全相關的數據體量大,例如系統中保存的日志數據、網絡流量數據等,處理如此海量的數據既需要龐大的算力支撐,也需要能處理如此海量數據的智能算法。由于人工智能技術能從海量數據中學習數據的特征,根據特征再對數據進行分類、聚類等處理,能大幅度提升效率和準確度。
以惡意代碼檢測為例,可以通過提取惡意代碼的靜態特征和動態特征進行智能化檢測,其中靜態特征包括文件散列(Hash)、簽名特征、應用程序編程接口(API)函數調用序列、字符串特征等,動態特征則包括中央處理器(CPU)利用率、內存消耗、網絡行為特征、主機駐留行為等,通過自動化提取或者經過特征工程提取的各類特征,可利用深度學習或機器學習方法,如卷積神經網絡等,自動對可疑的惡意代碼進行判定。基于人工智能技術的惡意代碼檢測,相比靜態檢測、動態檢測、啟發式檢測和虛擬機檢測等技術,能大幅度提升檢測效率,并提高檢測的準確率。
網絡安全相關的數據種類繁多、來源廣泛,如通過傳感器、網絡爬蟲、日志收集系統等能采集到不同類型的數據,從來源上數據類型可以分為環境業務數據、網絡層數據、日志層數據、告警數據等類別,綜合不同來源的異構數據進行綜合分析能提升網絡空間主動防御能力。
以網絡安全態勢感知為例,防御者需要對網絡系統的資產狀態進行全方位的掌握,因此需要獲取各種來源的信息,包括資產信息、漏洞信息、攻擊行為信息等,而這些信息往往又是通過流量數據、日志數據等不同數據進行綜合分析得到的結果。MDATA模型有助于實現全方位的網絡安全態勢感知[16]。該模型構建了不同類型的網絡安全知識庫,包括資產知識庫、漏洞知識庫、威脅知識庫,其中資產知識庫主要包括系統中的各類軟硬件資產及運行狀態信息等,漏洞知識庫包括各種類型的漏洞,威脅知識庫包括針對系統的各類攻擊行為,資產知識庫和漏洞知識庫進行關聯,可及時發現系統中的漏洞;漏洞知識庫和威脅知識庫關聯,可發現攻擊路徑、攻擊方法等,及時制定相應的防御策略;資產知識庫和威脅知識庫關聯,可發現攻擊者的攻擊目標等,增加資產的保護力度等。基于人工智能技術的網絡安全態勢感知有助于實現網絡空間主動防御,大幅度提升網絡系統防御能力。
網絡空間安全相關的數據增長速度快,時效性要求高。從數據增長速度上來看,每天都會產生很多新的流量數據、日志數據、告警數據等,如何對這些新產生的動態數據進行分析是一個十分迫切的需求;此外,網絡攻擊事件的時效性要求很高,實時根據動態數據檢測出潛在的網絡安全事件,也是網絡空間主動防御的難題。
專家系統可以用于提供專業的網絡安全知識,并且可以根據歷史網絡安全事件總結出網絡攻擊規律,從而能有效地檢測出正在發生的某些網絡攻擊。然而,專家系統的缺陷在于專家知識更新慢,利用專家系統能快速檢測已知的網絡攻擊,但是對于未知的網絡攻擊事件,專家系統的知識往往由于更新不及時,導致系統無法正確檢測。
此時,需要結合人工智能技術賦予的預測能力,對動態的數據設計在線算法,能夠結合已有的網絡安全知識和實時的數據判斷當前的潛在網絡攻擊;根據已經發生的攻擊事件和歷史數據,建立攻擊預測模型,預測未來可能發生的攻擊行為,通過人工智能技術增強系統的預測能力,提供動態防御能力,提升網絡安全事件的快速響應能力。
基于人工智能技術提升網絡空間安全防御能力,需要解決從原始海量數據到有效知識的整合,人工智能技術可以通過高效的知識表示,構建網絡安全知識大腦,助力實現網絡安全知識綜合利用和主動防御。
在已有的研究工作中,知識圖譜[15]是一種高效的知識表示模型,雖然其在一定程度上解決了數據到知識的表示難題,但是知識圖譜表示方法面臨著時空特性無法有效表示、多領域知識統一表示困難等難題。MDATA模型[16]通過對知識引入時間特性和空間特性,能有效解決時空特性的表示,以及支持不同領域、不同維度的安全知識的關聯和融合,可用于構建大規模動態網絡安全知識大腦。
基于人工智能技術構建大規模動態網絡安全知識大腦,實現網絡空間安全防御的關鍵技術主要包括網絡安全知識的抽取和融合、網絡安全知識表示、網絡安全知識大腦構建、基于網絡安全知識大腦的攻擊事件研判等。
網絡安全知識的來源廣泛,包括漏洞庫、病毒庫、告警數據、安全廠商的檢測結果、安全論壇、網絡安全事件報告資產描述等,為構建大規模的網絡安全知識大腦,需要首先從不同來源的網絡安全數據中抽取知識,并對不同領域的網絡安全知識進行有效融合。
網絡安全數據主要以文本數據、結構化數據、半結構化數據等類型為主,可以采用人工智能技術對數據進行抽取。例如,可以使用word2vec技術將文本中的單詞轉換為向量,結合卷積神經網絡(CNN),BiLSTM,條件隨機場算法(CRF)等技術進行實體和關系識別,同時按照網絡安全知識的類型進行分類,并將分類以后的實體和關系添加到對應網絡安全知識的實例中進行保存。
由于網絡安全中用于訓練的預料數據有限,可能無法覆蓋所有的網絡安全知識,因此需要根據已有的網絡安全知識進行推理,生成新的知識。例如,已有的網絡安全知識中包括某漏洞A的基本信息,包括受影響設備、軟件、漏洞危險程度等,同時已知某資產B包含了對應的軟件,并且未安裝對應補丁,便可推理出資產B存在漏洞A的新知識。此類知識推理的方法主要包括兩種,一種是自定義推理規則,根據預先制定的規則進行知識推理和演繹;第二種是采用智能化技術,根據已有的知識進行概率推理,計算新知識存在的概率。第一種方法需要人為地定義推理規則,可擴展性較差;第二種方法使用深度神經網絡進行計算新知識存在的概率,可擴展性強,但是可解釋性較第一種方法差一些。
不同數據源抽取得到的網絡安全知識可能會有不同的描述方式,例如很多廠商都研發了入侵檢測系統(IDS),不同IDS系統返回的告警數據格式并不完全一致,抽取得到的入侵檢測知識的描述也不一致,因此需要對網絡安全知識進行有效融合。常用的融合方法包括實體對齊、基于知識表示的消歧等,基本思想是將不同的網絡安全知識庫按照實體和關系的統一描述進行融合。
常用的知識表示模型包括符號邏輯、語義網、專家系統、知識圖譜、MDATA模型等,通過知識表示可以將網絡安全中不同類型的知識描述為統一的形式,并可通過知識的向量化進行高效計算。
知識圖譜主要采用“<實體,關系,實體>”這種三元組形式對具體的知識進行表示,例如“<Linux kernel漏洞,導致,DDoS攻擊>”表示Linux kernel漏洞會導致DDoS攻擊;“< Linux kernel 5.1.13,存在,Linux kernel漏洞>”表示Linux kernel 5.1.13的版本存在該漏洞。知識圖譜能有效描述網絡安全知識,但是當知識動態變化時,對應的三元組及相關聯的知識很難及時更新。
MDATA模型對實體之間的關系、屬性的時空特性進行表達,從而有效表示網絡安全知識的動態變化情況。具體而言,在關系和實體屬性上增加了時間和空間特性,如某系統存在漏洞的知識,添加存在漏洞的時間區間,從而能更詳細地表示系統的實際安全情況。網絡攻擊可能通過不同的IP(網絡之間互連的協議)地址等,攻擊事件中的IP地址等特性則作為網絡安全知識中的空間特性。MDATA模型通過對時間、空間特性的描述,可以表示出網絡安全知識的動態變化過程。
網絡安全知識大腦的構建包括兩部分:網絡安全知識庫(SeKG)和場景知識庫(ScKG)。其中,網絡安全知識庫是通用的網絡安全知識的集合,并且可以隨時或定期更新補充;而場景知識庫是特定知識的集合,可以依據仿真攻擊的設定而定,也是描述具體攻擊行為的知識庫。
網絡安全知識庫和場景知識庫可以根據概念、實例、關系、屬性、規則的五元組模型進行構建 [18]。其中,概念是抽象本體的集合,如操作系統、軟件、攻擊等;實例是具體例子的集合,如Windows 7,Adobe Reader,DDoS等;關系表示實例之間存在的關系, 如subClassOf,instanceOf,is a (ISA)等;屬性包括實例屬性值的集合;規則用來推演新的屬性值和新的關系。
構建網絡安全知識大腦用到的概念主要有漏洞、資產、軟件、操作系統和攻擊等。其中,漏洞信息來源于漏洞庫,每一個漏洞都有唯一的身份標識號(ID)和類別標識。資產則包括軟件和操作系統等,軟件和操作系統主要涵蓋當前市面上使用的所有版本。攻擊主要是針對利用漏洞的攻擊,攻擊的信息也主要是來源于漏洞庫,因為漏洞庫里對漏洞的描述會包含很多詳細的信息,包括漏洞會導致哪些攻擊發生等。
網絡空間防御面臨的主要威脅是網絡攻擊,一般而言網絡攻擊可以分為單步攻擊和復合攻擊。單步攻擊可以理解為針對某資產發動的離散的攻擊,而復合攻擊可以理解為是有多個單步攻擊排列組合而成的,也就是說復合攻擊有多個攻擊步驟,而這些攻擊步驟之間是有關系的,不是離散的、無關聯的,攻擊步驟之間有因果關系、順承關系、選擇關系等。
單步攻擊的研判相對而言簡單,已有的基于規則、特征的檢測方法能取得很高的成功率。而復合攻擊的檢測難度大,典型的復合攻擊包括APT攻擊等。復合攻擊通常是以攻擊鏈的形式發生的,可以看作是多個單步攻擊的排列組合。不同的操作系統上會安裝不同的應用軟件,不同的應用軟件會有不同的漏洞,也會感染不同的木馬,而這些木馬和漏洞會導致相同或不同的單步攻擊,此外,一些操作行為(網絡、注冊表、進程和文件)也會導致相同或不同的單步攻擊,入侵檢測系統會產生安全事件,這些安全事件就是一個單步攻擊,而每一個單步攻擊都屬于攻擊鏈中的某一類,所有的單步攻擊根據產生的效果進行排列組合就形成了不同的復合攻擊,而排列組合的和攻擊鏈中的時序、依賴關系等高度相關。
使用網絡安全知識大腦研判網絡攻擊時,可利用有限狀態機[19],設置初始狀態、中間狀態、終止狀態和觸發條件,并添加容錯機制,可以在缺失數據的時候仍然生成復合攻擊的攻擊鏈,在網絡安全知識庫和場景知識庫的基礎上,描述復合攻擊的各個步驟之間的關系,然后根據攻擊步驟的關系、時間先后關系、IP的傳播關系等來判斷是否可以生成攻擊鏈。如果滿足,則輸出復合攻擊的攻擊鏈,如果不滿足,就去知識庫中查找等價的步驟,或補充生成攻擊鏈并輸出。當輸入的數據中存在誤報和漏報的情況時,基于網絡安全知識大腦的研判可以自動補全缺失的信息,生成一條完整的攻擊鏈,從而提高攻擊研判的準確率,為網絡安全主動防御提供支撐。
隨著人工智能時代的到來,網絡空間安全面臨著很多新風險和新挑戰。將人工智能技術應用在網絡安全防御中,可以大幅度提升網絡空間防御能力。具體發展對策與建議如下。
充分利用人工智能技術在處理海量數據、多源異構數據、實時動態數據等方面的顯著優勢,構建動態可擴展的網絡安全知識大腦,提升網絡空間防御能力。具體而言,針對網絡安全知識描述中多實體、弱關系、時空復雜性和多來源等特點,對于結構化、半結構化和非結構化的數據,基于MDATA知識表示模型、網絡安全知識語料庫中的特定表達和網絡安全知識之間特有的邏輯關系和對應關系,構建相應的網絡安全本體模型,實現多領域知識的統一表示,相較于傳統的知識圖譜等知識表示模型,可提升融合效率和多領域動態知識統一表示的準確率。
在此基礎上,針對半結構化數據和非結構化數據知識抽取難的問題,基于構建的本體模型,結合雙向循環神經網絡和條件隨機場等深度學習方法,進行特征抽取、聯合標記、類別標記等。對于未被識別出的本體進行人工抽取,從而確保基于本體模型生成的三元組知識在邏輯上是正確的,實現動態可擴展的網絡安全知識大腦,為網絡安全防御提供強大的具有自學習能力的知識庫支撐。
針對網絡攻擊越來越智能化,大規模網絡攻擊越來越頻繁,網絡攻擊的隱蔽性越來越高的特點,遵循網絡攻擊的基本規律,基于構建的網絡安全知識庫,實現復雜網絡攻擊的智能化檢測算法。可將網絡安全事件和攻擊的基本信息存儲于安全知識圖譜中,通過采集數據與安全知識圖譜進行匹配,根據狀態的觸發約束,可分析得到網絡系統中的單步攻擊和復合攻擊。
一般而言,檢測復合攻擊時可以分析出攻擊的當前階段,無法確保輸出完整攻擊鏈,因此可進一步基于攻擊規則庫的復合攻擊研判技術,將先驗知識存入網絡安全知識圖譜和復合攻擊規則庫,基于大數據分析平臺,通過采集數據與安全知識圖譜進行匹配,再經過時空屬性和復合攻擊規則庫的共同約束,從海量的數據中挖掘出有效的攻擊鏈,并完善復合攻擊的攻擊鏈,實現自動化分析攻擊目的和意圖等。針對傳統方法無法應對輸入的數據中誤報和漏報的情況,可以基于多模態數據的復合攻擊研判,當輸入的數據中存在誤報和漏報的情況時,可以自動補全缺失的信息,并計算生成不同攻擊鏈的概率,消除誤報和漏報的影響。進一步,可通過網絡仿真平臺對攻擊事件進行仿真,將分析結果與仿真攻擊的信息進行對比,實現對有效網絡攻擊的智能研判。
目前人工智能技術還不能完全脫離人而存在,人的引導至關重要。在制定人工智能的發展路線的同時應該要緊盯風險防御,加強對潛在風險的預判和研究,注重系統安全防御技術的發展,明確防御發展策略。不能盲目地將人工智能作為一項“百利而無一害”的技術進行使用,在進行頂層設計的同時考慮風險管理,對人工智能技術的安全性進行有效評估,為人工智能乃至系統防御技術提供有效規范的引領作用。
同時,應加強人工智能風險管理。人工智能自身存在的漏洞和人工智能技術的濫用是系統安全防御中很難避免的環節。自身存在的安全風險屬于最致命的問題,應用越廣泛,其帶來的危害性也越大。系統安全防御技術要從人工智能技術自身入手,構建主動免疫的計算構架,盡可能地降低技術自身的漏洞危害,不斷創新保持技術優勢。
人工智能既能用來提升網絡空間安全,又會帶來新的風險與挑戰。基于人工智能技術提升網絡空間主動防御能力,是保障網絡空間安全的重要途徑。為此,需加強人工智能用于網絡空間安全防御關鍵技術的研究,構建大規模動態網絡安全知識大腦,推動有效網絡攻擊的智能化檢測,加快評估人工智能技術的安全性,推動人工智能技術在網絡空間領域的良性發展與應用,全面提升我國網絡空間安全保障能力。