王增光,盧 昱,李 璽,李志偉
(1.陸軍工程大學石家莊校區 裝備指揮與管理系,河北 石家莊 050003;2.陸軍工程大學石家莊校區 模擬訓練中心,河北 石家莊 050003)
隨著網絡攻擊手段的日益多樣化,網絡安全形勢愈發嚴峻。為了確保網絡安全,身份認證、訪問控制、加密通信和入侵檢測等技術被廣泛應用到網絡安全防御中。但這些技術主要基于先驗的知識和經驗進行被動的單方面防御,對網絡中的未知攻擊和瞬時攻擊無法起到較好的防御作用[1]。最理想的網絡安全防御是能夠對網絡中的所有攻擊行為進行防御,但這種“不惜一切代價”的防御思想顯然不適用于實際網絡的安全防御。因此,迫切需要一種新的網絡安全防御技術,能在網絡威脅發生前對網絡中的攻防情形進行預測和分析,在有限的網絡資源條件下實施最優的主動防御[2]。
網絡攻防的本質是攻防雙方之間的對抗,利用有限的資源做出合理的決策,與博弈論的基本思想不謀而合。基于博弈理論的網絡安全防御方法逐漸成為研究的熱點[3]。文獻[4]提出了一種動態博弈理論框架,通過對攻防雙方進行建模來預測對手策略的有效性,并通過納什均衡分析選擇有效的防御策略。文獻[5]將狀態攻防圖和博弈理論相結合設計了網絡安全最優攻防決策方法,從攻防交互的角度對狀態攻防圖進行分析,結合節點的防控措施,進行最優攻防策略的選取。文獻[6]將博弈論與馬爾科夫決策過程相結合對網絡安全態勢進行研究,以攻防博弈的過程來確定網絡安全狀態轉移的規則,通過數據融合來實現對網絡安全態勢的評估,進而為網絡安全防御提供技術支撐。文獻[7]基于不完全信息博弈理論對網絡中的動態對抗行為進行研究,設計了網絡攻防信號博弈模型,通過對精煉貝葉斯納什均衡進行求解來選擇網絡最優防御策略。文獻[8]基于零和博弈對網絡中的攻擊行為進行建模,使用帕累托前沿來確定網絡中危害最大的攻擊行為,并通過帕累托優化來選擇最優的防御策略。文獻[9]從網絡攻防的角度提出了一種防御圖模型,并將防御圖映射到攻防博弈模型中,通過對網絡安全攻防的動態變化進行描述,為主動防御策略選取提供依據。
由上述分析可知,現有的基于博弈理論的網絡安全防御方法取得了一定的研究成果,為網絡最優防御策略的選取提供了指導。但上述文獻存在的共性不足之處在于,在博弈模型的設計中沒有或僅簡單考慮了攻擊方的類型,都沒有考慮防守方的類型;沒有考慮攻防雙方策略選取能力差異對攻防博弈過程的影響,不貼近網絡實際情況;以概率的形式給出最優防御策略的選擇,在實際進行防御策略選取時可操作性不強。針對上述問題,筆者的貢獻如下:①基于靜態貝葉斯博弈設計了網絡攻防博弈模型,考慮攻防雙方不同類型對攻防博弈的影響;②提出了收斂度的概念,對攻防雙方策略選取能力的差異進行量化,并對混合策略貝葉斯納什均衡進行詳細分析;③提出了基于防御效能的最優主動策略選取方法,通過對防御效能進行排序來選擇最優的網絡安全防御策略,實現網絡的最優主動防御。
攻防雙方圍繞網絡安全進行攻防對抗,由于網絡的復雜性,攻防雙方在對抗的過程中均不能確定敵對方的攻防偏好。因此,網絡的攻防對抗可以看作是不完全信息下的非合作博弈,攻防博弈模型的成立需要滿足以下兩點假設。
假設1攻防雙方都是理性的決策主體。攻防雙方選擇的每個決策都是為了追求利益的最大化,不會做出無利可圖的決策。攻防雙方獲得的利益取決于所采取的不同策略的情況。
假設2攻防雙方具有信息不對稱性。在博弈過程中,攻防雙方不能確定對方的策略收益,但可以將策略收益的不確定性轉換為類型的不確定性。攻防雙方可以通過概率分布對對方的類型進行判斷。
網絡攻防對抗可以通過網絡攻防博弈模型(Network Attack-Defense Game,NADG)來體現。在實際的網絡攻防中,攻防雙方的信息對彼此來說都是不完全的。根據攻防的偏好,攻擊方和防守方可以劃分為不同的類型。網絡攻防博弈模型可以定義為以下五元組MNADG={N,T,S,P,U},其中:
(1)N={NA,ND},為博弈參與者的集合。NA為網絡攻防的攻擊方,ND為網絡攻防的防守方。




在實際的網絡攻防過程中,攻防雙方的信息處理能力不同,導致其根據網絡中的安全態勢實施攻擊或防御策略的速度不同。信息處理能力強的博弈參與者具有信息壓制優勢,能夠在其對手實施一個策略的周期內,實施多個策略,即攻防雙方的策略選取能力不同。現有基于博弈理論的網絡安全分析基本上沒有考慮到這一情況,而是將攻防雙方的策略選取能力假設為等同來進行博弈分析,而這一假設在實際的網絡攻防過程中很難滿足,降低了研究成果的價值和實用性。如何在攻防雙方策略選取能力不對等的情況下,對攻防博弈過程進行分析是一個十分復雜的問題,目前這方面的研究成果極其有限。針對這一問題進行了嘗試性研究,提出了收斂度的概念對攻防雙方策略選取能力的差異進行量化。當攻擊方的策略選取能力較弱時,防守方總能選擇合適的防御策略以應對網絡中的攻擊。在這種情況下,基于攻防博弈研究網絡的最優防御策略選取意義不大。因此,文中所提出方法只對攻擊方策略選取能力較強的情況下,攻防雙方的博弈情況進行研究。


(1)
在網絡攻防博弈過程中,由于攻防雙方信息處理能力的差異,防守方在實施一個防御策略的同時,攻擊方能夠實施一組攻擊策略,但攻防雙方都希望能在給定的類型和先驗信念集合的基礎上獲得最大的收益。在此原則的指導下,攻防雙方會達到一個均衡,任何一方改變自己的當前策略或策略組合都會使自身的收益受損。純策略下納什均衡的存在性無法保證。因此,僅對網絡攻防博弈模型的混合策略貝葉斯納什均衡進行分析。


在網絡攻防博弈模型中,攻防雙方的類型是有限的,而每種類型下攻防雙方的策略集合和攻防行動集合也是有限的,即網絡攻防博弈模型是一種有限的策略博弈。納什利用不動點定理證明了每個有限的策略博弈至少存在一個純策略或混合策略納什均衡[10]。由于純策略可以看作是混合策略的特殊情況,則網絡攻防博弈模型必然存在一個混合策略的貝葉斯納什均衡。由混合策略貝葉斯納什均衡的定義可知,在納什均衡狀態下存在一組混合策略或策略組合,使得相比其他策略,攻防雙方的收益最大。在不清楚對方策略的情況下,攻防雙方都傾向于選擇這一組策略或策略組合,以使得己方的收益最大,即通過對混合策略貝葉斯納什均衡進行求解一定能夠得到最優混合防御策略。
最優防御策略的選取是一個非常復雜的過程,需要在不完全信息條件下綜合考慮攻防雙方的回報和成本,進而選取防御效果最佳的策略。在實際的網絡安全防護中,防守方一次只能選取一種防御策略,但傳統基于博弈理論的最優防御策略選取方法,基本上都是在納什均衡求解后以概率的形式給出最優防御策略,對實際網絡防御策略的選取指導意義不強[11]。針對這一問題,在對網絡攻防博弈模型和混合策略貝葉斯納什均衡進行分析的基礎上提出了防御效能的概念,對攻防雙方達到均衡狀態后防御策略對攻擊行為的防御效果進行量化。以防御效能為標準,進行網絡最優防御策略的選擇,解決了混合策略選取方案對于網絡管理人員來說不便于理解和操作的問題。文獻[11]通過對攻擊方可能選取的攻擊策略進行預測來進行防御效能的計算,但在計算的過程中沒有考慮防守策略被選取的可能性,不能準確反映防御策略對攻擊行為的防御效果。因此,在考慮防御策略被選取可能性的基礎上,結合防御策略的收益函數和防守方的先驗概率對防御效能進行量化。
(2)
在對防守方所有防御策略的防御效能進行求解后,可以得到均衡狀態下防御策略對攻擊方攻擊行為的防御效果。根據防御效能的大小對防御策略進行排序,在網絡資源有限的情況下,防守方優先選擇防御效能最大的防御策略以提高網絡的安全性。
網絡攻防博弈模型的設計是否合理有效、準確,是選取網絡最優防御策略的關鍵。由于博弈模型之間的差異性較大,無法通過實驗對不同的博弈模型進行量化分析對比[7]。因此,本節從博弈假設、攻擊方類型、防守方類型、收斂性和可操作性等方面對文中提出的網絡攻防博弈模型與文獻[5]、[6]、[9]和[12]所提出的博弈模型進行對比,以此來說明文中所提出的模型的優越性,對比結果如表1所示。

表1 相關工作比較
文中方法基于不完全信息設計網絡攻防博弈模型,與基于完全信息的博弈模型相比,其考慮了攻防雙方不完全了解彼此信息的情況;與其他基于不完全信息的博弈模型相比,其考慮了攻擊方和防守方都可能具有多種類型的情況,更加符合網絡攻防實際情況。收斂性是指文獻提出的模型或方法是否考慮攻防雙方策略選取能力的差異對博弈過程的影響。相比其他文獻,文中方法提出的博弈模型充分考慮了收斂性所帶來的影響,使得最優防御策略的選取更加準確和符合實際攻防情況。可操作性是指文獻提出的模型或方法對最優防御策略的選取是否具有較強的指導性;與以混合策略形式進行最優防御策略選取的方法相比,文中方法以防御效能作為策略選取的標準,以純策略的形式進行最優防御策略的選取具有較好的可操作性;較差是指文獻中沒有給出攻防收益的量化方法和具體的實施方案。
搭建了如文獻[7]所示的網絡系統拓撲結構來模擬真實的網絡環境,對所提出的網絡攻防博弈模型和最優防御策略選取方法的合理性和可行性進行驗證。
通過對以往網絡中的攻擊行為進行分析總結,可以將攻擊方的類型劃分為三類,即TA={冒險型攻擊方,平衡型攻擊方,保守型攻擊方}。冒險型攻擊方的特點是為了達到目的愿意采用成本較高的攻擊方式,攻擊成功率較高,一旦攻擊失敗,付出的代價也較大;保守型攻擊方的特點是愿意采用較低成本的攻擊方式實施攻擊,攻擊成功率較低,但攻擊失敗時所付出的代價也較小;平衡型攻擊方的攻擊風格處于冒險型攻擊方和保守型攻擊方之間,實施攻擊所愿意付出的代價、攻擊成功的概率和攻擊失敗所付出的代價較為平衡。參照麻省理工學院(Massachusetts Institute of Technology,MIT)林肯實驗室對網絡攻防的分類,對網絡拓撲進行分析可以得到不同類型攻擊方所能實施的攻擊策略,如表2所示。表中,“√”表示此項選中。

表2 不同類型攻擊方策略
根據防御效果和防御成本的不同,可將防守方的類型劃分為兩類,即TD={高級防守方,初級防守方}。高級防守方的防御力度較強,防御的成本也相應較高;低級防守方的防御效果較弱,防御成本也較低。不同類型的防守方所選擇的防御行動不同。通過對防御行動的防御效果、成本進行分析,結合專家建議,不同類型的防守方的防御策略如表3所示。表中,“√”表示此項選中。

表3 不同類型防守方策略
設防守方對攻擊方類型的先驗信念為(冒險型攻擊方,平衡型攻擊方,保守型攻擊方)=(0.3,0.5,0.2),不同類型攻擊方的信息處理能力為(冒險型攻擊方,平衡型攻擊方,保守型攻擊方)=(6,5,4);攻擊方對防守方類型的先驗信念為(高級防守方,初級防守方)=(0.6,0.4),不同類型防守方的信息處理能力為(高級防守方,初級防守方)=(4,3)。實驗中的攻防雙方的先驗信念和信息處理能力的取值是在對網絡攻防歷史數據進行分析的基礎上,結合專家意見進行設定的。雖然在一定程度上符合網絡攻防的實際,但仍然存在主觀性較強和準確性不足的問題。下一步,將采用強化學習理論對網絡攻防過程進行分析,提高先驗信念和信息處理能力取值的客觀性和準確性。根據文獻[11]的收益量化方法對攻防雙方的策略收益進行量化,并根據式(1)對攻擊方的策略組合收益進行量化。在攻防場景中,攻擊方和防守方均具有不同的類型,因此需要通過兩次海薩尼轉換來體現網絡攻防過程。通過網絡攻防博弈樹能夠直觀體現攻防策略的對抗情況,網絡攻防博弈樹如圖1所示。

圖1 網絡攻防博弈樹

筆者對網絡最優防御策略選取問題進行了研究,提出了基于靜態貝葉斯博弈的網絡最優防御策略選取方法。在網絡攻防博弈模型的設計過程中,將攻擊方和防守方劃分為不同的類型,并通過收斂度對攻防雙方的信息處理能力進行量化,更加符合網絡攻防的實際情況。在混合策略貝葉斯納什均衡分析的基礎上,以防御效能為標準進行最優防御策略的選取,對網絡安全防御具有更強的指導意義。通過與其他文獻進行分析對比說明了文中所提方法的優越性,并通過實例分析對文中所提方法的有效性和可行性進行了證明。
文中所提方法主要針對攻防能力不均等條件下的最優防御策略選取機制進行研究,并沒有涉及網絡攻防階段變化對策略選取的影響,具有一定的局限性。但是,提出的最優防御策略選取方法對后續的研究具有借鑒意義。下一步將在此基礎上,運用動態博弈理論對網絡攻防過程進行建模,對動態變化條件下的網絡最優防御策略選取問題進行研究。