王增光,盧昱,李璽
(1.國防大學 聯合作戰學院,河北 石家莊 050084;2.陸軍工程大學石家莊校區 無人機工程系,河北 石家莊 050003)
高新技術的不斷發展改變了傳統作戰的方式,網絡中心戰成為現代戰爭的主要模式。快速有效地摧毀敵方的網絡系統,進而獲得戰場的制信息權,已經成為現代化戰爭中敵我雙方進行爭奪和對抗的焦點[1]。軍事信息網絡是網絡中心戰的重要陣地,能夠為軍隊實施情報偵查、作戰指揮、火力打擊等任務提供支撐[2]。軍事信息網絡的安全是確保其為軍事行動提供優質服務的關鍵。
傳統的軍事信息網絡安全防御主要通過加密存儲、防火墻等技術來確保網絡安全。但這些技術的本質是一種被動等待式安全防御模式,難以有效確保軍事信息網絡的安全。同時,能夠對所有攻擊行為進行防御固然是最理想的網絡安全防御手段,但這種不計成本的防御思想顯然不適用于實際軍事信息網絡的安全防御。因此,迫切需要一種新的網絡安全防御技術,以期能夠在有限的網絡資源條件下實現最優主動防御[3]。
網絡攻防的本質是攻防雙方利用有限的網絡資源選取最優的攻防策略,與博弈論的基本特征相吻合[4-5]。因此,基于博弈論進行網絡安全防御研究逐漸成為熱點。文獻[6]將防御圖與博弈論相結合設計了一種網絡攻防博弈模型,通過對網絡攻防狀態進行分析來選取主動防御策略,但模型沒有考慮攻防雙方可能具有多種類型的情況。文獻[7]提出了一種馬爾可夫博弈模型,以攻防雙方的博弈結果為依據來決定網絡安全狀態的轉移,但以混合策略形式來確定最終的博弈結果,不能準確地確定安全狀態轉移的情況,同時該方法還存在狀態爆炸問題。文獻[8]基于靜態貝葉斯博弈提出了安全風險預測模型,以信息資源的經濟價值作為攻防收益的量化標準,通過混合策略對網絡中的攻擊行為進行預測,但在收益的量化過程中,部分參數通過假設的方式給出,主觀性較強;同時模型僅適用于特定的攻防類型,難以應用到其他網絡安全防御中。文獻[9]構建了信號博弈模型,在精煉貝葉斯納什均衡求解的基礎上選取最優策略,但該模型僅考慮了攻擊方的類型,沒有討論防守方類型的情況。
綜上所述,現有基于博弈論的網絡安全防御方法研究取得了一定的研究成果,但還存在以下3個方面的問題:1)模型的設計過于理想化,沒有考慮攻防雙方都可能具有多種類型的情況;2)攻防策略收益量化分析不夠合理,沒有結合網絡具體情況對攻防收益進行量化;3)以混合策略形式給出主動防御策略的選擇結果,實用性不強。軍事信息網絡是一種復雜的專業網絡。由于業務的特殊性,網絡的保密程度更高,攻防雙方更加難以通過收集信息的方式確定攻防偏好,網絡攻防雙方可能具有多種類型;以信息資源的經濟價值為標準,難以準確量化攻防策略的收益;主動防御策略的選取應具有明確性和唯一性,不能以概率形式給出主動防御策略的選取。因此,雖然現有基于博弈論的網絡安全防御方法能夠為軍事信息網絡安全防御提供借鑒,但難以應用到軍事信息網絡的主動防御策略選取中。
針對上述問題,本文提出一種基于不完全信息博弈的主動防御策略選取方法。該方法在博弈模型的設計過程中緊貼網絡攻防實際,考慮攻防雙方不同類型對攻防博弈的影響;從攻防行動對網絡設備安全價值影響的角度出發對策略的收益進行量化,使得攻防雙方收益的計算更加精準且貼合實際;在對攻防雙方可能行動進行預測的基礎上,通過防御效能量化防御策略對攻擊方可能行動的防御效果。在此基礎上,以防御效能為標準來選取網絡安全防御策略,實現對軍事信息網絡的主動防御。
在軍事信息網絡中,攻防雙方圍繞網絡制信息權展開對抗,由于戰場態勢的復雜性,在對抗過程中雙方均無法確定對方的攻防偏好。因此,可以通過不完全信息非合作博弈模型對軍事信息網絡的攻防過程進行建模,攻防博弈模型的成立需要滿足以下3點假設[10]:
假設1理性假設。攻防雙方是完全理性的,做出每個決策的目的是為了獲得利益的最大化。
假設2信息假設。攻防雙方能夠通過類型的不確定性對策略收益的不確定性進行分析。
假設3收益假設。攻防雙方可以通過網絡系統的安全價值對攻防收益進行量化。
區別于傳統的互聯網,軍事信息網絡的攻防對抗更加激烈。網絡攻防的參與者多為紀律性強、配合度高、組織性好的作戰人員,使得網絡攻防具有較強的目的性;復雜的戰場環境和多變的指揮風格導致在網絡攻防行為發生之前無法判斷攻防雙方的行事風格,攻防雙方無法對敵對方的收益有較為直觀的了解;攻防雙方的最終目標是破壞敵方的網絡系統進而獲得制信息權。軍事信息網絡本身的特點符合攻防博弈模型成立的假設,為攻防博弈模型的設計提供諸多便利條件。
通過網絡攻防博弈(NADG)模型能夠對軍事信息網絡的攻防對抗過程進行建模。在實際的網絡攻防過程中,軍事信息網絡可能受到多個攻擊參與者的攻擊,但由于軍事環境的特殊性,多個攻擊參與者之間一般是相互配合、協同對目標網絡進行攻擊;同時,從防御方的角度看,多個攻擊參與者的行動目的相同,即反制防御行動獲得最大的攻擊收益。基于上述分析可知,多個攻擊參與者之間沒有利益沖突。此時,多個攻擊方的攻擊行動可以看作是單一攻擊主體發動的分布式攻擊。同理,多個防御參與者的防御行動也可以看作是單一防御主體實施的分布式防御。軍事信息網絡的攻防過程可以抽象為虛擬分布式攻擊主體和防御主體之間的博弈。因此,本文將多個攻擊參與者和多個防御參與者歸結為攻擊方和防守方進行考慮,并根據攻防偏好對攻防雙方進行合理分類,從整體角度考慮攻防策略的對抗對網絡安全的影響。網絡攻防博弈模型可以定義為以下五元組NADG={N,T,S,P,U}。其中:
1)N={Na,Nd}為博弈參與者的集合。其中Na為軍事信息網絡對抗中的攻擊方,Nd為軍事信息網絡對抗中的防守方。
2)T={Ta,Td}為博弈參與者的類型集合。其中Ta={Ta,1,Ta,2,…,Ta,n}為攻擊方的類型集合,n為攻擊方類型的總量;Td={Td,1,Td,2,…,Td,m}為防守方的類型集合,m為防守方類型的總量。
3)S={Sa,Sd}為博弈參與者的攻防策略集合,表示攻防雙方選擇的完整行動方案集合。對于攻擊方而言,Sa={Sa,1,Sa,2,…,Sa,k}表示攻擊策略的集合,k為攻擊策略的總量,A(Sa,k)={A1(Sa,k),A2(Sa,k),…,Al(Sa,k)}表示攻擊策略Sa,k的攻擊行動集合,l為攻擊行動的總量;對防守方而言,Sd={Sd,1,Sd,2,…,Sd,g}表示防御策略的集合,g為防御策略的總量,D(Sd,g)={D1(Sd,g),D2(Sd,g),…,Dr(Sd,g)}表示防御策略Sd,g的防御行動的集合,r為防御行動的總量。

5)U={Ua,Ud}為博弈參與者的收益集合,表示博弈參與者的獲利情況。對于?Sa,k∈Sa,Sd,g∈Sd,Ta,j∈Ta,Td,i∈Td,Ua(Ta,j,Sa,k,Sd,g)是指當類型為Ta,j的攻擊方采取策略Sa,k進行攻擊、防守方采用策略Sd,g進行抵御時,攻擊方所能獲得的收益;Ud(Td,i,Sa,k,Sd,g)是指類型為Td,i的防守方采用策略Sd,g抵御攻擊策略Sa,k時,防守方所能獲得的收益。
攻防收益量化的合理性直接影響策略選取的結果。本節在考慮網絡攻防實際情形的基礎上,從攻防策略對網絡安全價值影響的角度出發,對攻防收益進行量化。
定義1網絡系統價值。網絡系統價值可以通過網絡設備安全屬性來體現,用R={R(Cc),R(Ci),R(Ca)}表示,其中R(Cc)、R(Ci)、R(Ca)分別為設備在機密性、完整性和可用性方面的價值。
定義2攻擊影響度。攻擊影響度反映了攻擊行動對網絡系統價值的影響,用W={W(Cc),W(Ci),W(Ca)}表示,其中W(Cc)、W(Ci)和W(Ca)分別為攻擊行動對網絡設備的機密性、完整性和可用性等安全屬性帶來的影響權重。
定義3攻擊成功的概率。攻擊成功的概率反映了攻擊方成功突破防守方防御的概率。攻擊成功的概率θ主要受攻擊檢測概率λ和防御成功概率β的影響。
定義4攻擊收益。攻擊收益反映了攻擊方實施攻擊行為所能得到的利益。攻擊失敗時,攻擊方雖然能夠獲得防御方的相關防御信息,但會在防御系統中留下攻擊痕跡,防守方會根據歷史攻擊數據對相關漏洞進行重點防御。若攻擊方再采取攻擊行動對這些漏洞進行攻擊,則很難攻擊成功。因此,攻擊方只有在攻擊成功時才能獲得攻擊收益。
定義5防御收益。防御收益反映了防守方實施防御行動所能保護網絡系統的價值。無論防御成功與否,防守方都能獲得收益。具體表現為:
1)防御成功時,防守方能夠成功抵御攻擊,保護網絡系統價值,獲得直接防御收益。
2)防御失敗時,防守方無法保護網絡系統價值,但在防御過程中能夠獲得攻擊方的相關信息,提高下一次防御成功的概率,從而能夠獲得間接防御收益。
假設目標網絡中攻擊方的類型為Ta,j,選取的行動為策略Sa,k中的Ah(Sa,k)進行攻擊,h為所選攻防行動的序號;防守方的類型為Td,i,選取的行動為策略Sd,g中Dq(Sd,g)進行防御,q為所選攻防行動的序號;攻擊行動被檢測到的概率為λh,被成功防御的概率為βq.
攻擊方只有成功實施攻擊才能獲得收益。攻擊行動對安全屬性帶來損害的期望值EAh(Cx)可以通過(1)式進行量化:
EAh(Cx)=(1-λhβq)WAh(Cx)R(Cx),
(1)
式中:Cx為網絡設備的某項安全屬性,x∈{c,i,a};WAh(Cx)為攻擊行動對網絡設備安全屬性的影響權重;R(Cx)為網絡設備在安全屬性方面的價值。
實施攻擊行動Ah(Sa,k)時,攻擊收益可以通過(2)式進行量化:
(2)
式中:B(Ah)為發起攻擊行動Ah(Sa,k)的成本。
防御成功或失敗時,防守方獲得的收益不同。當防御成功時,防御行動所能保護安全屬性的期望可以通過(3)式進行量化:
EDq(Cx)=λhβqWAh(Cx)R(Cx);
(3)
當防御失敗時,防御行動在安全屬性上的期望可以通過(4)式進行量化:
EDq(Cx)=μq(1-λhβq)WAh(Cx)R(Cx),
(4)
式中:μq為防御失敗時收益的折扣因子。
實施防御行動Dq(Sd,g)時,防御收益可以通過(5)式進行量化:

(5)
式中:B(Dq)為發起防御行動Dq(Sd,g)的成本。
當攻防雙方選取策略對(Sa,k,Sd,g)進行對抗時,攻防收益可以通過(6)式和(7)式進行量化:

(6)
(7)
在網絡攻防博弈過程中,攻防雙方的最終目的是使自身收益最大化。以此原則為指導,攻防雙方會達到一個均衡狀態,任何一方無法通過單方面改變自身的策略來提高收益[10]。純策略可以看作是混合策略的特殊情況[11-12]。因此,本文使用混合策略對NADG模型的博弈均衡進行分析。


在NADG模型中,攻防雙方的類型及策略均是有限的,即NADG模型屬于有限策略博弈。由Brouwer不動點定理可知,有限的策略博弈至少存在一個混合策略納什均衡[13]。因此,NADG模型必然存在混合策略的貝葉斯納什均衡。由混合策略貝葉斯納什均衡的定義可知,在均衡狀態下存在一組混合策略,使得攻防雙方選擇該組策略能夠獲得最大收益。在無法確定對方所選策略的情況下,攻防雙方都傾向于選擇該組策略。因此,通過分析混合策略貝葉斯納什均衡,能夠對網絡攻防博弈過程中攻防雙方策略的可能選擇進行有效預測。
混合策略貝葉斯納什均衡的求解可以轉化為標準非線性規劃問題[14]。對于?Sg(Td,i)∈S(Td)和?Sk(Ta,j)∈S(Ta),求解如(8)式所示的非線性規劃問題,可以得到最優解集合(F*(Ta,j),F*(Td,i))。根據博弈論可知,(F*(Ta,j),F*(Td,i))是攻防雙方的混合策略,即在可預見的未來攻防雙方選擇策略的可能性。
在實際的網絡攻防博弈模型中可能會有存在多個納什均衡的情況,但為了進行防御策略的選取,需要明確一個納什均衡點才能進行后續的操作。風險優勢標準是現有應用較廣泛的針對多個納什均衡進行優化的方法,已經非常成熟,適用于無法確定最優均衡點的情況,與本文情況相符;同時,軍事信息網絡攻防對抗是特殊應用場景下的博弈,規避風險應該被作為一項重要的參考標準。因此,本文參考文獻[15]提出的風險優勢標準對多個納什均衡進行優化。混合策略貝葉斯納什均衡求解公式如(8)式所示:

(8)
軍事信息網絡是一種目的性很強的專業網絡,其防御策略的選取應該具有無二義性,以免對網絡管理人員實施防御策略造成困惑。同時,軍事信息網絡安全防御工作的實施是在上級統一領導和指揮下進行的,即軍事信息網絡可以看作是一個單體決策系統。因此,在實際軍事信息網絡安全防御中,網絡安全管理人員每次僅能選取一種防御策略。但傳統基于博弈論的策略選取方法基本上都是以概率形式選取防御策略,難以應用軍事信息網絡安全防御中。
在實際軍事信息網絡攻防對抗中,防守方具有對抗的主動權,能夠根據網絡安全態勢主動調整網絡部署,即具有終止對抗的權利。防守方能夠在對攻擊方可能行動進行預測的基礎上,分析防御策略對攻擊方可能行動的防御效果,進而調整防御策略,獲得最佳的防御效果。因此,本文通過混合策略貝葉斯納什均衡對攻擊方的可能行動進行預測;在此基礎上,通過防御效能量化防御策略對攻擊方可能行動的防御效果;以此為標準選取網絡防御策略,便于網絡管理人員理解和操作。防御效能可以根據均衡狀態下防御策略被選取可能性、防御策略收益和防守方的先驗概率進行量化。
(9)
通過防御效能進行量化,能夠得到防御策略對攻擊方可能行動的防御能力強弱,防守方根據防御效能選取并實施合適的防御策略,能夠達到最佳的防御效果。
本文設計的主動防御策略選取算法在攻防收益量化的基礎上,通過防御效能量化防御策略對攻擊方可能行動的防御效果,以防御效能為標準選取合適的防御策略。與傳統防御策略選取方法相比,該方法以純策略形式進行防御策略的選擇,具有更強的可操作性,能夠在網絡安全威脅發生前,通過選取合適的防御策略進行網絡安全防御,達到主動防御的目的。
算法1基于攻防博弈的主動防御策略選取算法。
輸入:網絡攻防博弈模型NADG
輸出:防御策略
begin
1.初始化NADG=((Na,Nd),(Ta,Td),(Sa,Sd),(Pa,Pd),(Ua,Ud));
2.構建類型集合Ta和Td;
3.構建策略集合Sa和Sd;
4.Ta,j←H(Na,Sa,k);//通過海薩尼轉換劃分攻擊方類型;
5.Td,i←H(Nd,Sd,g);//通過海薩尼轉換劃分防守方類型;
6.fork=1;k++;k 7. forg=1;g++;g 8.Ua(Ta,j,Sa,k,Sd,g)←f(μh,λh,βq,B(Ah)); 9.Ud(Td,i,Sa,k,Sd,g)←f(λh,βq,B(Dq)); 10. end for 11.end for 12.(F*(Ta,j),F*(Td,i))←arg maxf(Sa,Sd,Ua,Ud,Ta,Td); 13.whileSd,g∈Sddo 15.end while 16.return (arg max(E(Sd,g))); end. 算法的時間復雜度主要集中在博弈收益量化、納什均衡求解和防御效能量化三方面。在博弈收益量化方面,整個算法的時間復雜度為O(|Sa||Sd|)。在納什均衡求解方面,本文算法基于的博弈模型是非零和靜態博弈,已經證明其納什均衡解是PPAD-Incomplete問題[16]。在實際網絡環境下納什均衡求解過程中,不必求解所有的納什均衡解,在求解到合適的納什均衡解后就停止算法的運行,以提高算法的效率。在防御效能量化方面,整個算法的時間復雜度為O(|Sd|)。在實際網絡攻防中,攻擊參與者和防御參與者數量的增加只會帶來攻防類型和攻防策略數量的增加,算法復雜度仍在同一量級,整個算法復雜度能夠滿足網絡攻防的需求。 為了說明本文所提方法的優越性,從以下5個方面將本文所提方法與文獻[6-9]所提方法進行對比,相關工作比較如表1所示。 文獻[6-7]是基于完全信息進行博弈模型的設計,沒有考慮攻防雙方類型對網絡攻防博弈的影響,與實際網絡攻防情形有較大區別。其中:文獻[6]從系統損失和攻防成本角度對攻防收益進行量化,但在量化過程中將攻擊方收益與防守方收益理想化為等同,導致后續攻防雙方收益函數計算與實際網絡環境有一定誤差;通過求解所有安全狀態下的攻防博弈來選擇防御策略,但沒有考慮到網絡狀態爆炸問題,方法可操作性一般。文獻[7]沒有給出攻防收益的量化方法,通過假設方式給出攻防雙方收益,導致博弈模型實用性較差;同時,以混合策略形式給出防御策略的選擇,對實際網絡安全防御的指導性較弱,該方法同樣存在狀態爆炸問題,可操作性較差。 表1 相關工作比較Tab.1 Comparison of related works 文獻[8-9]是基于不完全信息進行博弈模型的設計,但都沒有考慮防守方類型對網絡攻防博弈的影響,導致博弈模型與實際網絡攻防情形不符合。其中:文獻[8]從成本和收益參數角度對攻防收益進行量化,但僅針對特定的攻防雙方進行量化,沒有給出通用的收益量化方法;模型的設計僅適用于特定類型的攻擊方,方法可操作性一般。文獻[9]從攻擊面轉移角度對攻防收益進行量化,但在量化過程中沒有考慮攻擊成敗對攻防收益的影響,依據此攻防收益求解得到的網絡防御策略不準確;沒有給出防御策略的選取算法,方法可操作性一般。 與上述文獻提出的方法相比,本文方法充分考慮了攻防雙方都可能具有多種類型的情況,更加符合軍事信息網絡攻防實際;從攻防行動對網絡設備安全價值影響的角度出發對策略收益進行量化,考慮攻擊成敗對攻防收益的影響,攻防收益量化方法步驟詳細、可行;以防御效能作為標準,能夠以純策略的形式選取防御策略,并給出詳細的網絡主動防御策略選取算法,方法可操作性較好。 下面構建典型的實驗環境以驗證本文所提方法的合理性和可行性,實驗網絡的拓撲圖如圖1所示。由圖1可見,內部網絡和外部網絡通過軍用防火墻進行隔離,內部網絡由隔離區域和信任區域組成。外部主機只能訪問隔離區域的節點,隔離區域的節點能夠對信任區域的數據庫服務器、文件服務器進行訪問。 圖1 實驗網絡的拓撲圖Fig.1 Topology of experimental network 在對歷史攻擊數據進行分析的基礎上,將攻擊方類型劃分為冒險型、平衡型和保守型三類。冒險型攻擊方所采用攻擊方式的成本和成功率均較高;保守型攻擊方所采用攻擊方式的成本和成功率均較低;平衡型攻擊方的特點位于二者之間,采取攻擊方式的成本和成功率較為均衡。參照美國麻省理工學院林肯實驗室對網絡攻防的分類[17],根據攻擊行動實施的難易程度和可能獲得收益的大小,結合專家意見和網絡拓撲分析結果,不同類型攻擊方的攻擊策略如表2所示。 表2 不同類型攻擊方的策略Tab.2 Strategies of different types of attackers 注:FTP是文件傳輸協議,UDP是用戶數據報協議,TCP是傳輸控制協議,“√”表示選擇了該種方法。 以防御效果和成本為標準,將防守方類型劃分為高級和初級兩類。與初級防守方相比,高級防守方所采用防御方式的防御力度和成本均較高。通過分析防御效果及成本可知,不同類型防守方的防御策略如表3所示。 注:SYN是同步序列編號,ICMP是網際控制信號協議,SSH是安全外殼協議。 通過對網絡攻防的歷史數據進行分析,可以得到攻防雙方的先驗信念集合。防守方的先驗信念為(冒險型攻擊方,平衡型攻擊方,保守型攻擊方)=(0.1,0.2,0.7);攻擊方的先驗信念為(高級防守方,初級防守方)=(0.5,0.5)。通過海薩尼轉換來構建網絡攻防博弈樹,如圖2所示。 圖2 網絡攻防博弈樹Fig.2 Network attack-defense game tree 從防御策略的選取和防御收益對比兩個方面,對5.1節中的實驗進行分析:通過防御策略的選取驗證方法的可行性;通過防御收益的對比,總結軍事信息網絡安全防御的一般性規律。 5.2.1 防御策略選取 在確定網絡攻防博弈樹的基礎上,對攻防策略的變化情況進行分析,攻防策略的概率變化如圖3所示。由圖3可見,隨著時間的不斷變化,攻防雙方選擇每種策略的概率逐漸趨于收斂,最終趨于穩定,由此可以得到攻防雙方的混合策略貝葉斯納什均衡。通過混合策略貝葉斯納什均衡分析攻防雙方選擇策略的可能性,結合防守方的策略收益和先驗信念計算防御效能,以此來量化防御策略對攻擊方可能行動的防御效果,防御策略的防御效能如圖4所示。 圖3 攻防策略的概率變化Fig.3 Probability change of attack and defense strategies 圖4 防御策略的防御效能Fig.4 Defense effectiveness of defense strategies 由圖4可知,防御效能的降序排列為(E(Sd,1),E(Sd,6),E(Sd,4),E(Sd,3),E(Sd,2),E(Sd,5))。在有限的資源條件下,防守方應主動優先實施防御策略Sd,1,以期實現最佳的防御效果。由此可見,本文提出的主動防御策略選取方法能夠為軍事信息網絡的主動防御提供指導。傳統基于博弈論的網絡防御策略選取算法,通過均衡狀態下不同類型防守方的混合策略來指導防御策略的選取,不便于軍事信息網絡管理人員是理解和操作。本文提出的主動御策略選取方法在對攻防雙方可能行動預測的基礎上,對防御策略的防御效果進行更進一步的量化,以純策略形式選取防御策略,具有更好的可操作性。 5.2.2 防御收益對比 無論是傳統網絡安全防御方法通過納什均衡求解來選取防御策略,還是本文以防御效能為標準來選取防御策略,其根本依據都是防御策略收益。通過對防御策略收益進行對比分析,總結網絡安全防御的一般性規律。不同強度的攻擊檢測率λ和防御成功率β對防御收益的影響如圖5和圖6所示。 圖5 不同λ的防御收益Fig.5 Defense payoffs of different λ 圖6 不同β的防御收益Fig.6 Defense payoffs of different β 由圖5可知,防守方檢測到攻擊行動的成功率越高,防守方的收益越大。這是因為攻擊行動被檢測到的成功率越高,防守方對攻擊方的類型判斷越準確,能夠為應對攻擊行動選擇更合適的防御手段,從而提高防守方的收益。防守方對攻擊方類型的判斷直接影響博弈均衡求解和防御效能的量化,進而影響防御策略的選取。因此,在實際的網絡安全防御中,防御策略和攻擊檢測共同部署,能夠增強網絡安全防御的效果。 由圖6可知,防守方對攻擊行為的防御成功率越高,防守方的收益越大。這是因為防御的成功率越高,防守方選取的防御策略對攻擊行動的抵抗性越強,能夠更好地保護目標設備不被攻擊方攻破,從而提高了防守方的收益。當面對網絡攻擊時,防御成功率與防御策略的強度呈正相關。因此,在網絡資源允許的情況下,應采取高強度的防御措施,以增強網絡安全防御。 本文針對現有網絡防御策略選取方法難以應用到軍事信息網絡安全防御的問題,構建了網絡攻防博弈模型并設計了主動防御策略選取方法。所得主要結論如下: 1)根據軍事信息網絡的特點構建了攻防博弈模型,充分考慮攻防雙方類型對博弈過程的影響,使模型更加符合軍事信息網絡對抗的實際情況,為軍事信息網絡安全防御的研究奠定了基礎。 2)從攻防行動對網絡設備安全價值影響的角度出發設計了攻防收益的量化方法,有效解決當前博弈模型中收益量化主觀性較強的問題。 3)以防御效能為標準,設計了網絡主動防御策略選取方法,有效解決了當前博弈模型以概率形式給出主動防御策略難以理解和實施的問題。 相對于傳統的防御策略選取方法,本文提出的方法更加符合軍事信息網絡攻防實際,能夠為軍事信息網絡的安全防御提供指導。下一步將重點解決攻防對抗過程中具有多個目標時,網絡主動防御策略如何選取的問題。3.4 算法復雜度分析
4 相關工作的比較

5 仿真實驗與分析
5.1 仿真實驗環境描述



5.2 實驗分析




6 結論