黃開枝 洪 穎 羅文宇 林勝斌
由于廣播傳輸特性,無線網(wǎng)絡容易受到竊聽、干擾、甚至攻擊等而引發(fā)一系列安全問題。針對這些安全威脅,需要相應地采用提供保密性、完整性、可用性的安全機制。傳統(tǒng)加密方法中,密鑰管理是構建安全無線網(wǎng)絡以及實現(xiàn)上層各種安全應用的重要基石,但由于網(wǎng)絡拓撲變化給密鑰的傳輸和分發(fā)帶來巨大的挑戰(zhàn),用戶密鑰頻繁更新,導致現(xiàn)有的加密方法復雜度極高。近年來提出的物理層安全傳輸方法是以竊聽信道模型為基礎,利用信道編碼、放大轉(zhuǎn)發(fā)、協(xié)作干擾等技術,在不增加無線網(wǎng)絡負荷的情況下,極大地增強整個網(wǎng)絡的安全性能[17]-。
目前,基于博弈論這一有力工具提高網(wǎng)絡物理層安全的研究已經(jīng)得到了廣泛的關注,博弈論給網(wǎng)絡內(nèi)發(fā)送端的安全協(xié)作研究提供了一種解決節(jié)點之間交互作用的通用數(shù)學框架。2012年,文獻[8]提出了一個基于多發(fā)送端協(xié)作的分布式購買者/銷售者博弈理論架構,通過友好干擾中繼有償給竊聽者發(fā)送干擾信號,可以有效提高發(fā)送端的安全速率。2013年,文獻[9]通過Stackelberg模型解決兩源發(fā)送端和友好干擾者之間的博弈問題,得出了安全速率最優(yōu)的均衡點。然而,現(xiàn)有基于經(jīng)典博弈的研究只給出了最大化單個用戶安全速率的策略,忽略了整個網(wǎng)絡的安全速率。在戰(zhàn)場無線通信、多跳無線通信[10]等場景中,網(wǎng)絡的安全速率取決于安全速率最低的那個發(fā)送端。當用傳統(tǒng)博弈論研究發(fā)送端安全協(xié)作行為時,各個發(fā)送端只考慮增加自身的最大安全速率,它將不利于整個網(wǎng)絡安全速率的提高。
針對此問題,本文基于演化博弈機制提出一種物理層安全協(xié)作方法。首先,建立發(fā)送端組網(wǎng)模型,互為中繼的兩個發(fā)送端形成合作組網(wǎng),一個發(fā)送端發(fā)送信號時,另一個可以選擇為其發(fā)送人工噪聲干擾竊聽者。然后,利用演化博弈機制[1113]-定義了策略以及不同策略組合下的安全速率收益,并通過復制動態(tài)方程來描述策略的動態(tài)更新過程;發(fā)送端根據(jù)當前網(wǎng)絡狀態(tài)以及協(xié)作策略下的收益與平均期望收益的差值,不斷進行策略調(diào)整以最大化收益;發(fā)送端在不斷的重復博弈過程中,學習安全速率收益較高的策略,剔除無效策略。最后,通過求解獲得使發(fā)送端達到協(xié)作穩(wěn)定策略的條件,使網(wǎng)絡從不穩(wěn)定狀態(tài)向協(xié)作穩(wěn)定狀態(tài)演化,提高了系統(tǒng)的安全速率。仿真和分析結果表明:在高斯信道條件下,當發(fā)送端功率滿足協(xié)作穩(wěn)定策略的條件時,所提方法的網(wǎng)絡安全速率比基于經(jīng)典博弈的方法提高了1 bit/(s Hz)?。
存在竊聽者的無線網(wǎng)絡模型如圖1所示,包含多個發(fā)送端、一個合法接收端和一個竊聽者。兩個發(fā)送端就近形成協(xié)作組,共有N個組網(wǎng),定義組網(wǎng)集合為 Ω = { G1, G2, … , GN}。一個發(fā)送端發(fā)送信號時,另一個發(fā)送端可以選擇發(fā)送人工噪聲進行協(xié)作干擾。發(fā)送端將噪聲置于合法接收端主信道的零空間上,因此能在降低竊聽者性能的同時不影響合法接收端的接收[14]。

圖1 無線網(wǎng)絡組網(wǎng)模型
網(wǎng)絡內(nèi)每個發(fā)送端的總能量恒定為W ,發(fā)送端在所屬組網(wǎng)時隙內(nèi)發(fā)送信號。發(fā)送端到合法接收端的信道為 1g= ,發(fā)送端到竊聽者的信道為h。為了有效地分析無線網(wǎng)絡中發(fā)送端的行為,文中假設每個發(fā)送端有兩個可選策略,一個是分配能量發(fā)人工噪聲(協(xié)作策略),另一個是不發(fā)人工噪聲(不協(xié)作策略)。在沒有與其他發(fā)送端協(xié)作時,某個發(fā)送端的安全速率為主信道和竊聽者信道的容量之差[15]為

其中, C ( x ) = l og2(1 + x )/2;功率 P = W / t(W) ;[]+表示取正的最大值。如果發(fā)送端相互協(xié)作,如圖2所示,在一個組網(wǎng)內(nèi),前半個時隙發(fā)送端 T1以功率 P / 2發(fā)送信號 X1時,發(fā)送端 T2以功率 P / 2發(fā)送人工噪聲 X2,后半個時隙 T2以功率 P / 2發(fā)送信號X3時, T1以功率 P / 2發(fā)送人工噪聲 X4。 X2和 X4是獨立同分布的高斯序列干擾信號,幫助發(fā)送端抑制竊聽者性能,Z1和 Z2是零均值的單位方差高斯隨機變量。

圖2 前后時隙下組網(wǎng)內(nèi)竊聽信道
下面將組網(wǎng)iG內(nèi)兩個發(fā)送端的安全速率根據(jù)“(協(xié)作,協(xié)作)、(不協(xié)作,不協(xié)作)、(協(xié)作,不協(xié)作)和(不協(xié)作,協(xié)作)”4種不同的策略組合進行定義和分析。其中,1r表示協(xié)作,2r表示不協(xié)作。
定義 11T和2T都選擇協(xié)作,那么各自的信道安全速率定義為

定義 21T和2T都選擇不協(xié)作,那么各自的信道安全速率定義為

定義 31T選擇協(xié)作,2T選擇不協(xié)作,那么各自的信道安全速率定義為定義 41T選擇不協(xié)作,2T選擇協(xié)作,那么各自的信道安全速率定義為


定義 5 組網(wǎng)iG的安全速率定義為

定義 6 在多跳無線通信[10]等場景中,發(fā)送端需經(jīng)過多跳路徑到達接收端,此時的安全速率取所有路徑中安全速率的最小值。本文研究的協(xié)作組網(wǎng)場景,各個發(fā)送端都需要發(fā)送信號,這時,網(wǎng)絡的安全速率取決于網(wǎng)絡中所有協(xié)作組網(wǎng)中安全速率最低值。所以,本文研究的無線網(wǎng)絡場景下的安全速率定義為

根據(jù)定義1~定義4,可以得到 T1和 T2不同策略組合下的收益矩陣如表1所示。

表1 1T和 2T不同策略組合下的收益矩陣

針對這一問題,本文擬利用演化博弈的思想加以解決。如圖3所示,從博弈者的角度,演化博弈研究的參與者為整個發(fā)送端群體,參與博弈的發(fā)送端在博弈結束后,將策略和對應的收益告知給群體中的所有個體,獲得的是群體最優(yōu)。然后,從博弈規(guī)則的角度,發(fā)送端根據(jù)當前網(wǎng)絡狀態(tài)以及協(xié)作策略下的收益與平均期望收益的差值,不斷進行策略調(diào)整以最大化收益。最后,由唯一演化穩(wěn)定策略決定結果,達到網(wǎng)絡穩(wěn)定均衡狀態(tài)。基于此,本文提出一種基于演化博弈的物理層安全協(xié)作方法,促使組網(wǎng)內(nèi)節(jié)點的均衡策略達到(協(xié)作,協(xié)作),信道條件差的發(fā)送端將得到其他發(fā)送端的協(xié)作。

圖3 基于經(jīng)典博弈和基于演化博弈的區(qū)別
首先,引入演化博弈理論中的策略和收益,策略為發(fā)送人工噪聲協(xié)作或發(fā)送信號,收益對應不同策略組合下的安全速率;然后,通過復制動態(tài)方程描述發(fā)送端策略的動態(tài)更新過程,各個發(fā)送端之間通過控制信道,交換各自的信道狀態(tài)信息,信號發(fā)送完成后再通過控制信道交流各自策略(現(xiàn)有將博弈論應用在物理層安全研究的文獻[8],文獻[11,12],文獻[16]中關于協(xié)作雙方通信的實現(xiàn)均做此假定),發(fā)送端可以通過對協(xié)作組網(wǎng)內(nèi)另一個發(fā)送端的檢測[17](通過檢測是否感知到功率判斷對方是否協(xié)作干擾),并通過控制信道的廣播特性,將該信息廣播到各個發(fā)送端,從而得到現(xiàn)階段協(xié)作策略的比例,然后根據(jù)當前網(wǎng)絡狀態(tài)以及協(xié)作策略下的收益與平均期望收益的差值,不斷進行策略調(diào)整以最大化收益。最后,對協(xié)作成為唯一演化穩(wěn)定策略的條件進行求解分析,使網(wǎng)絡從不穩(wěn)定狀態(tài)向協(xié)作穩(wěn)定狀態(tài)演化。
通過比較發(fā)送端竊聽信道條件與合法接收端信道條件的大小,將博弈參與者劃分為兩個群體:竊聽信道條件滿足 h > 1 的發(fā)送端群體為 M1,竊聽信道條件滿足 h < 1 的發(fā)送端群體為 M2。發(fā)送端的平均期望收益定義如下:
定義 7 平均期望收益:M1群體中被賦予協(xié)作的比例為X,被賦予不協(xié)作策略的比例為1 - X ;M2群體中被賦予協(xié)作的比例為Y,被賦予不協(xié)作策略的比例為1-Y ;則 M1和 M2的平均期望收益定義為

T1為 M1的概率為p,為 M2的概率為q,令q = 1 - p ,將 M1采用協(xié)作策略的4種組網(wǎng)情況概率組合:“(M1協(xié)作, M1協(xié)作),(M1協(xié)作, M1不協(xié)作),(M1協(xié)作, M2協(xié)作),(M1協(xié)作, M2不協(xié)作)”的收益函數(shù)求得 M1采用協(xié)作策略的期望收益函數(shù)為

同樣地,1M 采用不協(xié)作策略的期望收益函數(shù)為

M2采用協(xié)作策略的期望收益函數(shù)為

M2采用不協(xié)作策略的期望收益函數(shù)為

發(fā)送端群體中采取協(xié)作策略比例的變化速度既與采用這個策略的個體比例成正比,也與協(xié)作下的期望收益與平均期望收益的差值成正比。通過建立復制動態(tài)方程,發(fā)送端不斷地進行自身策略的調(diào)整以最大化收益函數(shù)。以 /dX dt表示1M 采用協(xié)作策略參與者的比例隨時間的變化率,1M 群體的復制動態(tài)方程表示為

式(18)最多有兩個穩(wěn)定狀態(tài),分別是 x*= 0 和x*= 1 。
以 d Y / dt表示采用 M2協(xié)作策略參與者的比例隨時間的變化率,那么 M2群體的復制動態(tài)方程為

式(19)最多有兩個穩(wěn)定狀態(tài),分別是 y*= 0 和y*= 1 。
由式(18)和式(19)可以看到,初始協(xié)作群體比例X,Y會影響系統(tǒng)達到穩(wěn)定狀態(tài)所需的時間。X,Y越大, M1和 M2采用協(xié)作策略參與者的比例隨時間的變化越快,系統(tǒng)達到穩(wěn)定狀態(tài)所需的時間就越短。
根據(jù)演化博弈理論,式(18)和式(19)構成了互為中繼發(fā)送端的動態(tài)復制系統(tǒng)。對于任意的初始點(X ( 0),Y ( 0))∈ [ 0,1]× [0 ,1],有(X( t), Y ( t))∈ [ 0,1]× [0 ,1],發(fā)送端在初始狀態(tài)隨機采取策略。因此,在發(fā)送方互為中繼的動態(tài)復制網(wǎng)絡的解曲線上任意一點(X, Y)都對應著演化博弈的一個混合策略(X⊕(1 - X ),Y⊕(1 - Y))。顯然,該動態(tài)復制系統(tǒng)有如下局部穩(wěn)定點:E1(0,0),E2(1,0),E3(0,1),E4(1,1) 。這些穩(wěn)定點分別代表選擇協(xié)作策略在 M1和 M2中所占比例,對應網(wǎng)絡的局部均衡狀態(tài)。
從以上分析可知,當存在不同策略的發(fā)送端進入網(wǎng)絡時,會引起網(wǎng)絡內(nèi)其他發(fā)送端策略的改變,這時網(wǎng)絡狀態(tài)并不絕對穩(wěn)定。本文通過構建復制動態(tài)方程的雅可比矩陣,在竊聽信道狀態(tài)信息一定的前提下,求解獲得使協(xié)作成為唯一演化穩(wěn)定策略的條件,并使得整個網(wǎng)絡趨于協(xié)作均衡穩(wěn)定。

證明 存在性:
由式(18)和式(19),可得到相應的雅可比矩陣:

其中

使協(xié)作成為無線網(wǎng)絡下組網(wǎng)發(fā)送端的唯一演化穩(wěn)定策略的充分必要條件為detJ>0,trJ<0。通過將(X = 1 ,Y = 1 )代入雅可比矩陣J,得到

則矩陣的行列式為

矩陣的跡為



唯一性:
當p p*
< 時。(0,0),(1,0),(0,1)為不穩(wěn)定點,所以協(xié)作是網(wǎng)絡唯一的演化穩(wěn)定策略。這時,不協(xié)作策略將在網(wǎng)絡策略更新過程中逐漸地消失,協(xié)作策略成為發(fā)送端唯一演化穩(wěn)定策略,具體如表2所示。

表2 網(wǎng)絡平衡點的穩(wěn)定性
基于演化博弈的協(xié)作安全方法步驟為:
(1)相隔最近的兩個發(fā)送端形成組網(wǎng),組網(wǎng)內(nèi)發(fā)送端 T1,T2各占半個時隙發(fā)送信號給合法接收端。
(2)通過比較發(fā)送端竊聽信道條件與合法接收端信道條件的大小,將其劃分為兩個群體:M1,M2;M1,M2中采取協(xié)作策略的發(fā)送端比例分別為X和Y; T1為 M1的概率為p,為 M2的概率為q。
(3) M1和 M2根據(jù)所有個體反饋的收益,得到協(xié)作下的期望收益,以及平均期望收益。
(5)通過 d X / d t= 0 ,d Y / d t= 0 可以得到網(wǎng)絡的局部均衡點。
(6)通過定理1得到協(xié)作成為發(fā)送端的唯一演化穩(wěn)定策略的條件。
(7)在滿足協(xié)作成為唯一演化穩(wěn)定策略的條件下,發(fā)送端根據(jù)步驟(4)更新協(xié)作策略,直到 d X / dt=0,d Y / dt=0,此時X和Y為 1,所有發(fā)送端穩(wěn)定在協(xié)作狀態(tài)。 證畢
仿真條件如下:共包括1000個發(fā)送端、1個竊聽者和1個合法接收端。竊聽信道為高斯隨機信道,信道增益h取1000個隨機數(shù)值,方差為1。圖4比較了基于演化博弈和經(jīng)典博弈物理層安全方法下網(wǎng)絡的安全速率,可以看到基于經(jīng)典博弈納什均衡下的網(wǎng)絡安全速率為 0,而基于演化博弈機制下的網(wǎng)絡安全速率最大達到了1 bit/(s Hz)?。圖5給出了1T為1M 的概率p的變化對其條件式中矩陣的行列式和跡的影響,這時各個發(fā)送端功率固定為P=10 mW。在4種竊聽信道組合的均值增益下,當1T為1M的概率p小于0.8時,det0>J,tr0<J。滿足唯一性的條件,此時協(xié)作是無線網(wǎng)絡組網(wǎng)內(nèi)互為中繼發(fā)送端的唯一演化穩(wěn)定策略。

圖4 基于不同方法下網(wǎng)絡安全速率的比較

圖5 1T為 1M 的概率p對演化穩(wěn)定策略條件的影響

圖6 0.9p= 時,無線網(wǎng) 絡的演化穩(wěn)定分析
為了分析概率p對發(fā)送端策略的更新過程的影響,圖6和圖7分別給出了 0.9p= 與 0.5p= 條件下,M1和 M2采取協(xié)作策略的比例值變化過程。當p= 0 .9時,從圖6可以觀察到無線網(wǎng)絡發(fā)送端采取協(xié)作策略的比例處于一個0和1之間不斷循環(huán)的不穩(wěn)定狀態(tài)。這對安全要求極高的無線網(wǎng)絡來說是十分不利的一種情況,因為此時發(fā)送端采取協(xié)作策略的收益在多次博弈下的優(yōu)勢并不明顯,發(fā)送端不知道是否采取協(xié)作策略,所以只能盲目選擇策略,這樣勢必會造成安全速率的降低。當 p =0 .5時,滿足了協(xié)作成為唯一演化穩(wěn)定策略的條件,從圖7可以觀察到無線網(wǎng)絡發(fā)送端采取協(xié)作策略的比例能達到一個穩(wěn)定的演化狀態(tài),在此條件下的發(fā)送端,不協(xié)作策略將在演化過程中逐漸消失。
圖8給出了初始協(xié)作群體比例不同時,系統(tǒng)達到穩(wěn)定狀態(tài)所需的時間,橫坐標表示的是時間片,在每一個時間片內(nèi),發(fā)送端更新一次策略。其中 T1為 M1與為 M2等概率,滿足協(xié)作成為演化穩(wěn)定策略的條件。可以看到, M1與 M2中采取協(xié)作策略所占比例不同的初始值對系統(tǒng)達到穩(wěn)定狀態(tài)所需的時間不一樣。分別取 M1中協(xié)作策略比例初始值 X = 0 .5,X= 0 .9, X = 0 .1, M2中協(xié)作策略比例初始值Y= 0 .5,Y = 0 .9,Y = 0 .1。如圖8所示,當 M1選擇協(xié)作干擾策略的初始比例越高時,M2群體達到演化穩(wěn)定的速度就越快。當 M2群體選擇協(xié)作干擾策略的初始比例越高, M1群體達到演化穩(wěn)定的速度就越快, M1和 M2相互影響。可以得出,初始協(xié)作群體比例直接影響系統(tǒng)達到穩(wěn)定狀態(tài)所需的時間,初始網(wǎng)絡內(nèi)各個發(fā)送端采取協(xié)作策略的比例越高,系統(tǒng)達到穩(wěn)定狀態(tài)所需的時間就越短。其中,竊聽信道條件 h < 1 的 M2群體采取協(xié)作策略的比例相比竊聽信道條件 h > 1 的 M1群體對系統(tǒng)達到穩(wěn)定狀態(tài)所需時間的影響更大。

圖7 p = 0 .5時,無線網(wǎng)絡的演化穩(wěn)定分析

圖8 初始協(xié)作群體比例對系統(tǒng)達到 穩(wěn)定狀態(tài)所需的時間的影響

圖9 本文方法對網(wǎng)絡平均 安全傳輸容量的影響
本文方法下,各個發(fā)送端策略最終穩(wěn)定于協(xié)作,圖9比較了基于演化博弈方法后的網(wǎng)絡與原始非協(xié)作狀態(tài)網(wǎng)絡下的平均安全傳輸容量(平均安全速率)。每個發(fā)射端在所屬組網(wǎng)時隙的能量有限,當單個發(fā)送端能量大于0.005 J時,網(wǎng)絡的平均安全傳輸容量得到提高。這時,各個發(fā)送端分配一半的能量進行協(xié)作干擾,雖然用于自身的安全傳輸容量的能量降低,但是也得到了其他發(fā)送端的協(xié)作干擾,當單個發(fā)送端能量大于0.005 J時,對應圖4中,發(fā)送端的功率大于5 mW,網(wǎng)絡的安全速率大于0,保證了所有發(fā)送端都能安全傳輸數(shù)據(jù),整個網(wǎng)絡的安全傳輸容量得到了提高。
在存在竊聽者的無線網(wǎng)絡模型中,基于經(jīng)典博弈論的方法,發(fā)送端趨于不協(xié)作策略,導致網(wǎng)絡安全速率無法進一步提高。本文提出一種基于演化博弈的安全協(xié)作方法,研究發(fā)送端隨著時間的推移,在確定的演化穩(wěn)定條件下,通過不斷重復博弈,最終達到協(xié)作的演化穩(wěn)定均衡狀態(tài)。仿真和分析結果表明:在隨機的高斯竊聽信道環(huán)境下,當協(xié)作成為任意組網(wǎng)內(nèi)兩個互為中繼發(fā)送端的唯一演化穩(wěn)定策略時,本文方法保障了網(wǎng)絡內(nèi)信道條件最差發(fā)送端通信的安全,因此也相應提高了整個網(wǎng)絡的安全速率。
[1] Gupta P and Kumar P. The capacity of wireless networks[J].IEEE Transactions on Information Theory, 2000, 46(2):388-404.
[2] Wyner A D. The wire-tap channel[J]. Bell System Technical Journal, 1975, 54(8): 1355-1387.
[3] Liu R, Maric I, Spasojevic P, et al.. Discrete memoryless interference and broadcast channels with confidential messages: secrecy rate regions[J]. IEEE Transactions on Information Theory, 2008, 54(6): 2493-2507.
[4] Jorswieck E, Lai Li-feng, Ma Wing-kin. Signal processing for wireless physical layer security[J]. IEEE Journal on Selected Areas in Communications, 2013, 31(9): 1657-1659.
[5] Marano S and Matta V. Achieving perfect secrecy by pdfbandlimited jamming[J]. IEEE Signal Processing Letters,2014, 21(1): 83-87.
[6] Liu B, Zhang L, and Xin X. Physical layer security in OFDMPON based on dimension-transformed chaotic permutation[J].IEEE Photonics Technology Letters, 2014, 26(2): 127-130.
[7] Lin P H, Lai S H, and Lin S C. On secrecy rate of the generalized artificial-Noise assisted secure beamforming for wiretap channels[J]. IEEE Journal on Selected Areas in Communications, 2013, 31(9): 1728-1740.
[8] Zhang Rong-qing and Song Ling-yang. Physical layer security for two-way untrusted relaying with friendly jammers[J].IEEE Transactions on Vehicular Technology, 2012, 61(8):3693-3704.
[9] 周潔. 基于博弈論的竊聽信道安全研究[D]. [碩士論文], 南京郵電大學, 2013.Zhou Jie. Security of wireless communication based on game theory[D]. [Master dissertation], Nanjing University of Posts and Telecommunications, 2013.
[10] Manzoor A K, Hamidou T, and Athanasios V. Evolutionary coalitional games: design and challenges in wireless networks[J]. IEEE Wireless Communications, 2012, 19(2):50-56.
[11] Walid S, Zhang Xiang-yun, and Behrouz M. Tree formation with physical layer security considerations in wireless multi-hop networks[J]. IEEE Transactions on Wireless Communications, 2012, 11(11): 3980-3991.
[12] 陳卓. 動態(tài)網(wǎng)絡上的演化博弈研究[D]. [博士論文], 上海交通大學, 2012.Chen Zhuo. The study of evolutionary games on dynamic networks[D]. [Ph.D. dissertation], Shanghai Jiao Tong University, 2012.
[13] 陸棟梁. 多人博弈與協(xié)作演化研究[D]. [碩士論文], 蘇州大學,2012.Lu Dong-liang. The research on multi-person game and evolution of cooperation[D]. [Master dissertation], Soochow University, 2012.
[14] Goel S and Negi R. Guaranteeing secrecy using artificial noise[J]. IEEE Transactions on Wireless Communications,2008, 7(6): 2180-2189.
[15] Leung Y C and Hellman M. The Gaussian wire-tap channel[J].IEEE Transactions on Information Theory, 1978, 24(4):451-456.
[16] Walid S, Zhu H, Basar T, Debbah M, et al.. Physical layer security: coalitional games for distributed cooperation[C].Proceedings of the Symposium on Modeling and Optimization in Mobile Ad Hoc and Wireless Networks,Seoul, South Korea, 2009: 1-8.
[17] Dong L, Zhu H, Petropulu A P, et al.. Secure wireless communications via cooperation[C]. Proceedings of the Allerton Conference on Communication, Control, and Computing, Monticello, USA, 2008: 1132-1138.