程 宇胡 詩
(1.海軍駐武漢地區第五軍事代表室 武漢 430205)(2.武漢數字工程研究所 武漢 430205)
海上編隊通信環境下用頻需求數量多,編隊內各通信設備用頻需求相互之間存在沖突。另外,電磁兼容設計也是需要考慮的問題之一,但是受到狹小的艙外空間以及拓撲動態特性的限制,通過設計布置等手段仍然無法完全解決,必須采用動態頻譜管理手段彌補電磁兼容設計的不足[1]。
認知無線電動態頻譜分配技術的實現使得系統能夠通過有效地利用頻譜資源,滿足不同用戶對頻譜資源的靈活需求,從而提高了系統頻譜利用率和抗干擾能力[2]。博弈論作為一種有效的資源分配方法[3],得到了較多研究人員的關注。文獻[4]設計了基于收益和花費的認知用戶效用函數,并結合多主多從Stackelberg模型提出了一種分布式迭代頻譜分配算法。文獻[5]討論了非合作博弈、合作博弈以及隨機博弈在認知無線電網絡頻譜分配中的應用。文獻[6]考慮了認知網絡中存在多個授權用戶和認知用戶之間發生頻譜競爭博弈的問題。文獻[7]通過建立認知用戶同時接入多個主用戶沒有使用的頻譜、把擁塞程度考慮到目標函數中的干擾感知頻譜接入博弈模型,從而研究了非合作頻譜接入博弈。Niyato等分析了集中式頻譜會大大增加控制信道信令傳輸開銷,提出了基于Cournot博弈的分布式頻譜分配算法,減小了控制信道信令開銷[8]。授權用戶空閑頻譜資源數量影響其共享頻譜的意愿,文獻[9]通過在授權用戶的效用函數中引入動態邊際成本參數,實現了授權用戶和認知用戶之間的供需平衡。為了使頻譜分配更加合理,最大化空閑頻譜利用率和授權用戶收益,文獻[10]采用二次邊際成本函數建立授權用戶的效用函數,通過薄利多銷的策略刺激授權用戶申請到更多的頻譜資源,從而達到系統利益最大化。但這些算法均未考慮因頻譜感知不準確造成的頻譜分配過程中有失公平的問題。
針對頻譜分配過程中如何懲罰影響授權用戶的正常通信服務質量的認知用戶的問題,本文提出了一種基于動態價格調整機制的認知用戶間博弈論頻譜分配算法。通過在博弈論效用函數中引入置信度和優先級參數,允許頻譜管理中心動態調整對各認知用戶的頻譜要價,改進的效用函數受認知用戶優先級和置信度的共同影響,可以更靈活地保障認知用戶多樣化的業務傳輸需求,體現了頻譜分配的公平性和對授權用戶合法權益的保護。
在編隊動態頻譜管理系統中,通常包含一個頻譜管理中心和N個認知用頻裝備。所有授權用戶的空閑頻段聚合成頻譜池統一由頻譜管理中心分配。認知用戶i通過博弈,以價格ci獲取頻譜bi的共享使用權,隨后可自主在此頻段上使用自適應調制編碼技術進行通信傳輸。在動態頻譜分配過程中,頻管中心采用認知用戶間博弈的方式決定頻譜分配方案,同時為了實現編隊頻譜資源的統一管理和合理分配,認知用戶需在頻管中心制定的規則和監督下完成博弈,即將無中心的博弈過程和有中心的分配方式相結合。圖1中頻譜池中灰色部分表示授權用戶已占用的頻譜,白色部分bi(i=1,…,N)表示分配給認知用戶i的頻譜。
頻譜共享的博弈模型可以表示為

式中N為參加博弈的用戶數目;bi∈Bi為認知用戶i可選擇的有限的策略,即認知用戶向頻譜管理中心申請的頻譜帶寬;Ui,i∈N為認知用戶在博弈中的效用函數,其收益與授權用戶要價、自身的博弈策略和其它用戶的策略有關。

圖1 頻譜分配系統模型
根據古諾博弈模型[11],建立認知用戶的效用函數如下:

式中ri為認知用戶i單位傳輸速率所獲得的收益;ki為認知用戶i通信的頻帶利用率;bi為認知用戶i申請的頻譜數量;P為頻譜管理中心對每單位頻譜帶寬的定價;c為價格調控因子。該公式表明,認知用戶并不是申請越多的頻譜資源越好,最優的策略是提高自身通信效率,申請滿足業務傳輸需求的最小頻譜資源。
在傳統的博弈論頻譜分配過程中,授權用戶對每單位頻譜帶寬的定價通常有如下形式的定義[12]:

授權用戶定價的主要依據是認知用戶申請的共享頻譜帶寬,對不同的認知用戶無差別對待。然而在實際應用中,各用頻設備所承載的業務具有不同的傳輸優先級,動態頻譜管理系統需要保證高優先級業務的通信傳輸的頻譜需求。具有高優先級業務通信傳輸任務的認知用戶在博弈過程中應該獲得低價競買權,即在相同出價的情況下可以給予更多的頻譜資源。改進的價格函數有如下表達式:

式中ω為優先級加權值,αi∈[0,1]為引入的優先級參數,當αi=1時表示該認知用戶業務優先級最高,此時價格函數蛻變為式(3)所述的傳統價格函數;隨著認知用戶業務優先級降低,參數αi值逐漸減小。通過優先級參數的調整,優先級高的認知用戶可以以更低的價格競爭到更多的頻譜資源,充分利用空閑頻譜實現高效、可靠傳輸。
動態頻譜管理系統應用的前提是認知用戶具有快速、準確的頻譜感知能力,然而在實際的認知無線電系統中,由于電磁環境的復雜性、時變性,以及船體的遮擋等非理想因素,每個認知用戶的頻譜感知結果準確率不同。認知用戶只能在授權用戶不使用其授權頻段時才被準許接入該頻段進行數據傳輸,一旦檢測到授權用戶的回歸,必須立刻退出該頻段,避免對授權用戶的合法、正常通信造成干擾。若認知用戶未能及時、準確感知到授權用戶的出現,必然會干擾授權用戶的通信,成為該頻段非法用戶。另外每個認知用戶均是自私的,動態頻譜管理系統必須維持整個無線通信網的用頻秩序,保障用戶間的頻譜博弈合理、高效和公平。對于不遵守動態頻譜共享規則,且實際已影響授權用戶的正常通信服務質量的認知用戶,動態頻譜管理系統懲罰其違規行為,提高下次頻譜要價。所以,在式(4)所述的價格函數基礎上,增加置信度參數βi。改進后的價格函數表達式為

式中βi∈(0,1)代表動態頻譜管理中心對認知用戶i設置的置信度,不同置信度的設置使得認知用戶i在博弈過程對頻譜的出價不同,置信度越低,競爭獲得同等頻譜資源時所付出的成本就越高,體現了動態頻譜分配的公平性原則。為了直觀體現優先級和置信度與頻譜價格之間的關系,圖2仿真了動態價格函數的三維圖。仿真參數設置如下:bi=1,bj≠i=1 ,N=10 ,ω=1 ,αi=[0.05,0.1,…,1] ,βi=[0.05,0.1,…,1]。
如圖2所示,頻譜價格受認知用戶優先級和置信度的影響程度不同。根據傳輸業務的重要性設定若干不同等級的認知用戶優先級,其對頻譜價格的影響呈線性變化,即優先級越高(越接近1),動態頻譜管理中心對該認知用戶的頻譜要價越低。置信度體現了對干擾授權用戶通信的認知用戶的懲罰程度,隨著置信度的降低(趨向于0),動態頻譜管理中心對該認知用戶的頻譜要價越高,且增加速度呈指數增加,這是因為具有過低置信度的認知用戶將嚴重影響授權用戶的通信,嚴重擾亂動態頻譜管理的頻譜共享秩序。總之,改進后的頻譜要價函數更加符合動態頻譜管理的需求,提供更加靈活、高效、公平的頻譜分配策略。

圖2 動態價格函數三維圖
圖3為動態價格調整機制的流程圖。

圖3 動態價格調整機制流程圖
動態頻譜管理系統上線運行時初始化所有認知用戶的置信度為βi=1,i=1,2,…,N,同時感知認知用戶業務優先級。在頻譜共享接入過程中,若授權用戶重新接入信道i,系統首先根據業務智能感知結果刷新當前認知用戶優先級,然后判斷認知用戶i是否及時退出信道i。如果認知用戶未能及時退出信道i,并對授權用戶的通信造成了干擾,則降低認知用戶i的置信度,令=βi-λβi,其中λ∈(0,1)為置信度調整因子,控制著系統對認知用戶違規行為的敏感度;當接受懲罰的認知用戶通過提高頻譜感知和切換能力,避免了對授權用戶的干擾,系統則提高認知用戶i的置信度,令=β+λβ,此處類似股票漲停與跌停之間的關ii系,若想恢復到原置信度水平,認知用戶需要經過多于被降低置信度的次數來提高置信度。通過頻譜動態價格調整機制,保證了授權用戶的用頻安全和認知用戶的用頻需求,體現了用戶間頻譜博弈的公平性。
整理可得到新的認知用戶i的效用函數:

其中第一項表示認知用戶i利用申請的帶寬為bi的頻譜進行通信傳輸的預期收益;第二項表示認知用戶i租借頻譜所要支付的成本費用。所有的認知用戶只能通過調節自身的策略,并與頻譜管理中心交互來進行博弈,從而得到認知用戶的納什均衡解[13],即系統頻譜分配進入了穩態。
動態博弈頻譜分配算法如下所示。

表1 動態博弈頻譜分配算法
本節采用Matlab軟件對所提博弈論頻譜分配算法進行數值仿真。為了方便分析,不失一般性,假設海上編隊動態頻譜管理系統中某一超短波頻段內有兩個用頻設備需要通過博弈獲取動態頻譜資源,即N=2。該頻段可用于共享的最大頻譜帶寬為W=40MHz。所有認知用戶的單位傳輸速率的 收 益 為ri=10,i∈[1,…,N],目 標 誤 比 特 率=10-5,優先級加權值ω=1,認知用戶業務優先級αi和置信度βi根據不同的對比條件在仿真中進行設定。另外,認知用戶申請的頻譜帶寬初始值設定為bi(0)=1,i∈[1,…,N]。
圖4給出了在不同的收斂速度調整因子設置下兩個認知用戶的動態博弈過程。設認知用戶1的SNR1=12,優先級α1=1,置信度β1=0.8,認知用戶2的SNR2=10,優先級α2=1,置信度β2=0.8,并分別取a1=a2=0.1和a1=a2=0.14兩組不同的收斂速度調整因子進行對比。

圖4 不同情況下認知用戶動態博弈過程
從圖4可以看出,兩個認知用戶在每次博弈過程中分別調整自身申請的頻譜帶寬。當認知用戶經過多次調整自己申請的頻譜帶寬后,系統達到納什均衡,即收斂到使自身收益最大的頻譜帶寬。兩組調整因子下的認知用戶1最終分配的頻譜帶寬均大于認知用戶2,表明信道質量好的認知用戶具有競爭到更多頻譜資源的優勢。另外對比兩組調整因子的仿真結果可以看出,調整因子越大,雖然認知用戶可以更快的從初始帶寬接近到最終分配的頻譜帶寬,但是顯然博弈過程曲線波動更大,收斂時間也更長。若調整因子設置過小,博弈達到穩定點需要更多的迭代次數;若調整因子設置過大,博弈過程將一直在收斂點附近抖動,無法收斂。
接下來,將采用控制變量法來進行仿真,分別分析認知用戶優先級和置信度對頻譜分配結果的影響。首先假設認知用戶1的SNR1=10,置信度β1=0.8,認 知 用 戶 2的SNR2=10,置 信 度β2=0.8。圖5呈現了在認知用戶1的優先級α1不變時,兩個認知用戶申請的頻譜帶寬隨認知用戶2的優先級α2變化的曲線。

圖5 優先級對認知用戶申請帶寬的影響
由圖5可見,當認知用戶1固定為某一優先級時,隨著認知用戶2的優先級提高,其申請到的頻譜帶寬不斷增加,而對于認知用戶1來說,由于其競爭優勢被抑制,申請到的頻譜帶寬不斷減少。當兩個認知用戶的優先級相同時,兩條曲線存在一個交點,此時兩用戶競爭優勢相同,競爭到的頻譜帶寬也相同,符合市場規律。對比認知用戶1的優先級分別為α1=0.5和α1=0.8時的兩組仿真結果可以發現,當α1=0.8時的兩曲線交點對應的申請到的頻譜帶寬大于當α1=0.5時申請到的頻譜帶寬,這說明在總共享頻譜帶寬內,提高認知用戶的優先級,系統總的收益也會增加。另外,仿真結果也驗證了認知用戶優先級的線性影響特性。同樣,當α2不變,α1變化時,仿真結果類似。
圖6討論了認知用戶的置信度參數對頻譜博弈結果的影響。仿真中假設認知用戶1的SNR1=10,優先級α1=1,認知用戶2的SNR2=10,優先級α2=1。如圖6所示,隨著置信度β2的提高,認知用戶2申請到的頻譜帶寬不斷增加。當兩個用戶置信度βi相等時,認知用戶之間的競爭力完全相同,最終申請到的頻譜帶寬也相同,所以兩條曲線此時相交。當把認知用戶1的置信度由β1=0.2提高到β1=0.6時,認知用戶1申請到的頻譜帶寬曲線明顯上移,表明其在頻譜博弈過程中的競爭優勢得到提高。從圖6還可以看出,當認知用戶的置信度較小時,取值的改變對申請的頻譜帶寬的影響要大于置信度較大時,即動態頻譜管理系統對置信度較小的用戶懲罰力度更大,進而可以更好地維護授權用戶合法的用頻權益,體現了高效、公平的原則。

圖6 置信度對認知用戶申請帶寬的影響
針對頻譜分配過程中如何懲罰影響授權用戶的正常通信服務質量的認知用戶的問題,本文提出了一種基于動態價格調整機制的認知用戶間博弈論頻譜分配算法。該博弈過程的效用函數引入了認知用戶業務優先級和置信度兩個參數,聯合控制動態頻譜管理中心對認知用戶的頻譜要價。考慮實際場景,設置優先級對頻譜價格的影響呈線性變化,而置信度對頻譜價格的影響呈指數變化。仿真和實驗結果表明,所提算法設置的效用函數更加合理,不僅能夠保護授權用戶的合法用頻權益,更保證了認知用戶多樣化的用頻需求。