王浩炎,王玉玫
1.中國電子科技集團有限公司 第十五研究所 系統三部,北京100083
2.中國電子科技集團有限公司 第十五研究所 總體部,北京100083
隨著網絡科技的發展,人們對無線互聯的要求越來越高,尤其現在5G通信的應用和發展,對頻譜的需求以及對動態接入和系統穩定性的需求越來越高。傳統無線通信網絡在網絡信道資源分配上會造成很大的浪費,并且頻譜利用率低下,因此認知無線電技術應運而生。
Mitola 等在1999—2000 年提出認知無線電(Cognitive Radio,CR)[1-2]。認知無線電思想的基本點是:無線通信電子設備具有認知功能,并可機會式工作在授權頻段,增加頻譜資源的利用率。
認知無線網絡(Cognitive Radio Networks,CRn)[3]是繼承認知無線電知識發展而來。認知網絡指網絡具有自主感知力,通過感知外界環境變化,自主學習理解,由目前的狀況來計劃、決定并采取行動,根據實際情況隨時調整網絡內部配置,自主決策,從而適應系統外部環境改變。其可以將傳統靜態頻譜分配模式轉換成動態自適應的模式,切實解決信道資源的不足,實現頻譜的高效利用,滿足當下通信發展趨勢。認知無線網絡的工作機理如圖1。

圖1 認知網絡工作機理
隨著對認知無線電的深入研究,Motorola和Virginia Tech等公司提出認知無線網絡這個概念。目前,很多研究都已經明確表明動態信道分配技術在多運營商環境下可行[4-5],全球許多學者提出多種有效提高信道資源利用率的動態信道管理方法。
利用博弈論框架,Ewaisha等[6]提出最優停止規劃的自適應信道選擇策略,驗證了關于信道分配的問題最后能收斂到確定的納什均衡點。蔣兵霞在文獻[7]中在博弈論基礎上研究認知無線網絡信道分配策略,基于潛在博弈理論框架分析頻譜分配優化問題。王曉宇在文獻[8]中講述如何利用博弈論來研究認知無線網絡的方法。
靜態信道分配的用戶無法去占用空閑信道,靜態信道分配方式很大程度降低信道的利用效率。因此基于博弈論,又出現了在信道競價拍賣基礎上的動態信道分配算法。Chen 等[9]提出一種在干擾限制基礎上的信道拍賣框架,授權用戶遭遇到認知用戶有限的干擾,結果證明該算法在認知無線網絡的分散自適應學習環境中適用。Kasbekar 等[10]在此基礎上提出一種信道拍賣框架。Toth 等[11]更多地引入經濟學拍賣交易理論來研究信道頻譜資源分配。
Akbar 等[12]利用隱馬爾可夫模型,分析授權用戶在連續多時間段的信道占用情況。Yao等[13]提出在信道感知中錯誤檢測和錯誤報警條件下的動態信道分配機制。沈高青[14]針對認知無線網絡飽和吞吐量構建二維馬爾可夫鏈,達到認知用戶的傳輸性被有效優化的目的。朱江等[15]提出一種基于隱馬爾可夫模型的多信道功率博弈機制,從而保證更多用戶達到傳輸速率需求。
分析上述文獻可知,認知無線網絡擁有傳統網絡所不具有的優勢,在信道競價拍賣基礎上利用博弈論進行動態信道分配策略研究是當下國內外學者研究的熱點,在具體模型構建上多采用排隊論構建馬爾可夫鏈模型對其進行研究。但是過去的研究往往只有授權用戶與單類認知用戶的博弈研究,缺少具體的動態信道聚合機制。隨著通信的發展,兩類以上認知用戶及信道聚合機制的頻譜分配策略是一個值得研究的方向。
認知無線網絡是擁有自主認知功能的網絡,通過分析實際具體的狀態,規劃、決策和響應以辨認當下網絡狀態。為實現提高端到端性能的目的,認知無線網絡在一個自適應過程中學習,并可用于以后的決策。文獻[16]對認知網絡提供一個更全面的定義。理想型認知網絡應具有前瞻性,在問題顯示出來前可以自主嘗試修改。另一方面,為支持未來網絡架構和網絡元素的變化,認知無線網絡體系架構應具有可擴展性和靈活性。
本文提出一種基于兩類認知用戶及信道聚合機制的頻譜分配策略。首先建立具有多優先級離散時間排隊模型,構造三維馬爾可夫鏈,得到馬爾可夫鏈的轉移概率矩陣。然后得到系統的穩態分布并進行分析,獲得系統性能指標。最后對次級認知用戶接入行為博弈優化,得到個人最優接入率和社會最優接入率等。
基于兩類認知用戶及動態信道聚合機制的頻譜分配策略,即授權用戶PU具有最高搶占優先權,高于認知用戶,而認知用戶有兩種類型數據包,分別是高級認知用戶SU1 和次級認知用戶SU2,SU1 搶占優先權高于SU2。隨系統中數據包個數改變,信道個數被中央控制器動態調整聚合。工作機制架構圖如圖2所示。

圖2 工作機制
設認知無線網絡中單獨一個授權頻譜一般是由NC個數據信道和1個控制信道組成。在系統中,授權用戶數據包PU有最高優先權,認知用戶分兩類數據包,分別是高級認知用戶數據包SU1 和次級認知用戶數據包SU2,SU1對SU2具有搶占優先權。PU數據包的傳輸可中斷SU1和SU2數據包的傳輸,而SU1數據包的傳輸則可以搶占中斷SU2數據包的傳輸。
為滿足PU和SU1的響應性能,PU和SU1設置零緩存,而SU2 設置有限緩存,從而降低SU2 響應延遲。系統中沒有數據傳輸時,為防止信道資源被浪費,所有信道不被激活。
當PU 對系統發出請求傳輸信號,而信道中沒有其他PU,并且授權用戶優先級最高時,全部信道都被中央控制器激活并綁定成一個新的聚合信道,新到達PU 在此聚合信道完成傳輸。假設信道中已有SU傳輸,則PU將搶占SU傳輸信道。
當SU1到達系統時,如系統被PU占據,則SU1離開系統,傳輸失敗。如果系統內是SU1 占據聚合部分信道,則新到達SU1尋找另一個可綁定的新的聚合信道進行傳輸。如信道被SU2 占據,則中斷SU2 傳輸,SU1 占據信道進行傳輸。
系統為SU2設置一個緩沖區,將準入門檻設置為一個接入閾值。系統中新到達一個SU2,假設此時SU2個數等于系統緩沖區的接入閾值,則新到達的SU2會阻塞系統。接入閾值也可以控制SU2 中斷后的返回行為。當傳輸中的SU2被中斷,如果緩沖區中的SU2個數小于接入閾值,則中斷的SU2 會返回緩沖區,否則中斷的SU2 就會離開系統,終止數據傳輸。這里假設中斷的SU2對新到達的SU2具有較高優先級。
當系統中僅存在SU2時,部分信道被中央控制器激活綁定用于傳輸SU2。設系統內SU2 的個數來決定激活的信道個數,次級認知用戶緩存量大小為K(K >0),此時系統所能容納的次級認知用戶數據包的最大個數為K+1。當僅存在SU2 在系統傳輸時,即PU 和SU1的傳輸請求不存在,假設系統內SU2個數為G,則次級認知用戶數據包個數與系統總容量的比率為G/(K+1)。系統內信道總數為NC,NC是整數,因此需被聚合綁定信道的個數用向上取整函數NCG/(K+1)來計算。
綜上,一個PU 或一個SU1(相對于SU2)始終在由全部信道激活綁定的聚合信道上傳輸,在這兩類數據包中,綁定聚合信道個數一直不變。相反,對SU2來說,一個次級認知用戶數據包在部分信道綁定的聚合信道上傳輸,隨到達系統的SU2 個數的變化,綁定信道個數隨之變化。
2.3.1 帶有可變服務率的多優先級排隊模型的建立
將時隙作為單位,系統模擬的建立是在離散時間領域中觀察用戶行為。舉例,設時刻t=n,在時隙開始時,(n,n+)這個時間點數據包到達,在時隙結尾(n-,n)這個時間點數據包完成傳輸,然后從系統離開。
設數據包系統傳輸所需時間與數據包到達的間隔互不影響。令PU的到達遵循參數SU1、SU2 到達分別遵循參數和Bernoulli 過程。授權用戶數據包和兩類認知用戶數據包在聚合信道上的傳輸時間的分布是幾何分布。設在一個時隙內PU的服務率為μ1,SU1的服務率為μ21,SU2的服務率為μ22。
通過信道聚合機制的頻譜分配策略可知,信道內SU2 數量和實際服務率聯系密切。當僅有SU2 數據包存在系統內,假定該類數據包的個數為G,SU2的實際服務率為其表達式如式(1)所示:

為保證式(1)中?G的取值范圍滿足0 <?G<1,假設SU2數據包在單個信道上的服務率服從0 <NCμ22<1。
把聚合信道看成單服務臺,假設次級認知用戶為低優先級顧客,而高優先級顧客是授權用戶和高級認知用戶抽象成的,緩存空間則為次級認知用戶的緩存,立足兩類認知用戶及信道聚合機制的頻譜分配策略工作機制,可以構建一個帶有可變服務率的具有多優先級和有限等待空間的排隊模型。
令Ln=i(i=0,1,…,K+1)表示在時刻t=n+時,系統中數據包的總個數為i(包括授權用戶PU、高級認知用戶SU1和次級認知用戶SU2)。令Pn=k(k=0,1)表示在時刻t=n+時,系統中PU 的個數為k 。令Sn=j(j=0,1)表示在時刻t=n+時,系統中SU1 的個數為j。則{Ln,Sn,Pn}就可以構成一個三維馬爾可夫鏈,該三維馬爾可夫鏈的狀態空間Ω 可表示為式(2)。

式中,狀態(i,0,0)表示有i 個數據包在系統里,且數據包都是SU2 數據包;(0,0,0)則表示沒有任何數據包在系統里;狀態(i,0,1)表示系統中有i 個數據包,其中1個數據包是PU的數據包,i-1 個數據包是SU2數據包;狀態(i,1,0)表示系統中有i 個數據包,其中有1 個數據包是SU1,SU2個數為i-1。
2.3.2 帶有可變服務率的多優先級排隊模型的穩態分布
設P 為三維馬爾可夫鏈{Ln,Sn,Pn}的狀態轉移矩陣,是一個(K+2)×(K+2)的塊狀矩陣,如式(3)。

對于式(3),矩陣的子塊Pu,v是一步轉移矩陣,含義是系統從水平u 轉移到水平v,這里u=0,1,…,K+1,v=0,1,…,K+1,根據系統的不同水平,對各個子塊具體分析如下所示:
(1)當系統處于u=0 水平狀態時,在t=n+時刻,無任何種類數據包在系統內。在t=(n+1)+時刻,系統狀態轉移到水平v(v=0,1,2)。
當v=0 時,在時刻t=(n+1)+無數據包到達,此時P0,0詳情見式(4)。

當v=1 時,在時刻t=(n+1)+,系統只含一個PU 或SU1或SU2,此時P0,1如式(5)。

當v=2 時,在時刻t=(n+1)+,系統有一個PU 和SU2或有一個SU1和SU2,此時P0,2如式(6)。

(2)當1 ≤u ≤K-1(K >1)時,在時刻t=(n+1)+,系統內有u 個數據包,系統轉移到水平v(v=u-1,u,u+1,u+2)。
當v=u-1 ,數據包在系統中的個數在時刻t=(n+1)+減少一個,則子塊Pu,u-1的詳細情況有兩種,如下所示:
若u=1,Pu,u-1如式(7)。

若2 ≤u ≤K-1 且K >2,Pu,u-1如式(8)。

在v=u 情況下,數據包在系統中的個數在時刻t=(n+1)+保持不變,子塊Pu,u如式(9)。

在v=u+1 情形下,數據包在系統中的個數在時刻t=(n+1)+變多一個,子塊Pu,u+1如式(10)。

在v=u+2 情況下,數據包在系統中的個數在時刻t=(n+1)+變多兩個,子塊Pu,u+2如式(11)。

(3)在系統水平u=K 時,在時刻t=n+數據包在系統中的個數為K ,即次級認知用戶緩存區僅剩一個空位且聚合信道已被占用,則時刻t=(n+1)+,系統轉移到水平v(v=K-1,K,K+1)。
在v=K-1 情況下,數據包在系統中的個數在時刻t=(n+1)+減少一個,此時PK,K-1如式(12)。

在v=K 情況下,數據包在系統中的個數在時刻t=(n+1)+不變,則PK,K如式(13)。

在v=K+1 情況下,數據包在系統中的個數在時刻t=(n+1)+變多一個,此時子塊PK,K+1如式(14)。

(4)當系統水平u=K+1 時,在時刻t=n+,數據包在系統中的個數為K ,即系統聚合信道已被占用,次級認知用戶緩存區已滿,則時刻t=(n+1)+,系統轉移到水平v(v=K,K+1)。
在v=K 情況下,數據包在系統中的個數在時刻t=(n+1)+減少一個,則PK+1,K如式(15)。

在v=K+1 情況時,數據包在系統中的個數在時刻t=(n+1)+仍處于滿的狀態,則PK+1,K+1如式(16)。

轉移概率矩陣中的每個元素都可由式(4)到式(16)運算得出。
分析轉移概率矩陣P 的結構,可得出三維馬爾可夫鏈{Ln,Sn,Pn}的特性,即非周期、不可約、正常返。定義三維馬爾可夫鏈的穩態分布πi,j,k如式(17)。

定義Π 為系統的穩態概率向量,Π=(Π0,Π1,…,Πk+1)。由平衡方程和正規化條件可得式(18)。

其中e 為列向量。
定義Πi為系統處在i 水平的概率向量,Πi如式(19)。

通過高斯-賽德爾方法,可得到穩態分布Π。
為更好更全面地評價使用以兩類認知用戶及信道聚合機制為基礎的頻譜分配策略的系統呈現出的性能優缺點,模擬一個性能指標體系,該指標體系由次級認知用戶SU2 的吞吐量θ、阻塞率β、中斷丟失率γ 及平均延遲時間δ 等組成。
2.4.1 次級認知用戶阻塞率
次級認知用戶SU2 的阻塞率β 表示在系統中每個時隙內被阻塞的次級認知用戶SU2 數據包個數。新到達次級認知用戶數據包因系統緩存區已滿,綁定聚合信道正被用戶占用傳輸數據,而占用信道的用戶在該時隙內不會離開系統,因此該次級認知用戶數據包無法傳輸,該現象稱為次級認知用戶的阻塞。β 的表達式如式(20)。

2.4.2 次級認知用戶中斷丟失率
由于次級認知用戶緩存區已被占滿,正在綁定聚合信道中傳輸的次級認知用戶數據包,其傳輸信道被剛到的授權用戶或高級認知用戶數據包強占,該包被丟棄,稱中斷丟失。單位時隙內丟失的次級認知用戶數據包數量便是次級認知用戶丟失率γ,表達式如式(21)。

2.4.3 次級認知用戶吞吐量
次級認知用戶數據包在系統中一個單位時隙內完成傳輸的個數就是次級認知用戶吞吐量θ,表達式如式(22)。

2.4.4 次級認知用戶平均延遲時間
次級認知用戶從加入系統傳輸到離開系統經歷平均時間長度是次級認知用戶平均延遲時間δ,據排隊論系統的Little 定理[17]給出次級認知用戶平均延遲時間δ表達式,如式(23)。

數值實驗分兩次模擬操作:第一次,在聚合信道數量不一樣情況時,次級認知用戶數據包吞吐量、阻塞率、中斷丟失率以及平均延遲時間等隨次級認知用戶數據包在系統中的個數變化而改變的趨勢。第二次,通過設置多組不同參數,分析次級認知用戶緩存容量對次級認知用戶的中斷丟失率、阻塞率、吞吐量以及平均延遲時間的影響。參數公式設置如表1。

表1 公共參數
圖3刻畫了當授權用戶數據包到達率λ1=0.1,高級認知用戶數據包到達率λ21=0.2,次級認知用戶到達率λ22=0.2 時,隨信道個數NC的變化,次級用戶阻塞率β的變化。如圖所示,在信道聚合機制下,信道個數為NC時,次級認知用戶阻塞率β 隨次級認知用戶緩存容量變大會下降。其他變量固定情況下可看到隨信道個數NC增大,次級認知用戶阻塞率下降,因剛進入系統的次級認知用戶被傳輸概率隨綁定信道個數變多而增加,阻塞率下降。

圖3 次級認知用戶阻塞率變化趨勢I
圖4 刻畫了信道個數NC=40 時,隨著用戶數據包到達率變化,次級認知用戶阻塞率β 的變化。如圖所示,當次級認知用戶與高級認知用戶到達率一定時,次級認知用戶阻塞率會隨授權用戶到達率的增加而增加,當次級認知用戶與授權用戶到達率一定時,次級認知用戶的阻塞率隨著高級認知用戶的到達率增加而逐漸增加。而當高級認知用戶與授權用戶到達率一定時,次級認知用戶阻塞率會隨其到達率的增加而繼續增加。

圖4 次級認知用戶阻塞率變化趨勢II
圖5 刻畫了當授權用戶到達率λ1=0.2,高級認知用戶到達率λ21=0.2,次級認知用戶到達率λ22=0.2 時,隨信道個數NC的變化,次級認知用戶吞吐量θ 的變化。如圖所示,在動態信道聚合機制下,信道個數為NC時,隨次級認知用戶緩存容量增大,次級認知用戶的吞吐量θ 會逐步增加并趨于穩定。也可看到,在其他變量固定情況下,次級認知用戶吞吐量會隨信道個數NC的逐漸增大而增加。

圖5 次級認知用戶吞吐量變化趨勢I
圖6 刻畫了當信道個數NC=30 時,隨各個用戶數據包到達率變化,次級認知用戶吞吐量θ 的變化。如圖所示,當高級認知用戶與次級認知用戶到達率一定時,次級認知用戶吞吐量會隨授權用戶到達率增加而減小。當授權認知用戶與次級認知用戶到達率一定時,隨高級認知用戶到達率的增加,次級認知用戶吞吐量減小。而當高級認知用戶與授權用戶到達率一定時,次級認知用戶吞吐量會隨其自身到達率的增加而增加。

圖6 次級認知用戶吞吐量變化趨勢II
圖7 刻畫了當授權用戶到達率λ1=0.2,高級認知用戶到達率λ21=0.2,次級認知用戶到達率λ22=0.2 時,隨信道個數NC的變化,次級認知用戶中斷丟失率γ 的變化。如圖所示,在動態信道聚合機制下,信道個數為NC時,隨次級認知用戶緩存容量增大,次級認知用戶中斷丟失率γ 逐漸減少并下降逐漸趨于平緩。也可看到,在其他變量固定情況下,隨信道個數NC減小,次級認知用戶中斷丟失率增大。

圖7 次級認知用戶中斷丟失率變化趨勢I
圖8 刻畫了在信道個數NC=10 情況下,隨各個優先級用戶數據包到達率的變化,次級認知用戶中斷丟失率γ 的變化。如圖所示,在動態信道聚合機制下,在信道個數NC=10 情況下,三種優先級別用戶數據包到達率的改變都會影響次級認知用戶中斷丟失率的大小變化。當高級認知用戶與次級認知用戶到達率一定時,次級認知用戶中斷丟失率就會隨授權用戶到達率增加而逐漸增大。而當授權認知用戶與高級認知用戶到達率一定時,次級認知用戶中斷丟失率也隨次級認知用戶到達率增加而逐漸增加。

圖8 次級認知用戶中斷丟失率變化趨勢II
圖9 刻畫了在授權用戶到達率λ1=0.2,高級認知用戶到達率λ21=0.2,次級認知用戶到達率λ22=0.2 情況下,隨信道個數NC變化,次級認知用戶平均延遲時間δ 的變化。如圖所示,在動態信道聚合機制下,在同一信道個數NC情況下,隨次級認知用戶緩存容量增加,意味著排隊等待傳輸的次級認知用戶數據包個數變大,每個次級認知用戶平均等待時間會增加,其平均延遲時間會增加。也可看到,在其他變量固定情況下,隨信道個數NC減小,次級認知用戶平均延遲時間增大。

圖9 次級認知用戶平均延遲時間變化趨勢I
圖10 刻畫了當信道個數為NC時,隨各個優先級用戶數據包到達率的變化,次級認知用戶平均延遲時間δ的變化。如圖所示,在高級認知用戶與次級認知用戶到達率不變情況下,次級認知用戶平均延遲時間會隨授權用戶到達率增加而增大,在次級認知用戶與授權用戶到達率不變情況下,次級認知用戶平均延遲時間會隨高級認知用戶到達率增加而變大。當高級認知用戶與授權用戶到達率一定情況下,次級認知用戶平均延遲時間基本不會隨次級認知用戶到達率增加而變化,當次級認知用戶緩存量一定時,次級認知用戶延遲時間不會被次級認知用戶到達率影響而產生變化。

圖10 次級認知用戶平均延遲時間變化趨勢II
本文采用一系列博弈論來研究次級認知用戶的接入行為,為保證自身利益的最大化,研究次級認知用戶應該產生什么樣的反應。第一步,為得到次級認知用戶數據包的均衡接入率,分析次級認知用戶數據包的納什均衡[18]接入行為;第二步,為達到社會最優化目標,使社會收益最大,分析次級認知用戶的社會最優接入率;最后,為使次級認知用戶遵循社會最優,給出最優定價方案。
給出一些分析中必須使用的優化假設:
(1)在進入系統時,一個次級認知用戶數據包可以選擇是否接入其中,但是它對系統內部詳細情況在做出決定以前并不了解。在這之外,次級認知用戶數據包在接入系統以后,不能自己退出系統。
(2)一個次級認知用戶可獲得收益a1在其接入并在系統傳輸成功以后。
(3)系統可能在一個次級認知用戶數據包進入系統選擇接入以后強制其在成功傳輸之前離開系統或將其阻塞。定義一次嘗試是一個次級認知用戶數據包進入系統中并做出選擇接入這個決定的行為,引入代價a2(a2<a1)來表示次級認知用戶數據包每一次嘗試。
(4)假設Λ 表示次級認知用戶數據包的潛在到達率。
對于一個次級認知用戶數據包來說,要不要做出接入系統這樣一個嘗試是其核心問題。設一個次級認知用戶數據包嘗試接入系統的概率q0(0 <q0<1)表示次級認知用戶數據包接入策略。
系統成功傳輸一個次級認知用戶數據包概率表示為ε(λ22),如式(24)。

式中,β 表示次級認知用戶數據包阻塞率,γ 表示次級認知用戶數據包中斷丟失率,λ22是次級認知用戶的到達率。
如式(25)所示,選擇接入系統的次級認知用戶數據包的定義表示為個人收益函數W1(λ22)。

分析納什均衡理論,假設均衡接入概率定義為qε,表示次級認知用戶數據包接入系統的概率,將均衡接入率使用λε=qεΛ 表示。任何一個次級認知用戶數據包在接入系統時都不能違背均衡接入概率qε和納什接入率λε。
設NC=15,Λ=0.5,a1=3,a2=2,在不同的授權用戶服務率μ1和次級認知用戶數據包緩存容量K 情況下,分別做出個人收益函數W1(λ22)隨次級認知用戶數據包到達率λ22改變而改變的變化曲線,如圖11所示。

圖11 個人收益函數變化趨勢
圖11 可知,個人收益W1(λ22)隨次級認知用戶數據包到達率λ22增大而單調下降。分兩種情況:
(1)在W1(Λ)≥0 情況下,無論哪種情況此時次級認知用戶的收益全部非負。在qε=1 均衡策略下,均衡接入率為λε=qεΛ=Λ。
(2)在W1(Λ)<0 情況下,次級認知用戶的收益總是為負。在所有的次級認知用戶數據包選擇接入系統時,W1(0+)>0,一個選擇嘗試接入系統的次級認知用戶數據包獲得收益在qε=0 時為正,顯然不嘗試接入系統的結果沒有這個結果好。相反,有一個選擇嘗試接入系統的次級認知用戶數據包獲得的收益在qε=1 的情況下為負。納什均衡在qε=1 與qε=0 這兩種情形下都達不到。可通過分析納什均衡理論,得出一個均衡接入概率,其表達式為qε=λε/Λ ,其中有一均衡點使方程W1(λε)=0 成立,其為均衡接入率λε。
表2 表示個人最優策略下均衡接入率λε與均衡接入概率qε的數值結果。

表2 個人最優策略下的數值結果
如表2所示,當μ1=0.500 和K=2 時,W1(λε)=0 的λε的解在[0.12,0.13]范圍內,觀察圖11可以發現。因此將0.12作為均衡接入率下限值,0.13作為均衡接入率上限值。根據qε=λε/Λ,將標記0.24作為均衡接入概率下限值,標記0.26作為均衡接入概率上限值。
根據個人收益函數表達式,通過分析給出社會收益函數W2(λ22)表達式,如式(26)。

其中,ε(λ22)表示一個次級認知用戶數據包在系統中被成功傳輸概率。
設NC=15,Λ=0.5,a1=3,a2=2 ,圖12 刻畫了在不同的授權用戶服務率μ1和次級認知用戶數據包緩存容量K 情況下,社會收益函數W2(λ22)隨次級認知用戶到達率λ22的變化趨勢。
圖12 可知,社會收益函數W2(λ22)隨次級認知用戶數據包到達率λ22增加,其變化趨勢顯示出一個上凸走向。總是會有一個最優次級認知用戶數據包到達率可達到最優社會收益函數。

圖12 社會收益函數變化趨勢
如式(27),存在社會最優接入率λs使得社會收益達到最大值。

推導社會最優均衡接入概率qs,如式(28)。

本文給出了社會最優接入率λs和社會最優接入概率qs的數值結果,如表3。

表3 社會最優策略下的數值結果
通過將表3 中社會最優策略下接入率與接入概率的數值和表2 中納什均衡策略下接入率與接入概率的下限值觀察比較,得出社會最優策略下的社會最優接入概率qs小于納什策略下的均衡接入概率qε,社會最優接入率λs也小于均衡接入率λε,納什均衡理論正好和這一現象吻合。系統中將會出現更多的次級認知用戶數據包在納什均衡理論下選擇接入,不合人意的是社會收益會因此下降。因此,為降低次級認知用戶數據包接入率并保證盡可能最大化社會收益,試著讓那些選擇接入系統的次級認知用戶數據包繳納一定接入費用。
基于兩類認知用戶及信道聚合機制的頻譜分配策略,假定中央處理器能成為一個收費者形象,可讓每個選擇接入系統的次級認知用戶數據包繳納一定的費用f 。
在一個嘗試接入系統的次級認知用戶數據包被中央控制器收取費用f 以后,得到一個表達該次級認知用戶數據包收益WP(λ22)的式(29):

社會最優的目標就是使系統中的次級認知用戶與中央控制器總體的一個收益最大化。對社會收益函數(考慮到接入費用f)重新做出定義,記作Ws(λ22),如式(30):

發現引入接入費用以后重新定義社會收益函數Ws(λ22)與未引入接入費用時社會收益函數W2(λ22)的表達式一樣,說明兩者不管收不收取接入費用,社會收益一樣。接入費用主要產生自中央控制器之上,不會影響社會最優策略的結果。
在式(30)中,設置λ22=λs,通過計算方程WP(λs)=0可以得到接入費用f 的表達式。
當λs<Λ 時,接入費用f 表達式如式(31)所示。

觀察表4中社會最優接入率λs并分析其數值結果,在不同的參數設置下表4 給出了接入費用f 的數值結果。表4中接入費用“ f ”估計到小數點后4位。

表4 接入費用的數值結果
為了讓系統得到更穩定的性能,本文提出一種基于兩類認知用戶及信道聚合機制的頻譜分配策略。與傳統靜態信道或者單信道以及只有一類認知用戶的研究不同,本文考慮兩類認知用戶及基于系統中數據包的個數動態激活聚合信道。首先根據提出的工作機制,構建三維馬爾可夫鏈,為得到系統轉移概率矩陣并進行穩態分析,構建多優先級帶有可變服務率的離散時間排隊模型。之后通過系統穩態分布進一步分析,得出性能指標。其次主要對性能指標展開分析,構建表達式并進行數值實驗,論證所提出的基于兩類認知用戶及動態聚合機制的頻譜分配策略在穩定系統性能和節省網絡資源方面的有效性。最后博弈分析次級認知用戶的接入行為,分析立足于社會整體優化方面的社會最優策略和以個體優化方面為基礎的納什均衡策略,在此基礎上提出一個定價方案,從而實現社會最優。
本文僅考慮兩類認知用戶,并提出一種基于兩類認知用戶及動態信道聚合機制的頻譜分配策略,但隨著網絡的發展,尤其是5G 網絡的普及,基于N 類認知用戶的認知無線網絡的研究將是必然趨勢。