陳彥銘,謝健驪,張 壘
(蘭州交通大學電子與信息工程學院,蘭州 730070)
隨著無線通信技術的發展,越來越多的智能終端出現在生活中,同時也帶來了劇烈增長的無線數據流量。頻譜是由政府或者國際機構管理的自然資源,目前使用固定的頻譜分配政策將其分配給持有許可證的人或機構。然而,用戶擁有固定頻譜資源的分配方式使頻譜利用率低下[1]。MITOLA 等[2]提出了認知無線電(Cognitive Radio,CR)用于解決頻譜資源不足和利用率低下的問題。認知無線電技術通過識別主用戶(Primary User,PU)未使用的頻譜空洞,并將它們分配給急需更多頻譜資源的次用戶(Secondary User,SU)[3-4]。雖然在5G 時代可分配足夠的帶寬,但認知無線電仍然是5G 網絡架構之一,發揮著重要作用[5-6]。
博弈論作為一種有效的資源競爭分配方法被廣泛應用于求解認知無線電系統中頻譜管理和頻譜共享等問題[7]。文獻[8]基于感知的多用戶CR 網絡頻譜共享和機會接入模型,建立了stackelberg 博弈模型,并通過干擾價格的形式,在保護PU 收益的前提下最大化SU 的傳輸收益。文獻[9]采用混合交織/下墊方法,通過設置次用戶功率干擾閾值的方式,在不確定主用戶是否存在的情況下避免了主用戶和次用戶之間傳輸發生沖突。文獻[10]考慮信道增益不確定性引起通信中斷概率的情況,提出一種概率約束的魯棒優化資源分配算法,在保證服務質量(Quality of Service,QoS)的前提下降低主發射機的能耗,提高對不確定通信環境的適應性。文獻[11]提出一種新的非合作博弈動態頻譜分配方案,通過考慮具有認知能力的多個蜂窩業務提供商和D2D 業務組,利用Bertrand 博弈理論解決用戶頻譜分配問題,并分別改進了D2D 業務組和蜂窩業務提供商的效用函數。文獻[12]在不完美檢測環境下提出子載波狀態信任指數與統計平均干擾功率的概念,利用拉格朗日對偶理論將資源分配問題分解為和每個認知用戶相對應的獨立子問題,并對各子問題進行求解,得到一種分布式多用戶資源分配方案。然而,上述文獻均未考慮到次用戶優先級的問題。文獻[13]提出基于深度學習的認知無線電網絡資源分配算法,通過引入傳輸速率和傳輸延遲的表型可塑性,獲得一個用于評估次用戶滿意度的函數,仿真結果表明,隨著用戶數量的增加,用戶滿意度保持穩定。文獻[14]建立了聯合頻譜分配與功率控制非合作博弈模型,將隨機學習理論引入到算法中,提出了基于隨機學習的策略選擇算法。文獻[15]以總傳輸速率最大化為目標,以受限頻譜資源及用戶業務需求為約束條件,構建非線性多約束的頻譜資源分配0-1 規劃模型。文獻[16]提出一種基于深度學習的方法,次用戶通過該方法調整其傳輸功率,在與主用戶交互迭代之后,兩用戶都可以成功傳輸自己的數據,并達到所需的服務質量。文獻[17]提出一種分布式自動學習機制用于CR 網絡中的頻譜管理,其中SUs 作為智能代理與RF 環境交互,并通過環境的不同響應以自組織的方式學習選擇合適的頻譜。文獻[18]提出一種基于遞歸神經網絡的預測算法,提高了主用戶出現的預測率。上述文獻中也未考慮到不同業務傳輸的問題。
已有的認知頻譜分配策略主要針對靜止或低速SU,且較少考慮SU 業務等級。為解決高速SU 由于固定分配的頻譜資源不足導致傳輸速率較低甚至通話中斷的問題,本文對高速移動列車上的SU 頻譜博弈分配算法展開研究,考慮PU-SU 通信距離不同所致的發射功率差異性對主服務成本函數和價格函數的影響,同時聯合SU 優先級和業務等級函數構造SU 效用函數,以實現SU 的動態頻譜博弈。
本文考慮如下異構網絡場景:高鐵上的旅客用戶歸屬于某一運營商網絡,進行業務的交互。由于移動業務類型的增多以及數據量的爆炸性增長,這些高鐵旅客用戶的可用無線帶寬可能面臨短缺。在這種情況下,這些高鐵旅客用戶就可以以認知無線電的方式接入其他異構網絡(包括其他運營商網絡或其他已分配出去的授權頻帶),此時,高鐵旅客用戶就成為認知無線電的次用戶SU,而其他運營商網絡或其他已分配出去的授權頻帶中本身存在的授權用戶就是主用戶PU。由于次用戶是非授權用戶,以認知無線電的方式使用授權頻段,因此主用戶在得到一定補償的情況下才會容許次用戶的使用,這時就存在以博弈方式進行頻譜爭用的情況。
在高鐵通信環境下,假設由一個擁有固定頻段的主服務和多個SU(即高鐵旅客)構成頻譜共享系統,如圖1 所示。其中,主服務由多個PU 和主服務控制器(Primary Service Controller,PSC)構成,SU 向主服務控制器發送頻譜申請,主服務控制器判決并向SU 反饋頻譜價格。假設在2 個主基站的覆蓋范圍內存在可供SU使用的相同的頻譜空洞。主服務擁有固定的頻譜資源可供自身使用,其通過出租的方式,在不影響自身使用的情況下,將頻譜資源租借給SU,達到共享資源的目的,主服務自身也能獲得最大收益。

圖1 頻譜共享系統模型Fig.1 Model of spectrum sharing system
SU 是自私的,其通過租借最佳的頻譜資源數量來實現自身利益的最大化。在一個動態頻譜分配模型中,SU 往往希望租借更多的資源,這也就造成了頻譜分配不均和浪費的問題。博弈論適用于解決這種問題,均衡博弈雙方,實現在SUs 中頻譜共享的公平性。
本文對高鐵用戶的優先級和傳輸業務等級進行劃分,達到按需分配的目的。文獻[19]采用了層次分析法,對SU 的優先級θi進行了劃分,定義如式(1)所示。

其中:δ為判決因子;Δ為調節因子;k為映射系數。且δ、Δ、k均為大于零的常數。
考慮到不同業務的QoS 傳輸需求,需要對業務等級進行劃分。本文參考IEEE802.11e 增強型分布式信道接入協議中對業務接入類型的劃分[20],為高鐵旅客用戶定義4 種不同業務等級,分別為VO(Voice)業務、VI(Video)業務、BE(Best effort)業務和BK(Background)業務。以φi作為次用戶i的業務等級因子,定義如式(2)所示。

其中:Ti=Rl·T表示業務類型l的退避時間;Rl為服從[0,Cl]的偽隨機整數;Cl為滿足[Clmin,Clmax)]范圍的正整數;Al為實常數。其他相關參數取值見表1。針對IEEE 802.11e 標準中EDCA 協議[21]不同物理層規范,以Camin和Camax分別表示最小競爭窗口和最大競爭窗口初始化值。

表1 業務類型及其參數Table 1 Service types and their parameters
定義SU 的總收益函數式(3)所示。

其中:c為大于零的常數;p為主服務出租單位頻譜的價格;b為SU 租借的總帶寬。需要注意的是SU 的總收益始終大于零,并且SU 租借的總帶寬不大于空閑帶寬。SU 通過調整向主服務租借頻譜的大小獲得不同的收益,因此,可以在SU 的總收益最大時可以確定SU 向主服務租借的總帶寬:

主服務通過向SU 出租空閑頻譜,調整單位價格的方式,達到主服務的最大收益。在出租帶寬的同時,主服務受到服務質量下降的影響,需要考慮成本因素,重新定義主服務的收益函數如式(5)所示。

其中:a1為大于零的常數,表示租借帶寬對主服務的影響因子;Breq為單個PU 需要的頻譜帶寬;W為主服務的總帶寬;M為在主服務中PU 的個數;Cfix為固定成本。本文將主基站對所有SUs 的總發射功率CP也考慮到主服務的收益函數中,更加符合現實。

在功率成本中,a2為大于零的常數,表示量級統一因子,N為SU 的個數,Pi為主基站對SU 的發射功率。根據式(5)可以確定在主服務收益最大時的單位帶寬價格:

本文考慮高鐵列車的移動性,為確保SU 的服務質量不受影響,在SU 與主基站的距離增加時,主基站對SU 的發射功率也應適當增大。由式(5)可以看出,當發射功率增大時,主服務的收益也將減小,這會影響主服務向次服務租借頻譜的積極性,整個系統的性能將會降低,因此,對單位價格函數進行更新。在此場景下,定義SUi的信噪比如式(8)所示。

其中:h1i、h2i分別表示主基站1 到和主基站2 到SUi的信道增益;P1i和P2i分別為主基站1 和主基站2 對SUi的發射功率。當SUi在主基站1 的范圍內時,ω1=1,ω2=0;當SUi在2 個主基站的重疊區域時,ω1、ω2均為1;當SUi在主基站2 的范圍內時,ω1=0,ω2=1。
根據式(8)可以得到在該信噪比下SUi的功率變化率。由此可對價格函數進行更新,如式(10)所示。

其中:p*為新的價格函數;γ為大于零的常數,表示價格調整因子,體現功率變化率對價格函數的影響程度。
根據SU 的優先級、業務等級以及價格函數,可以將SU 的效用函數定義如式(11)所示。

其中:Ci=bilb(1+Si)為信道容量。式(11)由兩部分組成,第一部分為SUi的收益,第二部分為租借bi帶寬所需的成本。在SUi最大效益處取得最優帶寬bi,即當0 時:

SU 租借的總帶寬可以表示為:

在無線通信中,認知用戶分為合作博弈和非合作博弈,因此,分這2 種情況進行討論。當認知用戶是合作博弈時,認知用戶具備其他認知用戶的完全信息,在博弈開始時,以較小的帶寬接入,在下一時刻,則會根據其他認知用戶的信息計算出自身最優帶寬,并向主服務租借:

當認知用戶是非合作博弈時,在博弈開始同樣以較小的帶寬接入,在之后的每一時刻,認知用戶都會試探性的增大或減小申請帶寬,計算該時刻的邊際效益并在下一時刻申請帶寬,如式(19)所示。

其中:αi為步長因子,將影響收斂到最優帶寬的速度。為取得使動態博弈穩定的αi,將代入雅可比矩陣:

令雅可比矩陣的特征值小于1,得到關于αi關系式,即為不完全信息的穩定區間。
在Matlab 環境下對本文算法進行仿真驗證。設置主服務的總帶寬W為50 MHz,主服務中包含3 個PUs,每個PU 所需的帶寬Breq為5 MHz,價格影響系數γ=0.5。如圖1 所示,主基站覆蓋鐵路的范圍為3 km,主基站距離鐵路的垂直距離為50 m,在2 個主基站的覆蓋范圍中存在寬度為300 m 的重疊區域,列車速度為360 km/h。本節對該環境中的2 個SU 進行分析,2 個SU 的優先級權重設置為0.75 和0.25,得到優先級因子為θ1=1.1 和θ2=0.9。背景噪聲為N0=-80 dBm,信道參數A=0.097,無線傳播損耗因子 為m=3,根 據IEEE 802.11e 的EDCA 協 議[21],T=20 μs,最小競爭窗口Camin=31,最大競爭窗口Camax=1023。
圖2 為該環境下主基站的對SU 的發射功率情況。場景中的列車在運行時,SU 與主基站的距離將會發生變化,也將影響無線通信傳輸的信道增益hi。SU1的信噪比設置為15 dB,SU2的信噪比設置為12 dB。可以看出,當距離在不斷增加時,主基站對SU 的發射功率也相應增加,信噪比越大,發射功率越大,功率變化率越快。

圖2 不同信噪比下的發射功率Fig.2 Transmitting power under different SNR
圖3 為在本文考慮場景下的帶寬分配情況。為確保SU 的通信質量,SU 和主基站的距離增加,SU 租借的帶寬保持緩慢增大,在重疊區域時,保持平穩的趨勢,避免了SU 從基站1 的范圍進入基站2 的范圍時發生帶寬突變情況。可以看出,在SU 優先級相同時,不同業務等級租借不同的帶寬,業務等級越高租借的帶寬也越多,隨著距離的變化,較高的業務等級頻譜變化較為迅速;同一業務等級下,用戶優先級高的,會租借到更多的頻譜。

圖3 不同業務等級的靜態帶寬Fig.3 Static bandwidth of different service levels
圖4 為PU 的個數對SU 租借帶寬的影響。在頻譜分配中,主服務擁有的總帶寬、PU 的個數M、PU所需的帶寬Breq以及SU 的個數都將會影響SU 租借到的總帶寬。此處以PU 的個數M為例進行分析,可以看出,在靜態納什均衡下,SU 租借的總帶寬和系統中PU 的個數呈線性關系,PU 的個數增加,SU 租借的總帶寬將減小。同一PU 個數時,SU 的業務等級越高,SU 租借到的總帶寬越多。

圖4 主用戶個數對頻譜共享的影響Fig.4 Influence of number of primary user on spectrum sharing
SU 的策略受到另一個SU 策略的影響,兩個SUs策略的交點即為納什均衡點。圖5 為靜態納什均衡,SU1和SU2的信噪比分別為15 dB、12 dB,從圖中可以看出業務等級高的用戶始終具有較多的帶寬。

圖5 靜態納什均衡Fig.5 Static Nash equilibrium
圖6 和圖7 為動態博弈結果。動態博弈通常采用迭代的方式,給定2 個SU 初始的租借帶寬,根據SU 的邊際效益逐漸調整請求帶寬,直到SU 的請求帶寬達到最優。此處設定初設帶寬為1 MHz,2 個SUs 的信噪比都為12 dB。在2 個SU 的業務等級都為4 的基礎上進行仿真,如圖6 所示。可以看出,在10 次迭代后動態博弈達到穩定狀態,且可以較好的收斂到靜態博弈的最優值。圖7 在2 個SU 具有相同優先級即θ1=θ2=1 的基礎上,比較不同業務等級的收斂狀況,表明算法可以達到穩定,且收斂到最優帶寬。αi的值將會影響系統的穩定性,以及收斂到最優值的速度,在這兩個圖中可以明顯看出αi的值越小,收斂到最優值的速度越快。對于同一優先級、不同業務等級,αi的值越小,業務等級高的用戶收斂到最優值的速度越快。

圖6 同一業務等級的動態博弈結果Fig.6 Dynamic game result with the same service level

圖7 同一優先級的動態博弈結果Fig.7 Dynamic game result with the same priority
本文提出一種針對高鐵通信場景的認知博弈頻譜共享算法。將SU 優先級和用戶業務等級以及主基站到SU 的發射功率引入到博弈算法中,基于SU 的移動性更新價格函數,以此完成SU 間的博弈頻譜分配,并分別從SU 完全信息和不完全信息分析動態博弈,確定動態博弈的穩定區間。MATLAB 仿真結果表明,該算法可在認知頻譜分配中準確體現高鐵旅客用戶的業務等級需求。下一步將對算法進行優化,降低迭代次數并提升系統性能。