劉愛民 曾凡仔 陳嘉貝



摘要:隨著認知無線電(CR)技術的發(fā)展,協(xié)作認知無線電網(wǎng)絡(CCRN)成為提高頻譜利用效率和解決頻譜稀缺問題的有效途徑。而且,無線通信系統(tǒng)中的過度能量消耗已變得越來越重要。能量采集(EH)被認為是緩解此類問題的有效解決方案。然而,由于自然能量的隨機性和間斷性,從自然能源采集的能量不能保證EH網(wǎng)絡中令人滿意的服務質量(QoS)。混合能源供應已經成為解決不穩(wěn)定電力供應問題的一種新模式,這意味著,這樣的網(wǎng)絡是由固定電源能量和采集能量共同提供動力。提出了一種新的混合能量供應認知無線電網(wǎng)絡協(xié)作頻譜租借方案。主用戶(PU)雇傭次用戶(SUs)作為協(xié)作中繼,SUs通過從PU的RF信號中采集的能量來幫助PU傳輸數(shù)據(jù),作為回報,PU授予SU接入信道的權利。PU的目標是通過與SUs合作來最大化其收益并節(jié)約自身能源,而SU旨在最大化其吞吐量和能源利用率。將此模式制定為Stackelberg博弈。最后,通過遺傳算法解決了PU和SU在定價和頻譜租借中的最優(yōu)策略問題。
關鍵詞:認知無線電;協(xié)作頻譜租借;斯坦克爾伯格博弈;能量采集;遺傳算法
中圖分類號:TP393.1
文獻標識碼:A
認知無線電已經作為非授權次用戶(SU)動態(tài)地接入主用戶(PU)的授權頻譜以提高頻譜利用率的一種手段。它被設計成一個具有觀察,推理,決定和合作能力的智能無線電[1-2]。近年來,協(xié)作認知無線電網(wǎng)絡(CCRN)這樣一種新型認知無線電模式被廣泛應用[3]。在CCRN中,PU雇傭若干SU作為中繼幫助PU傳輸數(shù)據(jù)并且給他們部分頻譜資源接入時間作為回報。這樣的一種合作模式導致的結果就是,PU不僅可以獲得顯著的效益,SU也有機會傳輸自己的數(shù)據(jù),從而實現(xiàn)“雙贏”。
盡管傳統(tǒng)的CCRN框架既可以使PU和SU都受益,但仍然存在效率低等弊端。近年的研究主要考慮鏈路層頻譜租賃,并假設主網(wǎng)絡中只有一條鏈路,例如[3-4]。在現(xiàn)實世界的系統(tǒng)中,網(wǎng)絡通常由多個用戶和多個鏈路組成,頻譜租借在網(wǎng)絡層面上才能更好地進行。并且,在未來,動態(tài)頻譜共享模式最有可能是具有多個PU和SU的二級頻譜市場。在同一地理位置,不同的PU在不同的授權頻段上運行,并面臨越來越多的SU要求頻譜租借的事實。當然,每個用戶都是理性和自私的,他們只關心自己的回報,并始終遵循最佳策略,從而最大化他們的效用。
使用合作多樣性來提高認知無線電網(wǎng)絡的性能引起了廣泛的關注。其中一類工作的重點在SU之間的合作以改善次級網(wǎng)絡(SN)的性能,如[5-6]。另一個CCRN的重點是PU和SU之間的合作溝通。
考慮具有一對主收發(fā)器和多對次收發(fā)器的CR系統(tǒng),其以時隙模式操作。文獻[7,8]均考慮了多中繼的合作模式,文中同樣采用文獻[7,8]提到的MRC技術,最大比合并(MRC)是分集合并技術中的最優(yōu)選擇,相對于選擇合并和等增益合并可以獲得最好的性能。波束成形技術近年來在多天線、多用戶的網(wǎng)絡模型中應用廣泛[9,10],其目的主要是通過編碼信號來防止信號之間的干擾,在本文中,我們同樣也用到這樣的技術,使主用戶和次用戶之間信號傳輸不會相互影響。由于從自然能源收集的能量動力和能量儲存能力有限,這種能源可能無法保證為SU提供足夠的電力供應。在模型中,SU發(fā)射機主要從PU的相對穩(wěn)定的RF信號采集的能量供電,即,SU發(fā)射機具有混合電源。在這樣的網(wǎng)絡中,如果SU的電池中存儲了足夠的綠色能源,則SU采用采集的能源。最大限度地利用綠色能源來優(yōu)化這種網(wǎng)絡中的能源利用,從而節(jié)省固定能源的消耗。頻譜感知和SU的預期吞吐量之間的基本平衡已經在[11]中進行了深入分析,重點在時間維度上的資源分配以及研究最優(yōu)感知持續(xù)時間以最大化SU實現(xiàn)的吞吐量不低于預定義的檢測級別。受到了[11]的啟發(fā),本文中,主要關注PU和SU的吞吐量以及效用值。這項工作的主要工作總結如下:
1.提出了一種新型的CCRN系統(tǒng)架構。研究一個PU和多個SU的情況。為了使SU能夠獲取更強的信號,運用了波束成形的設計。然后將這一模型放人在Stackelberg博弈框架下分析問題。最優(yōu)策略也將由Stackelberg博弈均衡得到。
2.考慮如何用PU頻譜接人時間的一部分來激勵給SU,如何確定租賃價格以最大化其效用,如何激勵SU作為合作中繼,并確定最優(yōu)合作策略,以及如何為PU和SU節(jié)省能源。
3.由于直接求解最優(yōu)策略相對復雜,設計了一種遺傳算法求解博弈均衡,之后,還設計了一個迭代算法實現(xiàn)Stackelberg博弈的最優(yōu)策略。
其余部分安排如下。在第二節(jié)中,詳細描述了系統(tǒng)模型。在第三節(jié)中,確定了效用最大化問題。第四節(jié)中將用Stackelberg博弈來獲得最優(yōu)策略。第五節(jié)中將會介紹本文中用到的兩個相關算法,數(shù)值仿真結果以及結果分析在第六節(jié)中給出。最后在第七節(jié)得出結論。
1 系統(tǒng)模型
考慮的認知無線電網(wǎng)絡,它由一對主收發(fā)器和多個次收發(fā)器組成,并且它們都以時隙模式工作。
在本文中考慮了協(xié)作頻譜租借模式,也就是說,只要有數(shù)據(jù)要發(fā)送,PU就優(yōu)先使用授權頻譜。假設在每個時隙中,都有一定數(shù)量的數(shù)據(jù)存儲在其緩沖區(qū)中。主傳輸完成后,授權頻譜的狀態(tài)變?yōu)榭臻e狀態(tài)。此外,PU知道SU的存在,并且為了從SU得到回報,一旦許可信道空置,PU允許沒有頻譜資源的SU接入頻譜并且發(fā)送SU的數(shù)據(jù)。在這種情況下,為了贏得數(shù)據(jù)傳輸?shù)臋C會,SU可以選擇等到主傳輸完成或作為中繼來縮短主傳輸時間。
由于自然能源的間歇性和動態(tài)性,收集的能量并不穩(wěn)定,不夠支持整個傳輸過程,因此在的工作中,考慮混合能源供應的網(wǎng)絡。在這個框架中,不是從動態(tài)的自然能源采集能量,而是在PU正在傳輸其數(shù)據(jù)時,SU從更穩(wěn)定的RF信號中采集能量。SU大量使用采集的能量,當采集的能量太少以至不能支持整個通信過程時,SU可以使用固定電源來確保穩(wěn)定的傳輸。我們還假定SU的收發(fā)器中只有一個天線,遵循save-then-transmit協(xié)議。在每個時隙中,次用戶首先使用一部分時間進行能量采集,然后盡量使用采集的能量進行中繼和自身數(shù)據(jù)傳輸,當采集的能量不足以支持通信時,則切換到固定電源。本文中PU和SU之間的協(xié)作通信采用了解碼轉發(fā)(DF)協(xié)議。
如圖1一圖4所示,文中無線通信過程共有四個步驟。也就是說,如圖5所示,我們模型中的一個時隙被分成四個部分用于兩種不同類型的用戶,具體描述如下:
1.時間段(0,pT):當PU將其數(shù)據(jù)直接從主發(fā)射器( PT)發(fā)射到主接收器(PR)時,ST,可以同時從PU的RF信號獲取能量。在此期間表示ST,收獲能量為:
其中,pT表示整個時間幀的一部分,0≤p≤1。PT在(0,pT]時間段內將數(shù)據(jù)直接發(fā)送給PR,同時,SU能從PT相對穩(wěn)定的RF信號中采集到能量。我們用來Xi表示STi的能量采集速率,即單位時間內采集的能量,只從PU的RF信號中獲取能量,RF信號相對穩(wěn)定,所以可以假定在整個幀持續(xù)時間內能量采集速率是恒定的,但是在不同幀內,不同的采集速率是不一樣的。假設PU數(shù)據(jù)率為,PU以功率直接傳輸其數(shù)據(jù)給PR。根據(jù)香農定理,其功率與傳輸速率的關系可以表述如下:
PU和SU采用合作傳輸模式的前提條件是協(xié)作傳輸速率Pps(S)應該大于直接傳輸速率Rpu,所以信道增益hps,i應該大于hpp。在這種情況下,PU的數(shù)據(jù)采用直接傳輸本可以在一個時隙中完成,合作模式下有SUs作為中繼來轉發(fā)縮短了主數(shù)據(jù)的傳輸時間,這就確保了SU可以贏得傳輸機會。
一旦STi解碼了數(shù)據(jù),它就可以從其它STj的RF信號中獲取能量。每個STi所需要的接收解碼數(shù)據(jù)時間可以表示為:
3.時間段:在這段時間內扮演中繼的角色,以最大功率轉發(fā)原始剩余數(shù)據(jù)到PR,其數(shù)據(jù)傳輸速率為。參考文獻[8]對多中繼SNR的處理方式,假設接收機在解碼信號之前利用最大比率組合(MRC),則PR處的有效SNR等于來自所有的SNR的總和。協(xié)作鏈路可達到的傳輸速率為:
2 問題分析
在本節(jié)中,將介紹一種基于效用的合作頻譜租借機制。用戶在系統(tǒng)中的效用值與其吞吐量以及能效有關。一方面,PU雇傭SU作為中繼來最大化頻譜租借費用并節(jié)約自身能量。另一方面,SU旨在通過與PU合作并通過從PU的RF信號收集能量來最小化固定能源消耗并盡可能提高其吞吐量。
3 最優(yōu)頻譜租借策略
根據(jù)以上分析,可以把該優(yōu)化問題建模成斯坦科爾博格博弈。在系統(tǒng)模型中,主用戶是頻譜的授權使用者,對頻譜具有絕對的優(yōu)先使用權,因此主用戶作為斯坦科爾博格博弈的領導者,次用戶作為跟隨者。目的就是要得到斯坦科爾博格博弈的均衡,即領導者與跟隨者均達到一個最優(yōu)狀態(tài),均不會試圖偏離這個均衡點[12]。基于以上的分析,可以將最優(yōu)頻譜租借策略表述為:
4.1 遺傳算法
借鑒生物進化理論,將遺傳算法需要解決的問題建模為生物進化過程,通過復制,交叉,變異等操作產生下一代解,逐步淘汰適應度低的個體,遺傳適應度高的個體。N代演化以后就能得到相應的最優(yōu)個體。
在模型中,當求解最優(yōu)策略ρ時,使用八位二進制數(shù)編碼ρ,因為p的值范圍為[0,1],所以求得的ρ值可以精確到小數(shù)點后兩位,實驗種群是由四組編碼的ρ組成。由于的目標是找到PU的最大效用函數(shù)值,將適應度函數(shù)設置為PU的效用值。當適應度值越大時,下一代被遺傳下來的機會就越大。
同樣的,在計算SU,的最大效用值和相應的ci時,由于ci也是一個有限的值,同樣可以把ci編碼并且產生初始種群,然后進行一系列的復制,交叉,變異等操作求得最優(yōu)效用值和對應的ci。
4.2 迭代算法
該迭代算法包括多次用戶和主用戶之間的相互影響更新。緩存的初始狀態(tài)設置方法有許多方法,例如通過歷史經驗設置初始狀態(tài)值(ρ,c0,cl,…)或者設置為0然后主用戶和次用戶可以按照上述迭代算法進行不斷更新最佳策略,直到收斂。
從圖中可以看出價格和頻譜接入時間分配策略對主次用戶的效用具有很大的影響。
圖9和圖10展示了SU的數(shù)量對PU和SU,效用的影響。圖9和圖10中的“非協(xié)作模式”意味著PU不會將頻譜租給任何SU,也就是說,這意味著p等于零,并且SU支付給PU的等于零。從數(shù)值仿真圖上可以看出,與非合作模式相比,合作模式下的PU和SUs獲得了更高的效用值。但是,隨著SU數(shù)量的增加,為了獲得更多的時間用于接入頻譜,SU的競爭變大,導致每個SU的效用下降,但是PU和整個網(wǎng)絡的效用依舊增加。在非合作模式下,每個SU在整個過程中收集來自PT的RF信號,并且在該模式下,PT以廣播的形式發(fā)送信號,因此SU,的效用與SU的數(shù)量多少無關。
6 結論
提出了一個協(xié)作通信頻譜租借模型,通過定價和頻譜接人時間分配策略來最大化主用戶和次用戶的效用,該主用戶為了增加收益而將一些頻譜接入時間租用給次用戶,并且利用次發(fā)射機作為用于主數(shù)據(jù)傳輸?shù)闹欣^。將主用戶和次用戶之間的頻譜共享建模為Stackelberg博弈,并通過智能算法求解出頻譜接人時間分配和頻譜定價的最佳策略。數(shù)值分析表明,在這種合作頻譜租賃和能量采集方案下,存在一個最優(yōu)策略可以使PU和SUs的效用最大化。
參考文獻
[1]
HU S, YAO Y D,YANC Z.MAC protocol identification approachfor implement smart cognitive radio[C]//IEEE Intemational Con-ference on Communications, IEEE, 2012:5 608-5612.
[2] HU S,YAO Y D,YANG Z.MAC protocol identification usingsupport vector machines for cognitive radio networks [J]. IEEEWireless Communications, 2014, 21(1 ):52-60.
[3] SIMEONE 0,STANOJEV I, SAVAZZI S,et al.Spectrum leasingto cooperating secondary Ad Hoc networks[J].Selected Areas inCommunic ations IEEE Journal, 2008, 26(1):203-213.
[4] ZHANG J, ZHANG Q. Stackelberg game for utility-based cooper-ative cognitiveradio networks[C]//ACM Interational Symposiumon Mobile Ad Hoc NETWORKINC and Computing, MOBIHOC2009, New Orleans, La, Usa, May.DBIP, 2009:23-32.
[5] JIA J,ZHANC J,ZHANG Q.Relay-assisted routing in cognitiveradio networks[J]Inform.IEEE, 2009:1-5.
[6] JIA J, ZHANC J,ZHANG Q. Cooperative relay for cognitive radi。
networks[C]//INFOCOM. IEEE, 2009:2304-2312.
[7]
WANG X,WANG Y,ZHANG Y,et al.Approximate analysis onuplink sum rate with MRC receivers in massive MIMO systems[C]//International Symposium on Wireless Personal MultimediaCommunications,IEEE, 2017.
[8]
HO-VAN K.Exact outage probability analysis of proactive relayselection in cognitive radio networks with MRC receivers[J].Joumal of Communications&Networks, 2016,18(3):288-298.
[9]
SHENG Z, TUAN H D,DUONG T Q,etd.Optimal beamformingfor physical layer security in MISO wireless networks [J]. IEEETransactions on Signal Processing, 2018:12-20.
[10] BANERJEE S,DWIVEDI V V.Comparative analysis of adaptivebeamforming techniques [J]. Progress in Intelligent ComputingTechniques: Theory, Practice, and Applications, 2017: 357-364.
[11] LIANG Y C,ZENG Y,PEH E C Y,et al.Sensing-throughputtradeoff for cognitive radio networks [J]. Wireless Communica-tions IEEE Transactions on, 2008, 7(4):1326-1337.
[12] FAHIMI M,GHASEMI A.Joint spectrum load balancing andhandoff management in cognitive radio networks:a non-coopera-tive game approach[J]. Wireless Networks, 2016, 22(4):1161- 1180.
[13] SHENF, LID, LINPH,etd.Auction based spectrum sharing for hybrid access in macro -femtocell networks under QoS require-ments[C]//IEEE Intemational Conference on Cormuunications,IEEE, 2015:3335-3340.