羅 歡, 曹開田, 錢 平, 鄧 菲
(上海應用技術大學 電氣與電子工程學院,上海 201418)
當前,無線頻譜資源具有分配不均勻和利用率低的特點。這些特性不僅導致了頻譜資源的巨大浪費,而且極大地阻礙了無線通信技術的發展。認知無線電(cognitive radio,CR)作為一種頻譜再利用技術,因其在提升頻譜利用率,解決無線通信中頻譜匱乏等方面表現出來的巨大優勢,越來越受到人們的重視[1]。頻譜預測技術應用于CR網絡中能夠顯著改善系統延時,提高靈敏度,減少信道沖突,對于提升CR系統性能具有重要意義。
頻譜預測技術一直以來都是CR中十分重要的部分,國內外學者對此也進行了廣泛的研究。Sun等[2]從性能界限的角度分析了頻譜狀態的可預測性,為頻譜狀態預測提供了理論依據。Ding等[3]從時域、頻域、空間域對頻譜預測算法及應用進行了綜述,并討論了其在5G等方面的應用。Zhao等[4]提出了一種新的基于預測的頻譜管理策略,綜合考慮了頻譜占用信息和用戶遷移率,同時提出一種多通道同時可用的信道選擇方案,能夠更有效地分配頻譜資源。本文分別從頻譜感知、頻譜決策、頻譜遷移和頻譜共享4個方面介紹頻譜預測技術的發展與應用。
基于預測的頻譜感知[5]是CR技術的基礎,它為后續的頻譜決策,頻譜遷移,頻譜共享提供可能。頻譜決策[6-7]為次用戶(secondary user,SU)選擇最合適的信道進行通信。頻譜切換[8-9]的目的是保證SU通信質量和避免對主用戶(primary user,PU)造成干擾。頻譜共享[10-11]是解決頻譜利用率低的最主要的途徑,具體結構如圖1所示。

圖1 結構示意圖
頻譜感知是CR核心技術之一。基于預測的頻譜感知能夠顯著縮短感知周期,降低系統感知時延,有效提升頻譜資源利用率。因此,無論是在時域,頻譜還是在空間域,基于預測的頻譜感知都得到了長足的發展。
在時域頻譜預測中,SU通過歷史頻譜信息建立頻譜占用模型實現頻譜感知。不同的預測模型適用于不同的外界環境和感知需求。隱馬爾可夫模型是時域頻譜感知中廣泛使用的一種數學模型,其基本模型如圖1所示,其中Y相當于觀測變量,X相當于隱變量,由觀測變量Y可以得到隱變量X的狀態。

圖2 隱馬爾可夫模型示意圖
Eltom等[12]在隱馬爾科夫模型的基礎上,以狀態轉移矩陣為目標進行頻譜感知,結構簡單,實用性強。但是其模型中假設的過去狀態(即當前以前的歷史狀態)與將來狀態(即當前以后的未來狀態)是無關的,在實際系統中并不常見。對此,Chen等[13]使用高階隱馬爾科夫模型,充分利用之前幾個狀態的數據進行預測,有效提升了系統預測感知的準確性。同時,對應于狀態不完全可觀的系統,Jiang等[14]引入狀態部分可觀的隱馬爾可夫模型,并提出了一種基于仿真的梯度算法來計算最優自適應感知策略。該自適應感知策略具有較低的計算復雜度,即使在低信噪比的擁擠頻譜中也能取得較好的性能。相對于隱馬爾可夫模型,基于人工神經網絡算法的模型具有更高效的預測機制。人工神經元模型的數學模型可用下式表示:
(1)
式中:x為神經元輸入;w為對應權值;θ為閾值;f(·)為激活函數;y為輸出。
文獻[15-16]中分別提出了前饋神經網絡模型和反饋神經網絡模型兩種人工神經網絡模型。相較而言,反饋神經網絡模型將歷史數據引入狀態預測算法中,比前饋神經網絡模型具有更好的感知性能。基于深度學習算法的模型在預測的頻譜感知中也有廣泛的應用。在文獻[5]中,作者開發了一個基于深度學習的頻譜預測框架,提出一種長短期記憶(long short-term memory,LSTM)模型,在協作中繼網絡和5G網絡中應用廣泛。LSTM模型將傳統循環神經網絡(recurrent neural network,RNN)中的隱含層換成存儲塊,當誤差從輸出層反向傳播回來時,可以使用模塊的記憶元記下來,有效地避免了RNN網絡中反向傳播時梯度指數衰減的現象。所以 LSTM 可以記住比較長時間內的信息。作者利用 5 270~5 290 MHz 頻段對線性LSTM網絡模型進行測試,結果顯示在90%以上的頻段LSTM網絡的均方誤差<15.2。支持向量機模型(support vector machine,SVM)[17]在頻譜預測感知中也發揮重要作用。然而SVM增加了算法復雜性,使系統延時有所增加。
頻域頻譜預測致力于根據已獲得的感知結果來推斷相鄰或其他信道的狀態。Ding等[18]開發了一個魯棒的在線頻譜預測(robust online spectrum prediction,ROSP)框架,應用于不完全感知及復雜干擾條件。首先對真實的頻譜測量數據進行分析,揭示頻譜演化的相關結構,并分析異常對頻譜矩陣秩分布的影響。然后,從頻譜-時間二維角度,通過有效地集成時間序列預測技術,將ROSP問題轉化為矩陣完成和恢復的聯合優化問題,并提出了一種交替方向優化方法來有效地求解。作者分別分析了數據丟失、數據錯誤等因素對系統的影響,并分別使用電視頻段、ISM頻段等多種頻段進行仿真。仿真結果顯示,文獻中所提方法較傳統時頻域聯合頻譜預測方法具有一定優勢。在電視頻帶下,當注入錯誤數據概率在20%的條件下ROSP的均方誤差具有約 5 dB 的優勢。但是,當數據誤差率達到50%時,Ding等[18]所提方法性能出現大幅下降,在更高誤差率條件下,該方法的有效性難以保證。
空間域頻譜預測在推斷頻譜狀態的同時考慮SU的位置移動性和CR系統覆蓋區域。Ma 等[19]提出了一種 sub-Nyquist寬帶頻譜傳感與地理定位數據庫的有效聯合方案,改進了子空間增廣貪心算法,引入了來自地理定位數據庫的先驗信息,從而使局部頻譜感知能在有限數量的電視空白頻譜上進行。該方法的局限性在于引入壓縮感知,需要建立在樣本稀疏性的基礎上來實現,對樣本的范圍是一種限制。同時在信號數據壓縮和恢復的過程中不可避免的造成數據的缺失與失真,文獻中并沒有明確這一條件的影響。
現有基于預測的頻譜感知方案仍有以下幾個問題亟待解決:①低信噪比,復雜電磁環境下的感知;②對于大批量數據的處理;③不完全感知條件下,保證感知結果的正確性。未來,從時間、空間和頻率3個維度獲取頻譜信息將是一個熱點問題。考慮實際應用,各種算法在多輸入多輸出系統的應用也應受到重視。
頻譜決策要求CR根據空閑頻譜的特征和用戶的需求選擇出合適的空閑頻段來進行通信,并根據對頻譜環境的預測適時地調整傳輸參數。相應地,可以從動態頻譜分配、信道選擇和動態頻譜接入3個方面分別來論述基于預測的頻譜決策的發展。

從感知結果中選擇一條最優的信道是頻譜決策中一個非常重要的內容。通過信道的歷史信息來預測未來最佳頻譜使得網絡對沖突的響應時間更短是信道選擇的一個重要任務。貝葉斯推理能夠將先前的知識和經驗包含在正在構建的模型中,在信道狀態預測中具有明顯優勢。貝葉斯公式:
(2)
式中:事件Bi的概率為P(Bi);事件Bi已發生條件下事件A的概率為P(A│Bi);事件A發生條件下事件Bi的概率為P(Bi│A)。
Reyes等[21]通過貝葉斯推理建立一個信道占用概率預測模型以協助CRNs中頻譜決策的過程,推導出信道占用概率表達式:
式中:Posocc為后驗概率;Priocc為第一次迭代的先驗概率;Locc為釋然概率;Pocc為特定分布的先驗概率。為了隨后的迭代,先前的Priocc是過去迭代后的Posocc。由于其具有學習能力,可以處理信道建模過程中的一些不確定因素,同時其能夠充分利用先前感知數據,以及對感知精度參數調整,貝葉斯推理應用于信道選擇過程中,具有很強的靈活性。
文獻[7]中提出一種由估計和排序組成的方法,保證了SU之間的公平性。在用時隙表征預測過程的方式中,當劃分的時隙個數T達到 100 000 時,SU在每個時隙中進行信道切換概率能夠降至接近0.01,性能優異。但是,文獻中假設信道狀態平穩,在實際應用中具有一定的局限性,信道狀態非平穩條件下,該方法的性能有待考證。
動態頻譜接入是實現頻譜效率優化不可或缺的一步,在整個CR系統中占據十分重要的地位。文獻[17]中引入SVM預測模型,對給定信道中授權用戶空閑狀態持續時間和占用狀態持續時間的概率密度進行評估,可以對頻譜實時檢測結果進行評估和修正,降低誤報概率和誤判概率對認知系統的影響。但是其算法相對復雜,系統時延增加。考慮到信道狀態隨時間變化的情況,Xu等[22]將時變環境下用戶之間的交互描述為一個非合作博弈,提出了一種超越期望優化的分布式學習算法。仿真結果顯示,該算法能在動態不完全信息約束下獲得穩定解。分布式的方式最大化特定的網絡實用程序,而不需要用戶之間進行在線協調或消息交換。但是,由于狀態空間大、狀態的局部可觀測性強,通常求解頻譜訪問問題的最優解計算量大。Naparstek 等[23]提出了一種基于深度多用戶強化學習的分布式動態頻譜訪問算法,在大狀態空間和部分可觀系統中表現優異。基于深度學習的算法具有靈活高效的特點,SU用戶之間不需要在線協調、消息交換或載波感知。文獻的不足之處在于,其沒有考慮感知過程中信號的缺失及錯誤問題,這在實際條件下是不可避免的。研究者針對LTE白空間的開發,設計并實現了基于生存分析的動態頻譜訪問算法。用空白空間利用率和主次用戶碰撞率來衡量算法的性能,在請求到達時間為200 ms時,空白空間利用率能夠達到44%左右,碰撞率低于0.1。同時,表明了只要累積危險函數是相似的(就斜率而言),算法可以使用任何數據集進行訓練,并在另一個數據集上運行。但是文章中并沒有明確相似性的數學表達[24]。
動態頻譜分配過程需要綜合多方面信息,不可避免的造成數據量巨大,這對算法的先進性,以及硬件方面的要求相對較高。有效區分并提取感知過程獲取的最有效的信息,獲取性能與開銷的平衡將是解決頻譜分配問題的有效途徑。信道的非平穩狀態對于信道選擇算法是一個極大地挑戰,它對于算法的自學習能力要求較高。在研究動態頻譜接入過程中,很多學者將PU和SU的到達概率分布設置為指數分布,而其他分布條件下以及非固定分布條件下的研究較少涉及,這將是下一步工作的方向。
CR系統中,SU在使用空閑頻譜的過程中不可避免的會受到外界環境的干擾。當PU回歸,或者當前信道無法滿足SU通信需求時,SU需要及時的進行頻譜切換以避免對PU造成干擾或滿足SU自身的通信需求。基于預測的頻譜切換能夠通過不同的預測方法獲取信道信息以實現這一目的。
排隊論在頻譜切換中也是一種比較常見的方法。研究排隊系統問題的主要目的是研究其運行效率,考核服務質量,以便據此提出改進措施。通常評價排隊系統優劣有6項數量指標。①系統負荷水平ρ:它是衡量系統在承擔服務和滿足需要方面能力的尺度;②系統空閑概率P0:系統處于沒有用戶來到要求服務的概率;③隊長:系統中排隊等待服務和正在服務的用戶總數,其平均值記為Ls;④隊列長:系統中排隊等待服務的用戶數,其平均值記為Lg;⑤逗留時間:一個用戶在系統中停留時間,包括等待時間和服務時間,其平均值記為Ws;⑥等待時間:一個用戶在系統中排隊等待時間,其平均值記為Wg。M/M/1排隊系統是一種最簡單的排隊系統,系統的各項指標可由圖3中狀態轉移速度圖推算出來(見表1),其中λ為到達率,μ為服務率。

圖3 排隊論中狀態轉移速度圖

表1 M/M/1排隊模型指標
文獻[25]中采用M/M/1排隊模型進行建模。仿真結果如下:在服務率為1,SU到達率為0.5的條件下,SU平均等待時間為1 s,平均服務時間為1.987 s;PU到達率為0.1的條件下,PU平均服務時間為1.18 s。該方法的不足之處在于M/M/1排隊模型表示系統具有泊松到達過程,服務時間呈指數分布,只有一個信道服務,條件過于苛刻。同時,該方法沒有考慮SU的不同需求。在文獻[26]中,作者提出了一種基于自由裁量規則的混合排隊模型來表征二級用戶之間的頻譜訪問優先級。然后利用該混合排隊模型計算了頻譜切換過程中的信道等待時間。同時,針對現有的CRNs認知引擎側重于通過SU自學習來適應頻譜。文獻中提出知識轉移的概念——多個已經成熟的SU與一個沒有經驗的SU分享他們的頻譜適應策略。作者在強化學習的基礎上增加多教師學習的算法,以實現新SU出現時迅速獲取環境參數,在切換性能方面表現良好,但是算法復雜。
主動式的頻譜切換以其低延時,高吞吐量的特性在PU流量高時具有良好的性能,在5G網絡、大規模MIMO系統中應用廣泛。而被動式的頻譜切換能夠在PU流量比較輕的時候有效降低切換過程的功耗。在文獻[8]中,作者評估了主動和被動頻譜切換策略在CRNs中的應用,還實施了一個混合頻譜切換方案,基于PU流量強度選擇性地使用被動或主動切換。仿真結果表明,當PU數據流量在2 kpt/s時,SU的丟包率可以控制在16%左右,明顯低于主動式或被動式頻譜切換策略。當PU數據流量達到10 kpt/s時,SU的平均數據延時達到0.24 s,此時系統時延增長迅速。此外,文獻中對于主被動切換模式選擇時的閾值設置沒有明確的指明來源。
頻譜切換過程中,需要綜合考慮系統的吞吐量和時延,需要在兩者之間進行權衡,根據現實情況來調整算法,以滿足實際需求。不同的SU對于網絡的需求也不盡一致,對SU分級的算法能更好的滿足現實條件,也會是研究的重點方向。
頻譜共享是解決傳統頻譜分配方式下頻譜利用率低,頻譜資源供需矛盾等問題的重要途徑。通過將指定頻段的電磁頻譜按一定的規則分配給不同用戶使用,頻譜共享可以有效提升頻譜使用率。上文所述頻譜感知、頻譜決策、頻譜切換都是實現頻譜共享的步驟。但是頻譜共享不僅包含上述3個部分,更多的涉及整個系統過程的框架設計與實現。
Garcia等[27]提出一種應用于未授權的大規模多輸入多輸出(massive multiple-input multiple-output unlicensed,mMIMO-U)系統的頻譜共享方法,提升了無線局域網(wireless local area networks,WLAN)的吞吐量。在文獻設置條件下,當天線數NA=64和NA=128時,基站接收到的總干擾在 95%的時間分別小于 -81 和 -89 dBm,遠低于閾值。文獻的限制在于其假設PU的信道增益總是遠小于SU的中繼信道增益,既沒有明確遠小于的數量關系,而且具有片面性。文獻[28]中提出了一種認知非正交多址(non-orthogonal multiple access,NOMA)方案,將CR與NOMA相結合,實現無授權頻帶的機會共享,是5G網絡中一種全新的共享方式。在信噪比SNR為20 dB時,PU掉線率約為0.026,優于實驗參照的其他方法。但是在SNR低于15 dB的條件下,SU的掉線率相對較高。由于CR與NOMA的結合,系統內部的干擾控制也是一個巨大的挑戰。文獻[29]中提出雙向中繼系統中具有雙向傳輸的協同頻譜共享,SU通過正交頻分復用的雙向中繼幫助PU實現其雙向目標速率。作為回報,PU允許SU在子載波的子集上雙向通信。該方法大大提高了SU的傳輸效率,使頻譜效率得到大幅提升。
在襯底式共享中,主網絡中引入的自干擾可能會極大地阻礙SU訪問頻譜的機會。針對這一問題,Sharma 等[11]提出一種使用不適當高斯信號的帶內全雙工系統的底層頻譜共享技術,推導了一個封閉形式的表達式和一個SU和PU中斷概率的上界。然后根據平均信道狀態信息對SU信號參數進行優化,在保證所需的PU服務質量的同時,將其停機概率降到最低。但是,襯底式共享固有的缺點在于SU發射功率太小,無法進行遠距離傳輸。覆蓋式共享可以很好地解決傳輸距離問題。SU通過信號處理和編碼解碼等技術,不僅能夠滿足自己的通信需求,同時還可以提升PU通信質量。文獻[30]中的基于擴頻和正向的覆蓋頻譜共享協議,采用覆蓋方式,所選的二次網絡分配部分功率對衛星信號進行中繼,并利用剩余的功率傳輸自己的信號。SU中繼PU的流量,以交換PU許可頻譜上的訪問時間。文獻對比了PU的Pareto 最佳平衡與Robusr平衡,在PU于SU數量不等時,兩者的性能差異小于10%。
頻譜共享以提升頻譜利用率為最終目的。在頻譜共享的框架設計過程中,更應該注重現實可行性以及策略的性價比問題,低延時、高吞吐量是主要考慮的兩個目標。頻譜共享在5G網絡、大規模MIMO系統等實際場景中的應用將會是工作的重點之一。CR與其他技術(如NOMA)的結合使用也會是一個熱點問題。
頻譜預測技術在CRNs中的應用可以有效提升頻譜利用率,為解決頻譜短缺問題開辟一條有效途徑,因此其在5G網絡、認知蜂窩網絡(cognitive cellular networks,CCN)等領域都有廣泛應用。
5G中不同服務的特性和需求是不同的。異構網絡、應用程序和用戶需求之間的管理和協調需要5G網絡的開放性和靈活性,以確保網絡資源的高效配置。文獻[31]中提出了一種由數據平面、認知平面和控制平面三部分構成的無線網絡虛擬化模型。設計了一種新的控制信令方案來支持該模型,以基于預測的頻譜共享為基礎進行擴展,從網絡虛擬化的實現角度出發,采用了一種基于單元聚類的分層控制方案,實現了資源利用率的動態優化。與沒有進行頻譜虛擬化的情況相比,頻譜虛擬化后的總頻譜利用率提高了近30%。文獻[32]中以新興的公私無線電干擾管理框架為基礎,建立一個新的QoE評價方法,利用頻譜預測技術探索未充分利用的候選5G射頻頻譜,使短期頻譜共享成為可能,在短期內提高無線接入網(RAN)內容傳輸能力,并對5G網絡價格、性能和總用戶QoE產生積極影響。
在云無線接入網絡(cloud radio access networks,CRANs)的基帶單元(baseband units,BBUs)上進行主動緩存已經引起了廣泛的關注。然而,大多數現有的工作都假定了一個已知的內容分布,而忽略了CRANs中數據的大量本質。Chen等[33]研究了CRANs的主動緩存問題。在主動緩存模型中,BBUs可以根據內容預測每個用戶的內容分布,確定緩存哪些內容,集成遠距離射頻單元(remote radio heads,RRHs)。在文獻[33]中這個問題被表述為一個優化問題,它結合了回程負載、RRHs集群和內容緩存。針對這一問題,文獻提出了一種將回波狀態網絡的機器學習框架與子線性算法相結合的算法。利用回波狀態網絡,BBUs可以預測用戶的內容請求分布,同時只提供有限的網絡和用戶狀態信息。在此基礎上,提出了一種子線性算法來確定緩存哪些內容以及如何在使用有限內容請求樣本的情況下對RRHs進行聚類。優酷真實數據仿真結果表明,與采用聚類隨機緩存和不采用聚類算法的隨機緩存相比,該方法的總有效容量分別提高了26.8%和36.5%。文獻[34]中研究在無授權頻段中加入LTE的蜂窩網絡(small cell networks,SCNs)的上行鏈路與下行鏈路解耦的資源分配問題。在這里,用戶可以訪問授權和未授權的波段,同時連接到不同的基站。該問題是一個結合用戶關聯、頻譜分配和負載均衡的優化問題。針對這一問題,作者提出了一種基于回聲狀態網絡機器學習框架的分布式算法,在網絡和用戶狀態信息有限的情況下,由小基站自主選擇最優頻帶分配策略。仿真結果表明,與Q-learning和最近鄰算法相比,該方法在總速度上有顯著提高,分別達到41%和54%。結果還表明,與Q-learning相比,ESN的收斂速度提高了17%。
CRNs中頻譜預測技術的發展極大地推進了頻譜資源的充分利用,有效地提高了能量效率、系統靈敏度,降低了信道沖突等。本文分別從頻譜感知、頻譜決策、頻譜遷移、頻譜共享四個方面研究了頻譜預測技術的發展與現狀,分析了不同方法、策略的優勢與不足。同時也指出了各個方面存在的問題,面臨的挑戰,也為下一步的工作指出了方向。