劉栩楠,石 榮,何彬彬,陳 敏
(1.電子科技大學,四川 成都 611731;2.電子信息控制重點實驗室,四川 成都 610036)
隨著無線電技術的發展,各種各樣的電子信息裝備大量應用,對頻譜資源的需求也大大增加。傳統的頻譜分配方式存在很大弊端,表現在大部分頻段分配給了固定用戶,各頻段的使用狀況存在很大差異,利用率為15%~85%不等[1]。部分頻段的通信需求逐年增加,頻譜資源越來越緊張;同時也存在大部分利用率不高的頻段[2-4],造成了頻譜資源的浪費。如果允許其他用戶在不影響主用戶用頻的前提下使用利用率不同的頻段,就可以在很大程度上改善頻譜資源浪費的問題。認知無線電(Cognitive Radio,CR)[5]是解決這類問題的主要方法。在CR中,頻譜占用預測技術可以有效地幫助認知用戶感知頻譜狀態,得到了廣泛的關注和研究。
常用的頻譜預測模型有馬爾可夫模型[6-10]、基于機器學習的預測模型[11-12]以及自回歸模型[13]等。Saleem[14]對CR相關文獻使用模型的頻率做了統計,其中基于馬爾可夫模型的預測方法原理簡單,易于建模,并且可以實現不間斷地預測,其相關文獻數量占比最高,達到了27%。2009年Ghosh[15]使用尋呼頻段的監測數據驗證了用戶的頻譜使用狀態數據中馬爾可夫鏈的存在。在頻譜預測中最常用的是兩狀態馬爾可夫模型,信道狀態分為占用和未占用。有一些研究[6-7]把認知用戶占用信道的狀態考慮到建模過程中,提出了建立多個狀態的馬爾可夫模型,更符合實際情況,但是對頻譜的狀態感知[16]提出了更高要求。由于頻譜感知過程不可避免地產生誤差,觀測到的頻譜狀態不能反映頻譜的真實狀態,所以隱馬爾可夫模型也被廣泛用于頻譜預測[8-9]。此外還有連續時間馬爾可夫模型[9]和Semi-Markov模型[10]在頻譜預測中的應用。
構建馬爾可夫模型的數據需要滿足狀態轉移規律保持穩定的條件[17]。本文通過分析頻譜特點,針對傳統馬爾可夫模型應用到特定頻段的缺陷,從建模數據考慮,提出了基于分段馬爾可夫模型的頻譜占用預測方法,并結合成都地區的實測頻譜數據進行了頻譜的預測分析。
頻譜占用預測是一種通過分析頻譜監測產生的歷史數據獲取頻譜使用規律,并用以預測未來頻譜占用狀態的方法。馬爾可夫過程是一類隨機過程,它的原始模型是馬爾可夫鏈,由俄國數學家Andrey A.Markov于1907年提出。馬爾可夫過程是指目標過程中狀態的轉移只依賴于之前的N個狀態,而與N個狀態之前的狀態無關,該過程如式(1)所示[18]。對應的N階馬爾可夫模型是指下一時刻的狀態僅與最近的前N個時刻的狀態有關,而與更早的狀態無關,并在此基礎上建立的狀態轉移矩陣。
P{Xn+1=xn+1|X0=x0,X1=x1,…,Xn=xn}=
P{Xn+1=xn+1|Xn-N+1=xn-N+1,Xn-N+2=
xn-N+2,…,Xn=xn},
(1)
式中,“0,1,…,n,n+1”表示不同的時刻;“x0,x1,…,xn,xn+1”表示對應時刻的狀態。
利用該過程的特點建立馬爾可夫模型,即可根據當前狀態對未來狀態進行預測。該模型可以通過狀態向量和狀態轉移矩陣描述。將其應用到頻譜占用預測時,用“0”表示頻譜空閑狀態,“1”表示頻譜占用狀態。以一階馬爾可夫模型為例,其狀態向量和狀態轉移概率的關系如圖1所示。

圖1 一階馬爾可夫模型Fig.1 First-order Markov model
圖1中,P01表示狀態“0”轉移到狀態“1”的概率,以此類推。根據歷史頻譜數據的狀態轉移序列可以統計圖中的4個狀態轉移概率,這4個狀態轉移概率組成的狀態轉移矩陣構成了馬爾可夫模型。根據當前時刻的頻譜狀態對應狀態轉移概率的大小可以預測下一時刻的頻譜狀態。
在傳統的基于馬爾可夫模型的離散時間頻譜狀態預測中,使用歷史數據建立狀態轉移矩陣,并假設該矩陣相對穩定,隨時間變化較小。如果統計足夠多的歷史數據,根據當前時刻信道的狀態,結合狀態轉移矩陣即可對下一時刻的信道狀態進行預測。以移動通信信號的頻譜占用為例,通信都是依賴某個特定的頻段完成,將頻譜數據按頻段劃分為多個信道,信道的占用與頻譜占用具有對應關系。觀察2個有代表性信道中的信號強度隨時間的變化,如圖2所示。

圖2 典型信道的信號強度Fig.2 Signal intensity diagram of typical channel
圖2中,電平值是頻譜監測設備采集到的該頻段的信號強度;信道占用度是指一段時間內有信號占用的時間所占的比例[19],有無信號占用可以根據電平值判斷。由圖2可以看出,信道占用度在時間上是不穩定的,在不同的時間段有明顯變化。由于信道占用度的變化較大,使用占用度差異較大的數據建立馬爾可夫模型,它們的狀態轉移矩陣可能存在較大的差異,而通過統計全部的歷史數據建立狀態轉移矩陣就會忽略這種差異。
圖2(a)的信道占用度變化具有明顯的以24 h為周期的周期性。由于信道占用度有周期性,并且其周期變化特點可以通過歷史數據得到,所以對于這類信道,如果分段建立馬爾可夫模型,即先把歷史數據按狀態轉移矩陣的差異做分段處理,再使用各段數據分別建立馬爾可夫模型或許能夠更好地描述數據的統計規律。據此提出基于分段馬爾可夫模型的頻譜占用預測方法,主要應用在占用度存在周期性的信道中。基于分段馬爾可夫模型的信道占用預測流程框圖如圖3所示。

圖3 基于分段馬爾可夫模型的信道占用預測流程Fig.3 Flow chart of channel occupancy prediction based on segmented Markov model
建模和預測過程即逐信道建立傳統的馬爾可夫模型并利用該模型進行預測。下面介紹周期性信道的篩選方法和數據分段建模方法。
先把頻譜數據按信道劃分,然后逐信道分析。以周期為1天的數據為例,假設各信道采集信號的時間間隔固定,每天采集y個信號占用度,x(x>1)天的數據表示為矩陣A:
(2)
式中,Axy為第x天的第y個占用度數據,其中Ai=[A1iA2i…Axi]T表示在不同周期內分別采集的第i個占用度組成的列向量。
信號的周期性指標為:
(3)
指標V越小,表示信號的周期性越好。
部分信道的占用度具有周期性,由于占用度是對1/0(有/無信號占用)狀態的統計值,所以本文假設占用度周期性較好的信道在每個周期內的1/0分布類似,即對每個周期的狀態序列建立馬爾可夫模型可以得到相似的狀態轉移矩陣。如果這個假設成立,在馬爾可夫建模過程中,首先使用2.1節方法挑選占用度周期性較好的信道;然后把一個變化周期分為n段;最后把多個周期的訓練數據按段分別建立馬爾可夫模型。如果分段合理,就可以更好地描述歷史數據的統計特性。其分段建模示意如圖4所示。

圖4 分段建模示意Fig.4 Schematic diagram of segmented modeling
通過實驗驗證在占用度具有周期性的信道,統計其不同周期內的占用狀態數據可以得到類似的狀態轉移矩陣。之后檢驗分段馬爾可夫模型效果,并分析分段數n取多少能達到最佳的預測效果。
實驗使用中星世通CS-805F可搬移監測測向系統采集頻譜數據,天線架設在成都市區某建筑物4樓進行數據采集,主要記錄信號的電平值和對應的采集時間。數據采集頻段為GSM900下行頻段(935~960 MHz),每個信道寬度為150 kHz,信道測量步進為200 kHz,信道數量為126,采集時長為96 h,數據量約為1.7 GB,時隙數約為378 874。
統計實測頻譜數據每個信道總體占用度,在126個信道中,66個信道的占用度不超過60%,34個信道的占用度不超過40%。總體來說,GSM900下行頻段的總體占用度較低,其利用率仍存在較大提升空間,所以該頻段數據適合用于頻譜預測實驗。
實驗中,取前72 h的數據作為訓練集,另外24 h的數據作為測試集。為了對比傳統馬爾可夫模型和分段馬爾可夫模型的預測性能,使用訓練集數據分別建立2種模型對測試集數據進行預測,并對比分析2種方法的預測結果。
實驗采用閾值法將測量電平值數據轉換為信道狀態序列。轉換方法為[11,20]:

(4)
式中,CS為信道狀態;“0”表示信道為空閑狀態;“1”表示信道為占用狀態;E為實測電平數據;T為噪聲閾值。分析采集數據的特征,T=7 dBμV。
每一天的CS序列平均分為100段,分別統計占用度,把CS序列轉化為占用度序列之后,帶入到式(3)計算每個信道的V值并歸一化,得到如圖5所示的結果。

圖5 各信道的歸一化周期性指標Fig.5 Normalized periodic index of each channel
有些信道的頻譜數據用式(4)處理后,其CS狀態序列幾乎為全0或者全1。如果使用馬爾可夫模型預測這些信道會達到接近100%的正確率,但是這種預測沒有意義,反而會影響評估預測方法的性能,所以在后續實驗中,將狀態“1”占比大于99%或者小于1%的信道排除掉。經過這一步篩選之后,適合用于頻譜預測實驗的信道有84個。在這84個信道中挑選出歸一化V值大于0.4的信道,觀察這些信道的實測頻譜數據,發現其占用度序列的周期性確實較差,所以在后續實驗中將這些信道標記為周期性較差的信道。最終得到周期性較好的信道59個,周期性較差的信道25個。其中周期性較好的59個信道的編號為:2~15,20,38,40,42~55,81~91,94,106,110,112,114~126;周期性較差的25個信道的編號為:56~79,113。
3.3.1 驗證占用度周期性較好信道不同周期內的數據具有類似的狀態轉移矩陣
以一階馬爾可夫模型為例,其狀態轉移矩陣包括0→0,0→1,1→0,1→1四個狀態轉移概率。建模數據包括72 h,3個周期的CS序列,分別建模可以得到3個狀態轉移矩陣。計算3個矩陣中對應狀態轉移概率的標準差并求和,記為S。分別計算每個信道的S,作S與對應信道周期性指標V的散點圖并進行線性擬合[21],如圖6所示。

圖6 S與周期性指標V的散點Fig.6 Scatter plot of S and periodic index V
由圖6可以看出,S和V呈現出明顯的正相關關系。V指標越大代表該信道的占用度數據越不具有周期性,同時其對應的S也越大,表示其不同周期的狀態轉移概率的標準差越大,即狀態轉移概率波動越大。所以占用度越具有周期性的信道,其馬爾可夫模型的狀態轉移概率波動越小,對應的在不同周期內的數據建立的馬爾可夫模型狀態轉移矩陣越相似,從而驗證了在2.2節中的假設。所以分段建立馬爾可夫模型是可行的。
3.3.2 分析分段馬爾可夫模型的預測效果
首先使用周期性較好的59個信道的數據建模并預測。按照2.2節的方法把訓練集數據分段建立馬爾可夫模型,數據分段采取平均分段的方式,即把一個周期平均分為n段,然后把模型應用到對測試集的預測中,統計分段數n與對應的預測正確率,其關系如圖7所示。圖7中的橫坐標最小值都是1,即為傳統的馬爾可夫模型。圖7(a)中n的取值范圍較大(1~1 000),展示了預測正確率和分段數n的相對變化趨勢。其中正確率在n取1和50兩個點之間變化較大。圖7(b)詳細展示了n取1~50之間所有整數取值對應的預測正確率,其中當n取33時,預測正確率最高達到了74.39%,相對于傳統馬爾可夫模型的71.42%提高了2.97%。

圖7 周期性較好信道的分段建模預測結果Fig.7 Prediction results of segmented modeling for better periodic channels
使用周期性較差的25個信道的數據建模并預測。統計分段數n與對應的預測正確率,其關系如圖8所示。

圖8 周期性較差信道的分段建模預測結果Fig.8 Prediction results of segmented modeling for worse periodic channels
n取1時,即采用傳統馬爾可夫模型時得到的預測正確率最高。對于占用度序列周期性較差的信道,分段馬爾可夫模型不能提高其預測性能。
綜合圖7和圖8來看,使用2.1節的方法篩選出占用度周期性較好的信道,并在這些信道使用分段馬爾可夫方法可以提高其頻譜狀態預測性能,但是該方法不適用于周期性較差的信道。同時,圖7(a)中預測正確率隨著n值的增加呈現先上升再下降的趨勢。上升主要是因為分段之后,每一段分別建模能更好地描述該段數據的統計規律。隨后隨著n值再增加,預測正確率下降可能是因為隨著分段數n越來越大,分段建立的馬爾可夫模型對歷史數據的刻畫越來越精細,但是丟失了訓練數據和測試數據之間的共性統計規律,導致馬爾可夫模型對歷史數據的過擬合。
分段數n的最佳取值與頻譜占用序列每個周期內的0/1分布有關,本文n取33能達到最佳的預測效果,相比傳統的馬爾可夫模型提高了2.97%的正確率,預測性能提高了4.16%。實際應用分段馬爾可夫模型時,分段數n要根據數據特點選擇。
針對部分信道占用度序列具有周期性的特點提出了分段建立馬爾可夫模型的頻譜預測方法,并給出了周期性信道的篩選方法。在大部分信道占用度都不會穩定在某個值附近的情況下,該方法相較于傳統馬爾可夫模型可以更好地描述周期性信道中歷史數據的變化特點。模型采用的數據分段方法不改變模型階數,在不改變預測算法復雜度的同時提高了周期性信道的預測精度,并且該方法同樣適用于其他以馬爾可夫模型為基礎的頻譜預測模型。使用分段馬爾可夫模型時,分段數n要根據數據特點選擇,實際應用時可以通過本文類似預實驗分析預測正確率相對于分段數n的變化趨勢,進而選擇合適的n值。