999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于XGBoost與協方差特征的頻譜感知算法

2020-01-05 07:00:06束學淵曹曉航
軟件導刊 2020年11期
關鍵詞:機器學習

束學淵 曹曉航

摘 要:近年來隨著盲檢測算法的提出,越來越多基于采樣協方差矩陣的盲檢測算法開始應用于頻譜感知。針對基于信號協方差矩陣的頻譜感知算法門限無法準確獲得,以及特征信息單一等問題,提出基于XGBoost與協方差特征的頻譜感知算法。首先提取接收信號采樣協方差矩陣統計量作為XGBoost的訓練特征向量,并生成訓練樣本和測試樣本,然后對XGBoost進行訓練得到頻譜感知分類器,最后利用分類器進行頻譜感知。仿真結果表明,該算法比支持向量機算法、隨機森林算法及傳統最大最小特征算法的檢測概率更高,在信噪比為???????? -14dB時,該算法檢測概率達到0.98,且訓練時間與測試時間少于對比算法,具有良好的性能。

關鍵詞:認知無線電;協作頻譜感知;XGBoost;機器學習;協方差矩陣

DOI:10. 11907/rjdk. 201300????????????????????????????????????????????????????????????????? 開放科學(資源服務)標識碼(OSID):

中圖分類號:TP312 ? 文獻標識碼:A ??????????????? 文章編號:1672-7800(2020)011-0084-06

Spectrum Sensing Algorithm Based on XGBoost and Covariance Features

SHU Xue-yuan,CAO Xiao-hang

(College of Communication Engineering,Hangzhou Dianzi University,Hangzhou 310018,China)

Abstract:In recent years, with the proposel of the blind detection algorithms, more and more blind algorithms based on sampling covariance matrix are applied to spectrum sensing. Aiming at the problem that the threshold value of spectrum sensing algorithm based on signal covariance matrix is difficult to get accurately and the feature information is single, we propose a spectrum sensing algorithm based on XGBoost and covariance feature. Firstly, the statistics of the covariance matrix of the received signal is extracted as the training feature vector of XGBoost, and then the training and test samples are generated, and the training is carried out to obtain the spectrum sensing classifier. Finally the classifier is used to carry out spectrum sensing. Simulation results show that the proposed algorithm has a higher detection probability than the support vector machine algorithm, random forest algorithm and traditional maximum and minimum feature algorithm. When the signal-to-noise ratio is -14dB, the detection probability of this algorithm reaches 0.98, and the training time test is less than the comparison algorithm with good performance.

Key Words:cognitive radio; cooperative spectrum sensing; XGBoost; machine learning; covariance matrix

0 引言

隨著無線通信網絡的不斷推出,頻譜資源變得日益短缺,而目前已使用的頻段資源利用率并不太高。為解決這一問題,認知無線電(Cognitive Radio,CR)應運而生,頻譜感知是其中的關鍵技術之一。

傳統能量檢測(Energy Detection,ED)算法較為簡單,感知時間短,但噪聲峰值對算法影響較大,不適合在低信噪比環境下使用[1];匹配濾波檢測方法精度較高,但是必須知道主用戶信號的先驗知識[2];循環平穩特征檢測算法精度高,能很好地抑制噪聲,但其復雜度高、感知時間長[3]。在進行實際頻譜感知時,先驗信息都是無法獲取的,并且單用戶頻譜感知方法受低信噪比、隱藏終端和信號衰落等因素影響嚴重。針對這些問題,基于接收信號協方差矩陣的盲檢測算法[4]相繼被提出,多用戶協作感知在一定程度上克服了上述問題,適用于獨立同分布的相關信號檢測。基于協方差的盲檢測算法包括:最大最小特征值檢測法[5](Maximum-minimum Eigenvalue,MME)、最大最小特征值之差法[6](The Difference between the Maximum Eigenvalue and Minimum Eigenvalue,DMM)、特征值之差與幾何平均特征法[7](Difference between the Maximum-Minimum and Geometric Mean Eigenvalue,DMMG)、能量最小特征值法[8](Energy with Minimax Eigenvalue,EME)、協方差絕對值法[9](Covariance Absolute Value,CAV)。基于協方差的算法能在一定程度上消除噪聲不確定性的影響,但其判決門限是漸進的,不精確的門限設定會影響算法檢測性能。

為解決傳統協作頻譜感知的門限問題,近年來學者提出利用機器學習進行頻譜感知的算法。該類型算法首先構造特征,再訓練機器學習算法,利用訓練得到的模型進行信號分類,不需要理論推導檢測門限,并且對不同噪聲環境適應度高。文獻[10]使用BP神經網絡作為感知分類器,但該算法容易陷入局部最優解;文獻[11]提取信號循環譜特征參數,使用隨機森林(Random Forest,RF)進行感知判決,但由于該方法為單點感知,無法避免多徑和衰落等影響;文獻[12]使用支持向量機進行頻譜檢測;文獻[13]利用循環自相關特征和Adboost算法進行頻譜感知。

XGBoost(eXtreme? Gradient? Boosting)算法是陳天奇等[14]于2015年提出的一種集成學習算法,在部分領域已進行了應用研究。本文使用信號協方差矩陣的多個特征統計量組成樣本特征向量,訓練XGBoost算法作為感知分類器進行頻譜感知。該方法克服了漸進門限的局限性,并且提取多個信號協方差矩陣特征,在減少信息冗余的同時,能夠盡可能多地利用有效特征。

1 系統模型與理論基礎

在經典的認知網絡(Cognitive Radio Network,CRN)中,假設認知網絡由M個次級用戶(Secondary User,SU)和一個主用戶(Primary User,PU)組成,yi(n)是第i個次級用戶的接收信號,s(n)為主用戶發送信號,hi(n)是第i個次級用戶與主用戶之間的信道系數,噪聲為vi(n),且噪聲服從均值為0、方差為σ2的高斯分布。第i個次級用戶進行頻譜感知的二元假設可表示為:

yi(n)=vi(n)H0s(n)hi(n)+vi(n)H1 (1)

式中,H0表示無主用戶存在,H1表示有主用戶存在。M個次級用戶收集信號,感知信號矩陣如式(2)所示。

Y=y1(1)y1(2)?y1(N)y2(1)y2(2)?y2(N)????yM(1)yM(2)?yM(N)M×N (2)

其中,N為信號采樣點數。認知用戶接收信號的統計協方差矩陣為:

Ry=EYYH (3)

由于信號采樣點數是有限的,無法精確計算統計協方差矩陣Ry,因此使用樣本協方差矩陣Ry(N)作為Ry的估計。

Ry(N)=1Nn=1NYYH (4)

2 基于協方差統計特征的XGBoost頻譜感知

2.1 協作頻譜感知常見算法

(1)MME算法。MME算法以接收信號采樣協方差矩陣Ry(N)最大特征值與最小特征值的比值作為統計量,表達式如下:

TMME=λmaxλmin (5)

其中,λmax為協方差矩陣最大特征值,λmin為協方差矩陣最小特征值。根據Wishart隨機矩陣Ry(N)的特征值極限分布以及M-P律可推出MME感知算法判決門限為:

γMME=(N+M)2(N-M)21+(N+M)-23(NM)16F1-1(1-Pfa) (6)

其中,F1-1為Tracy-Widom第一分布的累積分布逆函數。

(2)DMM算法。DMM算法基于接收信號協方差矩陣最大特征值和最小特征值在主用戶信號存在與否時的差異性進行檢測,其檢測統計量為:

TDMM=λmax-λmin (7)

DMM檢測算法判決門限為:

γDMM=σ2NvF1-1(1-pf)+μ-λmin=σ2NvF1-1(1-pf)+μ-(N-M)2 (8)

(3)EME算法。EME算法檢驗統計量為接收信號平均功率與信號協方差矩陣最小特征值的比值:

TEME=T(N)λmin (9)

其中:

T(N)=1MNi=1Mn=1Nyi(n)2 (10)

其判決門限為:

γEME=(2NMQ-1(Pfa)+1)N(N-M)2 (11)

其中,Q-1為Q函數的逆函數,Q函數為:

Q(x)=x+∞12πexp(-12t2)dt (12)

(4)CAV算法。接收信號是否存在主用戶信號會導致協方差矩陣的差異,CAV算法利用這一差異進行判決檢測,設:

T1=1Mi=1Mj=1Mrij (13)

T2=1Mi=1Mrii? ? ? ? ? ? ? ? ? ? ? ? ? ? (14)

其中,rij為Ry(N)第i行第j列的元素,T1為Ry(N)所有元素絕對值的平均值,T2為Ry(N)所有對角線元素絕對值的平均值,則CAV算法檢測統計量為:

TCAV=T1T2 (15)

相應判決門限為:

γCAV=1+(M-1)2Nπ1+Q-1(Pfa)2N (16)

(5)Cholesky分解算法。由于協方差矩陣的非負定性,則由Cholesky分解可知,Ry唯一表示為:

Ry=QTQ (17)

其中,Q是主對角元素大于零的上三角矩陣。當s(n)不存在時,Ry=σ2nI,由Cholesky分解得Q=σnI,即Q的非對角線元素均為零;當s(n)存在時,Ry=Rs+σ2nI,由Cholesky分解得Q的非對角線元素不為零,則Cholesky算法檢測統計量為:

TCCF=1≤i≤j≤Mqij21≤i≤Mqij2 (18)

2.2 XGBoost算法

XGBoost算法是一種集成學習方法,是GBDT(Gradient Boosting Decision Tree)算法的改進算法。GBDT算法思想為通過不斷降低殘差,使上一次迭代模型殘差在當前梯度方向上下降。模型要達到較好的評估指標一般需要一定數量的CART樹,當數據量較大時,會導致GBDT模型計算量巨大,而XGBoost算法在特征粒度上進行并行處理。XGBoost算法在訓練之前,預先對數據進行排序,以block結構保存,并在之后的迭代優化中重復使用這一結構。在進行節點分裂時,需要計算每個特征各切分點的增益,最終選取增益最大特征的切分點進行分裂,其對各個特征切分點的增益計算進行并行處理,從而大大減小了計算量。在迭代優化過程中,GBDT算法的損失函數只進行了一階泰勒展開,而XGBoost算法對其損失函數進行二階泰勒展開,對損失函數進行更精確的估計。并且該算法在計算損失時加入正則懲罰項,在迭代優化時進行預剪枝,有效地控制了模型復雜度。

XGBoost是串行樹結構,第k棵樹結構的生成取決于前k-1棵樹的結構。XGBoost算法希望建立K個回歸樹,使樹群預測值盡可能逼近真實值,而且有盡量強的泛化能力,因此是一個泛函最優化問題。

2.2.1 XGBoost算法損失函數

XGBoost算法數學模型表示為:

yi=k=1Kfkxi, fk∈F (19)

其中,K為樹的棵數,fkxi是第k棵樹對輸入xi特征的輸出得分值,fk為相應映射函數,F為相應函數空間。

損失函數表示為:

L=i=1nl(yi,yi)+k=1KΩfk (20)

其中,l(yi,yi)為訓練模型對樣本xi的訓練誤差,Ωfk表示第k棵樹的正則懲罰項。

循環地在模型中加入一棵回歸樹,其損失函數都會發生改變。在加入第t棵樹時,前t-1棵樹已訓練完成,此時前t-1棵樹的正則懲罰項和訓練誤差均為已知常數項。則XGBoost的目標損失函數可表示為:

L=i=1nl(yi,yit-1+ftxi)+Ωft+C (21)

對于目標損失函數中的正則懲罰項部分,從單一的樹結構方面加以考慮,對于其中每一棵回歸樹,其模型可表示為:

ftx=wqx,w∈RT,q:Rd→1,2,?T (22)

其中,T為該樹的葉節點個數,w為該葉節點得分值,q(x)是模型映射關系,用來將樣本映射到1~T的某個節點內。q(x)代表CART樹結構,wq(x)即為單個樹模型對樣本x的預測值。則每一棵樹的L2復雜度懲罰為:

Ωft=γT+12λj=1Tw2j (23)

此時,XGBoost目標損失函數可改寫為:

L=i=1nl(yi,yti)+k=1tΩfk=i=1nl(yi,yt-1i+ftxi)+Ωft+C=i=1nl(yi,yt-1i+ftxi)+γT+12λj=1Tw2j+C (24)

2.2.2 樹節點最優值求解

用泰勒二階展開式近似表示損失函數,將ftxi看作Δx。則原目標損失函數可表示為:

Lt≈lyi,yt-1i+?yt-1lyi,yt-1ftxi+12?2yt-1lyi,yt-1ftxi2+γT+12λj=1Tw2j+C (25)

設gi=?yt-1lyi,yt-1,hi=?2yt-1lyi,yt-1,同時對于第t棵樹,lyi,yt-1i為常數。去除所有常數項,進一步將目標損失函數改寫為:

Lt≈i=1ngiftxi+12hiftxi2+γT+12λj=1Tw2j (26)

已知ftx=wqx,w∈RT,q:Rd→1,2,?T,將損失函數轉換成在第t棵樹葉節點的表達形式,第t棵回歸樹的葉節點角度表示為:

Lt≈i=1ngiwqxi+12hiw2qxi+γT+12λj=1Tw2j=j=1T(i∈Ijgi)wj+(12i∈Ijhi+λ)wj2+γT (27)

其中,T表示第t棵樹的葉節點數量,Ij={i|q(xi)=j}表示第j個葉節點上的樣本集合,wj表示第j個葉節點打分值。令Gj=i∈Ijgi,Hj=i∈Ijhi,則:

Lt≈j=1TGjwj+12(Hj+λ)w2j+γT (28)

對wj求偏導,并令其導數為零,則有:

Gj+(Hj+λ)wj=0 (29)

求解得:w?j=-GjHj+λ。

則目標損失函數最優值為:

L?=-12j=1TG2jHj+λ+γT (30)

w?j為葉節點打分值。

2.2.3 最優樹結構求解

一個葉節點分裂為兩個子節點的評估標準為:

Gain=12G2LHL+λ+G2RHR+λ-(GL+GR)2GL+GR+λ-γ (31)

式(30)是單節點的L?值減去切分生成兩個葉節點的L?值,Gain若為正數,且值越大,表明該切分方法效果越好。γ是一個臨界值,其值越大,表示對切分后L?下降的幅度要求越嚴格,相當于在建樹的同時進行了預剪枝,以控制模型復雜度。

對所有特征切分點進行掃描,通過計算確定是否分裂該節點,以及使用哪一個切分點。如果分裂,對分裂出的兩個節點遞歸地調用該分裂過程,找到最優樹結構后,繼續迭代生成下一棵樹,直到模型達到最優或一定閾值后停止。

XGBoost依據該標準使用貪心算法一層一層枚舉不同樹結構,求出一個最優樹結構加入迭代模型中。在迭代過程中,每棵樹最佳葉節點值w?j由式(32)求出,此時完成整個建樹過程。

2.3 算法流程

在傳統基于接收信號協方差矩陣的頻譜感知中,構造出如TMME、TDMM、TEME、TCAV、TCCF等檢驗統計量,然后依據對應門限進行二分類判決。由于這些檢測統計量在一定程度上可確定接收信號中是否存在主用戶信號,因此將上述統計量作為每個訓練樣本的特征向量,即樣本特征向量為:

r=TMME,TDMM,TEME,TCAV,TCCF (32)

設總樣本數為Q,則訓練集表示為:

S=(r1,y1),(r2,y2),?(rQ,yQ) (33)

本文頻譜感知方法處理過程如圖1所示。

算法流程如下:

步驟1:根據系統模型,分別在H1和H0情況下生成信號協方差矩陣,提取特征統計量組成正負樣本。對于每一固定信噪比取等量樣本,對每一固定信噪比數據的每個特征列進行標準化,消除不同信噪比之間的量綱影響。

步驟2:將樣本切分為訓練樣本data_train和測試樣本data_test。

步驟3:根據XGBoost算法生成步驟,利用訓練數據data_train對XGBoost算法進行訓練優化,通過分步網格搜索確定超參數。

步驟4:利用測試數據樣本data_test,通過各項指標對算法模型進行評估。

3 實驗仿真

實驗仿真基于軟件MATLAB R2014a、Python3.6,硬件CPU為Inter(R) Core(TM) i5-3230M,運行內存為8GB。由MATLAB生成訓練數據和測試數據,利用Python的sklearn模塊進行模型訓練并測試效果。實驗參數設置如下:主用戶信號采用BPSK信號,載波頻率為7kHz,噪聲信號為加性高斯白噪聲,均值為0,方差為1。初始采樣點數為800,初始協作用戶M為5。對信噪比從-20dB到0dB、間隔為2dB的每一信噪比均生成相同數量的訓練樣本,且正負樣本數量相同。對每一量級信噪比的樣本特征列進行標準化。

3.1 訓練數據量對模型性能的影響

將數據分為3組進行實驗對比,第1組訓練數據量為11 000,每個信噪比數據為1 000;第2組訓練數據量為? ?22 000,每個信噪比數據為2 000;第3組訓練數據量為? ?33 000,每個信噪比數據為3 000;測試數據量均為11 000,每個信噪比數據為1 000。分別用以上3組訓練數據訓練XGBoost算法得出3個模型model_1、model_2、model_3,使用AUC值作為模型評估指標,用分布網格搜索確定模型超參數,各模型在測試數據上AUC值對比如圖2所示,訓練與測試時間對比如表1所示,測試時間為總樣本測試時間。

由圖2可知,3個模型在信噪比大于等于-10dB時,AUC值均為1;在信噪比為-12dB時,model_1、model_2、model_3分別為0.999 85、0.999 73、0.999 68,各模型無明顯差異;在信噪比為-14dB時,分別為0.991 77、0.993 65、0.994 00,其中model_2和model_3較model_1提升幅度基本一致;在信噪比為-16dB、-18dB、-20dB時,各模型有明顯差異,其中model_2相比model_1分別提高了0.009 97、0.028 39、 0.006 66,model_3相比model_1分別提高了0.016 78、0.013 40、0.003 58。從-14dB至-20dB共4處信噪比來看,model_2相比model_1平均提高了0.011 72,model_3相比model_1平均提高了0.009 00。由此可見,model_2較model_1訓練數據量增加了一倍,在低信噪比處檢測概率有一定提升,而model_3較model_1訓練數據量增加了兩倍,其在低信噪比處的檢測概率并沒有高于model_2,反而有所下降,說明進一步增加訓練數據量并沒有更好地表征數據真實分布,反而可能導致模型復雜度增加,降低模型泛化能力。3個模型對22 000個訓練樣本的訓練時間和11 000個測試樣本的測試時間比較也符合上述推斷,如表1所示,后兩組模型訓練時間并未與訓練樣本量呈線性增加,在測試數據相同的情況下,model_3的測試時間更長,說明模型計算復雜度增加,因此后續試驗采用model_2的方案。

3.2 協作用戶數與采樣點數對模型性能影響

圖3反映的是當信號采樣點數為800時,不同認知用戶數M對XGBoost模型性能的影響。由圖3可知,協作用戶越多,模型在測試數據上的AUC值越高,在低信噪比處差異越明顯。圖4是在虛警率為0.1時,不同協作用戶M對模型檢測概率的影響,其差異性變化趨勢與圖3相符。

[7] 楊雪梅,徐家品,何希. 基于特征值對數分布的頻譜感知算法[J]. 電子技術應用, 2018, 44(1): 79-83.

[8] JAIN S A,DESHMUKH M M. Performance analysis of energy and eigen value based detection for spectrum sensing in cognitive radio network[C]. Pune:International Conference on Pervasive Computing(ICPC),2015.

[9] CHHAGAN C, RAJOO P. A reliable spectrum sensing scheme using sample covariance matrix for cognitive radio[C]. 2016 IEEE International Conference on Advances in Electronics, Communication and Computer Technology(ICAECCT), 2016: 17-20.

[10] 陳易,張杭,胡航. 基于BP神經網絡的協作頻譜感知技術[J].? 計算機科學,2015, 42(2): 43-45,64.

[11] 王鑫,汪晉寬,劉志剛,等.? 基于隨機森林的認知網絡頻譜感知算法[J]. 儀器儀表學報, 2013, 34(11): 2471-2477.

[12] 聶勇,葉翔,翟旭平. 基于支持向量機和噪聲估計的寬帶頻譜感知方法[J]. 電子測量技術,2017, 40(12):88-92.

[13] 崔立波,陳立巖,劉強,等.? 基于CAE與AdaBoost的頻譜感知[J]. 計算機工程與設計, 2015, 36(5): 1161-1164.

[14] CHEN T Q, GUESTRIN C. XGBoost: a scalable tree boosting system[C]. Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2016:785-794.

[15] 王桂蘭,趙洪山,米增強.? XGBoost算法在風機主軸承故障預測中的應用[J]. 電力自動化設備, 2019, 39(1): 73-77,83.

[16] 張玄黎,修春娣,王延昭,等. 基于CSI-XGBoost的高精度WiFi室內定位算法[J]. 北京航空航天大學學報,2018,44(12):2536-2544.

[17] 崔艷鵬, 史科杏, 胡建偉.? 基于XGBoost算法的Webshell檢測方法研究[J]. 計算機科學, 2018, 45(S1): 375-379.

(責任編輯:黃 健)

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 免费观看国产小粉嫩喷水| 欧美高清国产| 一本综合久久| 91www在线观看| 国产精品真实对白精彩久久| 国产精品第三页在线看| 亚洲成人动漫在线| 丁香婷婷在线视频| 国产欧美在线观看精品一区污| 97超级碰碰碰碰精品| 亚洲无码精品在线播放| 欧美精品影院| 男人天堂伊人网| 婷婷激情五月网| 亚洲国产欧美国产综合久久| 老司机午夜精品视频你懂的| 亚洲最大情网站在线观看 | 久久天天躁狠狠躁夜夜2020一| 一级毛片在线免费看| 美女无遮挡被啪啪到高潮免费| 老司机午夜精品网站在线观看| 亚洲福利网址| 她的性爱视频| 久久九九热视频| 一级看片免费视频| 成人在线综合| 国产91小视频| 日韩毛片免费| 在线观看亚洲国产| 国产99在线| 91网红精品在线观看| 无码精品国产dvd在线观看9久| 99精品国产电影| 亚洲一区二区视频在线观看| 国产三级毛片| 老司机午夜精品视频你懂的| 国产簧片免费在线播放| 国内自拍久第一页| 狼友视频一区二区三区| h网址在线观看| 91在线一9|永久视频在线| 精品夜恋影院亚洲欧洲| 国产成人综合在线视频| 91视频区| 伊人色婷婷| 欧美色伊人| 久久亚洲国产最新网站| AV在线麻免费观看网站| www.亚洲色图.com| 熟女视频91| 福利视频一区| 国产精品精品视频| 欧美色综合久久| 国产真实乱子伦精品视手机观看| 人妻夜夜爽天天爽| 伊人久久精品亚洲午夜| 亚洲黄网视频| 57pao国产成视频免费播放| 国产伦精品一区二区三区视频优播 | 久久亚洲精少妇毛片午夜无码| 巨熟乳波霸若妻中文观看免费| 中文无码精品A∨在线观看不卡| 国产熟睡乱子伦视频网站| 毛片视频网| 欧美一级专区免费大片| 亚洲精品无码不卡在线播放| 欧美精品1区| 91成人在线观看| 精品免费在线视频| 婷婷色狠狠干| 人禽伦免费交视频网页播放| 99re热精品视频中文字幕不卡| 久久精品电影| 亚洲日本韩在线观看| 亚洲av日韩综合一区尤物| 亚洲天堂网站在线| 韩日免费小视频| 波多野结衣无码视频在线观看| 国产精品久久久久久影院| 亚洲第一黄片大全| 国产 在线视频无码| jizz亚洲高清在线观看|