張育瑜,趙 磊 ,郭文彬*,彭 濤 ,王文博
(1.北京郵電大學(xué) 信息與通信工程學(xué)院,北京 100876;2.通信網(wǎng)信息傳輸與分發(fā)技術(shù)重點實驗室,河北 石家莊 050000)
無線電監(jiān)測是一個討論多年的熱門話題,它能更有效地實現(xiàn)可用頻譜資源的監(jiān)測,增強頻譜資源的管理,具有很強的應(yīng)用價值。盲信號識別是無線電監(jiān)測中一項重要的識別技術(shù),它負(fù)責(zé)從一段頻譜中提取出信號信息,在缺少足夠的先驗信息前提下,及時發(fā)現(xiàn)違法、異常和干擾信號,凈化頻譜資源環(huán)境,同時,它能夠秩序化地利用空閑頻段,實現(xiàn)頻譜資源的高效利用。
大數(shù)據(jù)背景下的無線電監(jiān)測需要考慮諸多問題[1]。一方面,基于網(wǎng)格化節(jié)點[2-4]監(jiān)測產(chǎn)生的海量原始數(shù)據(jù)需要進行數(shù)據(jù)分析[5];另一方面,對于數(shù)據(jù)挖掘出的結(jié)果需要進行分布式存儲[6-7]。文獻[4]給出了海量數(shù)據(jù)背景下無線電監(jiān)測的功能實現(xiàn)、平臺構(gòu)建和結(jié)果存儲的一種方案,該方案缺乏對原始數(shù)據(jù)的全面分析,也沒有結(jié)合諸多成熟的識別技術(shù)挖掘出完備的知識單元,使得存儲數(shù)據(jù)含有大量冗余信息,不能很好地解決無線電監(jiān)測所面臨的問題。西華大學(xué)借助產(chǎn)學(xué)研聯(lián)合實驗室開展的無線電智能化監(jiān)管研究探索了共享型無線電監(jiān)測技術(shù)融合體制[3],一定程度上實現(xiàn)了智能化無線電監(jiān)測平臺,但還是缺乏對無線電監(jiān)測數(shù)據(jù)的深入分析以及對原始數(shù)據(jù)的提純。針對大數(shù)據(jù)背景的無線電監(jiān)測數(shù)據(jù)處理需要能夠結(jié)合相應(yīng)識別算法對原始數(shù)據(jù)進行深度挖掘,提純出有價值的知識信息替代原始數(shù)據(jù)[8],并對知識信息進行結(jié)構(gòu)化梳理、規(guī)范化存儲,進而實現(xiàn)機器智能化認(rèn)知識別結(jié)果。結(jié)構(gòu)化知識是大數(shù)據(jù)處理的高效方法[9],知識圖譜作為一種結(jié)構(gòu)化知識的架構(gòu),被廣泛應(yīng)用在涉及大數(shù)據(jù)處理的各個領(lǐng)域[10-12],取得了不錯的成果。
結(jié)構(gòu)化知識是核心[13],識別算法是關(guān)鍵。本文一方面在無線電監(jiān)測平臺上引入知識圖譜架構(gòu),并結(jié)合ITU無線電監(jiān)測內(nèi)容[14],全面梳理盲信號識別的知識,構(gòu)建知識間的拓?fù)浣Y(jié)構(gòu),規(guī)范存儲模板;另一方面,重點介紹了無線電監(jiān)測中的盲信號識別流程,結(jié)合改善多種盲信號識別算法進行數(shù)據(jù)分析與挖掘,利用得到的知識實體對構(gòu)建的盲信號知識模板進行知識填充,最終利用工程技術(shù)實現(xiàn)智能可視化無線電監(jiān)測平臺。第2節(jié)介紹了基于知識圖譜架構(gòu)的盲信號識別;第3節(jié)進行實驗結(jié)果分析;第4節(jié)給出結(jié)論。
無線電業(yè)務(wù)的發(fā)展以及監(jiān)測設(shè)備的增多,使得盲信號識別呈現(xiàn)出大數(shù)據(jù)的特點。盲信號實時監(jiān)測平臺所依賴的原始數(shù)據(jù)主要有以下3點特征[13]。
① 基于時空頻的多域特性。一段頻譜數(shù)據(jù)的標(biāo)簽信息包括監(jiān)測時間、監(jiān)測地點和監(jiān)測頻段以及監(jiān)測設(shè)備等。智能化的監(jiān)測平臺需要能夠從這3個維度展示識別結(jié)果。
② 基于多平臺的同構(gòu)異構(gòu)數(shù)據(jù)類型。由于監(jiān)測設(shè)備多樣化,接入監(jiān)測平臺的數(shù)據(jù)類型復(fù)雜多樣。這其中不僅包含不同設(shè)備對同一地區(qū)同一頻段同一時間的原始數(shù)據(jù),還包括除了頻譜掃描數(shù)據(jù)之外的IQ數(shù)據(jù)、AD采樣數(shù)據(jù)以及音頻、測向定位數(shù)據(jù)等[15]。
③ 數(shù)據(jù)存在冗余,不利于批量存儲。原始數(shù)據(jù)不能作為知識實體被機器所識別,無法實現(xiàn)智能化平臺,需要結(jié)合相關(guān)算法,抽取出有用的知識實體進行存儲。
針對上述特征,通過知識圖譜的構(gòu)建,賦予原始數(shù)據(jù)時空頻屬性、節(jié)點屬性和數(shù)據(jù)類型屬性等,對數(shù)據(jù)進行標(biāo)識;利用頻譜感知算法、信號識別算法挖掘提取有用知識實體。
盲信號知識圖譜的核心在于形成結(jié)構(gòu)化的知識,并采用高效的方式進行存儲。從構(gòu)建知識圖譜的流程[12]以及知識庫最終的呈現(xiàn)形態(tài)2個角度進行闡述。圖1展示了知識圖譜的構(gòu)建流程。
原始數(shù)據(jù)主要分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)2部分。結(jié)構(gòu)化數(shù)據(jù)中的歷史模板可以作為知識抽取的先驗信息。知識抽取主要從非結(jié)構(gòu)化數(shù)據(jù)中提取知識并生成知識實體,抽取出的知識需要與結(jié)構(gòu)化數(shù)據(jù)知識進行知識融合,融合過程中利用時間、空間、頻段和節(jié)點ID生成知識的唯一性標(biāo)簽,并對重疊實體部分進行消歧處理,初步形成盲信號知識的拓?fù)浣Y(jié)構(gòu),并利用知識計算生成新知識,與原知識拓?fù)浣Y(jié)構(gòu)融合形成完備的知識圖譜并存儲至知識庫,通過調(diào)度結(jié)構(gòu)化知識庫的數(shù)據(jù)進行智能化平臺展示。

圖1 盲信號識別知識圖譜構(gòu)建流程Fig.1 Blind signal recognition knowledge map construction flow chart
知識庫是知識圖譜的核心成果,它包含2個要點:模式層與數(shù)據(jù)層。模式層定義知識實體內(nèi)的屬性、關(guān)系,實體間的層級結(jié)構(gòu),盲信號識別知識庫的模式層定義了知識入口類、背景知識類、實時信息類和單個信號類4大類;數(shù)據(jù)層則是模式層的具體實現(xiàn),是數(shù)據(jù)呈現(xiàn)的一種方案。圖2給出了盲信號識別知識庫的模式層結(jié)構(gòu)。

圖2 盲信號識別知識庫模式層Fig.2 Blind signal recognition knowledge base pattern layer
知識入口類包含3個知識單元:時間、空間和頻帶,它是所有知識的共有屬性。時間指要檢索的起始時間,空間指要監(jiān)測的不同地理位置,頻帶指要檢索的頻段范圍。知識入口類中的屬性是每個知識實體的標(biāo)簽,將這些屬性加上監(jiān)測節(jié)點ID,生成唯一性標(biāo)識ID。背景知識類包含3個子類:注冊信息類、硬件信息類和信號模板類,它可以為知識挖掘和推理提供豐富的先驗信息。實時信息類包含背景噪聲功率、電磁波功率、頻譜圖和信號個數(shù)等7個屬性,實時信息類用于收集實時頻段中包含的知識單元。單個信號類包含3個子類:靜態(tài)信息類、實時變化類和知識推理類,單個信號類是對單個信號詳細(xì)屬性的歸類。圖中的類定義了所有知識實體的共有屬性,每個實體對象會存在屬性差異,類之間的箭頭顯示了類的層級結(jié)構(gòu),對象指向的箭頭顯示該對象的屬性,屬性有實體屬性和類屬性2種。
原始數(shù)據(jù)的頻譜是多信號共存的,不能直接用于調(diào)制信號識別,需要將需要識別的每個信號分離出來,再逐一識別。文獻[16]提出一種基于迭代檢測的寬帶頻譜自適應(yīng)感知算法,它能夠根據(jù)每個頻點的統(tǒng)計平均值設(shè)置判決門限,頻點判決結(jié)果能夠更準(zhǔn)確。
算法思路:根據(jù)大數(shù)定理,當(dāng)統(tǒng)計次數(shù)足夠多時,每個頻點的幅值大小服從高斯分布,據(jù)此可統(tǒng)計每個頻點的M次的平均值作為判決量,再預(yù)設(shè)檢測率與虛警率,得到每個頻點的判決門限與該頻點平均信噪比以及頻段底噪功率的關(guān)系,通過迭代計算得到頻段底噪功率進而得到每個頻點的判決門限。
考慮到M越大檢測率越高,但M太大會影響感知時間以及算法的時間復(fù)雜度,原算法再對M進行迭代計算找到合適的值??蚣苤袑崟r數(shù)據(jù)以流的方式存在,只需要設(shè)立全局變量存儲每次數(shù)據(jù)疊加的結(jié)果,就能達到不斷增大M的效果,隨著監(jiān)測時間的增長,識別結(jié)果就會越準(zhǔn)確。故在將本算法應(yīng)用于盲信號識別框架中,只迭代計算判決門限,大大減少了算法時間復(fù)雜度。圖3展示了算法流程。

圖3 基于迭代檢測的寬帶頻譜感知算法Fig.3 Wideband spectrum sensing algorithm based on iterative detection
先初始化合適的M與判決門限,得到噪聲功率,計算出判決量:
(1)
式中,n=0,1,2,...,N-1表示N個頻點;Ynm為第n個頻點功率值大小。根據(jù)信號底噪、每個頻點信噪比以及設(shè)定的檢測率、虛警率進行判決,并與上次判決結(jié)果進行比較,迭代計算直至滿足要求,一方面輸出結(jié)果,另一方面繼續(xù)增加M,重新計算。通過改善基于迭代檢測的寬帶頻譜自適應(yīng)感知算法,識別出頻段中每個信號的帶寬信息、背景噪聲功率、信號個數(shù)、頻段使用率以及空閑頻段信息。
由上節(jié)算法能夠理想濾波出單個信號進行調(diào)試模式識別。模擬信號與數(shù)字信號的序列統(tǒng)計特征值存在較大差異,通過非線性變換法,二次小波變換法都能很好地區(qū)分開來。考慮到工程的時效性,本框架采用非線性變換法進行處理。設(shè)信號序列s(t),t=1,2,...,N。非線性變換得到Q(i)序列:
Q(i)=s2(i)-s(i-1)s(i+1)。
(2)
再對Q(i)進行差分處理得到P(i):
P(i)=Q(i+1)-Q(i)。
(3)
設(shè)置合適的門限,通過計算P(i)的方差即可進行模數(shù)判決。
識別的模擬信號有AM,DSB,F(xiàn)M,CW,LSB,USB六種類型。采用文獻[20]中所提出的3個特征參數(shù)進行分類,利用包絡(luò)變化特性特征值gmax區(qū)分出AM,DSB信號;利用譜對稱性特征參數(shù)P區(qū)分出LSB,USB信號;利用序列點瞬時幅度統(tǒng)計特性sdp區(qū)分出FM,CW信號。
第1個特征參數(shù)gmax為:
gmax=max|FFT(Acn(i))|2,

(4)
式中,Acn(i)是該段信號第i(i=1,2,...,N)個歸一中心化的瞬時幅度;A(i)為該段信號第i(i=1,2,...,N)個瞬時幅度。
第2個特征參數(shù)P為:
(5)
式中,X(i)序列為采樣序列X的FFT;fcn+1代表載波所對應(yīng)的點數(shù)。
第3個特征參數(shù)sdp為:
(6)
式中,An(i)>a表示信號歸一化幅度An(i)大于門限a,即所謂的強信號;C為強信號的個數(shù);fNL(i)為瞬時非線性相位。
在實驗中,使用本文提出的知識圖譜架構(gòu)盲信號識別系統(tǒng)對實時環(huán)境進行頻譜監(jiān)測,搭建框架語言采用C++與QT結(jié)合的方式,后臺存儲部分采用Redis數(shù)據(jù)庫集群。通過結(jié)構(gòu)化知識庫進行高效的數(shù)據(jù)交互操作,實現(xiàn)智能化的無線電頻譜監(jiān)測平臺[17]。本系統(tǒng)采用如圖4所示的系統(tǒng)架構(gòu)[18]。

圖4 智能監(jiān)測平臺架構(gòu)Fig.4 Intelligent monitoring platform architecture
后端部分包括數(shù)據(jù)部分、服務(wù)集群、服務(wù)管理中心以及反向代理集群。數(shù)據(jù)部分包括數(shù)據(jù)庫集群、傳感節(jié)點網(wǎng)絡(luò)以及傳感節(jié)點管理中心;服務(wù)集群主要包括用戶服務(wù)、產(chǎn)品服務(wù)兩大類;服務(wù)管理中心集群負(fù)責(zé)監(jiān)控管理服務(wù)調(diào)度的負(fù)載均衡,反向代理服務(wù)器用于設(shè)立網(wǎng)關(guān)和服務(wù)管理中心的負(fù)載均衡,從而實現(xiàn)高可用的無線電監(jiān)測管理平臺[19]。
實驗數(shù)據(jù)的采集節(jié)點使用安捷倫公司生產(chǎn)的RF Sensor,覆蓋30 MHz~6 GHz的帶寬,可調(diào)數(shù)字中頻帶寬為20 MHz,支持輸出I/Q(同相正交)時間序列和快速傅里葉變換(FFT)數(shù)據(jù)流,同時提供遠程控制的可編程應(yīng)用程序接口(API)[20]。所監(jiān)測頻段每間隔2 s刷新一次,每次返回10 000個實時數(shù)據(jù)點,實時分析結(jié)果每隔30 s刷新一次。實驗檢測地點為北京市海淀區(qū)北京郵電大學(xué)新科研樓6樓,檢測頻段為90~110 MHz頻段,檢測次數(shù)為100次。90~110 MHz授權(quán)合法信號的信息一部分來自于北京廣播網(wǎng),另一部分來自收音機實地實測數(shù)據(jù)。
圖5為90~110 MHz頻段的部分電臺監(jiān)測100次,得到統(tǒng)計的調(diào)制類型識別結(jié)果,其中,后6列數(shù)字表示識別成相應(yīng)調(diào)制格式的次數(shù)。

中心頻率/MHz電臺名稱AMFMDSBCWLSBUSB90.5中國國際廣播電臺環(huán)球資訊1189000091.5中國國際廣播電臺EasvFM196200192.3外語廣播097012095.4故事廣播193000698.2青年廣播098200099.6中國交通廣播0990100100.6新聞廣播01000000101.8都市之聲(四套)0970201102.5體育廣播01000000
該頻段的信號調(diào)制類型為FM,所有信號識別出FM信號的正確率為96.56%,達到了較高的識別效果。識別成AM的概率為1.33%,識別成其他信號占2.11%。上述識別的方式需要首先經(jīng)過盲信號寬帶頻段的預(yù)處理,理想濾波出相應(yīng)頻段的單個信號,所以識別效果不僅取決于調(diào)制識別算法,也取決于頻譜感知算法對信號帶寬、中心頻率等的識別精度。實驗分析中,對中心頻率的識別結(jié)果也進行了評估,達到了優(yōu)良的識別準(zhǔn)度,對中心頻率為90.5 MHz的信號進行100次測量,得到平均值為90.503 MHz,方差為0.16。
利用構(gòu)建的知識庫,搭建出了一套智能化的可視化監(jiān)測系統(tǒng),部分可視化界面如圖6所示:圖6(a)中通過該界面能夠進入單個信號的實時監(jiān)測。圖6(b)包括01數(shù)據(jù)流以及解碼內(nèi)容。圖6(c)包括信號個數(shù)、噪聲功率、電磁波功率、頻段使用率和空閑頻段等實時信息。圖6(d)包括頻道占用度、碼元速率、調(diào)制方式和干擾類型。圖6(e)包括背景噪聲功率、電磁波功率、頻段使用率和空閑頻段。

圖6 智能可視化平臺Fig.6 Intelligent visualization platform
本文提出了大數(shù)據(jù)背景下利用知識庫構(gòu)建智能化頻譜監(jiān)測與管理平臺的新思路,梳理并結(jié)構(gòu)化了盲信號識別過程中的知識實體,并結(jié)合實際,利用相關(guān)算法提取了這些知識。實驗結(jié)果驗證了相關(guān)算法的準(zhǔn)確性,可視化系統(tǒng)也進一步驗證了框架的智能化特性,達到了優(yōu)良的效果。