唐哲 雷迎科 蔡曉霞
(1.電子工程學院,合肥 230037;2.通信信息控制和安全技術重點實驗室,嘉興 314033)
?
通信輻射源的潛在細微特征提取方法
唐哲1,2雷迎科1,2蔡曉霞1
(1.電子工程學院,合肥 230037;2.通信信息控制和安全技術重點實驗室,嘉興 314033)
為了充分挖掘高維特征空間中輻射源的細微特征,提出一種基于全局潛在低秩表示(Global Latent Low Rank Representation,GLat-LRR)的通信輻射源潛在細微特征提取方法.首先,提取通信輻射源信號的瞬時頻率,通過傅里葉變換將信號投影到高維特征空間;挖掘特征樣本之間全局的低秩結構和維度之間全局的潛在低秩關系,將特征樣本集作為整體應用到潛在低秩表示模型中,利用維度之間低秩關系得到特征樣本集的潛在部分矩陣,每個列向量即為每個通信輻射源信號的潛在細微特征向量.在實際采集的同廠家同型號FM電臺數據集上,該方法提取的潛在細微特征能夠顯著提高通信輻射源個體識別的性能.
通信輻射源;細微特征;瞬時頻率;傅里葉變換;潛在低秩表示
DOI 10.13443/j.cjors.2016011401
由于生產廠家、組件批次以及生產工藝等不同,使得通信輻射源發射的信號存在獨一無二的細微特征,從這些信號中提取的細微特征被稱為輻射源的指紋,而自動地識別一個輻射源即被稱為輻射源的指紋識別[1].在無線通信安全領域,通信網絡攻擊日益嚴重,通過識別入侵的通信輻射源細微特征,可以保障通信網絡的安全.同時,在偵察領域,隨著戰場電磁環境日益復雜,通過截獲敵方通信信號,獲取細微特征進而識別輻射源個體,對分析敵方通信網組成、確定輻射源威脅等級以及對敵實施電子打擊等具有重要的戰略意義.
早期的通信輻射源個體識別問題,主要結合“turn-on”暫態信號特征[2-3],通過小波分析、分形等理論對信號的時域信號進行分析.但該方法主要用于識別不同型號的電臺[4],并且要求接收機具有極高的采樣率,信號的截獲時間往往只有幾毫秒,因此,在非合作通信中該方法的適用性大大降低.近年來,圍繞穩態信號特征例如信號瞬時特性[5]、小波特征[6]和高階譜特征[7]的研究成為通信輻射源個體識別的主要方向.陸滿君[8]在提取頻移鍵控(Frequency-Shift Keying,FSK)信號瞬時頻率的基礎上,通過定義特征參數k來表示碼元持續時間內瞬時頻率的變化趨勢,以及特征參數b表示固定載波頻率與偏差之和的特性,得到較好的特征樣本分離效果.隨著機器學習等相關理論的發展,以模式識別的思想挖掘信號在高維特征空間中的特性并實現輻射源的個體識別逐漸成為新的研究熱點.
在實際通信輻射源個體識別中,通常將已截獲的輻射源個體作為已知樣本構成數據庫即字典,提取其細微特征來識別新截獲的輻射源個體信號.在不同傳輸信道、不同環境條件下截獲的同一輻射源個體信號,盡管其工作模式不盡相同、調制參數存在差異以及信號頻段互不交疊,信號波形存在較大差異,但其細微特征反映的都是輻射源個體的硬件屬性,其最本質的個體細微特征應當反映相同的輻射源內部器件的工作特性,具有一定的唯一性,從而使得輻射源的高維特征樣本具有相似的內在維度結構,在高維的特征空間中處于同一個低秩子空間.低秩表示[9-11]在壓縮感知的理論基礎上能夠獲得數據整體的低秩子空間結構,在聚類等問題上具有良好性能.而實際的通信輻射源個體識別,信號受噪聲影響大,細微特征常常分布在高維的特征空間中,為充分挖掘輻射源信號的潛在細微特征,需要從全局上利用樣本所處的低秩子空間,挖掘不同樣本之間的關系以及不同特征維度之間的關系,進一步在高維特征空間中提取信號的細微特征.
對于同型號同廠家工作模式下的FM通信輻射源細微特征問題,本文提出基于全局潛在低秩表示(Global Latent Low Rank Representation,GLat-LRR)的通信輻射源潛在細微特征提取方法,首先提取通信輻射源信號的瞬時頻率,然后對瞬時頻率進行傅里葉變換,最后,在高維的傅里葉特征空間中利用潛在低秩表示挖掘信號的潛在細微特征.通過實際采集的FM電臺數據集,驗證了該特征提取方法的有效性和魯棒性.
1.1 潛在低秩表示
對觀測到的一個數據矩陣AO,低秩表示模型將數據矩陣分解為一個低秩矩陣和一個稀疏矩陣,有

s.t.AO=AOZ+E.
(1)
式中:Z表示系數矩陣;E表示噪聲矩陣;rank(·)表示矩陣的秩;‖·‖0表示矩陣的l0范數;λ為權重參數.由于式(1)是NP-hard問題,需要在特定幾何條件下將其進行凸松弛,即用核范數替換秩函數,l1范數替代l0范數,式(1)變為

s.t.AO=AOZ+E.
(2)
式中:‖·‖*表示矩陣的核范數,即矩陣的奇異值之和;‖·‖1表示矩陣的l1范數,即所有元素的絕對值之和.
低秩表示直接將觀測數據矩陣作為字典,這個字典必須包含足夠的樣本才能很好地表達每個數據元素.在實際的數據分析中,我們所能獲取的樣本數目是有限的,使得字典缺乏足夠的表示信息,從而導致算法不夠穩健.潛在低秩表示基于已知的觀測數據矩陣AO,構造未觀測的隱藏數據矩陣AH,將聯合數據矩陣[AO,AH]作為字典,力圖解決字典表示信息不充分的問題.潛在低秩表示模型可以描述為

s.t.AO=[AO,AH]Z+E.
(3)

(4)
將式(4)代入式(3),化簡得
(5)

(6)


s.t.A=AZ+LA+E.
(7)
式中:λ為控制噪聲的權重參數.從式(7)可以發現,通過級聯隱藏的數據矩陣AH來表示觀測數據矩陣AO,最終將AO分解為兩個新的數據矩陣以及一個稀疏噪聲矩陣.進一步分析,假設A為D×n的矩陣,則Z為n×n的低秩矩陣,L為D×D的低秩矩陣.求解式(7)的優化問題,可以通過增廣拉格朗日算法進行迭代運算,具體步驟如表1所示.
通過增廣拉格朗日算法求得低秩系數矩陣Z,其誘導的數據矩陣AZ表示數據矩陣A的主要部分;低秩系數矩陣L,其誘導的數據矩陣LA表示數據矩陣A的潛在部分;稀疏矩陣E表示數據矩陣A中包含的稀疏隨機噪聲.
1.2 潛在細微特征提取算法
1.2.1 提取通信輻射源信號瞬時頻率
假設截獲到的FM通信輻射源信號為零中頻I/Q正交信號r(t),實部和虛部分別由rR(t)和rI(t)表示,則r(t)可表示
r(t)=rR(t)+jrI(t).
(8)
從式(8)可以發現,FM復信號的調制信息在實部rR(t)和虛部rI(t)中.
信號瞬時特性中,瞬時幅度反映了rR(t)和rI(t)的互補關系,瞬時相位則反映了rR(t)和rI(t)的非線性比例關系,而瞬時頻率直觀上為相位的微分,反映了r(t)更為復雜的特性.FM零中頻I/Q正交信號經過A/D采樣后,轉化為離散的時間序列{r(l)},并有r(l)=rR(l)+jrI(l),則瞬時頻率可以通過瞬時相位間接得到:

(9)
式中:fs為信號采樣頻率.

表1 算法一
1.2.2 瞬時頻率的傅里葉變換
在獲取通信輻射源信號瞬時頻率的基礎上,為進一步挖掘信號的潛在細微特征,需要將信號映射到高維的特征空間.本文將信號的離散瞬時頻率序列{fc(l)}進行傅里葉變換,有
(10)
信號瞬時頻率的傅里葉特征一定程度上反映了輻射源個體將基帶信息調制到頻率時的工作特性,較好地在高維特征空間表現輻射源的個體特征.
高階譜特征本身能夠很好克服高斯噪聲的影響,得到數據豐富的相位信息.而通過時域FM信號的瞬時頻率來表征信號的個體差異,能夠很好地反映輻射源將基帶信號調制到頻率上的工作特性,一定程度上體現了混頻器的性能差異,很大程度上彌補了傅里葉特征的表征能力,使輻射源信號的傅里葉特征同樣十分明顯.同時,由于高階譜特征是在傅里葉特征基礎上進行的相關運算,當傅里葉特征較為明顯時,信號的高階譜特征會出現與傅里葉特征較為相似的波形,其性能與傅里葉特征相近,而實際通信輻射源個體識別常常具有一定的時效性要求,傅里葉特征的運算復雜度大大低于高階譜特征,更適用于實際應用.因此,本文采用了傅里葉特征對輻射源個體進行特征提取.
1.2.3 基于全局潛在低秩表示的輻射源細微特征
時域信號的瞬時頻率經過傅里葉變換后,轉化為D維的傅里葉特征向量.在傅里葉特征空間RD中,需要進一步利用潛在低秩表示模型,挖掘能夠表征輻射源個體的潛在細微特征.

s.t.X=XZ+LX+E.
(11)
由于X為D×n階,則分解出來的潛在部分矩陣LX的每個列向量即為提取的信號潛在細微特征.
在上述的潛在低秩表示模型中,是將數據矩陣A本身作為一個對象進行潛在低秩表示.而在輻射源個體識別當中,對于一個D×n的特征樣本集,求解后的低秩系數矩陣Z為n×n階,反映了特征樣本之間的全局性低秩關系;低秩系數矩陣L則為D×D階,反映的是特征維度之間的全局性低秩關系,得到的低秩系數矩陣Z和L如圖1所示.

圖1 低秩系數矩陣Z和L
從圖1可以發現,系數矩陣Z和L的元素在對角線附近較為顯著,體現了很強的低秩特性.Z的元素分布說明,類別相同樣本具有較強的近鄰關系,相互聚集在某一低秩空間中;同時,L的低秩現象說明某些維度的信息具有很強的關聯性,進而為后續的特征提取提供了豐富的判別信息.
經過對施工圖審核管理工作現狀進行梳理,可以看出,咨詢單位所做的最為基礎的工作是:接收同行完成的設計圖文(以紙質版為主,也接收電子圖文),向對方分批次地反饋審核意見,設計方對審核意見應予以回復。對于未達成一致的意見,雙方可能會往返回復多次,確實無法達成一致,則可申請仲裁。所有往來的審核意見、回復意見均是電子版。
傳統的通信輻射源特征提取往往是針對輻射源的單個信號,通過特征映射、高階運算以及時頻分析等得到其特征參數或特征向量,具有很強的局限性,得到的特征僅僅來源于單個信號信息,并沒有利用信號之間的關系信息.并且,傳統的低秩表示模型也是針對單個信號進行處理,并未涉及信號之間的數據關系,得到的特征往往不能很好地反映樣本之間的高維結構.本文算法不僅僅通過傅里葉映射得到信號各自的特征,更通過潛在低秩表示模型,從全局的角度,利用信號特征集中包含的樣本之間的全局性信息,挖掘輻射源特征空間中所有樣本之間的低秩表示關系及其特征維度之間的潛在低秩關系,保證了特征提取算法的魯棒性.
在Glat-LRR中,將所有樣本構成的特征集作為一個全局對象進行潛在低秩表示,利用了樣本之間的全局性信息,得到維度之間的潛在低秩關系,而每個輻射源個體的瞬時頻率傅里葉特征即為特征樣本集X一個列向量.

表2 算法二
基于GLat-LRR的通信輻射源潛在細微特征算法可以得到信號的潛在細微特征,具體步驟如表2所示.
實驗數據為10部同廠家同型號FM電臺在相同工作模式下,實際采集的零中頻I/Q正交信號.信號中心頻率為160 MHz,信號帶寬為25 kHz,電臺接收機的信道帶寬為100 kHz.采樣頻率為204.8 kHz,采樣時間為1.5 s,得到由307 200個樣本點構成的樣本序列,每個電臺采集27個樣本序列.
圖2為利用FM復信號307 200個樣本點中連續的2 047個點計算的瞬時頻率,進行傅里葉變換后,最終得到10個電臺共270個1 024維的傅里葉特征樣本,構成傅里葉特征樣本集,即為1 024×270的矩陣.如圖3所示,利用GLat-LRR算法可以將特征樣本集X分解為3個1 024×270的矩陣.在通信輻射源個體識別實驗中,提取的電臺潛在細微特征即為圖3LX矩陣的每個1 024×1列向量.

圖2 270個信號構成瞬時頻率傅里葉特征樣本集

圖3 GLat-LRR算法提取的電臺潛在細微特征
時域信號的瞬時頻率經過傅里葉變換映射到特征空間,通過算法一對特征樣本集提取潛在部分矩陣,得到的列向量即為所求通信輻射源信號的潛在細微特征,GLat-LRR的算法流程如圖4所示.
在識別實驗中,利用圖3中的潛在部分LX作為輻射源個體的潛在細微特征進行個體識別實驗.同樣,針對信號的瞬時頻率,采用經典的矩形積分雙譜(Square Integrated Bispectra,SIB)特征以及文獻[7]提取的矩形積分雙譜/主成分(Square Integrated Bispectra /Principal Component Analysis,SIB/PCA)特征作為對比實驗.每次實驗重復20次,取各個算法的平均識別率作為最終的識別結果.
2.1 10部電臺的識別性能
為了驗證訓練樣本個數對識別結果的影響,將每部電臺27個樣本序列按比例隨機劃分為訓練樣本和測試樣本,構成訓練樣本集和測試樣本集.利用GLat-LRR算法分別對構造的訓練樣本集和測試樣本集進行特征提取,從而得到各自的潛在細微特征集.
10部FM電臺在不同的訓練樣本個數條件下的實驗結果如表3和圖5所示.
由表3可知,在所有的實驗條件下,GLat-LRR算法的識別率均顯著超過了SIB和SIB/PCA兩種算法.如:當訓練樣本個數少于180時,與其他兩種算法相比,GLat-LRR算法的識別率均高出10%,隨著訓練樣本繼續增多,GLat-LRR算法的識別率高出SIB和SIB/PCA約7%左右.從表3和圖5不難發現,SIB和SIB/PCA兩種算法在樣本數目較少時獲得相近的識別率,隨著訓練樣本增多,由于PCA作用,使SIB/PCA算法的識別率超過了SIB算法的識別率.

表3 10部FM電臺的平均識別率(%)
2.2 不同電臺的識別差異
在實際應用當中,由于輻射源的內部元器件的性能差異、本身生產工藝等因素影響,使得每個輻射源個體的識別難度會有比較大的差異.

圖4 GLat-LRR算法處理流程

圖5 10部FM電臺的識別結果

圖6 GLat-LRR算法對不同電臺的平均識別率
如圖6所示,在不同訓練樣本個數條件下,GLat-LRR算法對不同電臺個體具有顯著的識別差異.
從圖6可以看出,對每部電臺的平均識別率均在60%以上,當訓練樣本增多后,對每部電臺的平均識別率均在80%以上,其中,電臺1~3的識別率較高,說明其個體特征較為明顯.同樣,采用SIB特征和SIB/PCA特征,在不同訓練樣本個數條件下計算每部電臺個體的識別率.在圖6實驗的基礎上,三種算法對每部電臺的識別差異如圖7所示.

圖7 不同電臺的平均識別差異
圖7顯示的是,三種特征提取算法在8種訓練樣本個數設置下分別進行20次實驗后,即對每部電臺進行160次識別后的總平均識別率.
綜上所述,電臺1~3的識別難度最小,其個體特征較為明顯,易于識別.對于電臺4和電臺8,三種特征的總平均識別率較為相近,說明GLat-LRR算法并未很好地提取這兩部電臺的個體特征,需要進一步分析電臺個體特性,改進特征提取算法.而對電臺6和電臺10,與其他兩種特征相比,GLat-LRR算法則能夠提取有效的潛在細微特征,使得總平均識別率得到顯著提高.
2.3 特征維度
通信輻射源個體在某些頻率上往往會體現較為明顯的個體差異,在某些局部特征上的判別信息較為明顯.
為了驗證GLat-LRR算法隨特征維度變化的識別性能,分別采用30、90、150及210個樣本構成訓練樣本集,120個樣本作為測試樣本集,分別取256維的SIB特征中的前32、64、96、128、160、192、224、256維特征,利用GLat-LRR對其進行20次識別實驗,其平均識別效果如圖8所示.

圖8 GLat-LRR算法識別性能隨特征維度的變化
從圖8可以發現,GLat-LRR在512維之前的識別性能較差,而在512維至768維之間,識別率增長最為明顯,普遍能夠增加30%的識別率.其原因在于,如圖3所示,樣本的512維至768維的局部特征作為細微特征的主體,包含大量的判別信息,能夠大幅度增加識別效果,而其他維度的特征較為相似,判別信息很少,從而造成圖8中識別率增長區域較為集中,幅度較大的現象.
本文提出一種基于全局潛在低秩表示的通信輻射源潛在細微特征提取方法,在實際采集的FM信號數據集上取得了令人滿意的識別效果,對實際的通信輻射源個體識別具有較強的理論和應用價值.該方法基于通信輻射源信號的瞬時頻率,利用全局的潛在低秩表示,得到特征樣本之間全局的低秩結構以及特征樣本維度之間的全局潛在低秩關系,最終得到每個信號的潛在細微特征.在實際采集的通信輻射源數據集上,實驗結果驗證了該方法的有效性與魯棒性.
[1]DIETRICH J.A wavelet analysis of transients in phase-locked loops [D].Winnipeg:University of Manitoba, 1994.
[2]TEKBAS H, RETEN O, SERINKEN N.Improvement of transmitter identification system for low SNR transients[J].Electronics letters, 2004, 40(3):182-183.
[3]SERKINKEN N, RETEN O.Generalised dimension characterisation of radio transmitter turn-on transients[J].Electronics letters, 2000, 36(12):1064-1066.
[4]GERDES R, DANIELS T, MINA M, et al.Device identification via analog signal fingerprinting:a matched filter approach[C]// Proceedings of the 13th Annual Network and Distributed System Security Symposium.San Diego:NDSS, 2006.
[5]李學成, 段田東, 徐文艷, 等.基于固有時間尺度分解的信號細微特征識別[J].信息工程大學學報, 2014, 15(5):570-575.
LI X C, DUAN T D, XU W Y, et al.TD-based identification of signal fine features[J].Journal of Information Engineering University, 2014, 15(5):570-575.( in Chinese )
[6]徐玉龍, 王金明, 徐志軍, 等.基于小波熵的輻射源細微特征提取方法[J].數據采集與處理, 2014, 29(4):631-635.
XU Y L, WANG J M, XU Z J, et al.Fingerprint feature extraction method for emitters based on wavelet entropy [J].Journal of data acquisition and processing, 2014, 29(4):631-635.( in Chinese )
[7]徐書華, 黃本雄, 徐麗娜.基于SIB/PCA的通信輻射源個體識別[J].華中科技大學學報, 2008, 36(7):14-17.
XU S H, HUANG B X, XU L N.Identification of individual radio transmitters using SIB/ PCA[J].Huazhong University of Science &Technology (natural science edition), 2008, 36(7):14-17.(in Chinese)
[8]陸滿君, 詹毅, 司錫才,等.基于瞬時頻率細微特征分析的FSK信號個體識別[J].系統工程與電子技術, 2009, 31(5):1043-1046.
LU M J, ZHAN Y, SI X C, et al.Individual identification of FSK signals based on fine feature analysis of instantaneous frequency[J].Systems engineering and electronics, 2009, 31(5):1043-1046.(in Chinese)
[9]LIU G C, YAN S.Latent Low-Rank Representation for subspace segmentation and feature extraction[C]// IEEE International Conference on Computer Vision, 2011:1615-1622.
[10]LIU G C, LIN Z C, YAN S C, et al.Robust recovery of subspace structures by low-rank representation[J].IEEE transactions on pattern analysis &machine intelligence, 2010, 35(1):171-184.
[11]LIU G C, LIN Z C, YU Y.Robust subspace segmentation by low-rank representation[C]// Proceedings of the 27th International Conference on Machine Learning, 2010:663-670.
[12]CHEN M, LIN Z, MA Y, WU L.The augmented Lagrange multiplier method for exact recovery of corrupted low-rank matrices[J].Eprint Arxiv, 2013.10.8, arXiv:1009.5055v3.

唐哲 (1991-),男,山東人,電子工程學院碩士研究生,研究方向為壓縮感知、通信信號處理、通信輻射源個體識別.

雷迎科 (1975-),男,安徽人,博士,副研究員,研究方向為機器學習、通信信號處理.
蔡曉霞 (1965-),女,安徽人,博士,教授,研究方向為通信信號處理、通信網效能評估.
The extraction of latent fine feature of communication transmitter
TANG Zhe1,2LEI Yingke1,2CAI Xiaoxia1
(1.ElectronicEngineeringInstitute,Hefei230037,China;2.ScienceandTechnologyonCommunicationInformationSecurityControlLaboratory,Jiaxing314033,China)
In order to fully exploit the fine features of transmitter in the high dimensional feature space, we propose a method for extracting the fine features of communication transmitter based on global latent low rank representation.Firstly, we extract the instantaneous frequency of the signal of communication transmitter, and then transform the signal into a high dimensional feature space by the Fourier transformation.Secondly, the global low-rank structure between samples and global latent low-rank relationship between the dimensions are mined.Therefore, we can put the whole training sample set in the latent low rank representation model and get the latent part matrix of training sample set based on the low rank relationship between feature dimensions.Every column vector of latent part matrix is the latent fine feature vector of each communication transmitter signal.On the actually collected data set of the FM radios with the same model and manufacturer, the latent fine features extracted by our method can significantly improve recognition performance of different transmitter radios which reflects the effectiveness and robustness of our method.
communication transmitter;fine feature;instantaneous frequency;Fourier;latent low rank representation
唐哲, 雷迎科, 蔡曉霞.通信輻射源的潛在細微特征提取方法[J].電波科學學報,2016,31(5):883-890.
10.13443/j.cjors.2016011401
TANG Z, LEI Y K, CAI X X.The extraction of latent fine feature of communication transmitter [J].Chinese journal of radio science,2016,31(4):883-890.(in Chinese).DOI:10.13443/j.cjors.2016011401
2016-01-14
國家自然科學基金(61272333,61473237); 國防科技重點實驗室基金(9140C130502140C13068); 總裝預研項目基金(9140A33030114JB39470)
TN911.7
A
1005-0388(2016)05-0883-08
聯系人:雷迎科 E-mail:tongxtz@163.com