劉家豪, 郭 英, 孟 濤, 齊子森, 李紅光
(空軍工程大學信息與導航學院, 西安, 710077)
基于傳統信號參數估計手段獲取信號常規波形參數實現通信輻射源識別的方法,難以對于相同波形參數類型的多個輻射源完成可靠的個體識別。例如同步組網的跳頻網臺[1]中,網內每個跳頻輻射源發出的信號都具有相同的頻率集、跳頻速率、碼元速率、調制樣式等參數特征,僅僅依靠常規的參數化穩態特征分析無法實現網內輻射源的個體識別,特別是在復雜的電磁環境中,提取常規穩態參數的準確性都難以保證。對于通信對抗支援而言,通信輻射源個體識別的可靠性和可信度下降,將直接導致不能提供有效的干擾引導,顯然無法滿足戰場的電磁對抗需求。
對于輻射源個體來說,由于元器件制造工藝帶來的個體誤差不可避免,整機裝配更存在著細微差別,因此盡管是來自于同一生產線上的同一型號電臺,仍然存在著不影響信息傳遞的可檢測、可重現的細微特征差異,我們將這些因為電臺輻射源器件之間細微差別而造成的電臺輻射源信號的細微特征稱之為輻射源的指紋特征[2-4]。針對輻射源的指紋特征研究表明,具有代表性的指紋特征反映在輻射源波形的暫態特征上,暫態特征[5]相比于穩態特征,包含著更加豐富的個體特征,因此近年國內外學者針對輻射源的暫態特征進行了廣泛的研究。信號暫態特征提取是實現通信輻射源識別的重要一步,常用的信號暫態特征研究主要集中在幅度、頻率和相位3個層面,特征處理的數學方法針對性明顯,但也存在相應的弊端,其中針對幅度方面,分型特征是進行非平穩信號分析的有力工具,但是基于幅度提取的信號暫態特征,區分度較小,尤其是在低信噪比條件下,識別效果不佳;針對頻率方面,傳統方法是對非平穩信號進行時頻分析,包括不僅限于快速傅里葉變換(fast Fourier transform,FFT)、短時傅里葉變換(short-time Fourier transform,STFT)[6]、小波變換(wavelet transform,WT)和希爾伯特-黃變換(Hilbert-Huang transform,HHT)[7-8]等等,其中小波變換應用較為廣泛,但是在低信噪比情況下,該方法表現較差,存在小波基的選擇問題;針對相位特征方面,常用的方法是把信號暫態部分變換為復信號,之后再提取其相位特征,但是僅僅利用其相位特征來進行個體識別的效果并不理想,需要與信號暫態部分的其他特征相結合進行聯合特征分析;此外,文獻[9]中提出了一中基于時頻分析方法的輻射源調制識別方法,通過時頻分布將信號轉換到時間-頻率二維圖像,通過計算復雜度和特征維數實現特征提取,但這類方法存在最佳核函數的確定以及交叉項干擾等問題,比較復雜。近年來,經驗模態分解(EMD)[10-12]發展比較迅速,通過EMD分解實現將原信號分解為各個信號分量,有效規避了核函數的選擇問題,另外,信號的雙譜特性還能有效的抑制高斯噪聲,在處理非平穩信號中具有獨特優勢,可以動態描述信號的時頻分布,放大不同輻射源的暫態特征差異,提供了信號暫態部分細微特征分析的新思路,文獻[13]中提出了基于EMD的Hilbert譜對稱性參數估計算法,取得了較好的分類效果,但在抗噪聲干擾的效果上還有所不足。
綜合幾類典型暫態個體特征定義及提取特點,本文采用EMD分解和HHT變換提取信號暫態特征,再運用奇異值分解選取重要程度高的部分特征[14]作為輸入數據,并結合機器學習等分類器設計理論,訓練支持向量機(SVM)分類器,實現輻射源的個體識別。為了驗證本文提出的個體識別方法的有效性,以識別準確率作為評判標準,選取了4類輻射源信號進行特征分析實驗,驗證了本設計獲得了更好的識別效果。
本文使用的實驗數據是采集到有噪聲的4個通信輻射源信號,信號采樣率為1.01 MHz,最終獲得到的每個信號的長度為10 240幀。首先我們將每類信號依照一段數據為512幀劃分,獲得20個數據,從而得到4類信號共80個數據。
經驗模態分解可以將任何一個復雜的序列分解為若干個本征模函數(intrinsic mode function,IMF)[15]分量之和。采用EMD作為非平穩信號的處理手段,可以依據數據本身特征來進行信號分解,生成有限個IMF,各IMF分量代表了原信號不同的頻率分量。通過EMD分解后,得到的IMF分量需滿足以下2個條件:①經過分解得到的時間序列,極值點數量與過零點的數量差值不超過1;②在分析時間序列內,經過插值方式擬合的極值包絡線的均值為0。
輸入一個長度為512幀的通信輻射源信號是s(t),進行EMD處理的基本流程如下:
步驟1找到原始信號s(t)所有的局部極大值點和局部極小值點;
步驟2用3次樣條曲線擬合出上下極值點的包絡emax(t)和emin(t);
步驟3求上下包絡的平均值;
(1)
步驟4原始信號與上下包絡均值相減計算差值;
d(t)=s(t)-m(t)
(2)
步驟5判斷得到的差值d(t)是否滿足IMF的2個條件,若不滿足,則用d(t)重復前面4個步驟,直到dk(t)滿足條件為止,此時得到的dk(t)就是第一階IMF分量:imf1(t);
(3)
步驟6每得到一個IMF分量,就從原始信號s(t)中減去,得到剩余分量r1(t),再對剩余分量r1(t)重復前5個步驟,直到最后得到的剩余分量ri(t)就只是單調序列或者常值序列,此時便得到了信號的各階模態分量。
(4)
經過EMD分解后,信號s(t)最終分解為7個IMF分量和1個殘余分量,如圖1所示。

圖1 EMD分解示意圖
本實驗共80個數據,需要對每個數據都進行EMD分解,得到每個數據的各階IMF分量和一個殘余分量。殘余分量是單調序列或者常值序列,對信號特征提取沒有實質影響,因此,舍去殘余分量,用7個IMF分量:imfi(t),(i=1,2,…,7)進行特征提取。
對非平穩信號而言,比較常用的時頻分析方法主要包括FFT、STFT、WT和HHT等。其中FFT對非平穩信號處理效果差,STFT存在窗函數選擇窗長問題直接影響時域和頻域的分析不夠準確,WT不存在加窗函數的問題卻存在小波基的選擇問題,本文選取HHT變換作為信號暫態部分的時頻分析手段,從而實現輻射源的指紋特征提取,該方法是以前文所提到的經驗模態分解方法為基礎的一種非線性分析的新方法,可以自適應地利用信號的局部信息,從而獲得信號某一時刻的瞬時狀態,既可以很好地體現信號的時頻變化,又克服了小波變換中需要選擇小波基的困難。
對EMD分解后的7個IMF分量:imfi(t),(i=1,2,…,7)進行HHT變換,即對每一個IMF分量進行Hilbert變換:
(5)
再求相應IMF分量的瞬時頻率ωi(t):
θi(t)=arctan (di(t)/imfi(t))
(6)
(7)
根據ωi(t)和t就可以得到時頻圖。
本節選擇了4類輻射源信號進行實驗,對信號進行EMD分解后,通過HHT實現信號的特征提取,4類信號的HHT譜如圖2所示。

圖2 4類信號的HHT譜
通過4類信號的HHT譜可以清晰地看出4類輻射源信號的差異所在,由此可以推測,可以通過HHT變換提取信號的指紋特征來實現輻射源的個體識別。
因為進行經驗模態分解之后的信號中,通常少量的數據就包含了信號的主要信息,因此,本文采用奇異值分解(singular value decomposition, SVD)[16]的方法來進行特征選取。
SVD奇異值分解的原理是:假設一個m×n階的矩陣M,那么必定存在一個m×n階的對角矩陣Σ,一個m×m階的酉矩陣U滿足UTU=I,一個n×n階的酉矩陣V滿足VTV=I,使得矩陣M滿足分解:
M=UΣVT
(8)
滿足式(8)就稱為M的奇異值分解,奇異值就是分布在Σ對角線上的數值,為Σi,且按大小進行排列。
在很多情況下,前10%甚至更少的奇異值所包含的信息就能夠達到90%以上,所以,我們只需要用最大的k個奇異值就能夠對矩陣進行描述,即:
(9)
因此,通過奇異值分解,我們就可以得到較少的包含了大部分特征信息的數據。
對輻射源進行個體識別的算法通常有聚類算法和分類算法,兩類算法是完全不同的。聚類算法所研究的數據是沒有標簽的,無法通過標簽實現數據的分類,其分類依據是通過算法判斷各個數據之間的相似程度,通過對比相似程度,相似程度高的數據歸為一類,實現了數據的分類,最終歸為一類的數據相似程度高,而不同類別之間相似程度低。常見的分類算法如支持向量機(SVM)[17-18]、神經網絡、最鄰近分類器都是通過對輸入的數據進行訓練,按照一定的標準將數據貼上標簽,這個標簽就是代表著數據的類別,最終通過標簽實現對測試集數據的分類。本文選取SVM算法對奇異值分解提取的暫態特征進行分類,實現輻射源的識別。
SVM算法最初是為了二分類問題設計的,通過尋找一個最優的分類器將具有多個屬性的數據正確地分為兩類,為了達到最大的泛化能力,要求距離分類器最近的不同數據集之間的間隔最大[19]。分類器的類型取決于數據屬性的維數,二維的分類器是直線,三維的分類器是平面,多維的分類器是超平面。使用線性函數構造這個分類器:
f(x)=w·x+b
(10)
式中:w是權重;x=(x1,x2,…,xn)為訓練數組;n為特征個數;xi表示每個x在屬性i上對應的值;b是偏置;w·x表示w和x的內積。對數據進行分類,就需要將數據帶入這個函數,通過計算f(x)的值來確定所屬的類別。當f(x)>0就判定為類1,當f(x)<0就判定為類2。
將數據拓展至任意維,求最優分類器就是求最優超平面。當超平面:
w·x+b=0
(11)
滿足:①對所有數據分類正確;②分類間隔最大,即‖w‖最小,則該超平面為最優超平面。假設分類數據有m個(x1,y1)(x2,y2)…(xm,ym),xi∈Rn,yi∈{-1,+1}表示類別號,實現SVM算法等同于求解一個帶有不等式約束的非線性規劃問題:
(12)
SVM是一個二分類器,但可以通過訓練多個分類器實現多分類,常見的有以下兩種方式:
一對一(one-vs-one):假設有n類數據,其中每2個類就需要訓練1個分類器,總共需要訓練n(n-1)/2個分類器。例如有4類數據:1,2,3,4,就需要訓練6個分類器,分別是:1類和2類,1類和3類,1類和4類,2類和3類,2類和4類,3類和4類。輸入數據經過訓練的所有分類器的預測,最后由投票的方式來決定它最終的類屬性。
一對多(one-vs-rest):假設有n類數據,需要訓練n個分類器。例如有3類數據:a,b,c,要分出a就將a類數據設為正集,其它2類同設為負集,同樣操作區分b類和c類,一需要訓練3個分類器。輸入數據經過訓練的所有分類器的預測,再通過比較置信度的大小,選擇置信度最大的類別標記為最終的分類結果。
本文運用一對多的方式訓練多個分類器,對奇異值分解后得到輻射源特征進行分類。
將輻射源信號進行EMD分解以及HHT變換提取暫態特征,并通過SVD奇異值分解得到的數據量少、包含了主要信息的信號特征作為SVM分類器的輸入。我們把數據隨機劃分為訓練集和測試集,其中訓練集劃分50個數據,測試集劃分30個數據。運用訓練集的數據訓練4個分類器,再用測試集對訓練好的分類器進行測試,觀察識別準確率,實驗結果如下所示:
當奇異值個數分別為5、10、50、100、200、240時,測試集與預測結果對比圖見圖3。

圖3 奇異值個數取不同值時的對比圖
通過表格能夠更加直觀地顯示分類結果及識別率,如表1~6所示。

表1 奇異值個數=5時的分類結果

表2 奇異值個數=10時的分類結果

表3 奇異值個數=50時的分類結果

表4 奇異值個數=100時的分類結果

表5 奇異值個數=200時的分類結果

表6 奇異值個數=240時的分類結果
因為本實驗中訓練集和測試集是隨機分配,所以每一次實驗,測試集中每一類信號的個數是不固定的。
從表格中可以看出,當奇異值個數較少時,識別準確率較低,識別效果不佳;當奇異值個數較多時,隨著個數的增加,識別準確率不斷上升,當奇異值個數達到240個時,識別率為100%。此時,作為信號特征參與信號識別的奇異值個數240占信號總奇異值個數510的47.1%,占比較大,運算速度略有下降,以較小的代價獲得了更高的識別率。實驗結果表明,本文所設計的分類器能夠較好地對輻射源個體進行識別,識別率高。其優點在于處理較大數據時可以保證較高的效率。
通過小波變換WT提取暫態特征[20-21],并結合支持向量機進行分類,得到的識別準確率與本文方法得到的識別準確率對比如表7所示。

表7 不同特征提取方法的分類識別結果
從分類識別結果的表格中可以看出,本文提出的通信輻射源識別方法效果更好。
通過實驗驗證,本文采用的EMD算法和SVM算法,通過不斷調整提高奇異值分解個數來增加指紋特征的數據量,最終實現了對四類輻射源數據的個體識別,在增加奇異值分解個數的同時,運算速度并沒有因此而大幅降低,保證了較高的運算效率。通過EMD分解克服了以往對信號進行特征提取的經典時頻分析方法的抗噪性能差的弊端,對輻射源信號的特征提取手段進行了一定的優化,最終通過SVM算法也獲得了較好的分類結果。