廖 帥,王揚鈞,姜 楠,段金虎
(北京市遙感信息研究所,北京 100094)
雷達輻射源信號由于受噪聲等多種因素影響,最重要的特征常常難以發現,特征提取一般采用經驗式的方法,所提取出的特征往往帶有主觀性和猜測性,且由于大量噪聲的存在,信噪比通常在幾dB到幾十dB之間變化,這些因素易造成特征向量在特征空間中的無序分布,使不同類別的輻射源信號特征在特征空間中發生嚴重交疊而致使分類識別率降低。為了消除特征提取的主觀性和提高準確識別率,需要采用特征選擇方法,按照與分類有關的評價準則從高維特征中挑選最有效的特征集。
特征選擇的任務是利用特征模式樣本集的內部信息,從一組特征中挑選出一些最有效的特征以達到降低特征空間維數的目的。特征選擇應能有效降低特征向量的維數、減少特征提取的代價、簡化分類器的設計和提高識別效率,因此,特征選擇是繼特征提取之后的一個重要研究課題,受到模式識別、數據挖掘、機器學習等多個領域研究人員的廣泛關注。
將分類器的錯誤概率作為特征選擇準則固然好,但即使在類條件概率分布密度已知的情況下錯誤概率的計算也很復雜,何況實際問題中通常不知道這一分布,這使得直接用錯誤概率作為分類標準來分析特征的有效性變得十分困難。因此,在實際應用中,需要尋求一種有效的解決方案來衡量各類別間的可分離性。
本文給出了一種類內聚集度和類間離散度的定義,并提出一種基于類內聚集度和類間離散度的特征集評價準則。基于該準則,采用特征排序選擇的搜索策略,可以從雷達輻射源信號原始特征集中挑選出品質優良的特征子集,從而實現對雷達輻射源信號的準確識別。
物理意義上,可把雷達輻射源信號多模特征分為以下五個類別。
脈沖序列統計特征:載頻、重頻、脈寬等;
脈沖序列衍生特征:載頻、重頻、脈寬的相關性及組合變化特征等;
單脈沖脈內調制特征:頻率、帶寬、調制類型、調制參數、零中頻相位曲線等;
單脈沖脈沖包絡特征:精測脈寬、上升沿夾角、下降沿夾角、頂部趨勢夾角、頂部波動、包絡J特征、包絡差分J特征等;
雷達掃描特征:圓周掃描雷達掃描周期。
從識別的角度考慮,按照特征描述的方式,可把雷達輻射源信號多模特征分為以下三個類別。
連續取值類特征:脈沖載頻、帶寬、重頻、精測脈寬、上升沿夾角、下降沿夾角、頂部趨勢夾角、頂部波動、包絡J特征、包絡差分J特征、掃描周期、脈內調制參數等;
離散取值類特征:載頻統計類型、重頻統計類型、脈寬統計類型、脈內調制類型、脈內調制碼等;
曲線圖片類特征:脈沖序列載頻/脈寬/重頻的相關性臉譜圖、脈內調制識別曲線、脈沖包絡曲線、零中頻相位曲線等。
按照第1節中對雷達輻射源信號特征的描述,特征可分為連續取值類、離散取值類以及曲線圖片類。對于離散取值類和曲線圖片類的特征,目前只能依賴人工分類判別及挑選,本文詳細討論了連續取值類特征的奇異樣本篩選及評價準則。首先,給出了一種類內聚集度和類間離散度的定義,依據類內聚集度,通過設置合理的閾值,挑選并剔除奇異樣本。然后,提出了一種基于類內聚集度和類間離散度的特征集品質評價準則函數,基于該準則函數,采用相關的搜索策略,可從雷達輻射源信號原始特征集中挑選出品質優良的特征子集。
定義1 第i類信號的類內聚集度Cii為:
(1)

定義2 第i類與第j類信號的距離Dij定義為:
(2)
定義3 第i類與第j類信號的類間離散度Sij定義為:
Sij=Dij/Cii+Cjj
(3)
式中,Dij是第i類與第j類信號的距離,Cii和Cjj分別為第i類與第j類信號的類內聚集度。
如果待識別信號共有H類(H≥2),考慮識別的復雜度,選擇的特征子集維數越低越好,另外各類的類間離散度平均值越大越好。由此,根據定義1和定義3給出的類內聚集度和類間離散度,設計評價特征集質量的準則函數為:
(4)
由式(4)可知,特征子集維數q越小,f值越大;各類的類間離散度Sij平均值越大,f值越大。準則函數f值越大,表明選擇的特征子集越好。
在對某個雷達輻射源信號進行特征提取及分析時,依據信號分選結果提取的脈沖樣本可能會存在個別的錯誤情況,即脈沖樣本不是該雷達輻射源真實脈沖或者選取的脈沖樣本體現出的特征不是雷達輻射源真實的特征,主要有以下幾類情況:
1) 由信號分選策略所導致的脈沖信號漏分選,造成頻率跳變或捷變的范圍沒有完整體現,表現出雷達參數變化類型的錯誤或不完整;
2) 分選出的脈沖列中包含個別其他輻射源的脈沖,或者挑選出的脈內采集數據不是原脈沖列包含的樣本脈沖的采集數據;
3) 當脈沖功率較低,例如一個大脈寬的脈沖功率在接收機靈敏度附近起伏時,會分裂成多個小脈寬的脈沖,造成分裂成小脈寬脈沖以及不規則小重頻;
4) 對于頻率分集信號和脈內頻率跳變信號,由接收機體制導致未能截獲部分頻點的脈沖,造成脈沖分裂,形成虛假脈沖現象。
因此,對樣本進行統計分析時,存在奇異值樣本是正常的,對特征進行統計分析之前,有必要檢查樣本特征的統一性,剔除奇異樣本。由于樣本的數量較小,但每個樣本提取的原始特征種類多,表述樣式不統一,不便于用統一的方法去查找錯誤樣本。對于離散取值類的特征,可通過統計樣本該特征不同取值的出現次數,剔除出現次數很少的奇異樣本;對于圖片曲線類的特征,通過人工比對分析,挑選出差異較大的樣本;對于連續取值類的特征,本文結合聚類的思想,給出一種依據樣本特征值聚集度的挑選奇異樣本并分類的方法。


Step4:設σ為樣本類數量閾值,當a<σ,第一類樣本因數量小于閾值判為奇異樣本,舍棄該類樣本,否則保留該類樣本;
Step6:對于保留的樣本,重復Step2,直到Δya/Δyb≤δ,結束流程。
樣本篩選完成后,對于同型雷達輻射源的幾個不同個體,依據樣本類內聚集度及類間離散度排序的特征選擇方法,挑選合適的特征,以降低后面個體分類識別的特征維數,提高分類效率和準確率,具體步驟如下:
Step1:設某型待分類的雷達輻射源信號總共有H類信號,共提取了q個特征,計算第i類與第j類信號的第n個特征的分離度Snij及準則函數fn,其中i=1,2,…,q,n=1,2,…,q;
Step2:按各特征的準則函數f由大到小進行排序,結果為fA1≥fA2≥…≥fAq,其中fAi為第Ai個特征的類間離散度;

特征提取和特征選擇是雷達輻射源信號識別的重要課題之一,本文在給出的一種類內聚集度和類間離散度定義的基礎上,提出了基于類內聚集度和類間離散度的特征集品質評價準則函數。基于該準則函數,采用特征排序選擇的搜索策略,可從雷達輻射源信號原始特征集中挑選出品質優良的特征子集,從而實現了信號特征的高效描述,提高了雷達輻射源信號識別的準確率。■
[1] 張葛祥,榮海娜,金煒東.基于小波包變換和特征選擇的雷達輻射源信號識別[J].電路與系統學報,2006,11(6):46-49.
[2] 張靜遠,張冰,蔣興舟.基于小波變換的特征提取方法分析[J].信號處理,2000,16(2):156-162.
[3] 錢濤,馬健,劉凱,等.基于連通檢測和區域擴展的多重聚類方法研究[J].航天電子對抗,2016,32(5):36-39.
[4] 楊建,周濤,何梓昂.一種有效的雷達信號快速識別方法[J].電訊技術,2017,57(4):418-424.
[5] 普運偉,金煒東,胡來招.基于瞬時頻率二次特征提取的輻射源信號分類[J].西南交通大學學報,2007,42(3):373-379.
[6] 沈家煌,黃建沖,朱永成.特征參數匹配法在雷達信號識別中的應用[J].航天電子對抗,2017,33(2):9-14.
[7] 吳振強,常碩,張國毅.基于信號特征綜合處理的雷達輻射源識別[J].科學技術與工程,2015,15(25):12-17.
[8] 郭亞琴,王正群.基于類內類間離散度的分類器設計方法[J].信息技術,2010,5(1):35-37.