羅佳奕, 李煊鵬,*, 李江浩, 薛啟凡, 楊 鳳, 張為公
(1. 東南大學儀器科學與工程學院, 江蘇 南京 211189; 2. 中國航天科工集團8511研究所, 江蘇 南京 211100)
輻射源信號分選是電子偵察的重要環節,是電磁目標識別和定位的前提保障。通過分選,對接收機獲取到的輻射源信號進行特征提取及去交錯處理,將混疊的輻射源信號進行區分,進而實現輻射源識別和威脅評估等目的,在現代戰爭中獲取電磁對抗優勢。
輻射源分選過程中使用到的主要參數可分為時域、空域和參數域。時域參數主要指脈沖到達時間(time of arrival, TOA);空域參數主要指脈沖到達角(direction of arrival, DOA);參數域參數包括脈沖頻率(radio frequency, RF)、脈沖幅值(pulse amplitude, PA)、脈沖相位(pulse phase, PH)、脈沖脈寬(pulse width, PW)等,這些參數構成輻射源脈沖信號描述字(pulse description word, PDW)[1]。現有方法大多依賴時域參數,而忽略其他參數,易使分選結果的準確性不高。
按照分選過程使用數據參數的不同,當前國內外輻射源分選方法主要有以下兩大類:基于脈沖重復間隔(pulse repetition interval, PRI)的方法和多參數特征融合方法。
基于輻射源PRI的方法具有物理意義明確、設備配置簡便等特點,是過去輻射源信號主分選流程的核心關鍵技術之一,在輻射源偵察中得到廣泛應用。其本質是使用統計學方法,以時域參數TOA為基礎計算PRI。常見的PRI分選方法有基于直方圖統計的方法和PRI變換法。直方圖統計方法對輻射源脈沖序列中各個脈沖TOA的相互差值進行累積計數,構造全差直方圖,設定判決門限以檢測可能的PRI值。常見的方法如擴展關聯法[2]、累計差值直方圖法(cumulative difference histogram, CDIF)[3]、序列差值直方圖法(sequential difference histogram, SDIF)[4]、PRI變換法等[5]。PRI變換法克服了傳統直方圖統計法的子諧波問題,具有較好的抗抖動性能[6]。然而,上述方法分選結果的準確性受到脈沖丟失和干擾噪聲影響極大。直方圖法不適用于重頻率抖動信號,且同樣受噪聲影響較大;PRI變換法在脈沖數據點較多時性能較差。因此,傳統PRI分選法只使用時域參數難以適應愈發復雜的戰場情況。
基于多參數融合的方法主要包括聚類分選方法和神經網絡分選方法。聚類分選方法將多參數組成的無標注樣本按照相似性度量進行分組,很適合解決缺乏先驗信息的輻射源信號分選問題[7]。對于本研究中的PDW輻射源信號數據,可選用的參數包括TOA、RF、PA、PH、PW等。相似性度量則可以用各種距離公式來衡量,如歐氏距離[8]、漢明距離[9]、馬氏距離[10-11]、曼哈頓距離[12-13]等,可靈活運用各種不同的衡量標準以適配數據的實際意義。常見的聚類方法有K-均值算法[14]、空間密度聚類算法(density-based spatial clustering of applications with noise, DBSCAN)[15-16]、排序點結構算法(ordering points to identify clustering structure, OPTICS)[17]、凝聚層次聚類(agglomerative nesting, AGNES)[18]等。然而,常見的聚類方法由于數據信息使用不全或模型自身缺陷,盡管分選精度最高能達到90%左右,但所用數據混疊程度較小。
基于神經網絡的分選方法對識別輻射源信號的調制方式也有良好的效果,主要思想為利用不同調制信號的時頻差異,將輻射源信號分選問題轉化為圖像識別問題[19-20]。常見方法有基于長短期記憶(long short-term memory, LSTM)網絡的方法[21]、基于卷積神經網絡(convolutional neural network, CNN)的方法[22]、基于深度殘差網絡(deep residual neural network, DRNN)的方法[23]等。然而,基于神經網絡的方法需要大量訓練樣本和標注,耗時較長且可解釋性不強,目前仍然不是可以系統化使用的首選方法。
綜上所述,基于多參數融合的方法顯著降低了對數據的依賴性,相比PRI方法適應性更強,更適合信號點較多的數據集。本文在聚類方法的基礎上提出多參數融合的兩級分選框架。針對傳統聚類方法難以處理混疊信號的問題,提出了時空密度聚類模型以降低時頻域脈沖信號的混疊程度,作為第一級分選;針對單一分選方法精度不高的問題,利用信號幅值連續性,使用三維交并比(intersection-over-union, IoU)作為第二級分選,進一步提升總分選精度。
本研究使用全向干涉儀采集的PDW數據,具有時域、空域、參數域等多個維度的信息,各維度信息在參數空間嚴重混疊交錯。此類數據存在大量噪聲干擾,且存在大量脈沖丟失的情況,因此使用傳統的PRI分選方法效果較差、精度較低[24]。
本研究提出一種多特征融合的層級分選方法:第一級為時空密度聚類,第二級為三維IoU,兩級分選級聯輸出最終分選結果,算法流程如圖1所示。
基于密度的聚類方法將數據集看作若干個高密度簇的集合,并將低密度區域分割,對密集數據點分選效果較好。DBSCAN算法是一種基于密度的常用算法,其核心思想是定義樣本鄰域、樣本間距離及鄰域參數,通過樣本密度來衡量樣本間的可連接性[25]。若某一區域的樣本數據點密度大于設定的樣本密度分布閾值,則將此樣本數據歸到此類分選樣本集合中,否則,對此樣本數據點重新生成新的聚類樣本中心點,重新進行樣本密度與閾值判斷,直到遍歷所有的樣本數據集合,并生成聚類簇。
DBSCAN算法在一般幾何規則分布的數據上表現效果佳[26],但在各維度間數據分布顯著離散、或某些數據具有特殊意義時,空間密度聚類效果存疑[27]。
針對PDW信號數據這類具備時間維度,且信號點在時間維度上的密度顯著大于其他空間維度的數據,應將時間維度納入算法以提升效果[28]。因此,本研究在DBSCAN的基礎上,將空間密度聚類在時域上進行拓展,構建圖2所示的柱體模型時空密度聚類方法(spatial-temporal density-based spatial clustering of applications with noise, ST-DBSCAN),并有如下定義。

圖2 對象的時空鄰域柱體模型Fig.2 Spatial-temporal neighborhood of the object
時空實體:在時空多維空間內,選取一個核心點ST,稱為時空實體。
時空鄰域ε:時空實體ST的時空鄰域ε定義為以R為底面半徑,ΔT為高的圓柱體,如圖2所示。
最低點數Pmin:時空鄰域ε內手動設置的一個閾值,表示該鄰域內應被包含點的最低數量。
核心對象p:對于給定的時空鄰域ε、Pmin,若對象p的ε鄰域包含的其他對象點個數Nε(p)滿足下式,則點p為核心對象:
Nε(p)≥Pmin
(1)
直接密度可達:對于給定點p和q,若p在q的時空鄰域ε內,則稱對象p從對象q直接密度可達。
密度可達:對于給定的對象點集合D,若存在一個對象鏈P1,P2,…,Pn,P1=q,Pn=p,且對Pi∈D,(1≤i≤n),Pi+1從Pi關于ε和Pmin直接密度可達,則稱對象p從對象q關于ε和Pmin密度可達。即密度可達由一系列直接密度可達傳遞得到。TOA-RF-PW三維空間內多個時空實體之間的關系如圖3所示,密度可達用單箭頭表示。

圖3 三維ST-DBSCAN示意圖Fig.3 Three-dimensional schematic diagram of ST-DBSCAN
密度相連:若對象點集合D中存在一個對象點o,使得對象p和對象q從o關于ε和Pmin密度可達,那么對象p和對象q關于ε和Pmin密度相連。如圖3所示,密度相連用雙箭頭表示。
邊界點:若對象點p不是核心對象,而是從某一核心對象q密度可達的對象,則稱p為邊界點。
噪聲點:若對象點p不是核心對象,也不是任何核心對象的密度可達對象,則稱p為噪聲點。
使用ST-DBSCAN找到密度相連對象的最大集合,并以此為依據進行聚類,實現一級分選。具體分選流程如圖4所示。

圖4 ST-DBSCAN流程圖Fig.4 Flow chart for ST-DBSCAN
與空間密度聚類思路相似,為了更好地適配柱體時空模型,應先根據實際情況人工設置時空鄰域ε和Pmin參數,通常可直接設置區域半徑來實現;為了提升柱體時空模型的效果,RF和PW兩維度數據分布應較為均勻,因此需要進行歸一化操作;之后,算法遍歷檢查每個點,從任一核心點出發,不斷向密度可達的時空鄰域ε擴張,得到一個包含核心點和邊界點的最大化區域,視為一個聚類簇,且該簇內任意兩點至少是密度相連的。針對所有核心點的統計均完成后,仍未聚類到任何一個簇中的對象將被認為是噪聲并刪去[29]。
通過上述時空密度聚類方法,可以輸出一級分選結果C1,作為二級分選的輸入做進一步優化。
IoU是目標檢測中一種常見的用來衡量預測值和真實值之間關系的指標,定義為兩個矩形交集與并集的比值,取值在[0,1]之間[30]。當IoU=0時,兩對象完全無交集,表明其預測結果完全錯誤;當IoU=1時,兩對象完全重合,表明其預測結果完全正確。通過手工設定IoU閾值可以調整分選結果。
一個簡易的交并比包含A,B兩塊區域,定義如下:
(2)
屬于同一輻射源的PDW信號在PA維度具備一定的包絡特征,且TOA維度上信號點集中;在輻射源非變頻調制時,屬于不同輻射源的PDW信號在RF維度區分度顯著。因此,本研究在TOA-RF-PA三維空間內計算各PDW信號間的IoU。如圖5所示,點P1~P5三維鄰域的IoU大于閾值,因此屬同一點簇;而P6與P1~P5的IoU為0,因此不屬于同一點簇。

圖5 TOA-PA-RF三維空間中的IoUFig.5 IoU in TOA-PA-RF three-dimensional space
在一級分選獲取的每一個C1上使用三維IoU分選法,最終獲取C2個聚類。
綜上所述,一級時空密度聚類方法接受原始PDW數據,使用TOA、RF、PW 3類參數輸出一級分選結果,將原始數據集分成C1個聚類;二級IoU方法接收一級結果,針對C1中每一類使用TOA、RF、PA 3類參數再次分選,共獲得C2個聚類。將二者級聯,以輸出更優質的分選結果。
“用不著了,我準備明天去自首。”范堅強淡淡地說,“后事已經安排好了,公司的財產已轉到你名下,明天開始,你就是一風公司的總經理。我這樣做,不是要你原諒我什么,這只是我對你們母子的一點補償。”
本研究首先使用仿真模擬數據來驗證方法的有效性。根據輻射源連續頻率調制方法中的正弦非線性調頻獲取仿真輻射源信號,此類調頻可以產生更高的傳輸平均功率,較為常用[31]。
如圖6所示,仿真數據的具體生成方法如下:先確定組成目標PDW信號集的各簇、各參數取值范圍,再對每一簇的頻率和幅值分別做正弦型調制,并添加微小擾動以模擬真實情況下的數據誤差。生成數據的流程如圖6所示。

圖6 仿真PDW數據生成流程Fig.6 Simulated generation process of PDW data
生成的數據集如圖7和圖8所示,仿真數據共包含近2 000個數據點,TOA設定在0~1 s,頻率分布在0~60 Hz之間,PA絕對值不超過3 dB。

圖7 仿真PDW原始數據三維分布Fig.7 Three-dimensional distribution of simulated PDW signals raw data

圖8 仿真PDW原始數據二維分布Fig.8 Two-dimensional distribution of simulated PDW signals raw data
使用上述時空密度聚類對該仿真數據及進行兩級分選,所得結果如圖9所示,使用二維圖像中的包絡線特征做分選結果可視化,其中不同顏色點分別表示分選出的不同類輻射源信號簇。

圖9 仿真PDW數據分選結果Fig.9 Sorting results of simulated PDW data
與其他同類聚類方法相比,本研究在分選檢出率和準確率上都有較大優勢,如表1所示。由于K-均值聚類等方法需要提前指定聚類數目,難以滿足本研究要求,因此不參與比較。

表1 仿真數據實驗結果Table 1 Experimental results of simulated data %
現代電磁環境下的輻射源信號錯綜復雜,且考慮到數據安全,常人為添加調制。接收機獲取輻射源信號后,可采用數字瞬時測頻(digital instantaneous frequency measurement, DIFM)或快速傅里葉變換(fast Fourier transform, FFT)等方法獲取PDW信號的頻率等參數,并經過變頻和模擬變換后,通過模數轉換器件量化采樣得到幅值等參數[32-33]。
本文使用全向干涉儀實際采集得到的PDW數據為例進行實驗。真實數據共有3 000個數據點,包含TOA、RF、PW、PA 4個維度的參數信息,如圖10和圖11所示,PDW信號在各個參數維度下尺度相差較大,TOA范圍為0~64 ms, RF范圍在502 MHz左右, PA范圍為0~40 dB。

圖10 真實PDW原始數據三維分布Fig.10 Three-dimensional distribution of real PDW signals raw data

圖11 真實PDW原始數據二維分布Fig.11 Two-dimensional distribution of real PDW signals raw data
使用上述時空密度聚類對該仿真數據集進行兩級分選,所得結果如圖12和圖13所示,分別使用三維、二維圖像中的包絡線特征做分選結果可視化,其中不同顏色點分別表示不同的輻射源信號簇。

圖12 真實PDW數據三維分選結果Fig.12 Three-dimensional sorting results of real PDW data

圖13 真實PDW數據二維分選結果Fig.13 Two-dimensional sorting results of real PDW data

表2 實際數據實驗結果Table 2 Experimental results of real data %
被分選后屬于同一信號源的簇在TOA-PA空間內呈現明顯的正弦包絡特征,符合常見的輻射源幅值正弦調制方式[34]。
本研究分別使用仿真數據和實際數據對多參數融合的輻射源信號分選算法做出檢驗,均取得可以量化的成果,體現出相比其他聚類分選方法的優越性。
本實驗的結果仍可從以下角度進一步提升。
如圖14所示,本研究使用的PDW信號數據在頻率和脈寬上的分布不統一:在相同的標準化范圍條件下,屬于同一輻射源的PDW信號點在RF-PW空間內成橢圓分布。其中,橫坐標軸為PDW信號點RF,縱坐標軸為PDW信號點PW,使用脈沖的下降沿和上升沿時間之差計算,長短軸差距極大,這導致柱體時空模型中僅使用單一半徑R作為空間鄰域半徑的判定方法難以同時兼顧兩個維度。改善歸一化處理方法可以優化這個問題,但會讓部分重疊區域區分度降低。

圖14 空間域的標準化問題Fig.14 Standardization problem of spatial domain
本研究所述方法涉及4個參數:空間半徑R,時間區域ΔT,最低點數Pmin和標準化參數δ。判斷密度的核心是根據時空鄰域中樣本數量與最低點數Pmin的關系,同時涉及4個參數的調整。因此,如何獲取各參數的聯合最優解是一個可以改進的方向,可考慮對“密度”進行新的定義來解決。
使用IoU方法需設置三維矩形框范圍和IoU閾值,若閾值設置過高會導致數據點丟失,設置過低則會導致噪聲點增多。通過改進自適應閾值選取方法可以有效改善這一問題。
由于不同維度信息數據的尺度和分布不同,在數據標準化時比例不同,導致各數據維度對IoU數值的貢獻有所差異。因此,需要根據實際情況適度修正多維空間內IoU,使結果更優。
隨著加入特征數量的增多,并集部分所占比重越來越低,使得新加入特征的邊際效應持續遞減,可以通過優化多維空間中IoU計算方法來改進這一問題。
本文提出了一種基于時空密度聚類和三維IoU的輻射源PDW信號兩級分選方法。一級分選采用TOA-RF-PW三類參數,構建時空密度聚類模型進行分選。二級分選在一級分選的基礎上,使用三維IoU方法在TOA-RF-PA三維空間內進行優化,提升了分選準確率。本文分別采用仿真數據和實際數據進行實驗,最終分選結果的各簇內部經可視化驗證均呈現正弦調制的包絡特征,符合單一PDW輻射源特征規律,驗證了該分選方法的有效性。
該方法改善了傳統PRI分選法面對復雜輻射源信號的分選能力弱的局限性,但目前只適用于常規輻射源,針對捷變型等輻射源需開展進一步研究。