劉 建柴新新劉正成
(中國船舶集團有限公司第八研究院,江蘇 揚州 225101)
電子戰是敵我雙方利用電磁能和定向能以破壞敵方武器裝備對電磁頻譜、電磁信號的利用或對敵方武器裝備和人員進行攻擊和殺傷,同時保障己方武器裝備效能的正常發揮和人員安全而采取的軍事行動。雷達脈沖去交錯技術是電子戰中至關重要的一部分,是電子支援的核心和雷達對抗系統中的關鍵技術。在復雜的電磁環境下,來自同一類型的輻射源脈沖信號通常會采用同一傳播路徑,這使得接收到的信號在時域、空域和頻域上均高度重疊交錯。來自相鄰方向上的同一類型輻射源發出的脈沖信號往往只是在頻率上有所不同。但是,現代先進輻射源的脈沖頻率會有一組集合,對于不同的輻射源而言,它們在這個頻率集合上是存在交叉重疊的。在這種情況下,使用傳統的去交錯方法很難識別輻射源數量以及對混合脈沖信號去交錯。
本文提出一種對同一類型、同一方向的混合脈沖信號的去交錯方法。該方法首先根據脈沖信號的多參數對混合信號進行聚類,產生大量交錯的小信號群。接著,采用集成學習的Stacking方法對脈沖信號進行分類,從而達到對不同輻射源信號去交錯的結果。
傳統的去交錯方法主要包括:基于脈沖重復間隔(PRI)的方法、基于脈沖多參數的方法、基于聚類的方法和基于脈內特征的方法。
常用的基于PRI的去交錯方法有統計直方圖法(如CDIF和SDIF)和PRI變換法。基于PRI的去交錯方法利用到達時間參數(TOA)來計算脈沖之間的PRI。但是在混合脈沖信號中,僅有交錯在一個狹窄范圍內的PRI能被正確檢測到?,F代的輻射源越來越復雜,通常有較大的PRI范圍和復雜的交錯,這使得使用單一參數去交錯的方法變得愈加困難。因此,目前研究多數集中在使用多個參數進行去交錯。
多元脈沖參數去交錯方法的思路來自于模板匹配,從接收到的信號中提取TOA、DOA(波達方向)、射頻(RF)、脈寬(PW)和脈沖幅度(PA)等參數,并與輻射源數據庫中的模板進行比對。隨著人工智能技術的發展,多參數模板匹配方法也有了新的進展。例如,使用神經網絡能夠提高高度重疊脈沖信號去交錯的正確性。基于脈沖多參數去交錯方法的性能取決于輻射源數據庫的正確性和完整性。
基于聚類的去交錯方法也使用脈沖參數。每個輻射源被當做一個群組,每個脈沖都是一個樣本。來自同一個輻射源的信號屬于一個群組,以此進行混合信號去交錯。由于聚類方法是無監督的,因此不需要先驗知識?;诰垲惙椒ǖ男阅苋Q于來自同一輻射源信號的相似性和不同輻射源信號的差異性。
基于脈沖特征的去交錯方法除了使用上述提出的多個參數外,還引入了一個新的特征維度。然而,復雜電磁環境下脈沖信號的脈內特征提取存在一定的困難,目前對該技術研究較少。
在復雜電磁環境下,混合脈沖信號的脈沖參數TOA、DOA、PW 和PA 非常接近,甚至相同。在這種情況下,傳統的基于多脈沖參數的去交錯方法性能較差。因此,本文提出一種利用聚類和集成學習相結合的方法對復雜電磁環境下的混合脈沖信號進行去交錯。
如圖1所示,本文提出了一種將聚類方法和集成學習相結合的去交錯方法。該方法首先利用脈沖參數進行聚類,得到若干個小的信號群組;接著進行特征提取,然后將數據集輸入到分類器中進行訓練和預測,采用集成學習的Stacking方法將不同信號群組按照輻射源進行分類融合,從而將交錯信號分開。

圖1 基于聚類和集成學習的去交錯方法模型圖
在聚類階段,分別利用脈沖的RF和TOA 2個參數進行2次聚類。通過不同的參數進行聚類,將混合脈沖劃分成若干個小的信號群組,在同一個群組內的信號來自于同一個信號源。下一步將會把不同群組按照信號源分類進行融合。
由于相同類型的輻射源有著相同的DOA,為了避免互相干擾,就必須使用不同的RF。因此,在這種情況下RF是區分不同信號源最有效的參數。每個輻射源可能有多個頻率,但是不同輻射源的頻率集是不重疊的,因此將具有相同射頻的脈沖分到同一個群組()中,并計算PRI 值,方便后續處理。
第2次聚類利用脈沖的TOA 參數。假設信號組()中最新的2個脈沖的PRI值相等,則后續脈沖()的TOA 可以根據脈沖信號的延續性計算得到:

式中:和分別表示來自同一個輻射源的群組索引號;
表示某個信號群組中的脈沖序號。因此,相鄰脈沖群組滿足公式(1)的可以被歸為來自同一個輻射源,并融合到群組(),如圖2所示。

圖2 脈沖信號TOA 參數聚類
來自同一個輻射源的脈沖序列通常有著某種變化趨勢,這取決于輻射源的特性和位置影響。因此,脈沖信號的變化趨勢可以被用來混合脈沖去交錯。例如,搜索型輻射源脈沖信號的幅度(PA)通常會有一個凸起形狀,如圖3 所示。信號組()和()有著同一種變化趨勢,很大概率來自于同一輻射源,而()來自于另外一個輻射源。

圖3 脈沖幅度的變化趨勢
專家能夠通過對大量數據進行分析獲得信號的變化趨勢,并且在遇到新的混合信號時,可以確定輸入信號的數量以及根據所學知識識別來自于同一輻射源的信號,我們的目標就是構建一個像專家這樣有效工作的機器系統,因此本文采用了集成學習的思想來構建這個系統。
如前文所述,聚類是基于脈沖序列的變化趨勢。因此,從相鄰的2個信號群組中提取的特征應該能夠表征它們之間的關系和脈沖序列的形狀。本文中用到的特征與文獻[6]中一致,如表1所示,其中表示信號組的索引號,表示信號中脈沖的索引號。

表1 Stacking模型中輸入的脈沖特征
到達時間(TOA)差值特征表示信號組序列,來自同一個輻射源的信號組的差值必須為正值,而差值為負值則表示存在2 個不同的輻射源。幅度(PA)差值特征表示相鄰的信號組幅度的連續性,來自同一個輻射源的信號組必須有很小的幅度差值。幅度的變化范圍、變化趨勢用來表征信號組的形狀。
在機器學習的有監督學習算法中,我們的目標是學習出一個穩定的且在各個方面表現都較好的模型,但實際情況往往不這么理想,有時候只能得到多個有偏好的模型(弱監督模型,在某些方面表現得比較好)。集成學習潛在的思想是即使某個弱分類器得到了錯誤的預測,其他的弱分類器也可以將錯誤糾正回來。集成學習是將幾種機器學習方法組合成一個預測模型的元算法,以達到減小方差、偏差或改進預測的效果。
本文采用的是Stacking方法,該方法是一種集成學習技術,通過多元分類器組合多個分類模型。如圖4所示,基于完整訓練集訓練各個分類模型,基于各個分類模型的輸出-元特征來擬合元分類器。元分類器可以根據預測類標簽或者來自集合的概率進行訓練。即首先訓練多個不同模型,然后再以之前訓練的各個基分類器模型的輸出作為主分類器的輸入進行訓練。本文中采用的基分類器分別是樸素貝葉斯、決策樹和近鄰,目標分類器采用的是邏輯回歸。

圖4 Stacking模型圖
為了驗證本文提出方法的有效性,用軟件仿真模擬電磁環境來生成混合脈沖信號。為了對比文獻[6]中提出的方法,我們設置的仿真訓練環境參數與其保持一致。本實驗設計了2個發射器和1個接收機,2個輻射源是同一個類型且由同一個方向發出。2個輻射源發出的信號有著一樣的PA、PW、PRI和DOA,進行4輪仿真,每次持續20 s。
得到仿真數據后,訓練集和測試集按7∶3的比例劃分,并采用5折交叉驗證法對本文提出的方法進行驗證。
本文在4個測試集上對提出的方法進行實驗驗證,如表2所示,一共有4個數據集,分別是A、B、C、D,每個數據集包含2種輻射源。

表2 測試集數據描述
圖5展示了某訓練集中混合脈沖信號分布,點和圓圈表示2種不同的輻射源。

圖5 某訓練集脈沖信號分布
本文在4個數據集上進行仿真實驗驗證,并設計對比實驗來驗證本文提出方法的有效性,對比方法如下:CDMD 表示本文提出的方法;CDMD-NBM表示本文方法分類模塊只保留樸素貝葉斯;CDMDDT 表示本文方法分類模塊只保留決策樹;CDMDKNN 表示本文方法分類模塊只保留近鄰;Mu’19表示Mu等人在文獻[6]中提出的方法。
仿真實驗結果如表3所示。從表3可以看出,只保留單一分類器的3種方法仿真實驗準確性均不如本文提出的方法。從而說明Stacking 確實可以提升預測結果的準確性。同理,本文提出的方法CDMD 優于Mu’19,因為Mu’19中采用支持向量機算法進行分類,該方法也是單一的分類器,單一的弱分類器在分類時可能存在欠擬合問題。本文提出的方法采用的是Stacking融合方法,能夠彌補各個單分類器的不足,從而提高分類結果的準確性。

表3 不同去交錯方法的準確性
本文提出了一種復雜電磁環境下混合脈沖去交錯方法,首先利用脈沖的多參數進行聚類,然后再采用集成學習的Stacking方法進行分類。與傳統的僅采用脈沖參數TOA、DOA、PW、PA 的方法不同,本文提出的方法提取的是表征脈沖序列變化趨勢的特征,接著將數據集輸入到分類器中進行模型訓練,然后利用訓練好的Stacking模型對2 類輻射源信號組進行分類來達到去交錯的效果。仿真實驗結果表明本文提出的方法與對比方法相比,平均提升了2.41%,從而說明本文提出方法的可行性與有效性。