蔣伊琳 王林森 李金鑫*
①(哈爾濱工程大學信息與通信工程學院 哈爾濱 150001)
②(先進船舶通信與信息技術工業和信息化部重點實驗室 哈爾濱 150001)
轉發式干擾機的作戰能力需要適應寬頻帶,其可以在連續偵收敵方雷達信號及動向的同時,還能夠做到不影響自身發射對目標雷達的干擾[1]。轉發式干擾機在收發同時的工作模式下,發射天線與接收天線之間無法做到完全的隔離,大功率的有源干擾信號會從接收天線耦合進入接收機。目前,在導彈突防、戰機通信和艦船突防中往往需要轉發式干擾機的協同作用,而不同載體的轉發式干擾機所要求的環境都不盡相同且十分嚴苛,同時轉發式干擾機的體積和天線距離等條件限制使得天線耦合更加不可避免[2,3]。
目前解決自干擾數字對消問題通常使用的是傳統的自適應濾波算法,如最小均方誤差(Least Mean Square, LMS)算法。文獻[4]結合信號統計的知識,推導并分析了一種新形式的最小均方算法,在頻分雙工的工作模式下提高了數字干擾對消以及自適應性能。文獻[5]給出了一種改進的變步長LMS算法,利用類Sigmoid函數去調節步長,減少了運算量,解決了算法較快的收斂速度與較小的穩態誤差之間的矛盾,提高了雷達在復雜電磁環境中的抗干擾能力。文獻[6]改進的LMS算法利用濾波器系數周期性局部性的迭代更新以及修正過的sigmoid函數,提出了權系數部分更新的變步長自適應多徑干擾對消算法,能夠很好地處理自適應濾波器計算的復雜度以及收斂速率兩者的沖突,該方法在保證收斂速率相對較快的前提下,還降低了算法的計算量,并且擁有較好的多徑對消結果。文獻[7]詳細分析了步長因子與誤差函數兩者之間的關系,并構造了兩者之間的函數關系,提出了基于迭代變步長的LMS算法,利用該算法實現了快速收斂的高對消比數字域干擾對消,實現了較高的對消比。文獻[8]設計了一種新的變步長LMS算法,提出了一個基于步長因子和誤差函數的非線性函數模型,能夠保證在穩態的基礎上,還能有較好的收斂性能,通過仿真驗證了該算法比起現有算法的優勢。上述方法都是基于LMS算法的改進,對收發同時系統中目標信號與自干擾信號重疊且強相關時的自干擾對消存在一定的不足,而且其算法需要一定的收斂時間。
近些年來,深度學習被廣泛應用于信號處理領域。文獻[9]利用深度神經網絡(Deep Neural Network,DNN)的多層處理簡化信號處理模型來處理非正交波形信號中的干擾問題。文獻[10]將深度學習用在了自動語音識別和全雙工語音通話性能的改進上,建立了自適應非線性回波抵消層、感知子帶回波抑制層和噪聲抑制層3層神經網絡層,并將它們在頻域組合以減少各種類型的線性、非線性的時變回波。文獻[11]利用機器學習提出了一種信道估計和多用戶檢測相結合的方法來消除干擾,并提出了一種信號基于稀疏k的最近鄰分類器來估計未知的活動因子。文獻[12]提出了一種基于深度神經網絡的數字域自干擾對消方法,使用深度神經網絡來重構參考信號,將重構后的參考信號輸入自適應濾波器來實現自干擾信號的對消,取得了較好的對消效果。上述的神經網絡在語音回波以及轉發式干擾機自干擾對消領域的成功使用,給本文帶來了新的轉發式干擾機收發同時系統中自干擾對消的思路。
在轉發式干擾機系統中,為了降低采樣率,首先將接收機截獲的雷達信號轉換到基帶,對基帶進行采樣保存在存儲模塊,再由控制器對數字存儲模塊以及干擾生成模塊控制,從而產生與雷達信號強相關的干擾信號。由于接收天線與發射天線相距較近,雖然目前已經使用了空間隔離技術以及模擬域消除技術來抑制自干擾信號,但在接收天線上仍然會有較強的自干擾信號殘留。轉發式干擾機的基本工作流程如圖1所示[13,14]。
圖1所示轉發式干擾機系統基本工作流程框圖,其中數字域自干擾對消技術使用基于DNN的自干擾對消算法。以線性調頻信號(Linear Frequency Modulation, LFM)轉發式干擾為例,接收通道的射頻接收模擬信號經過模擬域對消后可表示為


其中,r(n)為 模擬域干擾對消采樣后的1 ×L的天線接收信號,s(n)為 1 ×L的 目標信號,S I(n)為接收到的來自發射天線1 ×L的模擬對消后的自干擾信號,N(n)為加性高斯白噪聲。
傳統的數字域自干擾對消方法使用的是自適應濾波器[15,16],其原理是隨著濾波器權重的自適應變化以最小均方誤差為準則使用最陡梯度下降法取最優解。其代價函數為
目前廣泛使用的消除自干擾信號的是自適應濾波算法,本文利用DNN神經網絡與自適應濾波器的相似性,設計一種基于DNN的自干擾對消系統,利用最小均方誤差算法作為損失函數來監督網絡的學習。本文建立的基于DNN的自干擾對消系統方案如圖2。

圖2 基于DNN的自干擾對消方案
區別于傳統的自適應濾波算法,基于DNN的自干擾對消算法在數字域是由軟件來實現的,擺脫了傳統算法計算量較大的問題。將接收信號和參考信號一同輸入提前訓練好的DNN模型中,網絡擬合的輸出即為對消后的目標信號,將目標信號經過干擾生成模塊后生成干擾信號,生成的干擾信號的去向有兩個:一是作為參考信號輸入回DNN模型中;二是經過數模轉變后過功率放大器由發射天線發出。
類比于傳統的自適應濾波器,利用DNN網絡提取接收信號與參考信號之間的特征信息,由監督函數監督學習兩者之間的關系,從而達到對消的目的。設計DNN的網絡結構如圖3所示。

圖3 DNN網絡結構
神經網絡的輸入包括兩部分,接收信號(目標信號、自干擾信號和噪聲)和參考信號。接收信號如式(2),參考信號為


經過以上的分析,損失函數梯度更新的方式類似于傳統自適應濾波器梯度更新的方式:其都是以最小均方誤差為準則來找尋權重的最優值,最終達到數字域自干擾對消的目的。不同的是,傳統的自適應濾波器是以參考信號與估計信號的最小均方誤差作為梯度下降函數,而DNN神經網絡是以網絡擬合的輸出和標簽的最小均方誤差作為梯度下降函數。
收發同時系統中,干擾信號主要由存儲后延遲轉發生成,只能在下一脈沖段對敵方雷達干擾。因此下面基于存儲轉發的原理,介紹一種新的干擾信號,該干擾信號可以在當前脈沖段直接對敵方雷達進行干擾,其干擾生成方式如圖4所示。

圖4 干擾信號生成原理
首先,當接收機接收到第1段目標信號s(n1)后由轉發式干擾機中的存儲模塊存儲,然后經干擾模塊生成第1段干擾信號I(n1)由發射天線發出;這時接收天線接收到第2段目標信號s(n2)和發射端耦合來的第1段自干擾信號 S I(n1),經過DNN自干擾對消擬合的信號為s′(n2)。假設此時目標信號與DNN擬合輸出之間的誤差為δ(n2),則

由于對消后干擾殘留所帶來的誤差影響,在后續的干擾信號生成中考慮到此問題,在訓練網絡的過程中直接使用DNN擬合輸出的信號s′(n2)來生成第2段干擾信號I(n2)由發射天線發出;此時接收天線將會接收到第3段目標信號s(n3)和第2段自干擾信號S I(n2),經過DNN自干擾對消后生成第3段干擾信號I(n3)由發射天線發出;當接收端接收到第i段目標信號s(ni)和 第i段自干擾信號S I(ni?1)時,經過DNN自干擾對消后的擬合輸出和目標信號的關系為其中,i表示的是第i次擬合。當DNN擬合輸出中不含有目標信號,該脈沖段的自干擾的對消過程結束。

在轉發式干擾機距敵方雷達較遠時,轉發式干擾機接收到雷達信號強度較弱,此時噪聲調幅干擾可以對雷達有較好的壓制效果。噪聲調幅干擾產生表達式為

其中, U0為一個干擾機干擾功率決定的常數,UN(n) 均值為0、方差為σn2、在區間[?U0,∞)分布的廣義的平穩隨機過程,φ是隨機的相位抖動。利用分段偵收噪聲調幅干擾以及間歇采樣噪聲調幅干擾[17]分別對目標信號壓制,調幅噪聲的中心頻率是雷達信號的中心頻率,帶寬為2倍的信號帶寬,敵方雷達經過匹配濾波后的時域如圖5。
由圖5可以看到,橫軸表示的是雷達距離轉發式干擾機的距離,縱軸表示的是不同干擾方式下敵方雷達回波信號的歸一化幅度。在仿真參數相同的條件下,兩種干擾方式在脈沖壓縮后的時域上對目標信號都有較強的壓制。同時由時域圖可以看到,分段偵收干擾相比于間歇采樣干擾在目標的附近有更多幅度的峰值,對敵方雷達信號有更好的壓制效果。

圖5 脈沖壓縮后時域波形
本文研究的是轉發式雷達干擾機數字域自干擾信號的對消,采用了常用的雷達信號構建仿真所需要的模擬目標信號:LFM信號和二進制相移鍵控(Binary Phase Shift Keying, BPSK)信號。設置信號的脈沖周期為7.5 ms,分段處理后每段信號的脈沖時間是1.5 ms。LFM信號和BPSK信號的具體調制參數如表1所示。

表1 信號的調制參數
基于目標信號生成干擾信號,由3.2節的干擾信號的構建方式生成干擾信號,干擾信號的形式為轉發式的噪聲調幅干擾,訓練集中信號采用信干比為–7~–11 dB的隨機值,其具體數據集生成以及訓練方式如圖6。
如圖6,首先生成目標信號,將目標信號分段,取第1段當作接收機接收的第1段目標信號,再經噪聲調幅處理后生成干擾信號,此時由于接收機與發射機是同時工作的,接收機會接收到第1段自干擾信號和第2段目標信號疊加后的信號,將疊加后的數據作為訓練集訓練DNN神經網絡,保存第1次訓練后的模型;其次,同樣生成目標信號,以第1步的方式生成第2段接收信號,輸入到第1次訓練好的DNN模型對消,對消的輸出經噪聲調幅處理后生成第2段干擾信號,此時接收機就會接收到第3段目標信號和第2段自干擾信號疊加后的信號,將疊加后的信號與第1步生成的第2段接收信號合并輸入DNN神經網絡中訓練,保存第2次訓練后的模型;以此類推,直至目標信號訓練結束。保存最后一次訓練后的模型,用測試集測試輸出。

圖6 數據集生成及訓練框圖
采樣頻率設置為1 GHz,采樣時間設置為脈沖周期7.5 ms,則采樣點數L=7500。將采樣后的數據分段處理,每段數據的持續時間為1.5 ms,即每段數據的采樣點數為M=1500。通過數據的預處理可以使原始數據中的特征更容易、更快速的被神經網絡識別。本文中將目標信號分段處理后將其與對應的參考信號結合在一起,每一段樣本的大小為1×3000,第1次訓練的訓練集中含有20000個樣本,每2次訓練集中包括第1次訓練的樣本和新生成的20000個樣本,以此類推,這樣使每一段信號都可以被訓練到,提升網絡模型的精度。每一個樣本對應一個“標簽”,標簽是1維的信號,其大小和每一段目標信號的大小相同。
本文所用的自干擾對消模型的仿真實驗流程如下:
步驟1 建立神經網絡結構模型,其具體結構如圖3所示,其中隱藏層設置為3~5層,各層的輸出使用Leaky ReLU激活函數以增強網絡的非線性擬合能力,各層之間使用Dropout函數連接,以防止訓練過程中網絡容易出現的過擬合問題;
步驟2 生成訓練數據并預處理以適應神經網絡,建立訓練集與測試集;
步驟3 輸入訓練集進行網絡訓練,訓練過程中訓練數據分為訓練集和驗證集,使用驗證集評估網絡擬合的好壞,從而選擇最佳的神經網絡模型;
步驟4 通過測試集來評斷網絡擬合的效果,進一步來驗證神經網絡模型的有效性。
在訓練的過程中,在Callbacks回調函數中使用早停監測函數,當損失函數的Loss值在訓練的連續50個輪次中都不再減小,則停止訓練,保存該次訓練過程中見到的最好的模型。各全連接層之間添加Dropout正則化來優化網絡框架,最小化結構風險,在每次訓練過程中屏蔽掉一部分神經元,有效防止因模型太復雜而數據集不足時所引起的過擬合問題。
將上述的訓練集和標簽輸入DNN神經網絡中訓練,第1次訓練集中包含20000個樣本,第2次訓練集在第1次訓練集樣本的基礎上再增加20000個樣本,以此類推,直至目標信號被全部訓練,保存訓練好的模型。將測試集信號輸入神經網絡模型測試,BPSK信號的自干擾對消結果如圖7、圖8所示。

圖7 BPSK信號干擾對消前后時域對比圖
LFM信號的自干擾對消結果如圖9、圖10所示。

圖9 LFM信號干擾對消前后時域對比圖
如圖8中BPSK信號與圖10中LFM對消前后頻域對比可以看出,輸出信號的頻譜幅度明顯低于接收信號的頻譜幅度,即強相關的自干擾信號所帶來的頻譜增益明顯被壓制掉了。下面針對不同信干比條件下仿真測試了兩種信號的數字對消效果。

圖8 BPSK信號干擾對消前后頻譜對比圖

圖10 LFM信號干擾對消前后頻譜對比圖
使用該網絡模型測試了–6 dB, –8 dB, –10 dB,–12 dB下的兩種目標信號的自干擾對消結果,在同一頻點、同一帶寬、同一信噪比的條件下,上述的每個信干比下生成100組測試集信號,最后求得100組信號的對消比并求均值,其均值對消比如表2所示。
由表2,基于深度神經網絡的自干擾消除方法在不同的信噪比下均有較好的對消效果,在訓練集中未涉及的信干比為–6 dB以及–12 dB的信號,神經網絡的輸出仍然有26 dB以上的對消比,結果表明訓練好的網絡模型擁有較好的泛化能力。同時,相對于LFM信號,目標信號為BPSK信號時該網絡具有更好的數字對消效果,一個可能的原因是BPSK信號的調制方式相較于BPSK信號簡單,更適應于網絡的學習。此外該方法不同于傳統自適應算法中對信號時延的嚴格要求以及需要收斂時間的問題,具有更好的魯棒性。

表2 LMS算法與DNN算法在不同信干比下的對消比(LMS算法/DNN算法)(dB)
本文針對收發同時系統中的自干擾對消問題,提出了一種基于DNN的自干擾對消算法,利用DNN神經網絡可以通過深度網絡逼近任意的函數的特性,使用DNN神經網絡來替代自適應濾波器在數字域消除自干擾信號,從濾波器系數更新和神經網絡的權重更新角度分析了算法的可行性。在此基礎上利用分段偵收的干擾生成方法,驗證了本算法在收發同時系統中自干擾信號對消的可行性,實現了基于本脈沖的雷達干擾信號構建;同時網絡模型訓練好后,直接調用,不同于傳統濾波器需要一定的算法收斂時間以及濾波器階數的選擇。由仿真分析可知,該對消算法可以對自干擾信號進行有效的壓制,當信干比為–8 dB時,LFM信號與BPSK信號的數字對消比可以達到26 dB以上。