趙 凡, 金 虎
(國防科技大學電子對抗學院, 安徽 合肥 230037)
通信干擾是通信對抗領域的一個重要研究方向,在通過通信偵察手段獲取目標信號的工作頻率、調制方式、調制參數等信息的基礎上,通信干擾系統通過產生與目標信號相關聯的干擾信號,對目標信號的通信過程進行壓制和破壞,最終達到削弱甚至阻斷對方通信能力的目的。
在實際的對抗過程中,干擾方在獲取目標信號特征的先驗知識后,目前主要依靠從固定的干擾策略庫中或憑借用戶經驗制定干擾策略,并從平時所積累的大數據樣本中選取干擾波形。當沒有關于目標信號的先驗知識,或目標信號參數動態變化時,干擾方無法自適應地調整干擾策略。與之相對的是,近年來人工智能領域蓬勃發展,越來越多的智能技術被用到通信系統中[1-3],通信系統的智能化水平不斷提高,能夠自主感知到電磁環境的變化并快速做出應變,抗干擾能力顯著提升。因此,為了應對智能化水平越來越高的通信系統,干擾方也在不斷嘗試提高自身的智能化水平[4-6]。利用遺傳算法[7]、博弈論[8-10]、強化學習[11-12]等方法代替人工搜尋最優干擾策略[13],但上述方法實現的前提是知道關于目標信號的先驗知識或者能獲得干擾反饋信息,并且多數方法只能針對固定干擾任務,當目標信號參數動態變化時,上述方法仍然難以發揮作用。生成對抗網絡(generative adversarial networks,GAN)的興起為解決這個問題提供了新的思路。
受博弈論的影響,GAN[14]由兩個互相博弈的網絡組成,生成網絡試圖生成逼近真實樣本分布的數據去騙過判別網絡,而判別網絡則試圖正確判斷輸入的來源,在相互博弈中,兩者逐漸提升各自的生成能力和判別能力。博弈的最終結果是兩者達到納什均衡,生成網絡學到了訓練集中真實樣本的分布,能生成逼真的樣本騙過判別網絡。而在通信干擾中,干擾方所用的干擾信號與目標信號的關聯性越大,干擾效果越好。這與GAN中生成網絡的目標相似,生成網絡生成的樣本越逼真就越能騙過判別網絡,通信干擾中所用的干擾波形與目標信號的關聯性越大,就越有可能落入目標信號的信道中,進入目標通信系統的接收機,對目標通信系統造成干擾。
因此,本文將GAN運用到通信對抗領域中,提出一種基于GAN的通信干擾波形生成技術,運用GAN自主對采集到的目標信號時域波形進行學習,獲取目標信號的潛在分布,并生成逼近目標信號分布的干擾波形,對目標通信系統施加干擾。本文在分析GAN基本原理的基礎上,首先針對通信信號的特點,設計網絡模型,并優化學習率,使得訓練數據為通信信號時域波形時,網絡能夠快速收斂,生成與目標信號高度關聯的干擾波形;其次,通過對不同類型和參數的通信信號進行干擾波形生成實驗,來驗證該技術的泛化性;最后,與最佳干擾和噪聲干擾效果進行性能對比試驗。
對數字通信系統進行干擾主要有3個可行途徑:對信道的干擾、對同步系統的干擾和對傳輸信息的干擾。其中,對信道的干擾是針對解調器的特點所施加的干擾,要求干擾信號與目標信號在信號層面是相似的,也就是要求干擾信號與目標信號具有相近的時域、頻域、調制域特性,這樣干擾信號就能夠與通信信號一起進入解調器的輸入端,擾亂解調器的門限判決過程,使判決出錯,誤碼率(bit error rate,BER)增加。本文基于GAN所生成干擾波形就是用于針對信道進行干擾。
GAN由兩個相互對抗的網絡——生成網絡G和判別網絡D組成,其基本結構如圖1所示。G的輸入是隨機噪聲矢量z,其目標是生成分布盡可能逼近真實樣本分布的偽數據G(z)去騙過D;D的輸入是訓練集中的真實樣本x或者G生成的偽數據G(z),其目標是盡可能正確的判斷輸入的來源。D的輸出是一個標量,用來表示判定輸入是真實樣本的概率,當D認為輸入是真實樣本時,輸出1,當D認為輸入是G生成的偽數據G(z)時,輸出0。

圖1 GAN基本結構
D和G可以是任意可微函數,在實際的訓練過程中,我們通常采用隨機梯度下降法交替對D和G進行優化。對D進行優化時,要固定G的參數,由于D的目標是實現對輸入數據的二分類,也即輸入為真實數據x時,輸出1,輸入是偽數據G(z)時,輸出0,其損失函數可以用交叉熵函數描述為
(1)
式中,第1項中的D(x)表示輸入是真實樣本x時,D判決輸入是真實樣本的概率;第2項中的D(G(z))表示輸入是G生成的偽數據時,D判決輸入是真實樣本的概率。優化D的過程就是運用隨機梯度下降法調整D的網絡參數使得J(D)最小化的過程。
同理,優化G時,需要固定D的參數。G的目標是用生成的G(z)來騙過D,也即希望D(G(z))趨近于1,J(D)的第二項越小越好,因此G的損失函數可以描述為
(2)
因此,優化G的過程就是運用隨機梯度下降法調整G的網絡參數使得J(G)最小化的過程。并且,由于優化G時,不需要用到真實樣本,總體上GAN的目標函數可以描述為
Ez~pz(z)[log(1-D(G(z)))]
(3)
因此,由式(3)可以看出,GAN的優化過程就是G和D進行極大極小博弈的過程。訓練時,先固定G的參數,以真實樣本x和G生成的偽數據G(z)為訓練集對D進行訓練,使目標函數V(D,G)最大化,也即使D具有一定的判別能力;再固定D的參數,優化G,使目標函數V(D,G)最小化,也即提高G的生成能力。上述過程交替進行,最終當G的生成能力優化到能夠生成以假亂真的偽數據去騙過D,而D無法判斷出輸入的來源,輸出逼近某個固定值時,便認為G已經掌握了訓練集中真實樣本的分布,能夠生成“逼真”的樣本。
本文實驗中,直接對目標信號時域波形進行采樣,1 000個點為一個樣本,得到長度為1 000的一維時間序列數據作為真實數據x輸入到判別網絡中去。由于本文所處理數據為一維時間序列數據,結構簡單,并且與二維圖像相比,通信信號所蘊含特征更少,更易理解,因此在搭建網絡時沒有采用卷積層和反卷積層來提取特征和擬合數據的分布,而是直接用全連接層加激活函數來實現[15],本文所搭建的GAN的基本結構如圖2所示。生成網絡與判別網絡都只含有一個隱藏層,并且隱藏層和輸出層都用全連接層加激活函數實現。

圖2 本文所用GAN結構
如圖2(a)為生成網絡的結構示意圖,輸入是長度為100的一維的隨機噪聲,經過兩層全連接層轉換成長度為1 000的干擾波形輸出,其中隱藏層的激活函數為Relu,輸出層的激活函數為Tanh。如圖2(b)為判別網絡的結構示意圖,判別網絡的結構與生成網絡相反,輸入是長度為1 000的目標信號時域采樣數據或者生成網絡輸出的干擾波形,經過兩次全連接層的變換,輸出一個標量,表示判定輸入是目標信號的概率,其中隱藏層的激活函數為Relu,輸出層的激活函數為Sigmoid。
搭建GAN和調制方式為二進制相移鍵控(binary phase shift keying,BPSK)、正交相移鍵控(quadrature phase shift keying,QPSK)、16進制正交幅度調制(16 quadrature amplitude modulation,16QAM)、二進制頻移鍵控(binary frequency shift keying,2FSK)的通信系統,采集通信信號制作訓練集,對GAN進行訓練。在訓練過程中,考慮到損失函數只能夠反映出網絡生成能力和判別能力的變化,并不能直觀、準確地衡量所生成干擾波形與訓練集中目標信號時域波形的關聯性,本文對生成波形做傅里葉變換,觀察分析其頻域特性,并與時域特性、損失函數一起作為衡量所生成波形優劣的標準。接下來對學習率進行優化,使網絡能夠迅速收斂,生成與目標信號高度關聯的干擾波形。最后運用生成的干擾波形對目標通信系統施加干擾,并與最佳干擾、噪聲干擾的干擾效果相比較,來驗證本文通信干擾波形生成技術的有效性。本文主要算法架構如圖3所示。

圖3 基于GAN的通信干擾波形生成技術框圖
本文算法主要步驟如下。
步驟 1采集BPSK、QPSK、16QAM、2FSK信號時域波形,以10個碼元,1 000個采樣點為一個樣本,每種信號產生128 000個樣本,制作多個訓練集。
步驟 2分別用幾種信號的訓練集對GAN進行訓練,當損失函數變化趨勢趨于穩定,生成波形具有與訓練集中信號相似的時域、頻域特性時,停止訓練,并輸出生成波形。
步驟 3更改學習率,多次進行訓練,選取最優的學習率實現通信干擾波形的生成。
步驟 4運用所生成的干擾波形對目標通信系統施加干擾,并與最佳干擾、噪聲干擾的干擾效果進行對比。
為了驗證本文干擾波形生成技術的可行性,進行了學習率的優化實驗、網絡的應用泛化性實驗和干擾效果對比實驗。
硬件設備環境:Window 10系統,NVIDIA GeForce GTX 1660Ti顯卡和TensorFlow1.14.0框架。
目前GAN多運用在計算機視覺領域[16-20],用于處理特征復雜的二維圖片數據,而本文需要用GAN來處理特征相對二維圖片更簡單的一維時間序列數據。數據維度和特征的變化,使得所需要的學習率也不同。因此,首先以BPSK信號為例,進行了學習率的優化實驗,選取合適的學習率用于實現通信信號的生成。仿真時,參數設置:BPSK信號載波頻率為4 000 Hz,采樣頻率為80 000 Hz,碼元速率為800 Hz,發送“1”時,初始相位為π/4,發送“0”時,初始相位為-3π/4,以10個碼元,1 000個采樣點為一個樣本,共128 000個樣本為一個訓練集,批次處理大小為256。
將學習率分別設置為0.000 1,0.001進行實驗,訓練次數從1 000次到90 000次,損失函數變化曲線如圖4所示。

圖4 學習率為0.000 1和0.001時損失函數
從圖4中可以看到,由于兩個網絡在相互對抗,因此無論總體變化趨勢如何,兩個網絡的損失函數都處于劇烈震蕩中。當學習率為0.000 1時,從總體趨勢上看,訓練初期判別網絡的損失函數呈下降趨勢,而生成網絡的損失函數呈上升趨勢,表明判別網絡的判別能力在提升,而生成網絡的生成能力較弱,無法生成逼近真實分布的波形來騙過判別網絡。隨著訓練次數的增多,判別網絡的損失函數在短暫的上升之后持續下降并趨于穩定,而生成網絡的損失函數在短暫的下降之后持續上升并趨于穩定,表明隨著訓練次數的增多,判別網絡判別能力迅速提升,而生成網絡的生成能力提升速度較慢,生成的樣本無法騙過判別網絡。
而在學習率為0.001時,初期判別網絡與生成網絡的損失函數波動都比較大,在短暫的上升之后迅速下降并趨于穩定,這表明訓練初期,兩者能力相當,在相互對抗中各自的判別能力和生成能力都在提升。后期判別網絡的損失函數呈上升趨勢并趨于穩定,生成網絡的損失函數呈下降趨勢并趨于穩定,表明隨著訓練次數的增加,生成網絡的生成能力逐漸提升,并且提升速度較快,逐漸能夠生成逼真的樣本去騙過判別網絡,判別網絡無法正確判斷出輸入數據的來源,輸出趨于某個固定值。
從損失函數的變化趨勢來看,學習率為0.001時生成網絡生成能力的提升速度比學習率為0.000 1時更快更好,因此嘗試將學習率取的更大,觀察損失函數的變化趨勢。學習率為0.01時,訓練次數從1 000次到90 000次,損失函數變化曲線如圖5所示。

圖5 學習率為0.01時損失函數變化圖
考慮到學習率為0.01時,損失函數變化趨勢差別較大,因此多次對網絡進行訓練,取較典型的3次數據作圖5。從圖5(a)中可以看到,判別網絡的損失函數在短暫波動之后,迅速趨于0,無法提供梯度供生成網絡更新,生成網絡的梯度消失了,生成能力無法再提高。這表明學習率取值過大,以至于參數在最優解附近來回震蕩,無法收斂。
總的來說,從兩個網絡的損失函數變化趨勢來看,學習率為0.001時網絡的生成能力提升較快,經過訓練后網絡能夠迅速收斂。接下來,進一步通過分析不同學習率時網絡所生成樣本的時域波形圖、頻譜圖來更加直觀地衡量網絡所生成干擾波形的優劣。圖6為不同學習率時GAN所生成樣本的時域波形圖和頻譜圖。

圖6 不同學習率時生成樣本的時域波形圖和頻譜圖
圖6(a)中從上到下依次為學習率為0.000 1,0.001,0.01時GAN所生成樣本的時域波形圖,左側為該學習率下訓練2 000次之后所生成的樣本,右側為訓練90 000次之后所生成的樣本,圖6(b)中對應位置為其頻譜圖。從圖6中可以看出,學習率為0.001時,GAN訓練速度最快,生成能力最強,在訓練2 000次后生成網絡所生成樣本已經有較為明顯的與目標信號相似的頻域特性,并且在訓練90 000次后生成樣本與目標信號時域特性、頻域特性相似度更高。而學習率為0.01時,雖然訓練2 000次后生成的樣本與目標信號有較為相似的頻域特性,但之后生成網絡的生成能力沒有明顯提高,訓練90 000次后所生成樣本與目標信號的相似度仍與訓練2 000次后相當。學習率為0.000 1時,生成網絡的生成能力提高的速度明顯比學習率為0.001和0.01時更慢,在訓練2 000次后,所生成樣本仍沒有明顯的特征,但隨著訓練次數的增加,生成能力在不斷提升,訓練90 000次后所生成樣本已經與目標信號具有較為相似的時域特性和頻域特性,但相似度與學習率為0.001時差別較大,說明學習率為0.000 1時,生成網絡的生成能力雖然能隨著訓練次數的增加而不斷提升,但提升速度較慢。總的來說,學習率取0.001時,網絡生成能力提升較快,能夠較快地生成與目標信號具有相似時域特性和頻域特性的干擾波形。
傳統干擾方法是基于已經偵察到的目標信號特征,來選擇合適的干擾波形實施干擾,而本文提出的基于GAN的通信干擾波形生成技術,直接運用GAN對采集到的目標信號時域波形進行學習,獲取其潛在特征,并生成與之具有相似特征的波形作為干擾波形,不需要關于目標特征的先驗知識,與傳統干擾方法相比泛化性更強。下面對GAN在不同目標通信信號上的應用效果做實驗探究,驗證其泛化性。
實驗1中對BPSK信號時域波形進行采樣制作數據集,對網絡進行訓練。為說明GAN對其他類型通信信號也有較好的生成效果,分別取QPSK,16QAM,2FSK信號時域波形制作數據集,對網絡進行訓練。
實驗所用QPSK信號載波頻率為2 400 Hz,發送“11”時,初始相位為π/4,發送“01”時,初始相位為3π/4,發送“00”時,初始相位為5π/4,發送“10”時,初始相位為7π/4。在網絡結構不變的情況下,學習率設置為0.001,批處理大小為256,以QPSK信號數據集對網絡進行訓練,訓練次數從1 000次到90 000次,損失函數變化曲線如圖7所示。

圖7 QPSK信號損失函數變化圖
從圖7中可以看到,在訓練初期,生成網絡和判別網絡的損失函數變化均較大,在訓練40 000次之后,生成網絡和判別網絡的損失函數均趨于穩定,網絡能夠迅速收斂。以10個碼元為例,訓練90 000次后所生成樣本時域波形圖和頻譜圖如圖8所示。

圖8 生成QPSK樣本時域波形圖和頻譜圖
圖8(a)為生成QPSK樣本的時域波形圖,可以看到,網絡學習到了QPSK信號相位翻轉的特征,在圖8(a)中,2,4,6,8碼元交界處出現了相位翻轉。圖8(b)為生成QPSK樣本的頻譜圖,與訓練所用QPSK信號載波頻率一致,表明網絡學習到了QPSK信號的頻譜特征。
BPSK、QPSK均通過載波信號的相位變化來攜帶信息,而正交振幅調制同時運用載波信號的幅度和相位來攜帶信息,是目前通信系統中較為常用的調制方式。與BPSK、QPSK信號時域波形相比,QAM信號時域波形同時具有相位和幅度的變化。實驗中,運用正交調幅法,將兩路獨立的正交4ASK信號疊加起來得到16QAM信號。兩路4ASK信號的4個振幅均設置為-1,-0.34,0.34,1,載波頻率均為2 400 Hz。以16QAM信號數據集對網絡進行訓練,訓練次數從1 000次到90 000次,損失函數變化曲線如圖9所示。

圖9 16QAM信號損失函數變化圖
從圖9中可以看到,訓練初期,生成網絡損失函數迅速下降,而判別網絡損失函數迅速上升,表明初期生成網絡的生成能力提升較快,逐漸學習到真實樣本特征并生成樣本騙過判別器。但判別器也在逐漸提升判別能力,兩者進行對抗,在短暫的平穩狀態之后,判別器的損失函數呈下降趨勢,表明了判別器判別能力的提升。在對抗中,生成網絡和判別網絡都逐漸學習到了真實樣本的特征,提升了各自的生成能力和判別能力,最終在訓練40 000次后,兩者損失函數趨于平穩,網絡收斂。以16個碼元為例,訓練90 000次后所生成16QAM樣本時域波形圖和頻譜圖如圖10所示。

圖10 生成16QAM樣本時域波形圖和頻譜圖
圖10(a)為生成16QAM樣本的時域波形圖,可以看到,每隔4個碼元,波形的相位或者幅度產生一次變化,網絡學習到了16QAM相位翻轉和幅度變化的特征。圖10(b)為生成16QAM樣本的頻譜圖,與訓練所用16QAM信號載波頻率一致。
BPSK、QPSK和16QAM均只含有一個頻率分量,而2FSK含有兩個頻率分量,運用載波信號的頻率變化來攜帶信息,在時域上,兩個頻率分量的波形按碼元信息的變化交替出現。實驗所用2FSK信號采樣頻率為160 000 Hz,發送“1”時,載波頻率為3 200 Hz,發送“0”時,載波頻率為8 000 Hz,初始相位均為0。以2FSK信號數據集對網絡進行訓練時,損失函數變化曲線如圖11所示,在訓練40 000次之后,損失函數的變化趨勢逐漸趨于平穩,網絡迅速收斂。

圖11 2FSK信號損失函數變化圖
以10個碼元為例,訓練2 000次和90 000次后所生成樣本時域波形圖和頻譜圖如圖12所示。
從圖12中可以看到,在訓練2 000次之后,生成網絡已經能生成含有兩個頻率分量的干擾波形,生成樣本頻譜特征與訓練所用2FSK信號的頻譜特征一致,但此時在時域上兩個頻率的波形是均勻混在一起的,網絡對2FSK信號的時域特征學習不夠充分。在訓練90 000次之后,網絡逐漸學到了2FSK信號的時域特征,生成了兩個頻率波形不在同一時間出現的干擾波形。

圖12 生成2FSK樣本時域波形圖和頻譜圖
綜上,可以看出本文GAN對其他類型和參數的目標信號也有較好的生成效果,能夠生成與目標信號具有相似時域特性和頻域特性的樣本作為干擾波形,具有較好的應用泛化性。
通信干擾波形生成的最終目的是實現有效干擾,為說明本文干擾波形生成方法的有效性和較傳統方法的優越性,將本文方法與最佳干擾、高斯噪聲干擾進行了干擾效果對比試驗。
在實驗中,為充分觀察干擾效果,以10 000個碼元長度為例,分別以訓練80 000次后所生成的干擾波形、最佳干擾波形和高斯噪聲對目標通信系統進行干擾,在不同的干信比下各重復100次,取BER平均值,畫干擾效果對比圖。對BPSK、QPSK和2FSK通信系統來說,最佳干擾是與其具有相同調制方式、載波頻率和碼元速率的通信信號,因此在實驗中,對隨機生成的基帶信號做不同的調制后作為BPSK、QPSK和2FSK通信系統最佳干擾波形。對16QAM通信系統來說,理論上最佳干擾是與其具有相同載波頻率和碼元速率的QPSK信號[21],但仿真中與目標信號具有相同載波頻率和碼元速率的16QAM信號進行干擾的效果與最佳干擾效果相差較小,并且低干信比時,以16QAM信號進行干擾的效果略優于QPSK信號,因此在本文實驗中仍以與目標信號具有相同載波頻率和碼元速率的16QAM信號對16QAM通信系統的干擾效果作為最佳干擾。3種干擾對BPSK、QPSK、16QAM和2FSK通信系統的干擾效果對比如圖13所示。
圖13(a)為3種干擾下BPSK通信系統的BER,圖13(b)為3種干擾下QPSK通信系統的BER,圖13(c)為3種干擾下16QAM通信系統的BER,圖13(a)為3種干擾下2FSK通信系統的BER。

圖13 3種干擾下BPSK、QPSK、16QAM和2FSK通信系統的BER
從圖13中可以看出,干信比相同時,生成干擾波形的BER比高斯噪聲高很多,也即干擾效果比高斯噪聲干擾明顯得多。干信比較小時,與最佳干擾相比,生成干擾波形的干擾效果比最佳的干擾還要好,這也從一個側面驗證了所謂的最佳干擾波形也是在某一定的干信比范圍內而言的;干信比較大時,生成干擾波形的BER低于最佳干擾的BER,但隨著干信比的增加,生成波形BER曲線能夠逐漸逼近最佳干擾的BER曲線。結合第2.2節中4種信號損失函數變化趨勢和生成樣本的仿真結果來看,在學習率取0.001時,運用4種信號的訓練集訓練網絡,訓練40 000次之后,網絡的損失函數變化趨勢都能逐漸變小,損失值趨于穩定,生成網絡能夠生成逼近真實樣本分布的樣本騙過判別網絡,并且所生成干擾波形能對目標通信系統產生較好的干擾效果。
本文提出一種基于GAN的通信干擾波形生成技術,利用GAN能夠自主學習訓練集中數據的潛在分布并生成具有相同分布的樣本的能力,將采集到的目標信號時域波形直接作為訓練集對GAN進行訓練,并將生成的與目標信號具有相似時域特性和頻域特性的樣本作為干擾波形,針對目標通信系統的信道實施干擾。與傳統干擾方法相比,本文所提出的方法不需要關于目標信號特征的先驗知識,能夠自主提取目標信號的特征并生成干擾波形實施干擾,減少了人工決策的過程,解決了實際干擾過程中未知信號和參數動態變化的信號干擾的問題,在取得較好干擾效果的同時,也具有良好的應用泛化性。