馬博昂,張海瑛
(1.中國電子科技集團公司 第54研究所,石家莊 050081;2.河北省電磁頻譜認知與管控重點實驗室,石家莊 050011)
現代戰場電磁環境日益復雜,戰術通信網臺主要集中在超短波頻段,常規信號、跳頻、擴頻信號普遍存在。我軍需要針對目標區域進行例行性偵察監視,重點對當面機場和空軍基地進行偵察監視,截獲其電磁信號,對重控信號進行通信組網特征提取和分析,提升對作戰目標的內涵情報獲取以及信息作戰支援能力。
超短波(ultra-short wave)是一種頻率范圍由30 MHz到300 MHz的無線電波,其波長在1至10米之間,也叫做甚高頻(VHF,very high frequency)、米波。超短波寬帶信號偵察包括信號搜索、跳頻信號檢測、超短波頻段信號的采集、分選、檢測以及信號分析等技術。傳統的超短波信號分類已知信號的相關先驗信息,多以告知偵察對象及任務范圍為主。針對超短波頻譜資源的利用問題,文獻[1]將采集到的信號進行時、頻域特征分析,通過對獲取的寬帶信號進行時頻分析,并采用相關匹配的算法,實現了在復雜電磁環境下對截獲的寬帶信號的檢測和自動分選。文獻[2]提出了一種利用峰度和小波變換對超短波信號進行分類識別方法。該方法通過決策樹的分類方法,完成了FM、MSK、QPSK等三類不同調制方式的信號的識別。文獻[3]針對不同頻段的超短波通信信號調制識別的問題,提出決策樹分類的方法。利用瞬時幅度、瞬時相位以及構造的瞬時特征實現了十種調制信號有效的識別。
但此類方法都是對特定目標信號進行仿真,諸如信號類型、調制方式、符號速率等,已有較多的先驗信息。現行的超短波通信偵察系統中戰場測量較為宏觀粗放,偵控細節都是由執行者依據對象、任務以及工作慣性,理解性地在工作過程中落實傳承。如今,在基于元數據協同的偵察活動中,大量的元數據活躍在每一個信號感知的細節里,如何應對戰場環境下各類目標信號測量特征的精確獲取需求,設計與之匹配的元數據測量特征,精細化地描述戰場測量特征情報,設計完備簡約的偵察策略是現代技偵工作的必然要求。未來的技術偵察情報生產,對智能化、大數據信息處理的需求越來越強烈,依托智能化技術的發展,提升情報生產能力,已成為技偵發展的必由之路。
近幾年里,深度學習在圖像識別領域取得了巨大的成果。文獻[4]利用最新的人工智能框架pytorch以及算力強大的GPU,對動物的圖像進行分類識別。雖然在圖像的預處理以及代碼遷移問題上需進一步優化和改進。但也證明了VGG16網絡模型識別準確率非常高,驗證了VGG16在圖像識別問題上的有效性。文獻[5]提出了一種基于改進VGG16和遷移學習的圖像分類方法。通過遷移學習傳統VGG16模型并進行了改進,該方法能將已學習到的特征和性能用到待解決的任務中,極大地節省了訓練時間。該方法針對選定的數據集,分別對激活函數、損失函數、優化器進行調整,最終完成了了對十種不同猴子圖像的識別。但其在細粒度圖像的識別上還需對模型進行完善,且當遷移學習到超短波盲信號的時頻圖時需要進一步優化。文獻[6]在超短波通信中Link11、Link4A、DQPSK、SOQPSK信號的識別問題上,將超短波信號的時頻譜圖和卷積神經網絡相結合。該方法需要先得到信號的時頻譜圖,然后使用得到的信號時頻譜圖對優化后的卷積神經網絡模型進行訓練,最后實現了超短波特定信號的識別。對于時頻譜圖的變換有時域分析法[7]。時域分析法是把信號按照時間序列劃分為許多子序列,分別分析其時域特性。快速傅里葉變換[8](FFT,fast fourier transform)在復雜度上雖有所降低,但僅適用于平穩信號,對非平穩信號和跳變信號不再適用。此外還有短時傅里葉變換(STFT,short-time fourier transform)、小波變換[9](WT,wavelet transform)和S變換[10]。本文選定STFT進行超短波盲信號時頻譜圖的獲取。是因為STFT常用于緩慢時變信號的頻譜分析,符合超短波盲信號的信號特征。此外,經STFT處理后的信號具有時域和頻域的局部化特性,可以借助其分析信號的時頻特性。先驗信息不足,信號特征缺失,難以滿足對作戰目標的內涵情報獲取需要是當下電磁作戰面臨的最大問題。且當前對超短波盲信號的研究主要在盲信號的分離方法[11]及準則的優化上[12],因此實現盲信號的智能化分類對于電磁環境日益復雜現代戰場具有重要意義。
隨著深度學習在圖像分類識別領域的飛速進步,運用卷積神經網絡對圖像分類相較于傳統的圖像處理方法更加高效與方便。研究人員們針對圖像分類等問題提出了很多特征維度提取更深的神經網絡模型。模型復雜的神經網絡雖然會有較高的準確率,但是會出現過擬合的問題,具有效率不高、訓練時間長等不可忽視的短板。因此輕量化卷積神經網絡的研究具有深遠的意義和影響。文獻[13]提出輕量化卷積神經網絡,在保證準確率的同時能夠提高圖像分類的效率,降低參數量,并且可以用于小型終端設備中。文獻[14]將優化后的空洞卷積與普通卷積相結合,提出一種將融合型空洞卷引入神經網絡中的方法。該方法利用空洞卷積可以增大特征映射與擴大感受野的結構特性,可實現模型計算復雜度的降低,實現了對訓練效率與準確率的權衡。但由于遷移學習到新的網絡,將基本空洞卷積直接應用于超短波盲信號時頻譜圖的分類,雖準確率會有所降低,但是整體上來看仍具有輕量化效果好的特點,可以解決超短波音信號時頻譜圖像學習過程時間過長的問題。
基于以上,本文提出了一種將超短波盲信號的時頻譜圖與VGG16相結合的識別方法,并通過引入空洞卷積減少網絡的訓練時長。該方法首先用STFT將電磁戰場中實際采集到的盲信號轉換為時頻譜圖,然后將其與優化的VGG16卷積神經網絡結合起來。通過仿真實現了在先驗信息不足的條件下超短波信號的分類。將空洞卷積引入優化后的網絡,在保證較高分類準確率的條件下,最大程度的減少了訓練時長,驗證了空洞卷積在盲信號分類上的實用性,增強電磁戰場作戰目標的內涵情報獲取以及信息作戰支援能力。
本文對超短波盲信號的時頻譜圖通過STFT[15]方法得到。STFT常用于緩慢時變信號的頻譜分析,與超短波盲信號的特征相匹配,如圖1所示,不同信號的時頻譜圖存在明顯差異。且經STFT處理后的超短波盲信號的時頻譜圖具有時頻域的雙重特征,可以作為深度學習的輸入。

圖1 兩種信號的短時傅立葉變換譜圖對比
STFT本質上是對超短波盲信號時域上的局部處理,在信號進行傅里葉變換(FFT,fourier transform)之前,對信號乘以一個時間極短的窗函數,用窗函數截取信號,原本非平穩的信號就可以采用平穩信號的手段進行分析。最后將時間窗口滑動,各個窗函數信號的頻譜組合就是整個超短波盲信號的時頻譜圖。
STFT的定義為:
(1)
其功率譜為:
SPEC(t,f)=|STFT(t,f)|2
(2)
對于STFT窗函數的選擇,設窗函數g(t)的有效時寬為Δt,帶寬為Δf,則它們二者的乘積服從Heisenberg不等式[16]:
(3)
從上式可以看出,需要根據需求權衡窗函數的有效時寬Δt和帶寬Δf的數值。為了局部頻譜清晰可辨,窗的長度應該足夠寬。
STFT最重要的還是窗口函數長度的選取。窗口較長,頻域刻度和平移步長足夠密時,頻率能夠清晰的顯示出來,但是時間上有些模糊。窗口較短,時間上的分界線能夠清晰顯示,但是頻率的值會很模糊。
選擇合適的窗函數及長度,是影響后續深度學習準確率的關鍵。針對本文選定的超短波盲信號,最終進行的STFT變換參數如表1所示。

表1 變換參數
空洞卷積核[17]是由Yu等人進行系統研究的。從特征提取的原理上來看,空洞卷積與傳統卷積核的結構相似。但是通過添加空洞元素,實現了輸入層和輸出層特征映射的擴張。空洞卷積的引入可以大大減少卷積網絡的訓練時長。部分學者已經將空洞卷積應用在目標檢測與語義分割中的空洞卷積池化金字塔[18]、ESPNet[19]等多個領域中。
空洞卷積可以認為是基于卷積操作的一種變形,空洞卷積在卷積核中添加空洞元素,增大感受野,實現了獲取更多的信息的目的。感受野是輸入層到輸出層的特征映射,決定著輸出層中元素對應的輸入層的區域大小。在圖像分類和目標識別上,感受野的選擇直接影響任務效果。
感受野的計算公式如下:
(4)
spn代表第n層的感受野,spn-1表示第n-1層的感受野,nk是第n層卷積核的尺寸,ri表示n層前第i層卷積的步長。
如圖2所示,圖像的像素為25,以5×5卷積核對一個5×5的圖像進行一次卷積操作。輸入層經過卷積操作后,得到1×1的輸出,即輸出層對應的整個特征映射為輸入層。

圖2 普通5×5卷積核一次卷積過程
如圖3所示,步長為1的3×3的空洞卷積與普通5×5卷積核的感受野相同。只不過在卷積元素之間添加了一個空洞,可以理解為此位置的特征值與0相乘。該空洞卷積對一個輸入圖像進行一次卷積操作,同樣得到了與普通卷積后相同大小的結果。

圖3 步長為1的3×3卷積核一次卷積過程
由于增加了空洞元素,空洞卷積利用較小的參數量實現較大的感受野,在神經網絡的訓練過程中可以減少參數量,減少訓練時長,提升模型的訓練效率。
當前對超短波盲信號的研究主要在盲信號的分離方法及準則的優化上。本文選則超短波盲信號分類識別是為了減少信號的先驗信息,在不知道信號調制方式、符號速率參數的情況下,僅根據輸入信號的特性,通過時頻譜圖實現盲信號的分類,可以增加網絡的魯棒性和應用價值。
本文首先對已采集到的寬帶信號進行離線分析得到瀑布圖,然后對信號進行短時傅立葉變換得到對應的時頻譜圖,由于盲信號的頻譜樣本的選取需要滿足一定的視覺差異,同時需要滿足細粒度圖像[20]的要求。基于此本文選擇以下四種盲信號作為分類數據集。
由圖4可以看出,信號(a)的譜圖呈雙帶寬形式,信號(b)的譜圖具有突發的特點,信號(c)和信號(d)的譜圖呈現包絡差異明顯的鋸齒狀。

圖4 特定信號的譜圖
四種盲信號的中心頻率及帶寬如表2所示。

表2 四種盲信號的頻率參數 Hz
數據增強[21](data augmentation)技術通常用于深度學習中。在圖像識別領域,在不改變圖像標簽的情況下,通過對圖像進行不同的變換操作,達到擴充原來的數據集的目的。而且卷積神經網絡具有尺度、平移不變性,成為圖像數據增強的理論支撐。常見的數據增強方法有旋轉、翻轉、縮放等[22]。即這些變換經過卷積操作也不會改變圖像的分類特征。
本文針對盲信號的特點,對輸入的時頻譜圖進行平移變換、縮減和中心裁剪處理。讀取圖像時,首先把圖像的短邊分辨率裁剪為256。然后對圖像進行中心切割,得到大小為分辨率為224*224的圖像。再將形狀為[H,W,C]的數據轉換為[C,H,W]的張量后,然后對圖像進行歸一化處理,每類盲信號有2 000個時頻譜圖用來作為后續網絡的輸入。

圖5 處理后訓練batch的圖像
VGG16卷積神經網絡通過組合與堆疊多個3*3卷積核,可以提取輸入鄰域內更多細小的特征。通過構建和組合多個3*3卷積核:2個3*3卷積核可代替5*5卷積核,3個3*3卷積核可代替7*7卷積核。多個小尺寸卷積核的組合比單個大的卷積核具有更好的非線性,增加了網絡的魯棒性和判決力。
VGG16卷積神經網絡通過卷積核對輸入的圖像進行卷積操作,最大池化進行圖像降維,提取主要特征,全連接層進一步降低參數量并與分類器softmax配合達到分類的目的。并且利用小尺寸卷積核代替大尺寸的卷積核,可以大幅減少由于深度增加所帶來的參數量。
損失函數(loss)用來表征實際值與預期值之間的偏移,損失函數越小代表模型的置信度越強。分類識別中常用softmax函數將多個神經元的輸出進行標準化,通過歸一化指數函數,可以使每一個元素的范圍映射到0~1之間,大大減少因為輸出結果不均勻引起的誤差。若卷積神經網絡的輸出為xi,經過softmax處理后變為:
(7)
采用softmax函數在于此函數特性的優勢,可以高效完成類間的信號識別,但是應用在盲信號的時頻譜圖識別問題上時,由于類內的間距還是比較大,識別任務會出現準確率降低的情況。因此為了縮小類內間的殘差,引入了中心損失函數(center loss)。中心損失函數的意義是在完成分類任務時,對于每一類特征都維持在一個中心點,即該類所有樣本的特征平均值,當輸入層的數據過于偏離平均值就要剔除或者取舍,從而更接近類內的特性表征。并且如果只替換為center loss函數,效果并不是很好,無法有效類間的特性有效區分。
Center loss的定義:
(8)
令Centerloss=Lc。
Softmax loss的定義:
(9)
其中:cyi代表每類樣本特征的平均值。將式(8)~(9)結合得到損失函數為:
L=LS+λLC=
(10)
而采用將以上兩種損失函數相結合的辦法,優勢相結合能夠有效完成盲信號的分類任務。將softmax loss與center loss相結合的方法增加損失函數的價值,從而提升分類任務的識別準確率。
在深度學習中輸入與輸出的關系復雜,用普通的線性函數無法表征學習到的特征,在學習的過程中會出現梯度消失的問題,因此激活層用來引入非線性因素從而提高整個模型的表征能力。
ReLU函數的定義為:
f(x)=max(0,x)
(11)
盡管ReLU僅在取值為正數時傳輸,具有單調、分散性等優點。但仍存在不足:當取值大于0時,輸出可能會無限大,出現梯度爆炸的問題。
Swish[23]函數則解決了這一缺陷,并且它非飽和、且不是單調函數。適用于神經網絡學習,且在多個數據集上使用Swish激活函數時,識別率均較高。
Swish的定義為:
(12)
將VGG13、VGG16和AleNet模型分別在手寫數據集上進行學習。學習結果如表3,證明了Swich函數具有更大優勢。因此,在針對超短波盲信的識別問題上,將原網絡的激活函數替換為Swich函數。

表3 Swish與ReLU在不同的模型結構學習結果 %
本文模型的訓練是在pycharm平臺下,調用pytorch深度學習庫來完成的。對VGG16原模型進行了如下調整:激活函數改為Swish激活函數,損失函數改為softmax loss與center loss結合的復合函數。優化后的模型用VGG16_U表示。采用前向傳播算法,學習率為0.03,每類盲信號的時頻圖有2 000個,四類盲信號共有8 000個樣本,訓練的batch為64。分別將四種盲信號的時頻譜圖送入網絡進行分類學習。圖像在VGG16原模型與VGG16_U模型上的訓練結果如圖6所示。

圖6 訓練結果
由結果可以看出,當訓練輪數達到10輪時,網絡模型和準確率已經基本穩定。VGG16_U的識別準確率比原模型有明顯提高,且VGG16_U最高識別率為93.1%,說明遷移學習后的卷積神經網絡對盲信號分類識別的有效性。
為驗證空洞卷積核對VGG16_U模型性能的影響,訓練集選取的盲信號的時譜圖保持不變,網絡學習率調整為0.001,訓練的epoch為10,對VGG16_U模型中的卷積層調整為步幅為2的3*3空洞卷積層。VGG16_U網絡的第4層,第7層,第10層均為卷積層,分別將不同層數的卷積層替換進行了測試,得到八組訓練結果。

表4 訓練的參數配置
訓練結果如圖7所示,由圖中的折線可知,引入空洞卷積會大大減小模型的訓練時長,訓練時長與空洞卷積核的位置無關而與空洞卷積核的數量呈正相關:卷積核的數量越多,模型的訓練時間越短。同時,識別準確率與空洞卷積的位置和數量均有關,且引入空洞卷積,整體的識別率皆有所降低。

圖7 引入空洞卷積后的模型對比
VGG16_U未引入空洞卷積時訓練時間為58分33秒,識別準確率為93.1%。經過分析,當將VGG16_U的第4層和第10層的卷積核同時替換成空洞卷積時,此時的識別準確率為92.2%,雖比無空洞卷積時有所降低,但仍維持在較高的水平,且訓練時長為38分35秒,訓練時長減少了34.1%,大大降低了訓練時長,證明了空洞卷積在模型識別上的有效性,提升對作戰目標的內涵情報獲取以及信息作戰支援能力。
在電磁戰場目標識別問題上,以往的仿真都是針對特定的目標信號,諸如信號類型、調制方式等,已有較多的先驗信息。當先驗信息不足時,信號特征缺失,難以滿足對作戰目標的內涵情報獲取需要,因此,對盲信號的分類識別具有突出意義。
在人工智能領域,對于不同的目標任務通常需要重新構造網絡,并采用新的源數據重新學習調整權重參數,任務工作量高且耗時較長。而遷移學習可以將原任務中所學到的知識運用到新任務中,對網絡進行調整從而構造出魯棒性更好的模型。不但降低了訓練時長,基于以前的參數信息也可以完成更優化的識別任務。空洞卷積核具有增大輸入層和輸出層的特征映射特性,可以大大減少網絡參數的數量。在保證較高的識別準確率的條件下,最大程度減少任務時長,在電磁環境日益復雜的戰場中的高效率完成任務有重要的意義。下一步的工作可以繼續增加超短波盲信號的種類、增大數據量。優化空洞卷積核與網絡模型,進一步提高識別率并降低訓練時長。