郭業才, 施鈺鯤
(1.南京信息工程大學電子與信息工程學院,南京210044;2.江蘇省大氣環境與裝備技術協同創新中心,南京210044;3.南京信息工程大學濱江學院,江蘇無錫214105)
隨著無人機使用的普及率迅速提升,人們對無人機安全問題也十分關注。為提高無人機使用的安全性,開發一套高精度無人機定位系統十分必要。在無人機定位技術中,波達方位(Direction of Arrival,DOA)估計技術受到研究者的關注[1-2]。傳統的DOA估計算法,如基于高分辨率技術的多重信號分類(Multiple Signal Classification,MUSIC)算法[3]和旋轉不變性子空間(Estimating Signal Parameter Via Rotational Invariance Techniques,ESPRIT)[4]算法計算量大、實時性差。近年來,基于機器學習的DOA 估計算法開始出現,文獻[5]中給出了從廣義互相關(Generalized Cross Correlation,GCC)向量中提取方位特征送入多層感知機(Multilayer Perceptron,MLP)網絡學習的DOA 估計算法,抗噪性較差。文獻[6]中提出了基于模擬退火思想(Simulated Annealing,SA)的改進粒子群優化算法(Particle Swarm Optimization,PSO)和誤差反向傳播(Back Propagation,BP)網絡的DOA 估計算法,有效地解決了BP網絡易陷入局部極小點問題,但低信噪比時估計精度不高。文獻[7]中提出了基于卷積神經網絡(Convolutional Neural Networks,CNN)的DOA 估計算法,雖精度較高,但卷積計算量較大。文獻[8-9]中通過切換波束天線陣獲得無人機功率信號并進行DOA估計,仍存在天線實際輻射方向對算法的影響。
為解決現有DOA估計算法穩定性差、定位精度較低、泛化性弱等問題,提出了基于局部加權長短時記憶(Local Weighted Long Short Term Memory,LWLSTM)網絡的無人機DOA估計算法,該算法利用圓陣天線對無人機的正交頻分復用(Orthogonal Frequency Division Multiplexing,OFDM)信號功率進行實值化和特征提取,選取第n個陣元平均接收信號功率與所有陣元平均功率值總和之比作為網絡輸入,通過LWLSTM網絡將方位角θ恢復,實現無人機DOA估計。
接收信號天線陣為N 個相同全向陣元組成的均勻圓陣,如圖1 所示。

圖1 N天線均勻圓陣
假設無人機信號s(k)以方位角θ∈[0,2π)被第n個陣元接收,即

式中:an(θ)為方位角為θ 的第n 個陣元響應矢量;zn(k)為圓對稱、獨立相同分布、均值為0、方差為σ2的加性高斯白噪聲,n∈{1,…,N},k∈{1,…,K},且

式中:Gn(θ)為方位角為θ 的實數陣元增益;βn(θ)為信號到達第n個陣元的時延[10]。
在平穩條件下,相同時間內,第n 陣元接收K 個樣本的平均功率為

式中:PA為信號平均功率。由G2n(θ)的變化,可推斷Pr,n與θ間有潛在的關系,定義rn,R(k)= Re[rn(k)],rn,I(k)= lm[rn(k)],下標R 為實部,I 為虛部。則rn(k)的平方和為

因此,通過最大似然估計可從測量的信號功率中恢復方位角θ[12]。
設xn為第n個陣元接收信號功率與所有陣元接收信號功率的和的比值,即

本文將無人機DOA估計視作分類問題,通過建立方位角θ和LWLSTM 網絡學習特征的非線性映射關系,將xn作為局部加權長短時記憶(LWLSTM)網絡的輸入,對其進行分類,根據分類結果選取對應角度子區間,從而將θ從xn中恢復。
長短時記憶(Long Short Term Memory,LSTM)[13]模型網絡結構,如圖2 所示。

圖2 LSTM結構示意圖
LSTM模型關系式為

式中:xt、ht和ct分別為t 時刻的輸入、輸出和記憶狀態;ht-1和ct-1分別為前一時刻的輸出和記憶狀態;(Wi,bi)、(Wf,bf)、(Wo,bo)、(Wg,bg)分別為輸入門it、遺忘門ft、輸出門ot和候選單元值gt的權矩陣和偏置矩陣;u(·)為sigmoid 激活函數,tanh(·)為雙曲正切激活函數。
為解決小樣本時,LSTM 網絡存在欠擬合問題,引入核函數對LSTM網絡的損失函數和反向傳播權矩陣Wf、Wi、Wo和Wc偏導進行局部加權,對誤差進行非線性映射,賦予不同樣本不同權重,避免欠擬合現象、提高網絡泛化性能。即


式中:e為核函數通過誤差賦予不同樣本的權重,使預測值ht更接近標簽yt。為選擇最合適的核函數,對不同的核函數進行了10 次仿真,結果見表1。

表1 基于不同核函數的LWLSTM神經網絡DOA估計均方根誤差
表1 表明,局部加權的回歸核函數為高斯核函數時估計精度最高,e為

式中:^yi為輸出;yi為標簽;q 為控制核函數徑向作用的寬度參數,影響樣本權重。選擇最合適的q值,對不同q值進行了10 次仿真,得到的結果如表2 所示。

表2 基于不同q值的LWLSTM神經網絡DOA估計均方根誤差
表2 表明,q = 0.05 時,DOA估計精度最高,因此q值選取為0.05。
本文采用均方根誤差(Root Mean Square,RMSE)來比較基于LWLSTM、MLP、模擬退火粒子群優化和反向傳播(Simulated Annealing Particle Swarm Optimization-Back Propagation,SAPSO-BP)SAPSO 和CNN的DOA估計方法的穩定性和精確性。RMSE 定義為

式中:A為數據集樣本個數;yi與^yi分別表示真實值與估計值。
仿真環境為開放圓形區域,N 個天線組成均勻圓陣[14],以圓陣圓心為坐標原點,將區域均勻分為M 個扇形范圍,取N = 8,M = 36,8 個天線成十字圓陣。信號源為無人機發送的OFDM信號,快拍數為200,信噪比為10 dB。數據集為無人機從0° ~360°每10°范圍內產生500 個OFDM信號樣本,共18 000 個樣本。按8∶2的比例隨機抽取訓練集和測試集[15-16]。實驗樣本為操場上固定圓心,從0° ~360°每10°范圍內收集10個定點的無人機OFDM信號,共360 個,如圖3 所示。實驗中所使用的無人機,如圖4 所示。

圖3 仿真環境示意圖

圖4 無人機實物圖
通過混淆矩陣比較DOA估計算法的精確性,矩陣中數字為多分類模型的百分比準確率。因分類區間太多,只統計350° ~90°之間11 個角度,縱坐標為標簽角度θ,橫坐標為當前角度φ 的分類結果。圖5 ~8 表明,本文算法的精確性明顯高于基于MLP 和SPASOBP的DOA估計算法,略高于基于CNN 的DOA 估計算法。
信噪比對算法性能的影響,如圖9 所示。隨著信噪比的增大,基于LWLSTM、SAPSO-BP、MLP 和CNN的DOA估計算法的RMSE都逐漸減小,但由于實驗環境存在電磁和機械噪聲干擾,使得實驗測得的均方根誤差大于仿真測得的結果。盡管如此,本文算法的RMSE均小于其他算法,且與仿真結果一致。

圖5 LWLSTM的混淆矩陣

圖6 MLP的混淆矩陣

圖7 SPASO-BP的混淆矩陣
陣元數對算法性能的影響,如圖10 所示。圖10表明,實驗測得的均方根誤差(RMSE)均大于仿真測量值,但隨著陣元數和網絡提取的特征數增加,幾種算法的RMSE都逐漸降低且變化趨于平緩,而本文算法的RMSE比其他算法的都小,實驗測量結果與仿真結果一致。

圖8 CNN的混淆矩陣

圖9 信噪比對算法性能的影響

圖10 陣元數對算法性能的影響
本文通過圓陣天線接收無人機OFDM 信號,將單陣元接收信號功率與所有陣元接收功率之和的比值作為網絡輸入,對LSTM進行局部加權回歸,最后得到基于LWLSTM網絡的無人機DOA 估計算法。仿真與實驗結果表明,與基于SAPSO-BP、MLP 和CNN 的DOA估計算法相比,該算法具有更好的抗噪能力、準確性和泛化性。