吳流麗,蘇懷方,王平,季偉,劉筱明
(中國人民解放軍61660部隊,北京 100089)
陣列信號測向,也稱到達方向(DOA)估計,廣泛應用于雷達、無線通信和天文學等領域[1-11]。傳統測向方法可分為波束形成類[3-4]、子空間類[5-6]、最大似然類[7-8]和稀疏重構類[9-11]等。在實際應用中,往往要求測向方法能夠適應復雜多變的信號環境和應用環境并能夠進行快速(實時)測向,然而上述傳統測向方法通常無法滿足這些需求[12]。
近年來,以深度學習(DL)為代表的人工智能技術飛速發展,基于DL的陣列信號測向技術越來越受到關注,并成為測向領域新的研究方向。運用DL進行信號測向的本質是從觀測信號中提取含有信號源入射角度的特征,并利用DL模型在該特征與信號角度參數之間建立一種非線性映射關系從而完成測向。此類方法突破了傳統測向方法對各種誤差適應能力弱的缺陷,并可實現近實時估計,其低信噪比適應能力、空間角度分辨能力也得到了相應的增強。
本文主要對近年來DL在陣列信號測向領域的應用成果進行整理和歸納,并總結出DL類測向方法的一般處理框架,然后對該處理框架的具體實現步驟進行詳細的介紹和討論,最后對未來發展方向進行了展望。
假設K個窄帶不相關的遠場信號s(t)=[s1(t),…,sK(t)]T分 別 以 角 度?=[?1,…,?K]同 時入射到由M個增益為1的各項同性陣元所組成的陣列上,陣元之間無互耦和通道不一致的干擾。則陣列輸出矢量x(t)=[x1(t),…,xM(t)]T可表示為:

式中,A(?)=[a(?1),…,a(?K)]是K個入射信號對應的陣列響應矩陣,a(?k)表示角度?k對應的陣列響應矢量;v(t)=[v1(t),…,vM(t)]T為觀測噪聲,通常假設各陣元的觀測噪聲為零均值高斯白噪聲,且不同陣元不同時刻的觀測噪聲相互獨立。
若陣列接收機共采集了N組快拍數據,即t=t1,…,tN,則陣列輸出矩陣 X=[x(t1),x(t2),…,x(tN)]可寫為:

式 中,S=[s(t1),…,s(tN)]為信號波形矩陣,V=[v(t1),v(t2),…,v(tN)]為觀測噪聲矩陣。陣列測向就是利用觀測數據X估計參數?的過程。
式(1)、式(2)所示觀測模型為窄帶條件下的一般模型,在寬帶信號、陣列誤差、稀疏條件下,該模型應作相應修正[10-12]。
DL是機器學習的一個分支,其本質是基于深度神經網絡(DNN),從Q個輸入/輸出訓練對中D={[Xq,Ψ(Xq) ;q=1,…,Q}自動學習非線性函數Ψ(·)。一般而言,DNN可分為3個基本的部分:輸入層、隱藏層和輸出層。其中,輸入層的神經元用于接收輸入數據X,并將其傳輸到隱藏層的各神經元;隱藏層中的神經元利用激活函數處理數據,并將處理后的數據傳到輸出層;最后由輸出層的神經元輸出結果Ψ(X)。在 DNN 中,隱藏層的層數越多,結構越復雜,其表示能力也就越強,學習得到的非線性函數Ψ(·)就越逼近真實函數Ψ(·),因而 DNN 相較于傳統淺層神經網絡具有更強大的性能。
目前已經提出了多種DNN結構,如自動編碼器、前饋神經網絡、環神經網絡、卷積神經網絡等。
圖1給出了利用DL實現陣列測向的總體處理框架,所示框架事實上是將監督學習用于陣列測向的一種十分直觀的做法,幾乎可以涵蓋目前所有基于有監督學習的陣列測向方法。其中“陣列模型”即對應1.1節的陣列信號觀測模型,包含了陣列測向中所需的所有基本設置和相應參數,如陣列構型、陣元個數、應用場景、信號環境等。

圖1 基于深度學習的陣列測向處理框架
圖1中虛線箭頭表示訓練階段的數據流向,實線箭頭表示測試/測向階段的數據流向。虛線框內即為DL類陣列測向方法的核心部分,涉及預處理、DL模型、數據后處理3個部分。目前將DL技術應用于陣列測向所取得的一些初步成果也基本上是圍繞這3個部分開展,下面對這3個部分進行詳細介紹和總結。
陣列原始接收數據X中包含信號的全部信息,但X∈CM×N維數過高,且包含很多與信號角度參數?無關的冗余信息,如信號的波形、調制樣式、頻率帶寬等。
預處理的目的是希望找到一個合適的變換r=F(X),在盡可能保留信號角度信息的基礎上,減少輸入r的維數,從而降低訓練復雜度、加快學習收斂速度、減少訓練時間。因此,數據預處理的方式會直接影響DL模型的構建以及角度估計的性能。
部分基于DL的測向文獻也將預處理過程稱為特征提取,常用的特征有:時差[13]、相位差[14-15]、功率測量值[16]、廣義互相關矩陣[17]、信道狀態信息(CSI)[18]、協方差矩陣[19]等。其中,最常用的特征就是協方差矩陣R。對于上文的觀測模型,陣列輸出的協方差矩陣為:

式中,Rs=diag[η1,…,ηK]和Rv=σ2IM分別表示信號協方差矩陣和噪聲協方差矩陣。diag[·]表示以給定序列作為主對角線生成對角矩陣;ηk為第k個信號的功率;σ2為噪聲功率;IM為M×M的單位陣。
從式(3)可看出,窄帶信號條件下陣列協方差矩陣R∈CM×M消除了陣列原始數據X中信號波形等因素的干擾,同時保留了入射角度?的全部信息,其維數也降低了(N>M時)。
考慮到R是共軛對稱矩陣以及其對角線元素與信號入射角無關,一般只需利用R的上(或下)三角部分元素(不含對角線):

式中,rˉpq=Rp,q為R的第(p,q)個元素。
由于式(4)中rˉ為復數矢量,因此實際學習過程中需要將復數分為實部和虛部兩部分,并將其歸一化處理后作為DL模型的輸入:

協方差矩陣作為DL輸入特征性能穩健,是目前使用最廣泛的特征;然而它也存在一些固有缺點,如輸入-輸出空間曲面映射關系不夠清晰、維數仍較高、與信號頻率/帶寬等參數相關等。在此基礎上,研究人員根據不同的應用場景提出了一些改進特征[20-22],在不損失角度信息的情況下進一步減少r中的冗余信息,提高訓練效率。
2.2.1 深度學習測向原理
如圖 1所示,DL模型旨在通過訓練集D={[Xq,?q] ;q=1,…,Q},近似模擬輸入輸出之間的非線性映射關系y=Ξ(r),其中,r為深度學習模型的輸入,其通過對陣列觀測數據X進行預處理得到,y代表深度學習模型的輸出,其經過處理可得DOA向量?。
根據y的類型,DL類信號測向方法可分為兩大類:基于分類模型的信號測向方法和基于回歸模型信號測向方法。
1) 基于分類模型的信號測向
將信號入射空域按照一定的角度間距劃分為若干個不相交的區間,例如將[-90°,90°)以1°的間隔劃分為[-90°,-89°),[-89°,-88°),…,[89°,90°)共180個角度區間。同一個區間內的角度視為同一類別,而不同區間的角度對應不同類別,共對應180類。則陣列測向問題可等效為判斷陣列觀測數據來自于哪一個角度區間的問題,DOA估計轉化為多類別分類。
基于分類模型的信號測向方法基本原理為:在訓練階段利用若干訓練樣本訓練分類器。訓練完成后,當一個角度未知的信號輸入到該分類器時,分類器輸出該信號的類別標簽,完成測向。該類方法原理簡單,易于理解,而且DL在分類問題上已取得了非常矚目的成就,可供借鑒和利用的工具非常多。但它也面臨著一些問題如:
① DOA估計結果是離散的值,估計精度受到空域劃分間隔的影響,無法達到無偏估計。
② 當存在多個信號同時入射時,同一個陣列輸出樣本對應多個類別標簽,如2個信號分別從-15°和30°方向同時入射,則該陣列輸出樣本同時屬于-15°和30°類別。這是機器學習中近年來相當活躍的一個研究領域——“多標記學習”,這與常規的分類問題已有較大的區別。
目前利用基于分類思想的文獻[23-27]主要應用于室內定位等對測向精度要求不高的場合。許多研究[28-30]致力于緩解現有分類模型的缺點,其中應用最廣泛的改進策略是使用0-1向量來代替類標簽作為DNN的輸出。將每一個角度區域用一個輸出節點表示,并對輸出節點進行0-1 編碼。在訓練階段,若某個角度區域內存在入射信號,則該區域對應的輸出節點輸出值為1,否則輸出值為0。在角度估計階段,當一個未知角度的樣本輸入到該網絡時,測向網絡在各輸出節點輸出相應的值,構成“空間譜”。
與分類模型相比,0-1 編碼模型可通過對空間譜進行后處理得到連續的角度值,估計精度有所提高;而且該模型還可以方便地處理同時入射的多個信號。
2) 基于回歸模型的信號測向
該類方法測向思路是假設到達角度?與輸入特征r之間存在某種函數映射關系?=Ξ(r),通過深度回歸模型得到這種非線性映射關系的近似(·),從而完成DOA估計=(r)。
回歸模型的優點是DOA估計結果連續且能達到較高精度。缺點是非線性映射關系Ξ(·)影響因素多、形式通常較為復雜,往往需要大量的樣本才能得到較好的近似;而且在處理多信號角度估計時,需要先預估信號個數,并建立多個函數映射關系[31]。
2.2.2 深度學習測向結構
DNN 是基于DL的信號測向的核心部分。在DL領域已經提出多種DNN結構,如循環神經網絡、LeNet、LSTM、AlexNet、殘差網絡(ResNet)等,同時新的DNN結構不斷被提出以適應特定的學習目的和要求。DNN的性能跟很多因素有關,例如隱藏層的數量、每層中的神經元數量、每個神經元的激活函數等,目前DOA估計領域的研究人員尚未就如何選取最合適的DNN結構達成一致。在這一小節中,簡要梳理現有用于DOA估計的DNN結構。
1) 全連通神經網絡(FCNN)
FCNN是一種直接前饋神經網絡,其2個相鄰層中的神經元完全連接。文獻[37-39]中引入了FCNN來解決DOA估計及其相關問題。
2) 卷積神經網絡(CNN)
CNN是目前應用最廣泛的DNN框架之一。它采用卷積數學運算來替換FCNN中的矩陣乘法。CNN適用于處理網格格式的數據,并在許多應用中取得了巨大成功,包括DOA估計[40]。一些改進結構如殘差網絡[41-42]等也陸續應用于DOA估計以進一步增強性能。
3) 循環神經網絡(RNN)
RNN是除CNN之外的另一種綜合神經網絡,其設計用于處理序列數據。RNN的神經元不僅接收來自前一層神經元的信息,還接收來自自身相鄰歷史狀態的信息。為了克服了原始RNN的許多缺點,一些改進算法相繼被提出,例如LSTM和GRU等。其中一些RNN結構已經成功地用于解決DOA估計問題,如在文獻[43]中,協方差矩陣序列R輸入到基于LSTM的RNN以估計信號源方向。
4) 卷積循環神經網絡(CRNN)
CRNN結合了FCNN、CNN和RNN 3種結構,以綜合利用每種神經網絡的優勢。文獻[44-45]提出利用CNN和RNN構建不同的CRNN以獲得改進的DOA估計性能。
5) 混合神經網絡
陣列輸出和DOA的之間映射關系受許多變量的影響,單類DNN很難在所有條件下都具有良好的泛化能力。因此,一些研究人員將 DOA 估計分解為一系列子任務,并采用多個級聯或者并行的DNN分別完成子任務,最終進行組合完成DOA估計。例如,文獻[46]提出了一種用于DOA估計的兩階段級聯神經網絡,它在第一階段使用CNN粗略估計DOA,在第二階段使用FCNN細化調整DOA估計值。文獻[31]提出了一種混合DNN結構,該DNN由3部分組成:用于噪聲濾波的自動編碼器、用于信號數檢測的FCNN和用于DOA估計的一系列并行有向無環圖(DAG)。文獻[47]首先將陣列測量值輸入到SNR測量網絡以評估陣列輸出的SNR,然后從一系列候選DOA估計DNN中調用與該SNR相對應的DNN網絡,以解決不同信噪比條件下DOA估計問題。
6) 復值神經網絡(CVNN)
在實際測向系統中,陣列的輸出為既有實部也有虛部的復數。因此,一些研究人員提出用CVNN以更好地處理復值陣列輸出。與實值DNN相比,CVNN包含復數權重參數并執行復數運算,以從陣列輸出中提取與DOA相關的信息。文獻[41]證明在某些情況下CVNN可以提高DOA估計性能。
7) 遷移學習(TL)和無監督學習
在實際測向系統中,通常很難收集足夠多的有標簽數據集。如果只有有限數量的標記數據可用,則很難通過監督學習獲得滿意的DOA估計性能。為解決這一問題,提出無監督預訓練[37](如自動編碼器)、半監督學習(SSL)[48]和TL[49]等方法。無監督預訓練以無監督的方式從原始陣列輸出中提取基本特征,并為實際分類和回歸任務中的DNN特征提取模塊提供初始權重。SSL利用標記數據和未標記數據來提高模型學習性能。TL通過傳遞在不同但相關的場景和數據集中共享的知識,減少了模型學習對訓練數據量的依賴。
8) 深度展開網絡
上述基于DL的DOA估計模型以黑盒的形式解決DOA估計問題,通過試錯方式優化神經網絡參數。最近,研究者提出深度展開網絡[50-52]以增強了傳統DNN的可解釋性。相關的DOA估計方法首先展開一種迭代的稀疏恢復算法,以獲得具有可訓練變量的信號流圖,然后使用監督學習技術調整這些變量,以獲得更精確的DOA估計模型。例如文獻[50]展開稀疏貝葉斯學習算法,文獻[51]展開FPC算法,得到前向神經網絡結構。
數據后處理的目的是從DL模型的輸出y中得到角度估計值。不同的機器學習模型輸出的信息不同,采用的后處理方法也不同。一般而言,基于回歸模型的測向方法可直接輸出角度,不需要進行后處理。
對于分類模型,如果最終輸出的是各類別的標簽,則該類別對應的角度即為信號DOA的估計值。對于0-1編碼模型而言,神經網絡輸出y可視為“空間譜”。一般情況下,y的峰值的位置即對應入射信號角度值;然而由于空間譜y是基于離散化的空域角度集形成的,如果直接將y中峰值的位置作為信號的波達方向估計值,會引入一定的量化誤差。可以利用線性插值等方法來減小量化誤差的影響,以改善估計結果。得到空間譜估計結果y之后,通過下式計算角度估計值:式 中,φk,1和φk,2分 別 為y中 第k個 譜 峰 的 左側和 右 側對應的方向值,yk,1和yk,2為和對應的幅度值,作開方處理是因為y代表了各方向上的信號功率而非信號幅度。

近年來基于DL的測向方法取得了一系列的成果,但還有一些問題需要進一步研究。
1) 基于DL的方法需要大量標記數據集來訓練具有滿意性能的DOA估計器。然而,由于實際應用中標記數據集通常難以獲取,因此如何減少對標記數據集的依賴是一個重要方向。目前有學者利用無監督學習和TL理念進行了一些嘗試,但現有成果與實際需求之間仍存在差距。在實際測向系統中,標記數據在使用過程中逐漸累積,建立可隨時間改進的演化模型也是研究方向之一?;谶@一目標,可能有必要將強化和增量學習技術引入這一領域,以進一步增強測向性能。
2) 現有基于DL的DOA估計方法大多是純數據驅動的,無法利用陣列流形或信號特征的先驗知識,例如完全或部分已知的陣列配置、循環平穩特征或入射信號的調制信息等。因此需要進一步研究如何更好地利用這些先驗信息。
3) 在DOA估計領域,許多因素會影響從信號方向到陣列輸出的函數映射關系,例如入射信號的數量、信號幅度和波形等。通常不可能枚舉所有場景并在每個場景中收集足夠的數據來訓練通用DNN模型。因此,如何增強基于DL的DOA估計方法的泛化能力值得進一步研究。