劉 佳, 徐群玉, 陳唯實
(1. 北京航空航天大學前沿科學技術創新研究院, 北京 100191; 2. 中國民航科學技術研究院民航法規與標準化研究所, 北京 100028; 3. 中國民航科學技術研究院機場所, 北京 100028)
無人機技術及產業的快速發展為眾多行業應用提供了全新維度上的解決思路[1]。然而,無人機體積小、部署靈活、成本低等優勢也為各類非法活動提供了新的作業平臺。近年來,多個機場及重點區域頻繁出現無人機干擾事件。隨著無人機載荷能力以及智能化水平的提升,無人機的潛在安全威脅也在不斷增大[2-3]。
為提升安全監管能力,非合作無人機的主動監視以及反制技術近年來成為了研究熱點[4]。雷達憑借其監視距離遠、全天候工作、全空域掃描等優勢成為最適合進行廣域范圍內無人機監視的技術手段。然而,無人機的雷達目標檢測、跟蹤與識別也面臨眾多難題?,F有無人機通常采用非金屬復合材料制造,體積較小,雷達回波強度低,可識別特征弱,有效檢測難度較大[5-6]。小型無人機通常在低空空域內活動,該空域內飛鳥是另一類主要的非合作“低慢小”目標。研究表明,飛鳥和無人機在雷達回波特性(如雷達散射截面)上存在高度相似性[7-10],是無人機目標監視中的主要干擾源,動態環境雜波在滿足一定條件時也會形成虛假目標航跡,影響無人機的精確跟蹤。
隨著雷達目標特性研究的發展,人們發現飛機目標上的活動部件(如螺旋槳)在高速旋轉過程中會對雷達回波進行調制;飛鳥撲翼動作產生的非剛性形變也會產生類似的調制效應。采用時頻分析算法可以提取該類微多普勒特征[11-12]。實驗表明,螺旋槳和撲翼產生的微多普勒特征存在顯著差異[13],理論上可用于對飛鳥和無人機進行有效區分[14-16]。然而,在實際復雜環境的監視場景中,微多普勒特征的提取和應用也面臨若干問題?,F有關于微多普勒特征的提取技術都是基于計算機仿真、暗室測量或者外場理想環境下的近距離測試獲取的。在實際環境中,旋翼無人機的微多普勒特征提取效果與雷達駐留時間、測量環境和距離均有密切的關聯[17]。因此,現有雷達技術尚難以在較遠距離下實現無人機微多普勒特征的快速提取,雷達難以采用監視模式進行觀測,限制了其在廣域范圍內對多個無人機目標的識別與跟蹤能力。
雷達對無人機和飛鳥等典型“低慢小”目標通常以航跡的形式進行描述,航跡采樣點的時空間信息包含了目標的運動特征。通過對飛鳥和無人機目標航跡進行分析后發現,盡管在飛行速度上接近,但是二者在運動模式上仍然存在顯著差異[18]。文獻[19]根據航跡運動特征,提出了基于運動模式轉換頻率的飛鳥和無人機航跡類別判定方法,初步驗證了基于航跡運動特征進行“低慢小”目標識別的可行性。本文也采用目標航跡中包含的時空間信息,提出了基于目標航跡的運動特征提取算法,提取了5類航跡運動特征描述子,構建了特征向量,并采用隨機森林模型構建分類器,實現了對無人機、飛鳥以及動態降水航跡類別的判定。該識別方法不需要對雷達硬件以及信號處理算法進行改動,具備較強的普適性;由于未采用雷達散射截面以及微多普勒作為識別特征,可以有效地避免雷達定標、環境衰減、微多普勒特征模糊等不利因素的影響,實現雷達在搜索工作模式下對無人機目標的遠距離精確識別。
本文提出的無人機目標識別方法主要針對常見的旋翼無人機,因此主要分析旋翼無人機和飛鳥在飛行機理以及行為模式上的特征。
旋翼無人機通過控制不同旋翼的旋轉方向和轉速來獲取升力,并通過調節不同螺旋槳葉片的轉速和方向產生升力和拉力偏差,實現機體的上升、下降、前進、旋轉、懸停、減速等基本飛行動作,如圖1所示。因此,通過對螺旋槳工作模式的智能化調整,無人機具備更高的飛行自由度以及機動能力。氣動外形在旋翼無人機設計以及飛行過程中的作用則不像固定翼無人機那樣重要。相比之下,飛鳥的飛行動力主要來自于兩翼撲動。通過自身姿態的控制結合空氣動力學完成機動,大部分情況下飛鳥的運動自由度低于無人機,飛行軌跡相對平滑,短時間內出現大幅度機動的概率較低。飛鳥的飛行機理與氣動外形存在密切關聯,且僅有極少數鳥類可以實現空中懸停。因此,盡管在飛行速度上類似,兩類目標在飛行機理上的本質差異使得飛鳥和無人機都很難完全重現對方的部分飛行模式。圖2為無人機目標在航拍、監視等典型作業場景下在水平面維度上呈現出的典型的飛行軌跡。大部分飛鳥則較難呈現出圖2中B和D所對應的飛行軌跡。

圖1 旋翼無人機和飛鳥飛行機理示意圖Fig.1 Schematic diagram of flight mechanics for wing drones and birds
從行為模式上看,無人機屬于典型的人造目標,其飛行本質上是完成各種指定的作業目的,如監視、偵察、貨運、攻擊等。因此,無人機的行為模式是駕駛員操作習慣以及作業模式的綜合體現。盡管目前無人機正向智能化自主作業方向發展,然而其行為模式本質上仍然是與作業目的和人工智能算法相關聯的,存在一定的確定性和預估性。相比之下,飛鳥屬于具備自我意識和智能的非人造目標,是典型的非合作目標。飛鳥的行為模式通常與其生活習慣存在密切關聯,如遷徙飛鳥和本地留鳥就存在顯著差異。同類鳥種之間在做出覓食、返巢、躲避天敵等動作時的飛行機動模式存在差異,而不同鳥種在體型、生活習性以及機動能力上的差異導致其運動模式更加千變萬化,對應的目標航跡特征也更具備多樣性。
綜上所述,在機動能力方面,飛鳥不如旋翼無人機具備更高的自由度,但是鳥類種群自身的多樣性及更強的非合作性使其在行為模式上具備更高的復雜度。除了雷達目標特性,飛鳥和無人機在飛行機理以及行為模式上均存在本質差異,而雷達目標航跡中包含的時空間信息則為挖掘并且利用這些差異進行目標識別提供了可能。
現有探鳥雷達系統均采用了檢測-跟蹤-識別一體化的技術體制,因此在探鳥雷達測量數據中,航跡是表征目標最基本的單元。目標航跡是由航跡采樣點組成的向量,每個采樣點包含時間以及空間信息。由于探鳥雷達掃描速率較大,且飛鳥和無人機飛行速度相對較慢,可近似認為在相鄰航跡采樣點之間目標為勻速運動,飛行方向為相鄰采樣點組成的矢量?;谠摻?通過關聯航跡中相鄰點的時空間信息,結合目標的運動模型可計算出每個航跡采樣點的航向、速度等信息。
然而,直接應用航跡采樣點的速度和航向信息描述目標運動特征存在一定的局限性:① 目標航跡長度不一致,導致特征向量維度不統一;② 速度和航向分別在時空間維度上描述目標的一階運動特征,關聯性弱,特征描述能力也存在較大不足。鑒于此,需要進一步挖掘航跡中包含的目標運動特征并構建統一維度的特征空間,便于采用機器學習等技術實現對目標的精確識別。本文提出一種基于雷達目標航跡的運動特征提取算法,根據航跡采樣點的速度以及航向信息提取了5類運動特征描述子并構建了目標特征向量,并采用隨機森林機器學習模型對飛鳥、無人機以及動態降水雜波目標進行識別。3類目標的雷達航跡信息均來自于探鳥雷達系統實際測量數據。飛鳥目標航跡樣本來自于雷達對本地留鳥的觀測數據并經過人工觀測進行交叉驗證;無人機航跡樣本來自于現場實測;降水在某些情況下會隨著風進行運動,在風速和降水強度均滿足一定條件的情況下會被雷達誤判為飛鳥目標,進而在雷達觀測屏幕上呈現出海量的虛假“飛鳥”目標[20]。該類虛假飛鳥目標可以結合氣象信息以及人工觀測進行判斷,但尚無有效的自動化識別手段。
定義某目標航跡為Z=[z1,z2,…,zN],其中zi(i=1,2,…,N)代表航跡的第i個采樣點,N為航跡長度。航跡Z對應的速度和航向信息可分別用矢量形式描述為V=[v1,v2,…,vN]和H=[h1,h2,…,hN]。速度信息的單位為m/s。航向信息的單位為(°),定義正北方向為0°,正東方向為90°?;谑噶縑和H,本文提取了5類目標運動特征描述子。
平均速度定義為速度矢量V中全部速度信息的統計平均值:
(1)
速度均值描述了航跡的整體平均速度,是目標航跡運動特征最基礎的描述子。對于飛鳥和無人機,除懸停模式,大部分情況下兩類目標的平均飛行速度較為接近,而降水雜波形成的航跡平均速度則與風速以及雨量大小存在關聯,通常情況下速度略慢于飛鳥和無人機。航跡平均速度適用于區分運動特征差異明顯的目標,如低空飛鳥以及地面車輛,但是不適用于有效區分飛鳥、無人機及降水雜波航跡,通??勺鳛橐粋€基礎描述子,與其他描述子聯合描述目標的運動特征。
目標航跡不同采樣點之間的速度通常存在差異,差異的大小則反映了目標運動特征的不確定性。本文采用速度標準差定量描述目標在速度維度上的變化特征,定義如下:
(2)
標準差越大,表明航跡的速度不確定性越高。飛鳥目標在正常飛行過程中速度變化通常較小,部分情況下飛行軌跡和速度也會呈現一定的高機動和不連續性,但是此種情況出現的概率較低;降水雜波速度特征通常與風一致,對應航跡出現較大速度變化的情況較為罕見;無人機在巡航過程中速度較為均勻,然而在不同作業模式下,其飛行速度的不確定性特征較為復雜,在懸停、轉向或者受側風影響時其飛行速度存在一定的變化。此外,操作人員的操作習慣、熟練程度等因素也會對無人機的飛行速度造成影響。因此,理論上,無人機航跡的速度標準差存在更大的變化范圍,具備區分飛鳥和無人機目標的潛力。
航向信息是通過關聯相鄰航跡采樣點空間位置得到的,與航跡采樣點上真正的瞬態航向并非完全一致。然而在足夠高的雷達掃描速率下,該航向信息仍可對目標飛行方向進行有效表征。與速度信息不同,航向統計平均值與運動模式無密切關聯,而航向偏轉產生的角度偏差則可用于描述目標空間位置的不確定性。本文提出航向偏轉標準差,對該不確定性進行量化描述,其定義如下:
(3)
結合航向的定義,式(3)中Δh(i)的定義為
(4)
式中:hmean為航跡的平均航向,單位為(°)。在hmean的計算過程中,要考慮到0°和360°之間的關系,從而保障平均航向信息的有效性。δh為航向偏轉角度差的閾值,通過對大量航跡相鄰采樣點的航向角度進行分析,該閾值設定為90°。飛鳥目標的航向偏轉程度與其活動模式存在一定關聯。通常情況下,本地飛鳥的活動模式較為多樣化,飛行航向不確定性大,呈現出的標準差數值變化范圍也比較大;遷徙飛鳥的飛行模式確定性相對較高,對應標準差數值略小。無人機目標由于具備空中懸停能力,因而在飛行航向的操作上具備更高的自由度,總體上航跡呈現出的航向不確定性數值跨度較大。此外,無人機飛機航跡與其作業模式密切相關,在作業需要以及環境干擾的情況下,需要進行頻繁的姿態修正,因而航跡的空間不確定性以及航向偏轉范圍也更大。動態降水雜波形成的航跡與風速、風向密切關聯,除了短時間的陣風影響,大部分情況下降水雜波航跡的航向偏轉程度較低,標準差對應數值較小。
在前3個描述子中,航向偏轉標準差描述了航跡采樣點的空間不確定性,但沒有與時間信息進行關聯;速度均值和標準差描述了速度的標量變化特征,而與空間相對位置信息關聯度較弱。因此,前3個描述子在各自單一維度上對目標運動特性進行描述。通過對大量目標航跡進行分析后發現,不同類型目標在產生航向偏轉過程中呈現出的速度特征是不一樣的。高速目標若呈現較大的航向偏轉,說明其機動能力較強,反之較弱。該機動能力是對目標在時空間聯合維度上運動特征的聯合表征。鑒于此,本文提出航跡機動因子,以實現對目標機動能力的量化描述,定義如下:
(5)

飛鳥的機動特征與鳥種以及活動狀態有較大關系。遷徙飛鳥在航跡上體現出來的運動特征較為平穩,通常不會出現明顯的高機動飛行。對于本地留鳥而言,覓食、歸巢、躲避天敵等動作通常會讓飛鳥出現短時間的高機動飛行,該類機動飛行的出現時間以及具體形式存在較高不確定性;對于旋翼無人機而言,由于其具備懸停功能,且飛行機理更類似于直升機,因此理論上運動模式更加多樣靈活,機動能力也更加寬泛,且與實際作業目的和場景的關聯更加密切。降水雜波的機動特征與風速風向存在密切關聯,大部分情況下航跡呈現出的機動特征較弱,僅僅在出現陣風或者風切變等小概率氣象特征時虛假航跡會呈現較為明顯的機動特征,因此大部分情況下降水雜波形成的虛假目標航跡機動特征較弱,σ值較高。
機動因子中采用的航向偏轉標準差主要描述了航向圍繞均值的變化特征,缺乏對航跡中整體航向變化的描述能力。此外,前述4類特征描述子在航跡運動特征描述中也存在一定的局限性。本節以圖3所示的兩個航跡在水平面上的投影為例對其局限性進行了舉例描述,字母A到I描述了雷達航跡的采樣點。

圖3 常見平滑航跡與典型震蕩航跡水平投影示意圖Fig.3 Schematic diagram of horizontal projection of regular smooth and typical oscillation tracks
圖3(a)描述的航跡較為平滑,運動特征連續,與大部分飛鳥目標航跡相似。圖3(b)所示的航跡在實際飛鳥航跡中較為罕見,而無人機做出該類型航跡運動模式難度較低。除了人為刻意操作,無人機在實際作業過程中在進行避障、姿態調整或者遭遇側風時均有可能做出類似圖3(b)所示的震蕩。然而,圖3中兩個航跡的顯著差異卻無法從前4個描述子中得到體現,原因來自于標準差的計算方法。由于采用了絕對值和平方求和計算方法,標準差僅能描述航向和速度的絕對數值變化,無法體現出航向在順時針或逆時針方向上的變化。此外,機動因子僅描述了航向相較于平均值的絕對變化,導致航向信息沿著一個方向的連續變化與沿著不同方向的交替變化在統計數值上沒有得到充分的體現。因此,前4個描述子無法有效體現出該類震蕩航跡的運動特征,目標誤判可能性較高。
為解決上述問題,本節提出了震蕩因子進行補充描述。該描述子對航跡中每個相鄰采樣點的特性進行分析,實現了對航跡震蕩特性的定量描述。通過計算航跡中每個相鄰采樣點之間的航向相對差異值τh(k)=hk+1-hk,結合雷達測量誤差,計算航跡采樣點zk的航向差異符號:
(6)
式中:δe為航向偏轉誤差閾值,本文定義為0.5°。根據式(6)定義,航向差異符號向量可用矢量描述為O=[1,-1,0,1,…]的形式。根據向量O中相鄰元素的正負號變化關系,定義兩種震蕩模式:①O(i-1)+O(i)=0且O(i-1)≠O(i);②O(i-1)+O(i+1)=0且O(i-1)≠O(i+1),O(i)=0。從航跡的起始點開始進行遍歷,若對應符號向量中存在上述兩種震蕩模式的其中一種,則航跡的震蕩次數加1,并記錄該次震蕩對應的航向角度變化絕對值τh(k)。在遍歷航跡全部采樣點之后,若航跡中存在K(K>0)次震蕩,則計算震蕩因子:
(7)
式中:w(k)為加權因子,具體定義如表1所示。震蕩次數越多,表明其震蕩特征越強。因此,本文定義與震蕩次數相關聯的加權因子,對單次震蕩角度進行加權累加,以實現震蕩強度的定量描述,量綱為度。表1定義中震蕩次數表示的是第k次震蕩,即震蕩次數3表示的是航跡發生第3次震蕩時采用的權值,因此式(7)所示的累加過程從航跡第1次震蕩開始,并隨著震蕩次數的增加,加權因子根據表1逐漸增大。表1所示加權因子目前基于人工定義,主觀性較強,主要體現在震蕩次數對于航跡整體震蕩強度的影響。在后續工作中,可通過對實驗反饋結果的逆向分析,采用擬合的方法對加權因子的數值定義進行進一步優化。

表1 加權因子定義Table 1 Definition of weighting factors
采用本文定義的5類航跡運動特征描述子,可構建目標運動特征空間及特征向量:
S=[vmean,vstd,hstd,σ,ζ]
(8)
根據第2節的定義,式(8)所示特征向量元素之間的物理概念以及量綱是不連續的,包含了目標在不同維度上的本地及全局運動特征。因此,基于式(8),可以保障不同長度航跡的特征向量具備統一的維度,但是需要針對向量中存在的特征不一致性選擇合理的分類器。本文選取了隨機森林模型構建分類器。隨機森林是一種基于多個決策樹的組合分類模型,其基本原理是基于可重復隨機部分抽樣策略構建多重決策樹,通過融合多個決策樹提供的信息,對目標類別進行綜合判定[21]。隨機森林模型的基本原理如圖4所示。

圖4 隨機森林基本原理示意圖Fig.4 Schematic diagram of random forest fundamental principle
隨機森林模型的原理以及實現難度較低。然而,本文需要對選擇隨機森林模型作為分類器的原因進行進一步的闡述。
(1) 隨機森林與其他模型的一個顯著區別在于其可對特征空間中的部分特征進行可重復的隨機采樣并構建不同的決策樹分類器。這使得隨機森林模型具備更好的抗噪聲能力,且過擬合的幾率更低[22]。在本文實驗中,盡管雷達系統可提供較高精度的目標航跡,然而環境干擾及算法的不確定性使得航跡類別無法保障100%的準確率。因此,訓練樣本集不可避免地存在質量不確定性,而隨機森林的上述特性更加適合該類問題。
(2) 如前所述,特征向量S中的元素之間存在顯著的量綱以及物理概念上的不連續性。這種不連續性使得眾多常見的機器學習模型(如神經網絡、支持向量機等)難以構建高效精確的分類模型,但是并不會對隨機森林模型造成顯著影響。作為隨機森林的基本單元,決策樹天然適用于定性和定量問題,且不需要為了特征空間分布構型對描述子進行歸一化操作。因此,隨機森林模型對于特征描述子的物理概念和量綱連續性敏感度較低,且在加入新的特征元素的條件下可以快速重構森林模型,具備非常好的樣本靈活性和適應性。
(3) 隨機森林的計算復雜度通常遠遠小于其他機器學習模型。鑒于飛鳥種群以及運動模式的高復雜性和多樣性,無人機識別通常需要根據監視場景條件對飛鳥目標的航跡訓練集進行頻繁調整。因此,在實際監視場景下,隨機森林模型的效率以及樣本靈活性具備更加突出的優勢。
(4) 隨機森林模型中的基尼指數可對特征描述子在分類過程中的重要性進行量化描述[23]。本文介紹的5類特征描述子是根據實際觀察與理論分析提出的,針對其實用價值以及各描述子之間的相對重要程度尚無有效的分析及評估方法?;嶂笖递^好地彌補了這一不足。在第4章的分析中,基尼指數對不同場景下的目標運動特征描述子的重要性進行了量化描述,為進一步認知描述子的合理性以及新特征的挖掘提供了參考依據。
本研究工作實驗數據來自于中國民航科學技術研究院(China Academy of Civil Aviation Science and Technology,CAAC)開發的探鳥雷達系統。探鳥雷達系統示意圖如圖5所示。該雷達系統采用雙天線掃描技術體制,工作頻率在S波段。水平掃描天線安裝在一個可以調整高度的平臺上。發射機采用了峰值功率為0.4 kW的固態功率放大器,機械天線掃描速率為25轉/min。系統包含鳥情數據處理與分析軟件,具備機場凈空區的鳥情探測能力[24-25],對于常見家鴿目標的最大有效觀測距離為5 km,采用多目標自動起始與跟蹤算法。該雷達系統通過融合水平以及垂直掃描天線的信息實現目標三維坐標(距離、方位、高度)的重構,在3個維度上的分辨率分別為10 m、1°以及5 m。

圖5 CAAC探鳥雷達系統Fig.5 Bird surveillance radar systems of CAAC
探鳥雷達系統部署在廣西北海福成機場,具體部署位置如圖6所示。圖6中,區域O和區域P為飛鳥活動較為頻繁的區域,也是飛鳥航跡信息的主要數據源。區域Q為無人機實驗空域,無人機航跡信息均來自于該實驗區域內的無人機飛行。降水雜波信息則來自于機場周邊區域。

圖6 北海福成機場探鳥雷達系統及實驗部署示意圖Fig.6 Schematic diagram of bird surveillance radar system and experimental deployment in BeiHai FuCheng airport
實驗數據采集時間段為2019年9月3日到10月30日,為最大限度降低無人機對機場空域安全造成的影響,所有無人機飛行實驗均安排在深夜或者清晨(沒有航班)的情況下進行。飛鳥數據采集時間段集中在7:00到19:00,且選擇晴天氣象條件較好的條件下進行篩選,通過對比人工觀測進行了二次驗證,盡可能地保障了飛鳥目標航跡數據的準確性。無人機型號為大疆精靈3系列,在飛行過程中模擬了眾多日常應用場景,包括連續航拍,單點圖像采集,多點多方位圖像信息采集等。通過對比無人機衛星定位航跡和雷達航跡后發現,在無人機懸停超過15 s(6次全空間掃描)之后,現有跟蹤算法會丟失目標。在其他機動場景下,雷達系統均可以實現對無人機目標的有效跟蹤。根據雷達回波強度,現有探鳥雷達系統將無人機判定為小型飛鳥目標。
通過對雷達航跡與天氣情況進行交叉比對后發現,當降水達到中雨級別且隨風進行穩定運動時,系統會將降水回波誤判為飛鳥目標,回波強度介于小型飛鳥和中型飛鳥目標之間。由于降水雜波通常密度較高且范圍較大,因而會形成大量且方向雜亂的航跡,屬于典型的環境干擾雜波。降水雜波選取方法基于大量歷史數據與氣象信息的比對分析,選擇了2019年9月中的兩個中度降水天氣進行動態雜波信息采樣,風速大概為10 m/s。降水雜波采樣期間,結合視覺觀測,僅發現極少數量的飛鳥活動,并且沒有進行無人機實驗,因此最大程度地保障了采集到的雷達航跡信息均為動態降水雜波形成的虛假目標航跡。
在構建訓練以及測試樣本集合之前,還需要對原始樣本集合進行進一步的優化。結合航跡的多元統計特征,濾除了長度過長或者過短的航跡,靜動態雜波引起的多次震蕩航跡也通過人工甄別進行了濾除。航跡有效長度定義在4~25之間,震蕩次數上限定義為7次。采用隨機采樣方法構建了不具備重復航跡的訓練和測試樣本集合。本實驗訓練數據集中飛鳥、無人機以及降水雜波的航跡樣本數量分別為927,635和1 385。測試樣本集中3類目標航跡樣本數量分別為217,194和239。由于采用不重復隨機采樣方法,航跡訓練樣本集和測試樣本集的樣本重復率為0%。
4.2.1 航跡描述子可分性分析
首先對5類運動特征描述子的有效性在特征空間中進行直觀評估。鑒于在五維空間中難以直觀描述和觀測不同類型目標在特征空間中的可分性,采用主成分分析(principal component analysis, PCA)方法提取出各類目標特征向量中的主成分,并將不同類型目標特征向量的第一和第二主成分投影至二維平面,如圖7所示。由圖7可以看出,3種類型航跡運動特征存在較為明顯的可分性,其中降水雜波與其他兩類目標相比,尤其是無人機的運動特征差異尤為明顯。由于無人機和降水雜波的動力來源存在本質區別,因此二者之間運動特征的差異可視作無人機與風在運動模式上的差異。飛鳥航跡主成分分布范圍較為廣泛,與無人機和降水航跡均存在一定程度的重疊。對不同重疊區域的航跡樣本特征進行挖掘,有助于進一步認知飛鳥和無人機在運動模式上的差異。與降水航跡重疊明顯的飛鳥航跡呈現出較為簡單的運動模式,航跡平滑且速度均勻;與無人機高度重疊的飛鳥航跡則呈現出更強的機動能力,其中少量飛鳥航跡甚至呈現出震蕩特征,而這類震蕩特征則有可能來自于航跡關聯算法中的誤差。

圖7 3類目標航跡特征空間的第1和第2主成分分布Fig.7 Distribution of the first and second principal components in feature space of three types of target tracks
圖7中的主成分分布同樣呈現出一定的聚類特性。采用k-means算法對聚類中心進行提取后發現,無人機聚類中心附近的航跡有較大比例呈現出類似于圖2中B和D航跡的運動模式,這些航跡通常來自于無人機進行空中視頻錄制或者圍繞某特定目標進行多角度圖像采集,飛鳥較難呈現出類似的機動能力。綜上所述,采用主成分空間投影方法可以較為直觀地看出運動特征空間具備有效區分三類目標航跡的可能性。
4.2.2 分類器交叉驗證實驗
采用隨機森林構建分類模型后,本文采用五折交叉驗證的方法對分類模型的質量進行評估。表2所示為采用五折交叉驗證后的平均識別率模糊矩陣,正確識別率基本達到了85%以上,初步驗證了該分類模型的有效性。

表2 三類目標五折交叉驗證識別率模糊矩陣Table 2 Fuzzy matrix for recognition rate of five-fold cross validation for three types of targets
在眾多監視場景中,降水雜波形成虛假目標航跡的幾率較低。因此,分類器區分飛鳥和無人機目標的能力具備更加廣泛的應用和研究價值。表3所示為排除降水航跡樣本后隨機森林分類器五折交叉驗證的識別率模糊矩陣。由表3可以看出,飛鳥和無人機正確識別率沒有發生明顯的變化,總體正確識別率可達85%以上。

表3 飛鳥與無人機目標五折交叉驗證識別率模糊矩陣Table 3 Fuzzy matrix for recognition rate of five-fold cross validation for bird and drone targets
4.2.3 目標識別精度及效率評估
表4所示為采用測試樣本集之后,分類模型對3類目標的識別率模糊矩陣,與表2所示交叉驗證相比,整體識別精度并沒有顯著下降,仍然達到了85%以上,無人機和降水雜波的誤識別率接近0%,表明分類器可以非常精確地區分兩類目標,與圖7的樣本可分性分布特征一致。在剔除降水雜波樣本之后,分類器對無人機和飛鳥目標的識別性能沒有產生明顯變化,如表5所示,這說明飛鳥是無人機目標識別的主要干擾源。此外,根據圖6所示,目標航跡樣本采集區域距離雷達的平均距離均在1 km以上,因此表4和表5中的實驗結果表明本文提出的目標識別方法具備在廣域范圍內實現無人機目標精確識別的能力。

表4 三類目標識別率模糊矩陣Table 4 Fuzzy matrix of recognition rate for three types of targets

表5 飛鳥和無人機目標識別率模糊矩陣Table 5 Fuzzy matrix of recognition rate for bird and drone targets
為了對本文提出方法的性能進行橫向驗證,采用文獻[19]介紹的方法對本文構建的航跡樣本庫進行目標分類。由于文獻[19]方法僅能對無人機和飛鳥航跡進行二分分類,因此數據庫中去除了動態降水雜波航跡。表6所示為兩類方法對飛鳥和無人機目標的正確識別率。從表6可以看出,本文所提方法在識別性能上要略好于文獻[19]提出的方法。通過對文獻[19]中的誤判斷樣本進行分析后發現,造成該方法誤判的主要原因在于文獻[19]假設飛鳥目標機動性高于無人機,因此對于高機動無人機航跡以及平緩飛鳥航跡的類別進行了誤判,降低了整體正確識別率。

表6 本文與文獻[19]分類方法對飛鳥和無人機目標的正確識別率比對Table 6 Comparison of the correct recognition rate of bird and drone targets using classification methods in this article and [19]
與無人機這類人造目標不同,飛鳥以及降水雜波的運動特性與環境存在密切關聯,因而即便是在同一個監視場景下,不同季節和不同時段的飛鳥以及降水雜波也會呈現出較大的運動特征差異。這就使得目標識別系統需要頻繁地更新調整訓練樣本數據集,以實現對目標運動特征的準確描述,也對分類模型的樣本魯棒性提出了較大挑戰。為了進一步驗證隨機森林模型的樣本魯棒性,本節將既有訓練和測試樣本集融合為一個新的訓練集。基于新的訓練集構建隨機森林分類模型后,進行了五折交叉驗證實驗,分類模糊矩陣如表7所示。與表4進行比對后可以看出,3類目標的正確識別率沒有發生明顯的變化,說明訓練集的變化并沒有對分類器性能造成顯著影響,分類模型具備較好的樣本魯棒性,適用于需要頻繁調整訓練樣本的目標識別場景。需要說明的是,本節實驗僅部分反映了分類模型魯棒性,受限于實驗數據樣本,尚無法進行更加充分的驗證。

表7 基于新融合訓練集的五折交叉驗證模糊矩陣Table 7 Fuzzy matrix of five-fold cross validation based on new fusion training set
在識別效率方面,由于隨機森林模型的復雜度以及特征向量維度較低[26],在訓練以及識別過程中均不會過度消耗計算機資源。本實驗采用的隨機森林模型基于python平臺開發,計算機采用Intel i5-7500中央處理器,內存為16 GB。由于訓練集數量較小且維度低,構建隨機森林模型的平均訓練時間僅為17.6 s,單一未知航跡特征向量類別判定的平均時間為0.31 s,幾乎可以實現未知目標的準實時識別。基于上述對分類模型的識別精度、樣本魯棒性以及識別效率的分析可以看出,由目標航跡運動特征和隨機森林模型構成的目標識別系統具備較好的工程應用價值。
4.2.4 基于基尼指數的特征重要性評估
圖8采用基尼指數對描述子重要性進行了評估,基尼指數越大,對應特征描述子在分類中的重要性越高[27]。機動因子對應最大基尼指數表明,在識別無人機、飛鳥和降水雜波3類目標的過程中,目標機動能力是區分3類目標的主要依據。基尼指數最小的平均速度則表明其在分類過程中的重要性最低,與理論分析和經驗預期一致。在去除降水雜波航跡后。目標識別過程中的基尼指數分布如圖9所示,其中機動因子在識別飛鳥和無人機的過程中仍然是最重要的區分特征。圖8和圖9的主要區別在于航向偏轉標準差重要性的顯著下降。一方面,表明在區分降水雜波與另外兩類目標過程中航向偏轉標準差起到了非常重要的作用;另一方面,由于飛鳥和無人機在連續航跡內均可以做出較大的航向變化,但是變化的方式以及航跡采樣點時空間關系存在顯著差異,而這類差異在航向偏轉標準差中難以體現出來,從而導致航向偏轉標準差在區分兩類目標過程中的貢獻程度出現了較大的下降。相比之下,航向偏轉標準差體現出來的不足則由震蕩因子進行了補充描述,其重要性的進一步提升則表明其在描述飛鳥和無人機目標運動特征差異性上的有效性。

圖8 隨機森林模型基尼指數分布-三類目標識別Fig.8 Random forest model Gini exponential distribution- three types of target recognition

圖9 隨機森林模型基尼指數分布-飛鳥無人機目標識別Fig.9 Random forest model Gini exponential distribution- bird and drone target recognition
上述分析表明,基尼指數對特征描述子重要性的定量描述與人工觀測的直觀分析較為一致,該指數有助于進一步加深對目標運動特征的認知,為探索新的目標可識別特征提供參考。
4.2.5 現有工作存在的不足
現有實驗結果對本文提出的特征提取與目標識別方法進行了驗證。然而,現有工作仍然存在改進的空間,主要體現在以下幾個方面。
(1) 本文提出的特征提取技術基于目標跟蹤航跡,因此與跟蹤精度存在密切關聯。通過對現有觀測數據進行分析后發現,雷達系統在跟蹤大群飛鳥的過程中,關聯算法中存在的不確定性會產生部分非正常航跡。該類航跡通常呈現出一定的震蕩特征,易造成目標類別的誤判。在后續工作中,除了進一步優化跟蹤關聯算法,還需要實現系統對空中集群目標的智能判定以及跟蹤[28]。
(2) 本文提出的目標識別算法并沒有考慮雷達回波特征,如雷達散射截面,這使得該方法不受雷達定標以及數據安全的影響,可以廣泛應用于各類型探鳥雷達監視系統。然而,若可以將雷達散射截面等雷達目標特性與航跡運動特征融合,挖掘其綜合目標特性,則有助于進一步豐富目標的可識別特征,提高目標的正確識別率。這也將是本研究后續的主要工作方向之一。
(3) 通過對誤分類樣本進行分析后發現,對于運動模式較為簡單且平滑的飛鳥和無人機航跡,現有識別方法仍然難以進行完全有效的區分。該類航跡在運動模式以及雷達回波上均呈現出高度相似性。為進一步提升識別性能,需要引入其他信息進行輔助決策。對現有飛鳥觀測數據進行分析后發現,飛鳥的活動特征、地理位置以及時間均存在密切關聯,因此可結合雷達觀測區域內的地理以及時間信息,建立飛鳥活動的聯合概率密度模型,輔助系統對特定時間及區域內出現的目標航跡類別進行判定。該方法與認知雷達理論關聯密切[29-30],也是今后基于探鳥雷達系統進行鳥情信息挖掘以及環境認知的主要研究方向之一。
本文分析了飛鳥和無人機在飛行機理和行為模式上的差異,提出了基于航跡時空間信息的目標運動特征提取方法,構建了特征空間?;谔进B雷達系統提供的無人機、飛鳥和動態降水雜波的航跡信息,結合運動特征向量構建了隨機森林分類模型,得出以下結論:
(1) 無人機的平均正確識別率可以達到85%以上,可實現無人機的高精度識別;
(2) 隨機森林模型計算效率較高,可實現準實時目標識別,且該模型具備較好的樣本魯棒性;
(3) 基尼指數清晰描述了目標識別過程中運動特征描述子的重要性,為深入了解目標運動特征以及新描述子的挖掘提供了參考;
(4) 本文提出的無人機目標識別方法尚有改進空間,多尺度集群目標跟蹤、雷達回波特征融合以及基于認知雷達理論的輔助決策,將是今后進一步研究的主要方向。