胡盟霄,盧 旺,徐 燦,來嘉哲
(航天工程大學宇航科學與技術系北京101416)
自人類發射衛星以來,空間衛星數量不斷增多,在通信、氣象預測、導航定位等領域有著重要作用。當衛星受到惡劣空間環境等因素影響時,自身可能發生異常,若沒有及時發現并進行搶修,則將對各方面造成巨大的影響[1]。空間目標姿態異常通常表現為姿態失控,目標在攝動力的影響下繞主慣量軸翻滾,并伴隨著一定的進動和章動[2],劇烈的翻滾會導致地面接收信號中斷,進而失去對空間目標的控制。隨著姿態控制技術的發展,低軌衛星多采用三軸穩定姿態,其姿態控制方式可以成為判斷衛星工作狀態的重要依據。
當前,我國地基監測雷達多采用窄帶信號體制,雷達散射截面積(Radar Cross Section,RCS)是窄帶雷達獲取的重要信息數據。衛星雷達散射截面積大小與其形狀尺寸、姿態以及雷達觀測角度等因素有關,因此雷達散射截面積時序數據可以作為衛星目標識別及其姿態異常識別的重要依據[3]。通過分析同衛星姿態敏感變化的雷達散射截面積時序數據,可以判斷出其姿態變化情況,進而對衛星目標異常情況進行判斷。在異常檢測研究中,提取特征質量直接決定了檢測效果的好壞。傳統的異常檢測方法需要借鑒經驗或實驗結果來人工提取特征,雖然取得了不錯的結果,但如何基于數據提取出抽象本質特征的問題仍未解決。近些年來,隨著大數據的產生和計算機硬件的快速發展,深度學習方法[4]在許多領域都取得了很好的研究成果,如計算機視覺、語音識別等[5-7]。深度學習利用大量的非線性變換,對數據進行高層次抽象,通過學習訓練自主生成數據中的深層本質特征,簡化人工設計提取特征的過程[8]。截止目前,基于雷達散射截面積時序數據進行衛星姿態異常識別的研究少有報道,筆者對此進行初步探索。針對雷達散射截面積數據的時序特性,提出了一種基于門控循環單元(Gated Recurrent Unit,GRU)深度神經網絡的空間目標雷達散射截面積異常檢測方法。作為循環神經網絡的改進體,門控循環單元神經網絡在時序數據的識別檢測、預測上具有良好的性能,可以很好地應用于提取雷達散射截面積時序數據的深層本質特征。考慮到衛星目標空間特性引起的觀測數據不等長問題,筆者采用滑動窗口法將數據轉化為等長數據集。
雷達散射截面積是一種窄帶雷達目標特性,包含豐富的信息,且具有數據量小、處理方法簡單等特點,是實施雷達目標監測識別的重要信息源。在雷達方程中對雷達散射截面積做出了明確的定義[9]:
P2=S1σ,
(1)
其中,P2為目標散射總功率,S1為入射的功率密度,σ為雷達散射截面積。由于二次散射,雷達接收點處單位立體角的回波功率PΔ及σ可定義為
(2)
(3)
假設雷達發射信號Et(t)=E0exp{jωt},當目標姿態角為θ(雷達觀測線與目標主軸夾角)時,目標坐標系為(x,y),雷達俯仰角為φ,在t時刻雷達到目標中心的距離為R0(t),到目標上任意一點的距離為R(t),則目標與雷達的距離為
R(t)=R0(t)+ycosθ-xsinθ。
(5)
雷達收到的回波F(ω,θ)可表示為
(6)
其中,f(x,y)是二維目標散射函數,λ為與雷達波長,2L為目標尺寸。消除載波和R0(t)相位項后,雷達回波可表示為
(7)
由上式可知,雷達散射截面積是與目標姿態角變化相關的函數。對于窄帶信號體制雷達而言,可以通過空間積累的方式獲取觀測弧段內衛星雷達散射截面積的時序序列,以此分析目標隨姿態角的變化關系。
針對上述雷達散射截面積時序數據的特點,設計一種門控循環單元神經網絡以提取出其深層本質特征,并用于衛星目標姿態異常識別。
深度學習大多數采用多層神經網絡,由輸入層、多個隱含層、輸出層共同組成。與淺層網絡相比,網絡層數的增加使其可以提取出數據中更為深層本質的特征,進而獲得更好的識別效果。
循環神經網絡是深度學習中具有代表性的一種神經網絡,其隱含層內節點相互連接,在處理時序數據時各個節點輸出不僅與當前輸入有關,還依賴于上一節點的輸出,因此具有一定的記憶功能[10],在處理時序數據時具有優勢。但值得注意的是,循環神經網絡在學習訓練過程中存在梯度消失和梯度爆炸問題[11],導致其對復雜長序列的學習能力有限。為彌補上述不足,長短期記憶網絡作為循環神經網絡的變體構造了一種名為記憶單元的新型節點結構[12]。記憶單元由遺忘門、輸入門和輸出門組成,增加了節點的遺忘功能。長短期記憶網絡通過記憶單元對上一節點輸出以有選擇記憶的方式學習參數,可以有效地解決循環神經網絡在處理長時序數據時出現的問題。
門控循環單元由重置門和更新門構成,在保留長短期記憶網絡記憶單元功能的同時簡化了結構,減少了參數數量,從而大幅提升了訓練速度[13],因此選用門控循環單元構建深度神經網絡進行異常檢測。門控循環單元結構如圖1所示。

圖1 門控循環單元神經網絡隱藏層結構圖
在圖1中,重置門rt和更新門zt在t時刻的狀態定義為
(8)
其中,W和U為權重矩陣,x為輸入數據。隱藏狀態ht和候選隱藏狀態t由下式計算:
(9)
式(8)和式(9)中兩種不同的激活函數分別定義為
(10)
2.2.1 數據集構建
考慮到深度學習模型需要大量訓練樣本,采用滑動窗口法對不同觀測弧段的雷達散射截面積時序數據數據進行劃分。該方法不僅可以擴大數據量,還能有效地避免截斷樣本而導致的特征缺失。
如圖2所示,滑動窗口長度w為樣本截取長度,滑動步長m為滑動窗口每次移動的距離。為保證劃分樣本間具有關聯性,通常滑動步長小于滑動窗口的長度,因此相鄰樣本間部分重疊。筆者選擇滑動窗口w為300,滑動步長m為50,實現對門控循環單元深度神經網絡模型數據集的構建。

圖2 滑動窗口劃分數據
2.2.2 模型構建
筆者設計的門控循環單元網絡模型如圖3所示,它由輸入層、4個隱含層和輸出層組成。其中隱含層分為門控循環單元隱含層和全連接層,輸入層的節點數等于樣本輸入維數,與門控循環單元隱含層和線性函數全連接層共同構成編碼模塊,自主生成深層本質特征。
為了使得模型訓練更加精確,門控循環單元隱含層采用雙向門控循環單元結構(Bidirectional Gated Recurrent Unit,Bid-GRU)學習時序序列完整的前后信息。在特征輸出層和輸出層之間配置線性修正單元(Rectified Linear Unit,ReLU)函數全連接層,使得網絡訓練時提取的特征更為有效。在門控循環單元隱含層后設置了丟失率為0.2的隨機失活結構,以防止訓練過擬合。采用動態學習率控制參數更新速度,并選擇了對超參數魯棒性較強的適應性矩估計優化器[14],最后通過全連接層構建分類器實現異常檢測。

圖3 門控循環單元網絡模型結構
2.2.3 異常檢測流程
將數據集按4∶1的比例隨機劃分為訓練集與測試集。從訓練集中劃分20%的樣本作為驗證集,以調整門控循環單元神經網絡的超參數;由訓練集對構建的神經網絡進行訓練,調整網絡內的參數及權值;利用驗證集對訓練網絡進行優化;最后使用測試集對訓練好的門控循環單元神經網絡模型檢測效果進行驗證。異常檢測流程如圖4所示。

圖4 異常檢測流程
實驗環境基于聯想ThinkStation P520工作站,其CPU是主頻為2.2 GHz、內存為32 GB的E5-2630,門控循環單元為NVIDA Tesla K20c。此外,基于Python 3.6語言,利用Keras 2.2.4及TensorFlow 1.9作為后端構建門控循環單元神經網絡模型,以雷達散射截面積時序數據作為輸入完成網絡的學習訓練和測試,進而驗證筆者提出方法的有效性。

圖5 空間目標模型
衛星模型如圖5所示,軌道根數如表1所示。雷達測站地理位置設定為北緯29.6°,東經100.5°,采樣頻率為1 Hz,雷達可觀測的最小高低角為15°。對地三軸穩定姿態正常數據觀測時間為世界標準時2018年1月1日00:00:00.000至2019年1月1日00:00:00.000;翻滾姿態異常數據觀測時間為世界標準時2018年1月1日00:00:00.000至2018年2月1日00:00:00.000,仿真數據經滑動窗口技術劃分處理后,雷達散射截面積正常數據為8 657組,異常數據為3 201組。姿態異常類型如表2所示,其中衛星目標繞本體軸Z軸自旋,Vp為自旋速率,Vs為進動速率,Ω為章動角。

表1 樣本軌道根數

表2 姿態異常類型
門控循環單元網絡模型經過100次迭代時的損失函數如圖6所示。可以看出,訓練集和驗證集損失函數在訓練輪次超過40次后基本保持不變并收斂于0,證明所構建的門控循環單元神經網絡模型沒有發生欠擬合或過擬合現象,達到了較好的訓練效果。
圖7展示了筆者構建的模型對動態雷達散射截面積序列的特征學習能力。利用T分布隨機近鄰嵌入算法對門控循環單元神經網絡輸出的特征進行降維可視化。從圖7可以看出,測試集中正常和異常雷達散射截面積樣本數據通過門控循環單元神經網絡模型提取出的特征分離度很高,能夠達到良好的異常檢測效果。

圖6 損失函數曲線

圖7 學習特征可視化分布
為驗證基于門控循環單元神經網絡模型相比傳統特征提取方法能取得更好的空間目標姿態異常檢測效果,選取傳統方法中廣泛使用的雷達散射截面積統計參數特征、小波統計特征以及變分模態分解能量特征,并以BP神經網絡作為分類器進行對比實驗,結果如表3所示。可以看出,雷達散射截面積統計參數特征和小波統計特征的準確率偏低,對空間目標姿態異常敏感性較差;變分模態分解通過對雷達散射截面積序列自適應分解,將其精確表示為頻率-時間-能量的分布,各模態歸一化能量特征能夠良好地反映姿態變化,并取得了約82.6%的準確率;門控循環單元學習特征相比變分模態分解能量特征使準確率提高了約16.8%,證明深度學習在挖掘數據信息、進行檢測識別方面有著巨大優勢,能夠突破人工提取特征方法中存在的知識瓶頸,自主提取有效的深層本質特征。

表3 空間目標姿態異常檢測效果對比

圖8 抗干擾對比
為了比較門控循環單元神經網絡在不同噪聲干擾下的異常檢測效果,筆者在數據集上分別添加信噪比為20 dB、15 dB、10 dB以及5 dB的高斯白噪聲,檢測結果如圖8所示。可以看出,隨著噪聲干擾增強,各指標均有所下降,但準確率和F1分數整體仍在97%以上,證明訓練算法有較強的噪聲魯棒性。
及時發現空間目標姿態異常并進行搶修對空間態勢感知具有重要意義。針對人工提取特征難以準確反映衛星姿態異常的問題,筆者提出了一種基于門控循環單元神經網絡的空間目標異常檢測方法。仿真實驗結果表明,筆者設計的門控循環單元神經網絡模型擁有較強的特征提取能力,可以從雷達散射截面積時序數據中提取有效反映衛星姿態變化的深層本質特征,相較傳統方法能夠更好地完成衛星姿態異常檢測任務,并有良好的抗干擾能力。值得注意的是,對于已知衛星姿態異常類型,筆者構建的有監督學習模型可以達到良好的識別效果。但實際工程中存在許多未知異常,有監督學習模型存在局限性,因此研究無監督模式下的深度學習異常檢測方法是下一步的重點研究方向。