
















摘 要:針對衛星遙測數據先驗知識稀缺、常規數據驅動的異常檢測方法難以準確辨識異常狀態的問題,提出一種基于元學習與動態放縮閾值法的衛星遙測信號異常檢測算法。首先,通過元學習算法求解一組具備快速適應小樣本任務能力的長短期記憶神經網絡初始參數,并在訓練過程中為網絡權重添加噪聲,進一步提升模型泛化性能。其次,采用動態放縮閾值法分析預測誤差序列,劃定動態變化的異常閾值,標記異常點索引以實現衛星遙測數據異常檢測。最后,通過兩組衛星遙測信號算例驗證所提算法的有效性。仿真結果表明,所提方法能夠改善預測模型過擬合現象,并降低漏警概率。
關鍵詞: 衛星遙測信號; 異常檢測; 長短期記憶神經網絡; 元學習
中圖分類號: V 474
文獻標志碼: ADOI:10.12305/j.issn.1001 506X.2025.02.02
Anomaly detection method of satellite telemetry signal based on noise meta learning
GUO Pengfei1, JIN Kai2, CHEN Qifeng1, WEI Caisheng1,*
(1. School of Automation, Central South University, Changsha 410083, China;
2. The 54th Research Institute of China Electronics Technology Group, Shijiazhuang 050081, China)
Abstract:Due to the scarcity of prior knowledge in satellite telemetry data, conventional data driven anomaly detection methods are difficult to accurately identify abnormal states, a satellite telemetry signal anomaly detection algorithm based on meta learning and dynamic scaling threshold method is proposed. Firstly, a set of initial parameters of a long short term memory (LSTM) neural network with the ability to quickly adapt to small sample tasks is solved through meta learning algorithms. The noise is added to the network weights during the training process to further improve generalization performance of the model. Secondly, the dynamic scaling threshold method is used to analyze the prediction error sequence, define the abnormal threshold for dynamic changes, and mark the index of abnormal points to achieve anomaly detection of satellite telemetry data. Finally, the effectiveness of the proposed algorithm is verified through two sets of satellite telemetry signal examples. The simulation results show that the proposed method can improve the overfitting phenomenon of the prediction model and reduce the probability of missed alarms.
Keywords:satellite telemetry signal; abnormal detection; longshort term memory (LSTM) neural net work; meta learning
0 引 言
衛星作為一項復雜系統工程,被廣泛應用于包括導航、通信、資源勘探等在內的各類軍事及民用項目中。隨著現代衛星技術不斷向結構復雜化、功能多樣化方向發展,其在軌異常情況與故障問題的發生也愈發頻繁[1-2]。此外,衛星在運行時處于外層空間環境,長期暴露在太陽風暴、高能粒子輻射、空間碎片和其他類型的惡劣條件下,盡管當前星上組件的可靠性與精密性顯著提升,但仍不能完全避免在軌期間發生事故[4]。因此,及時有效地檢測衛星異常并采取相應措施,對提升在軌衛星可靠性、保障國家財產安全而言具有重要意義。
衛星在軌運行期間,遙測系統將傳感器測量數據傳輸到地面遙測中心,監測遙測數據是診斷衛星健康狀況的重要途經。在實際工程中,基于閾值的異常檢測方法[5]應用廣泛,盡管該方法較為簡潔,但由于人工標注成本高,及時獲取專家知識難度大,無法保障該方法有效性[6]。近年來,數據驅動的異常檢測方法因無需大量先驗知識,并且能夠識別未知異常模式,受到廣泛關注,并已被應用于衛星遙測數據的異常檢測任務中[7]。部分學者針對遙測數據缺少標注且數據不平衡[8]的特征,提出基于數據重構的異常檢測方法。該類方法先通過無標簽信號訓練重建模型,然后再重建異常信號,得到重建誤差序列,最后通常采用窗口閾值法分割出異常子序列[9],屬于無監督學習算法。從經典的深度神經網絡(deep neural network, DNN)到包括深度殘差神經網絡[10]、Transformer[11]、生成對抗神經網絡[12]在內的各種前沿深度學習模型,均經過不同程度的適應性改進[13-15],以用于解決重構遙測數據問題。例如,文獻[16]針對火星車遙測信號異常檢測問題提出一種改進變分自動編碼器算法,并通過混合無導數優化算法解決超參數優化問題。文獻[17]針對航天器遙測數據異常檢測問題,提出一種融合長短期記憶(long short term memory, LSTM)神經網絡和多尺度策略的異常檢測方法,有效提升算法對序列長距離關聯性的捕捉能力。該類方法雖然擺脫了對先驗知識的依賴,但泛化性仍有待提高。例如,一些衛星遙測系統的通道信號摻雜了一定比例的異常數據,模型檢測準確率將受到嚴重影響。
數據驅動的異常檢測方法除包括上述基于數據重構的算法外,還包括基于小樣本學習的檢測算法。部分學者將研究重心轉移至如何利用少量的有標注數據,驅動算法精準預測衛星遙測信號,并根據預測值偏差程度診斷衛星健康狀況。遷移學習作為一種解決小樣本學習問題的主流方法,其核心是利用領域內相似數據對模型進行預訓練,以提高對目標域數據的利用效率[18]。例如,文獻[19]采用微調的遷移學習方法對預測模型進行優化,并證明遷移學習在解決航天器異常檢測問題上的有效性。然而,遷移學習需要獲取與目標任務相關性強的有標注數據并將其作為預訓練數據集,且訓練所得模型的泛化性能較差[20]。相較于遷移學習,元學習雖然需要在先驗任務中學習元知識,但不要求先驗任務與目標任務間存在強相互關聯[21],因而在小樣本異常檢測領域備受關注。在眾多元學習算法中,模型無關元學習(model agnostic meta learning, MAML)算法通過雙層梯度下降方法為模型尋找一組強泛化性的初始化參數,被廣泛應用于包括異常檢測在內的各類小樣本學習任務中[22]。例如,文獻[23]基于MAML算法優化形成一種適應多變量時間序列的雙變換異常檢測方法,以提高其在小規模數據集上的檢測準確率與訓練效率。文獻[24]針對不同工況下的小樣本軸承故障診斷問題,借鑒MAML算法思想,提出一種廣義模型不可知元學習算法,提升異構信號驅動下故障診斷算法的整體性能。此外,MAML算法具有優秀的開放性與靈活性,可與LSTM神經網絡深度融合,形成元學習LSTM (meta learning LSTM, M LSTM)神經網絡,用以提升小樣本時序數據預測準確率[25]。盡管MAML算法相對簡潔高效,且可以有效提升小樣本異常檢測性能,但其仍存在過擬合風險,導致虛警情況頻發。因此,進一步提升MAML算法的泛化性與魯棒性是提升衛星異常檢測準確率的關鍵。
基于以上分析,本文針對已有的數據驅動的遙測數據異常檢測算法無法滿足稀疏標簽場景下異常檢測需求的問題,提出一種基于改進MAML策略與動態放縮閾值的小樣本衛星異常檢測方法。首先,以LSTM神經網絡作為MAML算法的基礎學習器,在訓練過程中為權重添加微弱噪聲,形成加注噪聲的M LSTM (M LSTM with adding noise, M LSTM AN)算法,用M LSTM AN算法在訓練樣本稀疏條件下預測遙測信號。然后,引入動態閾值與二次放縮策略,綜合分析殘差序列變化,辨識異常數據。最后,通過在公開的衛星遙測信號數據集與實驗室衛星姿軌半實物仿真平臺收集的衛星飛輪轉速數據集上進行實驗并與已有方法對比,結果表明本文方法具有較強泛化性能,能夠有效提升小樣本衛星遙測數據異常檢測效果。
1 LSTM與MAML基本理論
1.1 LSTM
由于能夠有效挖掘時間序列中的長距離關聯信息,LSTM神經網絡在數據預測領域得到廣泛應用。LSTM神經網絡單元由3個記憶門構成,分別為遺忘門、輸入門與輸出門,通過門控單元實現各記憶細胞信息的傳遞并解決標準循環神經網絡中出現的梯度爆炸問題[26]。
遺忘門決定上一單元狀態對當前單元的影響,經上一神經單元加工后的數據首先被傳送到遺忘門,遺忘門會剔除無用信息、保留有意義信息,運算過程如下:
ftn=σ(Wf·[htn-1,xtn]+bf)(1)
式中:σ(·)為Sigmoid激活函數;ftn為遺忘門的輸出;htn-1為上一神經單元隱含層輸入至本單元的狀態向量;xtn為當前神經單元的輸入;Wf和bf分別為遺忘門的偏置和權重。
輸入門決定了由當前單元輸入對狀態所進行的更新,運算過程如下:
itn=σ(Wi·[htn-1,xtn]+bi)
C~tn=σ(WC·[htn-1,xtn]+bC)
Ctn=ftn×Ctn-1+itn×C~tn(2)
式中:itn為輸入門的輸出;C~tn為由于當前單元輸入所更新的信息;Ctn為當前神經單元的狀態向量;Ct-1n表示上一神經單元的狀態向量;Wi、WC為輸入門權重;bi、bC為輸入門對應偏置。
輸出門控制輸出狀態,運算過程如下:
otn=σ(Wo·[htn-1,xtn]+bo)
htn=otn×tanh(Ctn)(3)
式中:otn為輸出門的輸出;htn為當前單元的狀態輸出;Wo和bo分別為輸出門的權重和偏置。
針對衛星遙測數據預測問題,每一采樣時刻的遙測信號首先被傳送到遺忘門,清理無用信息;遙測信號隨后經過輸入門,更新神經網絡單元狀態;最終,狀態信息在輸出門輸出。經過上述運算過程,LSTM神經網絡可捕獲任意長度遙測數據間的長期依賴性、歸納信號間的短期影響和變化規律[27]。
1.2 MAML
MAML算法屬于元學習范疇,算法主要思想可概括為通過跨任務學習訓練任意基礎學習器,獲得一組具有快速適應新任務能力的初始參數[28]。本文將LSTM神經網絡作為基礎學習器,通過大量任務訓練其泛化能力。區別于一般機器學習算法,元學習訓練過程以多個不同任務作為訓練集,本文所使用的訓練集合p(τ)包括k個時序信號預測任務τ,每個任務又包含多組帶有標簽的時序數據:
p(τ)={τ1,τ2,…,τk}(4)
在元學習模型訓練過程中,會通過隨機抽取訓練集合p(τ)中的任務對基礎學習器進行訓練,而MAML算法的目的就是為基礎學習器訓練一組能夠快速適應新任務的初始權重。
MAML算法在訓練過程中將基礎學習器的初始權重θ作為參數構成神經網絡fθ(·),并在訓練過程中不斷更新θ,初始權重的更新包括內環更新與外環更新兩部分,其中每次更新都是一輪經過多次迭代的完整訓練過程。
首先,從多個任務中選取樣本并將其輸入基礎學習器以得到預測值,計算預測值與真實值之間的均方誤差,針對任務τi的均方誤差計算方法為
Lτi(θ,τi)=∑xi,yi~τi(yi-fθ(Xi))2(5)
式中:Xi表示輸入基礎學習器的樣本數據;yi為神經網絡fθ(·)的預測值。
然后,使用梯度下降方法將基礎學習器的權重θ更新為權重θ′,完成內環更新:
θ′i=θ-αΔθLτi(fθ)(6)
式中:α為內環更新過程的步長;Δθ為關于θ的梯度算子。基于以上步驟,內環更新的目標可定義如下:
minθ∑τi~p(τ)Lτi(fθ′)=∑τi~p(τ)Lτi(fθ-αΔθLτi(fθ))(7)
為了提高網絡權重θ對新任務的泛化性能,在完成預期內環更新次數后,將查詢集樣本Qi輸入神經網絡fθ(·),然后通過全局梯度下降更新初始參數,完成外環更新,即:
θn=θ-βΔθ∑τi~p(τ)Lτi(fθ′)(8)
式中:θn表示外環更新后的網格超參數;β為外環更新步長;初始參數θ在θ′i的基礎上進行更新。
2 本文方法
2.1 算法整體流程
為提高MAML算法的泛化性能并使其在訓練樣本有限的條件下精準把握數據內在的變化規律,本文設計一種主動加注噪聲的元學習算法,算法流程如圖1所示。
本文算法在元學習階段采用MAML策略,并針對目標任務特點,設計LSTM神經網絡作為基礎學習器。將離線訓練后的模型用以預測目標域數據,計算預測誤差,進而檢測異常。
在MAML算法訓練階段,非目標場景的訓練數據被劃分為內環訓練數據集與外環訓練數據集。經過標準化與缺省值填充處理后,內環訓練數據被用于MAML算法內環更新。LSTM神經網絡參數經內環更新后,利用外環訓練數據進行外環更新,并在外環更新過程中主動為模型權重參數添加微小高斯噪聲,加注噪聲的模型參數返回內環更新階段再次更新。重復以上過程,直至外環更新損失函數值達到收斂。
在MAML算法訓練結束后,將學習到的模型參數遷移到目標任務,將其作為遙測信號預測模型的初始參數。在此基礎上,利用少量帶有標注的遙測數據對基礎學習器參數進行離線訓練,訓練結束后的神經網絡模型在線預測目標通道的信號幅值,將預測值與真實值作差求得誤差序列。依據誤差序列的數值變化情況劃定動態閾值,并對疑似異常值進行閾值二次放縮,最終輸出檢測結果。
2.2 主動噪聲加注的元學習模塊
在神經網絡權重出現小擾動的情況下,輸出受影響程度的大小是衡量模型泛化能力的一大標準。通常對權重微小變化相對不敏感的模型所學習的數據模式更具代表性,而對權重微小變化過于敏感的模型,其過分關注訓練集樣本的某些獨有特征。為提高算法的泛化性能、使訓練出的模型能快速適應小樣本衛星遙測數據預測問題,本文設計一種主動加注噪聲的元學習算法,算法流程如下。
首先,依據MAML算法簡單高效且可擴展性強、LSTM神經網絡具備長時記憶功能的優勢,將MAML算法作為元學習框架、將LSTM神經網絡作為基礎學習器。
然后,在MAML算法外環更新過程中,對基礎學習器的所有權重加注噪聲:
θn=θ-1-itItβΔθ∑τi~p(τ)Lτi(fθ′)+Gz(9)
式中:it為當前外環更新的迭代次數;It表示最大外環更新次數;Gz為添加到神經網絡權重的高斯噪聲。高斯噪聲可以通過改變分布的期望與方差,達到為權重加注可控噪聲的效果。其噪聲數值服從正態分布N(μG,σG):
g(z)=1σG2πexp-(z-μG)22σ2G(10)
式中:g(z)表示噪聲取值為z時的概率;μG和σG分別為正態分布的期望和方差。
為推動模型參數進入對權重小的變化相對不敏感的區域,本文在元學習階段設計損失函數LM約束模型參數的改變。假設元學習訓練集合p(τ)包括k個時序信號預測任務數據,每次內環更新時隨機選取某一任務數據中的多個樣本。元學習外環更新階段損失函數的設計如下所示:
LM=∑k1αnln+∑k
1ln αn
αn=μ(|Y-n-Y^n|)+12σ[Softmax(|Y-n-Y^n|)](11)
式中:ln為元學習算法訓練階段,LSTM神經網絡針對第n個任務的預測值與真實值的均方誤差;an為第n個任務均方誤差的權重系數;μ(·)表示計算向量所有元素平均值的函數;Y-n為權重加注噪聲前,模型針對第n個任務樣本的預測值;Y^n為權重加注噪聲后,模型針對第n個任務樣本的預測值;σ(·)表示計算向量所有元素方差;Softmax(·)函數將向量元素標準化至0~1之間,使方差項與平均值項在數量級上保持一致。
設計權重系數an的目的是推動模型進入對權重小的變化相對不敏感的區域,一旦模型針對某任務出現權重小的擾動嚴重影響輸出的情況,則提高相應任務的損失數值,約束模型參數梯度更新方向。ln αn項的存在可避免模型陷入局部最優的情況。
2.3 動態放縮的異常閾值劃定方法
將模型預測輸出值與衛星遙測數據真實值相減,得到殘差序列,通過分析殘差序列確定異常閾值,進而可及時檢測出異常數據。
基礎的窗口閾值方法將序列平均值與方差線性相加計算閾值,然而衛星遙測信號異常模式多變,該方法過于簡單,無法有效識別所有異常點[29]。以圖2中所示的異常情形為例,圖2(a)中虛線框內所示的階段性震蕩異常持續時間長,常規窗口閾值方法無法記憶長時數據變化趨勢,在該異常階段后期無法實現準確檢測。圖2(b)中標注的連續幅值跳變會對窗口內殘差數據平均值造成顯著影響,導致該窗口時間內的檢測結果虛警情況頻發。
此外,基礎窗口閾值法中的窗口大小與方差權重的取值缺少機理模型支撐、難以兼顧準確率和召回率,故無法滿足復雜信號的異常檢測需求[30]。為此,本文設計一種二次放縮的動態閾值劃定方法,該方法根據殘差序列計算動態變化的閾值。相鄰采樣時刻的閾值并不相同,而是根據殘差變化情況不斷更新。該算法對疑似異常的數據采取二次判定策略,減少虛警情況發生,提高檢測準確率,以適應多種檢測場景。提出的動態閾值劃定方法的具體步驟如下。
步驟 1 定義閾值更新時所依據的數據窗口長度為N,計算殘差向量E0=[e1,e2,…,eN]中所有元素的平均值與方差,確定前N個采樣時刻的異常閾值ε0:
ε0=μ(E0)+rσ(E0)(12)
式中:r=2為方差權重系數。
步驟 2 將檢測為正常的殘差數據存儲為向量Ea=[e1a,e2a,…,esa],若向量Ea中元素的個數不足N,則仿照步驟1,對E1=[e2,e3,…,eN+1]進行檢測,將正常殘差數據添加至Ea末端。重復步驟1和步驟2,直至Ea中元素的個數大于等于N。
步驟 3 更新采樣時刻i的閾值εi:
εi=μ(Es)+rσ(Es)(13)
式中:Es=[es-N+1a,es-N+2a,…,esa]中的元素為向量Ea中末尾的N個元素。若殘差值ei不超過閾值εi,則將ei添加至向量Ea的末尾,若超出閾值則進入步驟4進行二次檢測,防止虛警。
步驟 4 將檢測為正常的遙測數據構建為正常數據序列Xn,計算向量Xn末尾N個采樣時刻的信號峰值xm,改變閾值進行二次檢測:
ε-i=μ(Es)+r+xm-xi3xiσ(Es)(14)
式中:ε-i為進行二次檢測時的閾值;xi為待二次檢測的遙測數據真實值。
3 算法實驗
本文采用以下2個數據集進行仿真校驗,分別為① 美國大氣和空間物理實驗室(laboratory for atmospheric and space physics, LASP)公開的衛星遙測信號[31];② 由北京靈思創奇開發的衛星姿軌半實物仿真平臺仿真收集的衛星飛輪轉速數據集。通過與DNN、LSTM神經網絡以及M LSTM算法進行對比,檢驗M LSTM AN算法針對小樣本遙測數據的學習能力。通過與傳統窗口閾值法對比,驗證動態放縮的閾值劃定方法的異常檢測性能。
3.1 實驗數據集介紹
LASP數據集由以下5個衛星遙測通道信號組成:衛星電池溫度(satellite battery temperature, SBT)、衛星總線電壓(satellite bus voltage, SBV)、衛星總線電流(satellite bus current, SBC)、衛星反作用飛輪每分鐘轉速(revolutions per minute, RPM)、衛星反作用飛輪溫度(reaction wheel temperature, RWT)。
實驗室衛星姿軌半實物仿真平臺為FW5動量輪,仿真平臺實拍圖如圖3所示,圖中設備從左至右依次為星載工控機、主機、飛輪與顯示器。FW5動量輪的最大轉速為4 500 r/min,最大角動量為5 mNms、最大輸出力矩為1.5 mNm。
取SBT、SBV、RPM以及FW5動量輪轉速數據作為元學習階段的訓練樣本集,以上通道信號數據量龐大,但摻雜未標注的異常數據。分別選取100個SBC與RWT數據作為目標任務訓練樣本集,以上兩通道樣本數量有限且無異常,滿足實驗需求。為驗證算法有效性,測試集樣本應盡可能豐富,故另取238個SBC數據與313個RWT數據作為測試樣本集。采用離差歸一化方法排除衛星異源異構數據量綱的影響。
3.2 小樣本衛星遙測數據預測結果
驗證引入元學習與主動噪聲加注元學習策略的LSTM神經網絡對小樣本學習效果的影響,設置MAML算法訓練過程內環更新步長為0.02,最大內環更新次數為4。LSTM神經網絡作為基礎學習器的參數設置如表1所示。
采用箱型圖統計M LSTM AN算法在元學習訓練階段,所選取所有訓練樣本在LSTM神經網絡權重加注噪聲后預測值與真實值之間殘差的數值分布情況。每個箱型結構的橫向線段依次表示:均方誤差(mean square error, MSE)變化數據的最大值、上四分位數、中位數、下四分位數、最小值;實心圓圈表示異常數值。統計結果如圖4所示。
由圖4可知,隨著迭代次數的增加,權重加注噪聲后預測值與真實值之間殘差不斷減小,分布逐漸集中。由此可見,模型抗權重小擾動能力不斷提升,針對樣本集的預測能力愈加穩定,泛化性能得到提升。
對比不同方法在目標任務上的訓練結果,經150次迭代的小樣本訓練過程如圖5所示。由圖5可知,傳統LSTM神經網絡在小樣本學習過程中收斂情況最差,損失值波動較大,最終MSE值達到0.035。由于采用MAML策略預先更新了模型初始參數,M LSTM算法能夠較快適應新任務,收斂速度與收斂程度優于傳統LSTM神經網絡,且最終MSE值穩定在0.009左右。采用權重加注噪聲策略的M LSTM AN算法泛化性能進一步提升,在小樣本學習初始階段損失值便遠低于其他兩種方法,最終MSE值最小,達到0.007。
為進一步量化不同方法針對小樣本衛星遙測數據的學習能力,采用以下3種指標統計模型預測性能:平均絕對誤差(mean absolute error, MAE)、MSE、均方根誤差(root mean square error, RMSE)。對比DNN、LSTM、M LSTM、M LSTM AN 4種算法在小樣本衛星數據預測任務測試集上的表現,結果如圖6所示。
由圖6可知,DNN算法適應小樣本衛星遙測任務的能力最差。引入元學習策略的算法則要優于傳統LSTM神經網絡,其中M LSTM AN算法的3種評價指標均為4種算法中的最佳,分值分別為:0.007 5、0.000 77、0.007 8。
綜上所述,引入權重加注噪聲的元學習策略可顯著提升LSTM神經網絡適應小樣本衛星遙測信號預測任務的能力,主要表現在:提升算法泛化性能、針對新任務更快收斂、提升模型針對小樣本數據預測的精準程度。
3.3 基于閾值動態放縮的異常檢測結果
衛星遙測數據異常檢測并非簡單的分類問題,異常檢測過程中存在虛警和漏警情況。為反映上述兩種情況發生的概率,需要計算出模型檢測的準確率(pa)與召回率(pr):
pa=TpTp+Fp
pr=TpTp+Fn(15)
式中:TP為正常樣本被正確檢測為正常樣本的數目;FP為異常樣本被誤檢為正常樣本的數目;Fn表示正常樣本被誤檢為異常樣本的數目。
本文采用F1值評價指標以綜合評價算法異常檢測性能,該評價指標兼顧異常檢測pa與pr:
F1=2paprpa+pr(16)
窗口長度取值對于窗口閾值法與動態放縮閾值算法性能均有較大影響,為探究最佳窗口長度取值、驗證動態放縮閾值的衛星遙測信號異常檢測方法的優越性,進行如下實驗:利用M LSTM AN算法對測試集樣本進行預測,通過計算得到測試集殘差序列,分別采用不同窗口長度的窗口閾值法與動態放縮閾值算法檢測異常,統計F1值變化情況。
統計結果如圖7所示,圖中折線表示采用兩種閾值劃定方法檢測異常的F1值,柱狀圖形為動態放縮閾值算法相較傳統窗口閾值法所提升F1值的大小。相較傳統窗口閾值算法,采用動態閾值算法顯著提高異常檢測性能。當窗口大小取值為15時,采用動態放縮閾值算法檢測異常的F1值最高,達到0.923 3。
將DNN、LSTM、M LSTM、M LSTM AN算法分別與傳統窗口閾值法、動態放縮閾值法組合,構成多種小樣本衛星遙測數據異常檢測算法,其中傳統窗口閾值法、動態放縮閾值法的窗口長度取值均為15。通過對比不同異常檢測算法針對測試數據的檢測結果,驗證本文方法的優越性。檢測結果如表2所示。
由表2可知:相較基礎窗口閾值法,動態放縮閾值法可以在保障pr的前提下有效提升檢測準確率,從而提高F1值,其中M LSTM AN預測算法搭配動態放縮閾值法的衛星異常檢測方法性能最優,在測試集中實現了93.8%的pa、90.9%的pr與0.923 3的F1值。
綜上所述,相較基礎窗口閾值法,采用動態放縮閾值法劃定異常閾值對于提升小樣本異常檢測算法性能有積極影響。
4 結 論
針對衛星遙測信號異常檢測任務中存在有標簽數據不足、常規數據驅動方法無法準確檢測異常的問題,本文在MAML算法訓練階段為LSTM神經網絡的權重添加噪聲,從多角度分析殘差序列統計特征,提出一種基于改進MAML策略與動態放縮閾值的小樣本衛星異常檢測方法,以LASP公開的衛星遙感數據集與FW5動量輪轉速數據集為例完成實驗驗證,得到如下結論:
(1) 本文提出的M LSTM AN預測算法相較經典LSTM算法與M LSTM算法有效改善模型過擬合現象,具有更高的泛化性能。
(2) 采用動態放縮閾值法劃定異常閾值,能夠在保障檢測pa的前提下,有效提高異常數據檢測的pr。
(3) 本文算法能夠有效提升小樣本衛星遙測數據異常檢測性能,相較搭配基礎窗口閾值法的M LSTM算法,F1值提高了0.106 4。
參考文獻
[1]XU Z P, CHENG Z T, GUO B. A hybrid data driven framework for satellite telemetry data anomaly detection[J]. Acta Astronautica, 2023, 205: 281-294.
[2]沈毅, 李利亮, 王振華. 航天器故障診斷與容錯控制技術研究綜述[J]. 宇航學報, 2020, 41(6): 647-656.
SHEN Y, LI L L, WANG Z H. A review of fault diagnosis and fault tolerant control techniques for spacecraft[J]. Journal of Astronautics, 2020, 41(6): 647-656.
[3]何家輝, 程志君, 郭波. 聯合字典學習與OCSVM的遙測數據異常檢測方法[J]. 航空學報, 2023, 44(13): 207-219.
HE J H, CHENG Z J, GUO B. Telemetry anomaly detection method based on joint dictionary learning and OCSVM[J]. Acta Aeronautica et Astronautica Sinica, 2023, 44(13): 207-219.
[4]WANG Y, ZHANG T, HUI J J, et al. An anomaly detection me thod for spacecraft solar arrays based on the ILS SVM model[J]. Journal of Systems Engineering and Electronics, 2023, 34(2): 515-529.
[5]WANG Y K, GONG J L, ZHANG J, et al. A deep learning anomaly detection framework for satellite telemetry with fake anomalies[J]. International Journal of Aerospace Engineering, 2022, 2022: 1676933.
[6]XIANG G, LIN R S. Robust anomaly detection for multivariate data of spacecraft through recurrent neural networks and extreme value theory[J]. IEEE Access, 2021, 9: 167447-167457.
[7]PANG G S, SHEN C H, CAO L B, et al. Deep learning for anomaly detection: a review[J]. ACM Computing Surveys, 2021, 54(2): 1-38.
[8]CHEN J, PI D, WU Z Y, et al. Imbalanced satellite telemetry data anomaly detection model based on Bayesian LSTM[J]. Acta Astronautica, 2021, 180: 232-242.
[9]MENG H Y, ZHANG Y X, LI Y X, et al. Spacecraft anomaly detection via transformer reconstruction error[C]∥Proc.of the International Conference on Aerospace System Science and Engineering, 2020: 351-362.
[10]傅晨琦, 季利鵬, 孫偉卿, 等. 基于深度殘差網絡的模擬電路軟故障診斷方法[J]. 飛控與探測, 2021, 4(4): 74-81.
FU C Q, JI L P, SUN W Q, et al. Deep residual learning based soft fault diagnosis method for analog circuits[J]. Flight Control amp; Detection, 2021, 4(4): 74-81.
[11]丁建立, 張琪琪, 王靜, 等. 基于Transformer VAE的ADS B異常檢測方法[J]. 系統工程與電子技術, 2023, 45(11): 3680-3689.
DING J L, ZHANG Q Q, WANG J, et al. ADS B anomaly detection method based on transformer VAE[J]. Systems Engineering and Electronics, 2023, 45(11): 3680-3689.
[12]YU J S, SONG Y, TANG D Y, et al. Telemetry data based spacecraft anomaly detection with spatial temporal generative adversarial networks[J]. IEEE Trans.on Instrumentation and Measurement, 2021, 70: 3515209.
[13]LEI X, LU N Y, CHEN C, et al. Attention mechanism based multi scale feature extraction of bearing fault diagnosis[J]. Journal of Systems Engineering and Electronics, 2023, 34(5): 1359-1367.
[14]張萬超, 倪昊, 舒鵬, 等. 基于蟻群優化的長短時神經網絡變外形飛行器故障模式識別[J]. 飛控與探測, 2023, 6(3): 72-77.
ZHANG W C, NI H, SHU P, et al. Fault mode recognition for variable shape vehicles based on ACO LSTM[J]. Flight Control amp; Detection, 2023, 6(3): 72-77.
[15]LIU L, TIAN L, KANG Z, et al. Spacecraft anomaly detection with attention temporal convolution networks[J]. Neural Computing and Applications, 2023, 35: 9753-9761.
[16]DOUNIA L, RYAN A, SBASTIEN L D. Anomaly detection for data accountability of Mars telemetry data[J]. Expert Systems with Applications, 2022, 189: 116060.
[17]YANG L, MA Y, ZENG F, et al. Improved deep learning based telemetry data anomaly detection to enhance spacecraft operation reliability[J]. Microelectronics and Reliability, 2021, 126: 114311.
[18]PAN S J, YANG Q. A survey on transfer learning[J]. IEEE Trans.on Knowledge and Data Engineering, 2009, 22(10): 1345-1359.
[19]劉切, 上官子卓, 李嘉璽. 基于遷移學習的航天器遙測數據異常檢測技術[J]. 空間控制技術與應用, 2023, 49(4): 76-85.
LIU Q, SHANGGUAN Z Z, LI J X. Transfer learning based anomaly detection technology for spacecraft telemetry data[J]. Aerospace Control and Application, 2023, 49(4): 76-85.
[20]WEISS K, KHOSHGOFTAAR T M, WANG D D. A survey of transfer learning[J]. Journal of Big Data, 2016, 3(1): 1-40.
[21]HOSPEDALES T, ANTONIOU A, MICAELLI P, et al. Meta learning in neural networks: a survey[J]. IEEE Trans.on Pattern Analysis and Machine Intelligence, 2022, 44(9): 5149-5169.
[22]BAIK S Y, CHOI J H, KIM H W, et al. Meta learning with task adaptive loss function for few shot learning[C]∥Proc.of the IEEE/CVF International Conference on Computer Vision, 2021: 9465-9474.
[23]MA M R, HAN L S, ZHOU C J. BTAD: a binary transformer deep neural network model for anomaly detection in multiva riate time series data[J]. Advanced Engineering Informatics, 2023, 56: 101949.
[24]LIN J, SHAO H D, ZHOU X D, et al. Generalized MAML for few shot cross domain fault diagnosis of bearing driven by hete rogeneous signals[J]. Expert Systems with Application, 2023, 230: 120696.
[25]CHEN J K, QIU X P, LIU P F, et al. Meta multi task learning for sequence modeling[C]∥Proc.of the AAAI Conference on Artificial Intelligence, 2018.
[26]YU Y, SI X S, HU C H, et al. A review of recurrent neural networks: LSTM cells and network architectures[J]. Neural Computation, 2019, 31(7): 1235-1270.
[27]GREFF K, SRIVASTAVA R K, KOUTNK J, et al. LSTM: a search space odyssey[J]. IEEE Trans.on Neural Networks and Learning Systems, 28(10): 2222-2232.
[28]ZHANG S, YE F, WANG B N, et al. Few shot bearing fault diagnosis based on model agnostic meta learning[J]. IEEE Trans.on Industry Applications, 2021, 57(5): 4754-4764.
[29]HUNDMAN K, CONSTANTINOU V, LAPORTE C, et al. Detecting spacecraft anomalies using LSTMs and nonparametric dynamic thresholding[C]∥Proc.of the 24th ACM SIGKDD International Conference on Knowledge Discovery amp; Data Mining, 2018.
[30]ZENG Z F, JIN G, XU C, et al. Satellite telemetry data ano maly detection using causal network and feature attention based LSTM[J]. IEEE Trans.on Instrumentation and Measurement, 2022, 71: 3507221.
[31]SANCHEZ F, PANKRATZ C, LINDHOLM D M, et al. Webtcad: a tool for AD HOC visualization and analysis of telemetry data for multiple missions[C]∥Proc.of the SpaceOps Conference, 2018.
作者簡介
郭鵬飛(2000—),男,碩士研究生,主要研究方向為飛行器狀態感知與異常檢測。
靳 鍇(1988—),男,高級工程師,博士,主要研究方向為無人系統地面測控與信息處理。
陳琪鋒(1976—),男,教授,博士,主要研究方向為飛行器智能決策、先進制導與控制。
魏才盛(1990—),男,教授,博士,主要研究方向為航天器智能感知與控制。