劉子俊,馮 勇,陳景龍,王 珺,張志偉
(1.西安航天動力研究所,陜西 西安 710100;2.西安交通大學 制造與系統工程國家重點實驗室,陜西 西安 710049)
21世紀以來,世界各國對太空資源愈加重視,使得航天技術發展迅猛,該技術甚至在一定程度上代表了國家的軍事、科技、經濟等發展水平,近年來眾多民營企業的涌現更是促進了航天領域的商業化發展。航天發射任務愈加頻繁,各類航天事故的發生不可避免,促使人們對火箭系統及關鍵部件開展狀態監測、異常檢測、故障診斷等進行研究。發動機作為液體火箭的動力核心,對其進行異常檢測方法的研究對于保證火箭系統運行的可靠性和安全性具有重要意義。
液體火箭發動機(liquid rocket engine, LRE)的異常檢測是指對傳感器測量的發動機運行數據進行特征提取后,做出二元決策,即判斷該發動機工作是否發生異常。由于航天發動機結構復雜,且具有機械—流體—燃燒等過程耦合的特點,僅依靠單路傳感器所測數據無法準確地判斷發動機健康狀態,因此常采用多傳感器采集的多源數據進行LRE異常檢測。
目前的液體火箭發動機異常檢測方法大致可分為以下3種:基于模型驅動的方法、基于數據驅動的方法、基于人工智能的方法。其中,基于模型驅動的方法具有完備的理論,但該方法的分析結果依賴于建模的精確程度,而由于航天發動機系統的復雜性和工況的復雜性(高溫、高壓、強振動等),建立各種工況下的模型比較困難,限制了該方法在實際中的應用。基于數據驅動的方法主要是根據發動機的輸出與故障之間的對應關系,通過主成分分析、小波分析、聚類方法等對測量信號進行分析處理,根據安全閾值判斷發動機的健康狀態或故障類型,但該方法對所獲取的數據質量要求較高。
隨著機器學習方法的發展與應用,具有自組織和自學習能力的人工神經網絡以及深層神經網絡被應用于航天發動機故障診斷和異常檢測等領域中。聶僥利用過程神經網絡對某大型氫氧火箭發動機的故障進行預測并實現部件級別的故障隔離,提高了火箭發動機異常檢測效率。孫成志等提出了基于BP神經網絡、證據理論和滾動時域估計算法的火箭發動機異常檢測模型,以解決火箭動力系統故障的復雜特性帶來的異常檢測效率低的問題。彭軍等利用深度置信網絡對同樣具有高溫、高轉速、大應力等惡劣工況的航空發動機進行異常檢測,克服了淺層神經網絡的不足,大大提高了檢測精度。An等提出利用自動編碼器(deep autoencoder, DAE)的重構損失來進行異常檢測的方法。近年來,由Goodfellow等提出的生成對抗網絡(generative adversarial networks, GAN)被廣泛應用于圖像分類、語音識別、故障診斷等領域中,由于GAN具有對數據的強大生成和鑒別能力,研究人員也將其應用于異常檢測中。Sabokrou等將GAN與DAE結合,設計出具有端到端訓練的異常檢測模型(adversarially learned one-class classifier, ALOCC)。Schlegl等提出無監督訓練的快速異常檢測模型f-AnoGAN,有效提高了醫學圖像中的病灶檢測效率。國內研究中,基于人工智能尤其是深度學習的火箭發動機異常檢測方法研究較少。張克明等提出基于生成對抗網絡的異常檢測模型,無需標注數據,僅利用系統運作時的正常數據訓練該模型,實現對航天異常事件的有效檢測。但該方法未在真實航天數據上進行驗證,且僅研究了基于單個傳感器數據的異常檢測,檢測結果的不確定性較大。
鑒于液體火箭發動機異常檢測方法的準確性和通用性需求,本文在僅有發動機健康數據可用的條件下對液體火箭發動機異常檢測進行了深入研究,提出了基于深度學習的自編碼式—生成對抗網絡(autoencoding generative adversarial network, AEGAN)以融合多源信息,根據輸入數據的重構損失和鑒別分數,通過無參數的核密度估計完成二元決策。實驗結果表明,該方法能有效地實現液體火箭發動機的異常檢測。
本研究提出的AEGAN,結構上由3部分組成:編碼器E、生成器G、鑒別器D。功能上,編碼器—生成器(E-G)構成深度自編碼器,生成器—鑒別器(G-D)構成相對生成對抗網絡(relativistic generative adversarial network, RGAN)。


(1)
反向傳播中采用梯度下降法進行網絡權值更新,其優化目標為

(2)
式中為求平均操作。
在實際的操作中,使DAE僅具備復制輸入的功能是不夠的,通過加入噪聲以損壞輸入,再由自編碼器進行恢復。因此DAE不僅需要去除噪聲損壞,還需要還原至最初的輸入,迫使自編碼器具有更強的特征提取能力。式(1)變為

(3)
式中~(0,01)為高斯噪聲。
一般地,GAN由生成偽數據的生成器和鑒別數據真偽性的鑒別器組成,其優化目標為

(4)
式中~(0,1)為一維高斯噪聲。通過提高鑒別器的“鑒偽”能力和生成器的“造假”能力,可以生成高質量的正常數據和低質量的異常數據,并通過鑒別器成功鑒別發動機的正常/異常狀態。
相較于標準GAN而言,RGAN針對的不是增大鑒別器對真實數據的輸出概率,而是增大真實數據相對于重構數據的真實程度,優化目標為

(5)

(6)

本研究提出自編碼式—生成對抗網絡AEGAN進行液體火箭發動機的異常檢測,如圖1所示。

圖1 AEGAN異常檢測流程Fig.1 Flowchart of AEGAN anomaly detection
AEGAN異常檢測具體實施步驟如下:
1)使用多個傳感器采集LRE運行狀態下的原始信號作為多源數據,以固定長度截取時間序列得到數據樣本集,并對各樣本進行預處理,將一維多通道數據轉換為二維多通道圖像;
2)將獲取的圖像樣本分類標簽化,劃分樣本數據為訓練集和測試集;
3)構建相對生成對抗網絡作為異常檢測模型,使用步驟2)中的訓練集進行RGAN和DAE的訓練,最終得到3個對LRE健康狀態具有良好識別能力的子網絡;
4)使用步驟3)中訓練的模型對步驟2)中的訓練集樣本進行狀態評估,對得到的評估分數()進行核密度估計,計算LRE正常樣本的分數閾值;
5)使用步驟3)中訓練的模型對步驟2)中的測試集樣本進行狀態評估,對每個樣本進行鄰域信息聚合,根據步驟4)中的分數閾值進行異常檢測。
首先,對每個傳感器通道采集的每個時間序列樣本∈進行歸一化,得出

(7)


(8)
式中表示信號通道數目。某型LRE地面熱試車數據加速度通道一維振動信號及預處理后的二維圖像如圖2所示。

圖2 數據預處理Fig.2 Data preprocessing
因為訓練集僅包含LRE健康狀態數據,根據該部分數據重建LRE健康狀態下的數據分布對于安全閾值的確定非常重要。核密度估計是一種用于估計給定樣本概率密度分布的非參數方法,如果給定樣本為=[,…,],則點=處的概率密度估計定義為

(9)
式中:=106()-02;表示高斯核函數。
模型訓練完成后,對訓練集中所有正常樣本(正樣本)進行狀態評估,評估分數由兩部分組成,如圖3所示,測量信號轉換為多通道圖像后,將其輸入到E-G構成的自編碼器中得到重構圖像,與原圖像對比得到重構損失;將其輸入鑒別器中對其狀態為正常進行估計,得到鑒別分數,則最后的檢測分數為

圖3 AEGAN異常檢測模型Fig.3 AEGAN anomaly detection model
()=sigmoid[()]-{[()-]}+
(10)
式中為大于0的常數。


(11)
式中:為置信度;(·)表示標準正態分布(0, 1) 的上側分位數。
為增強方法的檢測準確率及其魯棒性,在測試中聚合鄰近信息得到最終檢測分數為

(12)

筆者驗證實驗所用數據來自于某型號的液體火箭發動機地面熱試車數據,實驗裝置結構及原理如圖4所示。其結構主要包括渦輪、氧泵、燃料泵、燃燒室、燃氣發生器等。發動機氧化劑經過氧主泵加壓后部分進入噴注器,其余進入發生器進行燃燒產生高溫和富氧燃氣,并在對主渦輪做功后經燃氣導管到達噴注器的氣噴嘴入口,最后由氣噴嘴進入燃燒室;發動機燃料經過燃料一級泵增壓后主要分為兩路,其中大部分通過推力室冷卻通道進入燃燒室,另一部分由燃料二級泵增壓后進入燃氣發生器和推力室燃料入口路。燃料由燃燒室頭部噴注器混合霧化,形成細小液滴,被火焰加熱氣化并劇烈燃燒,產生高溫高壓燃氣高速噴出,進而產生推力。

圖4 某型液體火箭發動機原理圖Fig.4 Schematic diagram of a LRE
熱試車實驗中,選取該發動機10個關鍵位置作為測點,采集的多通道信號主要包括推力室振動信號、燃氣發生器振動信號、氧泵振動及氧化劑管路流體壓力信號、燃料泵振動信號及燃料管路流體壓力信號等。
在25.6 kHz的采樣頻率下獲取LRE運行數據,以1 024數據點即0.04 s所采數據為一個單通道樣本,以18個通道所測信號作為多源數據樣本。驗證實驗中,選取該型號發動機健康狀態下的1 500個正樣本以及異常狀態下的1 000個負樣本,以500個正樣本作為訓練集訓練異常檢測模型,以1 000個正樣本和負樣本作為測試集測試模型。
用于液體火箭發動機異常檢測結果及檢測方法的性能指標主要有精確率、召回率、準確率、靈敏度、特異度、受試者工作特性曲線(receiver operating characteristic, ROC)及曲線下面積(area under curve, AUC)、F1—分數等。如表1所示的混淆矩陣,若以P、N表示樣本的正負,以T、F分別表示預測的真假,則上述指標可解釋如下。

表1 異常檢測結果混淆矩陣Tab.1 Confusion matrix of anomaly detection results
1) 精確率與召回率。精確率描述的是預測為正的樣本中實際為正的比例,即=/(+);召回率描述的是預測為正的樣本占所有正樣本的比例,即=/(+)。
2)準確率。準確率描述的是預測為正確的樣本占所有樣本數的比例,即(+)/(+++)。
3)靈敏度與特異度。靈敏度即為召回率,特異度描述所有真實的負樣本中預測正確的比例,即/(+)。
4) ROC與AUC。以假正率(false positive rate, FPR)即1—特異度為橫坐標,以真正率(true positive rate, TPR)即靈敏度為縱坐標,可繪制受試者工作特性曲線,曲線下面積反映檢測模型的分類能力,面積越接近于1,性能越好。
5)F1—分數。精確流程與召回率相互制約,為綜合評價二元分類結果,使用F1—分數同時考慮精確率與召回率,即2/(+)。
筆者使用Python編程語言實現文中所提出的AEGAN異常檢測模型,所用版本為Python 3.8,深度學習框架采用PyTorch 1.6.0,GPU加速訓練使用容量為6 GB的GeForce GTX 1 660。
為驗證檢測模型的有效性及優越性,筆者選取與本文方法相關且具有代表性的3個異常智能檢測模型——自編碼器DAE、ALOCC、D作為對比方法,在相同訓練和測試條件下進行LRE異常檢測。其中,D表示使用RGAN的鑒別器進行異常檢測。
某型液體火箭發動機異常檢測結果見表2,本文所提出檢測方法AEGAN能達到96.55%的準確率,尤其是對于1 000個異常事件(負樣本)的檢測率達到98.90%,模型的AUC值也達到0.991 5,表明在實際異常檢測中,對于不同置信度下的檢測結果,AEGAN的性能更好。

表2 某型液體火箭發動機異常檢測結果Tab.2 Anomaly detection results of a LRE
為更加直觀地描述異常檢測結果,繪制檢測結果分數的分布如圖5所示,該圖展示了模型對于異常與正常樣本的區分情況,分布曲線越高、越窄,兩個分布的中心距離越遠,代表檢測模型性能越好;繪制ROC曲線如圖6所示,曲線下面積越大、曲線越靠近左上方,代表模型性能愈佳。

圖5 某型液體火箭發動機異常檢測結果分布圖Fig.5 Distribution of a LRE anomaly detection results

圖6 某型液體火箭發動機異常檢測結果ROC曲線圖Fig.6 ROC graph of anomaly detection results for a LRE
圖5和圖6所展示的結果分布與模型分類性能均能表明,相比于其他異常檢測模型,AEGAN在LRE異常檢測中更為有效。
為提升模型在實際異常檢測中所獲結果的可靠性、增加檢測模型的魯棒性,筆者提出融合檢測時刻的前{1, 2, 3, 4}個樣本的檢測結果,綜合判斷該時刻的健康狀態,如式(12)所示。選取時間上連續的1 000個正樣本和1 000個負樣本進行異常檢測,結果見表3,可視化結果如圖7所示。

表3 鄰域信息聚合的某型液體火箭發動機異常檢測結果Tab.3 Anomaly detection results of a LRE based on neighborhood information aggregation

圖7 不同數量的鄰域信息聚合后的異常檢測結果Fig.7 Anomaly detection results after neighborhood information aggregation with different amounts
表3中模型的檢測結果隨著鄰域信息的增加而向好。從圖7中可以看到,聚合鄰域信息使得模型對LRE健康狀態的檢測更加準確,在該實驗中準確率最高可達100%,對于模型檢測性能的提升效果顯著。值得注意的是,離線時已經訓練好的檢測模型,在線測試時融合鄰域信息只需要在決策級進行結果的融合,不會顯著增加時間成本從而影響檢測效率。
本研究提出的自編碼式-生成對抗網絡,僅依靠正常數據進行訓練,在特征級融合多源數據,根據輸入數據的重構損失和鑒別分數,通過核密度估計確定閾值完成二元決策,實現對液體火箭發動機的智能異常檢測。某型液體火箭發動機地面熱試車數據分析結果表明,該方法能進行準確且可靠的LRE異常檢測。
在下一階段,本研究將繼續完善該方法以提升訓練穩定性和訓練速度,并開展實驗進一步驗證其在工程應用中的適用性。