劉傳魯 李常亮 高伊萱 章雷 薛彬
(航天科工空間工程發展有限公司,北京 100854)
隨著衛星硬件性能的提升,衛星由在軌運行的簡單傳感器和數據發送接收器向集高精密電子計算機及自動控制等多種先進技術為一體的復雜航天器轉變,其系統內載荷及平臺內連接部件之間互相關聯且緊密耦合,致使現在的工作狀況異常特征往往具有微弱性、非線性、不確定性以及因果關系復雜等特點[1]。因此,當衛星上設備工作狀況出現異常后,如何及時發現、定位以及處置,對提升在軌衛星生存能力和保障其使用壽命具有重要意義。
采用人工監測的方式對衛星系統運行狀態進行實時監測,存在判讀反應慢和受主觀因素影響的問題,面對已經產生異常運行數據的衛星或者即將進入異常運行狀態的衛星,受制于星地測控鏈路等因素,往往難以采取實時檢測與處置措施,這對于衛星系統的安全性存在一定隱患。數字化技術的發展對衛星多種工作狀況監測范圍變廣,產生的健康管理數據急劇增加,促進了以大數據為背景的智能判讀發展,并逐漸成為故障診斷研究的主流[2]。基于數據驅動的判讀模型從衛星運行過程中積累的大量數據中訓練系統健康狀態模型和判據,在很大程度上擺脫對人工特征設計與工程診斷經驗的依賴,提升了監視發現異常問題并預判潛在風險的能力。當前傳統數據驅動的判讀方法分為無監督的聚類方法和有監督的分類方法。采用聚類方法的判讀包含了通過分析擬合數據與異常數據,設計兩者之間的差異,建立航天器故障診斷模型[3]。通過生成健康狀態知識庫,與健康狀態的差異大小來定量描述衛星的健康狀態,區分衛星異常狀態的等級[4]。采用分類方法的判讀是通過有監督的方式訓練多分類模型對故障進行診斷[5]。衛星系統復雜性的快速增長同樣給以數據驅動的傳統智能診斷方法帶來了極大地挑戰,主要表現在:①表征衛星狀態的參數越來越多,復雜的衛星參數間關系難量化且冗余參數多,關鍵參數難以確定;②現有智能判讀方法可以定性確定是否故障狀態卻難以定量判讀健康狀態。
本文研究了可量化衛星網絡系統參數間關聯復雜關系的空間數據挖掘方法,衛星健康狀態關鍵關聯參數提取方法和衛星健康狀態定量判讀的方法。提出一種結合相關性聚類分析的數據處理機制和多分類器集成的健康狀態判讀模型。
數據提煉過程是在海量遙測管理數據中提煉出與故障關聯的關鍵信息,生成訓練衛星自主健康監測判讀模型的知識庫。挖掘方法包含了相關性分析、關鍵關聯參數選擇和聚類分析3個部分。其中,相關性分析是識別海量健康管理數據中各參數之間的關聯關系,關聯的強弱以及強弱的分布情況,為故障的關鍵關聯參數提取提供依據;關鍵關聯參數選擇是在高維遙測數據中篩選出與故障高度相關且彼此之間低冗余的參數,其關鍵關聯參數也作為智能判讀模型的輸入,避免了高維冗余參數輸入模型造成的額外空間和時間開銷;聚類分析是對健康狀態關鍵關聯參數樣本劃分為不同的狀態,為模型訓練提供健康狀態樣本知識庫,以此實現故障的定量判讀。
相關性分析方法采用最大信息系數(MIC)。MIC是建立在互信息上的方法,其核心思想是如果兩個變量之間存在某種關系,則可以在其散點圖中用網格劃分數據點來封裝這種關系[6]。在處理高維健康管理數據時,相比于其他相關性度量方法如皮爾森(Pearson)相關系數[7],斯皮爾曼(Spearman)相關系數[8],距離相關系數(Dcor)[9-10],MIC最重要的優勢是兼具通用性和均勻性,不僅可以檢測出各種類型的關系,線性和非線性,單調和非單調,甚至是非函數類型的廣泛關系,而且對于相同噪聲水平的不同函數關系,可以給出相近的評估值,受異常值的影響較少。
給定二元變量數據集D,以及在橫向劃分數量為y與在縱向劃分數量x滿足的上限條件xy
(1)
式中:B(n)是關于樣本量n的函數B(n)=nα,參數α的默認值為0.6[6],max 表示取最大值函數,M表示特征矩陣。
衛星遙測數據的參數樣本為時間段t1~tn記錄的狀態值。如圖1所示,當每個參數的樣本量相同,那么既可以衡量單個載荷內部參數間的關聯,也可以衡量載荷間參數的關聯。若考慮單個載荷A內部參數間的關聯,那么僅需要對載荷A的Ka個參數進行兩兩組合,并按相關性強弱進行排序選出強相關的參數。若考慮兩個載荷及以上參數間的關聯,如圖1中兩個載荷A與載荷B,其參數的個數分別為Ka與Kb,那么需要對K=Ka+Kb個參數進行兩兩組合,并量化參數之間的關系,其中識別過程如圖2所示。

圖2 強相關關系識別
高維遙測數據是指在遙測終端接收到的實時數據,其維度高是典型特點。提取與故障高度相關且彼此間低冗余的參數,要求故障特征具有維度少、表征故障信息量豐富、故障特征與故障模式存在明確的關聯關系。
本文對關鍵關聯參數的選擇分為3個階段(見圖3),其中第一階段是通過分析特征本身特性對海量特征數據進行預篩選,降低后續兩個階段的計算量;第二階段與第三階段是基于最大信息系數MIC篩選高相關低冗余特征,第二階段是度量特征與類別間的相關性,應用特征排序方法獲得與不同特征與類別之間的強弱關系;第三階段是冗余性分析階段[11],綜合考慮特征與類別間的強弱關系以及特征間的冗余性進行特征選擇。

注:M、K為特征數。
健康管理數據特征維數高,其中有些特征值對于整體判讀影響極小,且增加判讀模型的復雜性。由于這一部分特征數據表現特點就是值的變動幅度小,為了降低時間成本,在進行MIC的相關性特征選擇之前,采用計算簡單快速的方差篩選方法,過濾掉與健康狀態相互關聯程度低的特征。
對于K-1個特征 (f1,f2,…,fK-1),計算每一個特征的方差,然后根據方差的大小進行排序,并按比例刪除排名靠后的特征。
將進行方差過濾之后的特征子集,首先進行高相關特征的確定,在本文處理中,刪除與指定關鍵特征目標變量Tv弱相關特征。分別計算選擇特征(FS)中特征和關鍵特征Tv之間的相關性,若大于給定的閾值,則將其保留。
刪除冗余特征基于近似馬爾科夫毯。對于給定的兩個特征變量fi、fj(i≠j)和目標變量Tv,fi是fj的近似馬爾科夫毯當且僅當如下條件滿足FMIC(fi,Tv) >FMIC(fj,Tv)且FMIC(fj,Tv) 聚類分析是對健康狀態關鍵關聯參數樣本劃分為不同的狀態,進而對不同的工作狀態進行區分識別,以此實現故障的定量判讀。基于密度聚類算法在處理空間數據具有快速、有效處理噪聲點和發現不同形狀簇的特點[12],本文采用密度聚類算法(DBSCAN)對表述衛星運行狀態的關鍵遙測參數數據進行聚類。 DBSCAN包含2個參數,即掃描半徑(Eps)和最小包含點數(MinPts)。Eps描述了某一樣本的鄰域距離閾值,MinPts描述了某一樣本距離為Eps的鄰域中樣本個數的閾值。 (1)任選一個未被訪問(unvisited)的點p,找出與其距離在Eps之內(包括Eps)的所有點,若包含的點數不小于MinPts,則當前點與其附近點形成一個新簇C,將其中的所有點加入候選集N,標記p為已訪問(visited); (2)對候選集N中所有未被訪問(unvisited)的點q,檢查其鄰域,若包含的點數不小于MinPts,則將這些點加入N;如果q未歸入任何一個簇,則將q加入C; (3)重復步驟(2),繼續遍歷N中的剩余點; (4)重復步驟(1)~(3),直到所有對象都歸入了某個簇或標記為離群點。 在聚類算法中,作為輸入的每一個衛星運行狀態的關鍵遙測參數樣本表示一個點,不同類簇結果對應了不同的實際工作狀態。通常情況下,衛星運行狀態可以分為正常、異常和故障。其中,正常狀態的數量最多,異常狀態的數量次之,故障狀態數量最少。在本文故障模式即表示為異常狀態和故障狀態,不同狀態的差異通過聚類結果的不同簇集表現。正常運行狀態的數據簇內點數量多,異常運行狀態和故障狀態數據的簇內點數量少(在聚類結果上表現為離群點)。正常狀態與異常和故障狀態在數據上表現出的簇間距差異是定量描述衛星的健康狀態,區分衛星異常狀態的等級的理論依據。 判讀模型采用4種分類方法集成對健康狀態進行綜合判讀,較單一模型具備更高魯棒性和預判的準確性。模型的訓練數據是經過挖掘分析降維后的簡化數據,這保證軟件部署之后,軟件的數據輸入和計算的復雜性都大幅簡化。 圖4所示為生成模型的檢測過程,其中關鍵關聯參數通過1.1節中最大信息系數和1.2節中關鍵表征參數選擇確定,關鍵關聯參數數據將作為模型的輸入。判讀模型集成了4種方法,分別為神經網絡(NNs)[13],邏輯回歸(LR)[14],自適應提升(AdaBoost)[15],K最鄰近法(KNN)[16]。每個方法都采用由1.3節DBSCN聚類的樣本數據單獨訓練出一個最優分類器,在工作判讀時,每一個分類器都有一個結果,最后集成作為輸出。健康管理中的工作狀況定量分為4種,其中第1種狀態是故障,第2種狀態是異常,第3和第4種狀態是兩種健康工作狀態。在本文中的多個分類器的集成是結合投票機制和權重相結合的方式,4種分類器算法集成對4種健康狀態的判讀機制如下。 注:W為權重。 情形1:4個分類器的分類結果為同一個類別C1,那么判讀結果是類別C1; 情形2:4個分類器的判讀結果為兩個類別C1和C2,且其中3個分類器分類結果為C1,那么判讀結果是類別C1; 情形3:4個分類器的判讀結果為兩個類別C1和C2,且其中2個分類器分類結果為C1,2個分類器分類結果為C2,那么判讀結果是訓練過程中分類準確率最高的分類器分類結果; 情形4:4個分類器的判讀結果為3個類別C1,C2和C3,且其中2個分類器分類結果為C1,那么判讀結果為C1; 情形5:4個分類器的判讀結果為4個類別C1、C2、C3和C4,那么判讀結果是訓練過程中分類準確率最高的分類器分類結果。 為了對本文所提出的數據驅動的衛星健康狀態判讀模型進行驗證,采用某星的載荷遙測數據進行驗證。其中用于訓練的數據集有486個樣本,測試數據集有1142個樣本,樣本特征個數為146個。在這里樣本特征即是遙測參數,代表了統計中的隨機變量。 首先對載荷遙測數據的訓練數據集進行相關性分析,篩選健康狀態的關鍵關聯參數。采用MIC方法對146個特征的兩兩組合進行度量,相關性分布結果如圖5所示,其中相關性主要集中在3個大部分:第1部分是強相關性的,相關性的值在0.8到1之間;第2部分的相關值是中等相關,值在0.4到0.6之間;第3部分是弱相關,值在0到0.1之間。 圖5 載荷任意變量組相關性 作為通信載荷,其內部必然存在強相關的參數關系。從圖5中的強相關參數的數量,也驗證了這種預計的設想,通過對相關性的值為1的關系進行散點圖觀測,其中的關系主要呈現一種線性相關,側面反映出這些特征之間存在明顯的冗余,這種冗余在實際判讀體現在以隨機變量T表示故障變量,隨機變量X與T相關,隨機變量Y也與T相關,X和Y表示與故障相關的兩個變量[17]。若X與Y也相關,那么這兩個變量是相互冗余的,在高維數據中存在的類似大量相互冗余的參數即為高維冗余參數。 在本文以饋線鏈路發射機輸出功率監測作為一個降維關鍵指標參數,相關性參數閾值設置為0.7,從146個特征中篩選出7個關鍵關聯參數,關鍵關聯參數即與饋線鏈路發射機輸出功率監測強相關,而彼此之間相關性又極弱。7個與故障相關的參數分別為:T7檢波2;饋線鏈路發射機A機電壓模擬;T7檢波7;接收+6V主份電壓狀態量;饋線鏈路開關加電;接收-6V主份電壓狀態量;饋線鏈路發射機輸出功率監測。 以饋線鏈路發射機輸出功率監測作為工作狀態主要參考指標,其余6個參數特征都與其存在明顯關聯關系,6個參數特征之間彼此弱相關,表示出6個參數是非冗余特征。7個關鍵關聯參數表示衛星載荷是否出現在軌故障的情況。例如,對于正常工作狀態的數據,饋線鏈路發射機輸出功率監測值為0的情況下,T7檢波2與T7檢波7顯示值應為0;倘若饋線鏈路發射機輸出功率監測值為0,T7檢波2與T7檢波7兩個參數中任何一個參數顯示值為非0,那么就是異常的數據。 部署在衛星上的判讀模型越簡單,那么對星上的計算資源和內存資源占用越少。判讀模型中的超參數設置決定了其計算的復雜性,為了選擇合適的超參數配置簡化判讀模型,在本節采用窮舉遍歷的方式來確定模型超參數。超參數作為一個未知常量,KNN超參數為近鄰個數,AdaBoost超參數為基分類器的個數,NNs超參數為神經網絡的層數和節點個數。在這里對KNN的超參數近鄰個數,AdaBoost的超參數基分類器個數都在2至20之間進行遍歷。NNs的超參數層數和節點個數分別在2至30之間遍歷。其中超參數結果如圖6所示。 圖6 分類器的參數選擇 根據圖6(a)與圖6(b)所示,其中KNN方法隨著近鄰個數增加,準確率沒有改變;AdaBoost超參數基分類器個數隨著基分類器個數的增加,準確率也沒有改變;NNs的超參數層數和節點個數分別在2至30之間遍歷,其中參數結果如圖6(c)所示。當層數為3,每一層神經元個數為6時,準確率已經達到最大值。因此,KNN方法近鄰個數選擇2,AdaBoost超參數基分類器個數選擇2,NNs的層數選擇為3層。 為了模擬生成的判讀模型部署在星上的性能,在ZYNQ7045ARM嵌入式開發平臺上進行實驗。實驗測試數據集為不同時間產生的1142個樣本,經過相關性降維和聚類后數據維度為7,每一個維度即是一個參數,每一個樣本表示某個功能模塊當前的一個工作狀態,涵蓋了故障,異常和正常的工作狀態。首先對4種單獨方法NNs,邏輯回歸(LR),KNN,AdaBoost以及4種方法集成的方法集成(Ensemble)進行準確率的測試。 圖7所示為5種方法對測試數據健康狀態的預測結果。NNs、LR、KNN和AdaBoost中都存在將故障以及異常判讀錯誤的情況,而Ensemble沒有將故障以及異常判讀失誤的情況。對于4種狀態的判讀,誤判出現最多的是在兩種正常狀態之間,其中標簽為-1的狀態是故障,標簽為0的狀態是異常,標簽為1或2的狀態是健康。 圖7 5種方法對測試數據健康狀態的預測 表1為訓練樣本與測試樣本中4個類別的準確率,對于訓練樣本中4個類別的判讀結果,NNs、KNN和集成分類器Ensemble的準確率都是最高值1。Ensemble僅在第4個正常類別沒有達到1,其余均達到最大值。 表1 訓練樣本與測試樣本4種類別的準確率 表2為5種方法的虛警率(FAR)和漏警率(MAR)結果,其中FAR是誤報為故障的正常樣本數目與正常樣本總數目的比值。正常樣本是狀態1和2的兩種健康狀態樣本;MAR為誤報為正常的故障樣本數目與故障樣本總數目的比值。故障樣本是狀態-1和0的故障和異常狀態。 表2 5種方法的虛警率和漏警率 由表2可知,對于虛警率,5種方法在訓練樣本上的值都是0,而在測試樣本上,僅LR和Ensemble的值為0。對于漏警率,5種方法在訓練樣本上的值是0的方法是NNs、KNN和Ensemble,在測試樣本上,僅LR為大于0的值0.015,其余方法的值都為0。由虛警率和漏警率越低,模型的判讀效果越好。對于訓練集和測試集,僅Ensemble模型的虛警率和漏警率都為0,可以得出集成模型的判讀結果最好。 此外,數據庫中每一組樣本都有正常或異常的標簽,集成模型對每一組樣本進行判讀,若預測結果與標簽一致,則判斷準確,經統計對每一組樣本平均判讀時間僅為15 ms,且準確率達98%。由于每一組樣本可以看作某一個時間點衛星載荷工作記錄的多個參數值,因此具備在星上有限的算力下,實現高效判讀的能力。 針對衛星系統變得越來越復雜,其工作狀況的健康狀態也越來越難實時判讀的問題,本文提出了一種數據驅動的判讀模型,對衛星工作狀況的健康狀態進行實時定量判讀。模型包含了數據處理和訓練判讀兩個部分,其中數據處理部分作用是對數據的簡化,降低數據判讀難度,提高狀態判讀效率。首先是對特征進行相關性分析并提取關鍵關聯參數,然后對關鍵參數數據聚類分析,劃分出工作狀況的數據,為多分類器提供訓練知識庫。訓練判讀部分是多分類集成,通過多個分類器的分類結果綜合判讀,以此來提升對健康狀態判讀的泛化能力。根據上述方法針對某衛星載荷的遙測數據對該模型有效性進行了驗證,通過在載荷遙測訓練數據中提煉出與故障關鍵關聯參數測試數據對智能判讀模型驗證。模擬結果表明:該集成判讀模型具有較好的衛星異常狀態識別能力,有望為未來在軌衛星自主健康監測技術提供一種新型手段。1.3 聚類分析
1.4 判讀模型生成

2 仿真結果與分析
2.1 相關性降維分析

2.2 模型超參數選擇

2.3 模型性能評估



3 結束語