黎媛捷 徐敏兒 張國勇
(上海衛星工程研究所,上海 201109)
隨著我國航天事業的迅速發展,衛星的發展呈現出以下幾個特點:(1)應用范圍廣。衛星已經融入日常生活中,例如,通信、導航、天氣預報、環境監測等都離不開衛星,人們對衛星的依賴度越來越高。(2)造價高昂。隨著技術的進步,衛星功能越來越強,性能指標越來越高,這就使得衛星的造價也越來越高,每顆少則數億元,多則十幾億甚至幾十億元。(3)設計復雜。以上海航天技術研究院研發的衛星為例,衛星設計越來越復雜,涉及的元器件數量也越來越多。(4)壽命延長。以某型號衛星為例,01批要求3年壽命,02批要求5年壽命,03批則要求達到8年壽命,有的衛星甚至要求15年或更長的壽命。
衛星的應用越廣、功能越強,意味著衛星一旦發生故障,造成的影響及經濟損失也就越大,這就對衛星的可靠性提出了更高的要求;加之對于衛星壽命指標的要求提高,對衛星可靠性的要求達到了幾乎苛刻的程度。每顆衛星都有幾千條遙測參數,衛星功能或性能出現異常時,可以在遙測中體現出來,在地面測試及在軌運行期間,通過地面監測軟件對衛星運行狀態進行監視并實現超限報警。目前,通常預先由設計師根據設計經驗確定各遙測的正常閾值,當遙測超出設定的正常閾值范圍時系統報警。由于這種方法過于依賴設計師經驗,且確定的范圍往往過大,不能準確反映衛星的真實工作狀況,因此這種方法可能會出現漏報等情況。該方法難以及時檢測遙測之間相對關系的改變、趨勢性變化,導致故障檢測時刻滯后,延誤故障處理良機,從而有可能造成故障惡化。針對現有系統的不足,本文提出了衛星故障檢測系統的整體架構思路,闡明了系統的工作原理、工作流程,定義了各模塊的功能及接口關系,并基于某型號衛星地面測試數據進行了試驗,試驗結果表明,該系統能夠較目前的故障檢測系統更早地發現故障,甚至能夠發現原有系統無法發現的趨勢性故障,對充分暴露衛星缺陷、提高在軌衛星可靠性具有重要意義。
超限報警方法是一種單維遙測報警方法,即把衛星的每個遙測作為獨立變量設定閾值,這種方法對狀態量遙測是適用的;對于連續型變量(如電流、溫度等)的遙測,由于遙測變化范圍較大,因此只能設定一個范圍較寬的閾值。當遙測在閾值范圍內發生如圖1所示的形態異常時,則該方法無法有效識別;當遙測發生圖2所示的緩慢趨勢性異常變化時,該方法也不能立刻識別;只有當遙測超出閾值時,系統才能識別故障,從而造成故障識別時間滯后。
為了彌補原有故障檢測系統的不足,本文提出的衛星故障檢測系統采用了一種截然不同的思路。該系統包含多個分系統,各個分系統又由許多模塊或部件組成,它們之間存在著物理或邏輯關聯關系,因此該系統利用了遙測參數之間的邏輯關聯性來進行衛星狀態檢測。當衛星正常運行時,遙測參數之間符合一定的邏輯關系,當故障發生時,遙測之間的邏輯關系發生改變,即進行衛星狀態報警。該方法在一定程度上彌補了原有系統的不足,可以作為原有系統的補充。
衛星故障檢測系統由基礎支持庫、離線處理模塊、模型庫、在線處理模塊、報警模塊、二次開發模塊及管理模塊等幾個部分組成,如圖3所示。
(1)基礎支持庫。基礎支持庫為系統提供了基本的輸入、輸出、運算、建模、顯示等功能,包括了數據源圖元、數據宿圖元、顯示圖元、預處理算法圖元、簡單數學運算圖元及故障檢測算法圖元等。數據源圖元用于從本地文件、數據庫讀取數據或接收網絡上的組播數據;數據宿圖元是將系統計算結果或原始遙測數據保存到本地文件、數據庫,或通過網絡發送到遙測顯示計算機;顯示圖元提供了圖表等表示方式,用于顯示原始遙測數據或系統計算結果;預處理算法圖元提供了平滑、濾波、剔野、抽樣等多種預處理算法,為后續遙測關系建模提供符合要求的數據;簡單數學運算圖元提供了各種基本的統計運算、數學公式編輯功能,用于對遙測進行基本的統計運算,也可供測試/監視人員手工建立遙測關系或模型用于故障檢測;故障檢測算法圖元提供了神經網絡、決策樹等多種機器學習算法。
(2)離線處理模塊。基于規則的衛星故障檢測的實現分為兩個階段:離線處理階段和在線處理階段。由于衛星遙測之間不是互相獨立的,而是具有關聯性,離線處理階段就是利用機器學習算法對歷史遙測數據進行分析,挖掘出遙測之間的關聯關系。離線處理模塊為離線遙測分析提供了分析平臺,測試/監測人員可以在該平臺上利用基礎支持庫中的數據源、數據預處理、數學運算或檢測算法、數據宿等圖元構成離線訓練流程,利用保存在本地或數據庫中的正常歷史遙測數據對機器學習算法進行訓練,生成遙測關聯模型,供在線處理模塊使用。

圖3 衛星故障檢測系統組成框圖
(3)模型庫。在線處理模塊生成的遙測關聯模型將保存到模型庫中,模型庫除了保存關聯模型外,還對遙測關聯模型進行集中管理,包括模型的刪除、命名、更新等。在利用現有的遙測關聯模型進行在軌衛星故障監測期間,如果監測人員基于最新的遙測數據重新對算法進行了訓練,生成了最新的遙測關聯模型,并保存到模型庫中,則模型庫會向在線處理模塊推送消息,讓監測人員確認是否更新在線處理模塊中的模型,如果需要更新,則模型庫把最新的遙測關聯模型發送給在線處理模塊。
(4)在線處理模塊。在線處理模塊是用于衛星狀態實時檢測的平臺,測試/監視人員能夠在該平臺上調用基礎支持庫中的網絡數據源、數據預處理、遙測關聯模型等建立實時分析流程,遙測數據進入遙測關聯模型進行關聯關系驗證。如果遙測關聯關系未發生變化,則模型目標變量與實際目標遙測的符合性較好且偏差較小;反之,則符合性較差且偏差較大。檢測結果可以通過網絡發送至遙測顯示計算機或在軌監測大屏,同時也輸出至報警模塊。
(5)報警模塊。報警模塊提供了聲音、指示燈等多種報警方式,當在線處理模塊中的實時檢測流程檢測到故障時,通過報警模塊進行報警。報警模塊也可以對測試或在軌監視期間發生的報警信息進行統一管理,供測試人員檢索,如發生故障時,報警模塊給出報警的遙測關聯模型ID號、模型名稱、模型備注信息,以及報警前后的遙測數據,供監測人員查看。
(6)二次開發模塊。由于系統現有的預處理方法、機器學習算法有限,因此有必要設計二次開發接口。在后續使用過程中,使用人員可以根據實際需要編寫新的預處理算法或機器學習算法加入系統中,通過二次開發模塊添加的算法與系統自帶的算法進行統一管理。
(7)管理模塊。管理模塊用于系統管理,包括算法的管理、模型的管理、流程的管理等。算法管理包括控制離線分析流程或在線分析流程的開始、暫停、結束、編輯、刪除、恢復等。
衛星故障檢測系統工作流程如圖4所示。系統首先從本地文件或數據庫中讀取歷史數據,進行數據平滑、抽樣、剔除野值等預處理操作,生成符合算法要求的數據,然后進行數據擬合或神經網絡等智能算法訓練,生成遙測關系模型保存到模型庫中。在線分析流程主要涉及從網絡上接收遙測數據,進行預處理、特征提取、數據優選等操作,然后從模型庫中取出離線分析流程訓練生成的模型,利用接收到的遙測數據實時預測目標遙測參數,預測殘差輸入報警模塊進行故障判別、報警,同時將實時計算結果保存到本地數據或數據庫,輸出到顯示大屏進行實時顯示,也可以輸出到第三方的健康評估軟件中進行衛星健康狀態評估。

圖4 衛星故障檢測系統工作流程
舉例說明。某次,在軌運行的某型號衛星發生供電通路故障,正常情況下太陽電池陣A、B路充電陣電流為16.1A,發生故障后,太陽電池陣A路充電陣電流下降到3.3A,B路充電陣電流下降到7.4A,衛星進入能源危機模式,整星載荷關機,部分功能受損,故障前后遙測數據如圖5所示。
太陽陣電流與光照條件有關,能夠反映光照條件的還有太陽角計信號等遙測參數,因此這些遙測參數之間存在某種關聯關系,因此,選擇太陽角計信號Vi(i=1,2,3,4)作為輸入參數,以A、B路充電陣電流IA、IB作為目標參數,進行遙測關系建模。采用此前某次的正常遙測數據對模型進行訓練,生成的模型預測效果如圖6所示,可以看出通過歷史遙測數據建立的模型預測值與實測值符合性較好,該模型能夠用來進行故障檢測。
利用建立的模型對后續的A、B路充電陣充電電流進行預測,將預測結果與實測數據進行比較,如圖7所示。當衛星狀態正常時,實測值與預測值之間的殘差很小,當故障發生時,實測值與預測值之間的殘差很明顯變大,系統據此能夠很快檢測出故障。

圖5 故障前后遙測數據

圖6 預測結果與遙測值對比

圖7 故障檢測結果
本文提出了基于遙測關系進行故障檢測的方法,并構建了衛星故障檢測系統的整體架構,闡明了系統的工作原理、工作流程,并基于某型號衛星地面測試數據進行了試驗。試驗結果表明,該系統能夠比目前的故障檢測系統更早地發現故障,甚至能夠發現原有系統無法發現的趨勢性故障,對充分暴露衛星缺陷、提高衛星在軌可靠性具有重要意義。