房紅征,張 瑞,羅 凱,李 蕊,王曉棟
(1.北京航天測控技術有限公司,北京 100041;2.北京市高速交通工具智能診斷與健康管理重點實驗室,北京 100041;3.中國航發沈陽發動機研究所,沈陽 110015)
故障預測與健康管理(PHM)技術可以減少各種類型的在軌航天器的意外風險,已經成為提高航天器的可靠性、維修性、測試能力和安全性的關鍵技術。作為整個航天器健康管理系統的核心,地面健康管理系統主要為航天器技術人員提供對航天器的試驗、運行和管理過程中的數據分析、診斷、預測等服務。在航天器地面健康管理系統的設計開發過程中,驗證是非常重要的階段,通過研究和開發相應的航天器地面健康管理系統驗證方法、評價體系并實現相應的驗證系統,將有效地提高PHM系統驗證的可信度,有效減少人力需求、拓展系統功能、提升技術水平、保障航天器健康管理系統的穩定性額可靠性。
驗證評估技術目前已成為PHM技術研究的一個重要方向[1-3]。國外通過近年的研究,已形成了較為成熟的驗證系統平臺和工具[4-8],例如美國Impact公司與喬治亞理工學院合作研發的JSF的PHM驗證系統平臺,形成了一套基于網絡的綜合軟件應用集成工具,為美國聯合攻擊戰斗機(JSF)系統供應商提供PHM的驗證與確認(V&V)工具;美國波音公司的RITA HUMS的度量評估工具(MET),與診斷數據庫一起,提供了用于估計和記錄基于振動的診斷算法的性能的工具平臺;美國海軍增強型預測診斷系統的V&V工具,可基于大量數據和蒙特卡羅模擬法形成足夠的統計基準來評估診斷和預測算法的性能和效力。國內在航空航天領域也開展了PHM驗證技術和系統研究[9-15],提出了一些驗證評估的指標體系和方法,但在如何用于具體工程應用方面仍然處于探索研究階段。
本文針對航天器地面健康管理驗證系統研究目前存在的驗證指標及技術框架不夠通用明確的問題,提出了一種基于大數據的航天器地面健康管理系統設計思路,在PHM驗證評估指標體系和方法研究的基礎上,結合實際航天器測試保障需求,設計實現了基于仿真和試驗驗證的航天器地面健康管理驗證系統并進行了應用驗證,有助于解決航天器等復雜裝備系統PHM能力驗證評價困難的問題,為促進航天器PHM系統工程進程進行了有益探索。
一種基于大數據的航天器地面健康管理系統的總體架構如圖1所示[16-17],主要工作包括:

圖1 航天器地面健康管理系統的總體架構示意圖
1)故障診斷預測評估模型構建。知識模型構建是保證航天器地面系統應用的基礎,地面系統為航天器各分系統技術專家提供了知識創編功能,以完成對已有知識和本項目研究、驗證知識模型集成,并利用提供的數據驗證功能,完成知識模型的初步檢驗,形成初步的知識模型庫。
2)航天器地面測試與在軌遙測應用。通過將本系統與地面實時測試數據、在軌實時遙測數據進行對接,實時獲取多星實時數據,利用系統提供的診斷、預測應用,實現對異常檢測、故障定位、故障與壽命預測等應用,為地面運管人員提供決策支持
3)結果的人工分析與干預。由于航天器在軌工況復雜、環境干擾多,導致故障模式異常復雜,整個地面系統應用過程中可能會遇到系統知識不足、無法識別故障等情況。本系統為相關技術人員提供航天器數據事后分析計算功能,通過數據挖掘、人工比對等方法進行人工故障分析,并對分析結果進行干預處理。
4)機器學習與數據歸檔。地面系統提供診斷、預測與評估數據自動歸檔功能,并在歸檔過程中,自動調用系統機器學習算法,對已有知識、模型進行自學習計算,優化原有知識規則門限及模型參數,實現系統自主熟練。同時,為用戶提供選擇訓練數據,進行算法模型精度優化分析工具,實現人工優化知識。
裝備PHM系統級要求通常可以分成三類:安全、成本和性能[18-19]。航天器地面健康管理系統的目標是能夠通過提高可靠性和可用性來確保航天器的安全,并最大限度地減少額外成本,從而維持航天器系統性能。根據不同人員在健康狀態感知全壽命周期中的作用,可以將其進一步分成3類:1)作業(關鍵部件/分系統/整星/星座管理員、業務應用、運行管理和維護人員等);2)監管者(決策者);3)工程設計人員(總體單位設計/研究人員等)。因此需要針對這些不同用戶群來考慮地面PHM系統的能力評估與度量指標。依據系統的設計要求、運行和成本要求、算法性能要求、工作模式,總結出健康狀態感知能力評估指標分類如表1所示,具體包括:

表1 航天器地面PHM系統能力驗證評估指標
2.1.1 設計能力評估指標
1)失效覆蓋率。健康狀態感知所覆蓋的失效數與作為健康狀態感知候選對象的嚴重失效總數之比。
2)系統覆蓋率。健康狀態感知所覆蓋的重要部件/分系統的比例,要求將系統劃分成若干個具有嚴重關鍵度的獨立模塊。
2.1.2 成本能力評估指標
1)計算性能指標。有助于制定硬件要求或軟件必須工作的約束條件,且仍需滿足算法的性能要求,并對系統工程設計和實施成本產生影響。主要包括:
(1)計算復雜度。描述算法運行(獨立于軟件和硬件實現)所需的時間。
(2)CPU時間。度量中央處理器執行軟件所花費的時間,規定了算法/軟件實現和其搭載硬件運行的組合性能。
(3)其他指標。如運行時間、內存大小、數據速率等。
2)費效指標。用于從經濟性上進行健康狀態感知的性能評價。如投資回報率(ROI),通過“采用非計劃性維修進行管理時系統的壽命周期費用”與“在使用健康狀態感知方法進行管理時系統的壽命周期費用”之差與“實現和管理見狀態感知所花費的投資”的比值來實現。
2.1.3 算法性能評估指標
1)故障診斷算法性能度量。
(1)故障檢測率(FDR)。在規定時間內,由航天器PHM系統正確檢測的故障數量與該時間內發生的故障總數之比,計算公式如下:
(1)
式中,NT、ND分別表示PHM系統在規定時間內發生的故障總數和正確檢測到的故障總數。
(2)故障隔離率(FIR)。在規定的時間內由PHM系統正確隔離到單個LRM/LRC的故障數量與該時間內PHM系統正確檢測的故障總數之比。計算公式如下:
(2)
式中,ND、NL分別表示PHM系統在規定時間內正確檢測的故障總數及正確隔離到單個LRM/LRC的故障總數。
(3)虛警率(FAR)。計算公式如下:
(3)
式中,NFA為虛警次數;NFD為檢測出的故障次數,TFH為PHM工作時間。
(4)平均虛警間隔時間(MTBFA)。在規定的時間內,產品累計的運行小時數與該時間內PHM系統累積虛警次數之比,計算公式如下:
(4)
式中,NFA為虛警總次數;T為PHM運行總時間。
其他故障診斷評價指標還包括穩定性、工況敏感度、噪聲敏感度、總體置信度等。
2)故障預測算法性能度量。
(1)預測準確率。計算公式如下:
(5)
式中,Lri為第i次真實結果,Lpi為第i次預測結果。

(6)
(3)預測相對誤差。預測點的絕對誤差與預測對象的觀測值之間的比值。計算公式如下:
(7)

其他故障診斷評價指標還包括預測覆蓋率、置信度、相似度、靈敏度等。
3)健康評估算法性能度量。主要指標為健康康狀態評估準確度。
4)維修決策算法性能度量。包括MTBF(平均無故障工作時間)、MTTR(平均修復時間)、MTBUR(平均非計劃拆換間隔時間)等。
航天器健康管理系統驗證評估方法主要包括仿真驗證、試驗驗證和評估驗證等方法[20-21],實現對航天器健康管理系統的功能和性能指標進行驗證和評價,如圖2所示。

圖2 航天器地面健康管理系統驗證評估方法示意圖
2.2.1 仿真驗證方法
該方法主要針對航天器系統PHM試驗成本高或不適合做實物試驗的場景,采用基于數字仿真模型的方式代替實際的航天器系統進行試驗驗證,針對特定工況建立數學物理模型模擬系統實際運行情況,用定量的方法分析系統運行過程。優點是可以適當降低對航天器實物驗證試驗需求,不足是對數學模型有較高的精度要求。由于航天器的可靠性程度較高,因此在軌實際運行過程得到的故障案例有限,很多故障真實航天器上無法注入,因此需要搭建基于仿真的半物理仿真驗證平臺進行必要的驗證。具體內容包括診斷預測等算法仿真驗證、故障半物理仿真、指標仿真驗證等。
2.2.2 試驗驗證方法
對于定量評估要求,如果工作條件不具備,可以用該方法加以補充。試驗驗證該方法按照預定的試驗方案和計劃,在規定的條件下針對航天器實物進行故障或故障趨勢的模擬和注入,獲得與健康管理系統驗證相關的有關數據,通過分析、處理、計算與評定等過程,確定被驗證的參數指標是否符合規定要求所采用的一種驗證方法。具體內容包括航天器單機測試性設計驗證試驗、壽命試驗等,以及系統級的大型環境試驗等。
2.2.3 評估驗證方法
在航天器系統樣本量少、數據量不足等情況下可以考慮試用該方法,一方面可以針對健康管理技術定量要求,按照用戶認可的計算、分析、評估模型和計算方法,利用試驗或在軌運行中已經得到的遙測數據,以及系統的測試試驗等數據進行分析評估,判定航天器系統健康管理水平是否滿足規定要求;另一方面可以將待驗證航天器產品同已經通過驗證或實際使用結果證明滿足要求的相似產品,進行功能、使用環境條件、診斷預測能力等方面的對比分析,根據相似產品驗證結果得出航天器產品健康管理技術水平是否滿足要求。具體內容包括歷史數據評估、在軌評估驗證等。
航天器地面PHM驗證試驗主要用于驗證地面健康管理系統的數據接口和故障診斷、預測、評估和決策等功能。設計了相關驗證系統,架構如圖3所示。

圖3 航天器地面健康管理驗證系統架構圖
在基于仿真的驗證流程中,地面驗證系統采用了基于模型的系統設計技術,首先根據航天器各部件工作機理和故障機理進行原理建模,構建航天器環境模型庫、故障模型庫和退化模型庫,然后利用航天器歷史試驗數據與在軌運行數據進行模型修正,將得到的修正后模型用于系統設計與集成。在系統運行階段,驗證平臺通過效果評價軟件發送驗證指令至仿真調度軟件,仿真調度軟件加載并運行集成后的模型,生成仿真數據發送至可編程接口單元,接口單元加載接口報文配置,將仿真數據組幀以模擬衛星實際健康數據流,通過星地鏈路模擬器傳至地面系統,地面系統完成分析工作后將分析結果反饋至驗證效果評價軟件,后者根據反饋結果計算健康管理系統的檢測率、虛警率等指標,實現閉環驗證。
在基于歷史數據的研制流程中,驗證平臺通過效果評價軟件發送回放驗證指令,選擇導航、遙感等不同類型的相關歷史在軌數據,發送至地面健康管理系統,用于驗證診斷、故障預測、壽命預測等系統功能。
其中,航天器數字故障仿真、半物理仿真驗證主要工作流程如圖4(a)所示。歷史數據回放驗證在開始時采用數據庫接口程序,按照數據庫鏈接、數據庫操作、數據抽取、數據返回以及轉發流程實現數據回放啟動控制。具體流程如圖4(b)所示。

圖4 航天器地面健康管理驗證系統工作流程
利用通用故障預測與健康管理開發工業軟件實現了航天器地面健康管理系統以及驗證系統,選取了導航、遙感等多個衛星的控制、電源、熱控、測控等分系統的遙測參數和故障模式,結合數字仿真、半實物仿真、在軌歷史數據等進行了航天器地面PHM系統的故障診斷、預測、評估等功能和性能的驗證,其中診斷、預測部分驗證情況說明如下。
該故障原因主要包括模擬太陽敏感器故障(無輸出和輸出異常)、控制計算機工作異常(驅動控制單元對外接口故障)、SADA工作異常(驅動機構堵塞卡死、信號環短路和傳動機構失效等),在發生故障后,系統主要表現為輸出特征參量為0。帆板無法正常捕獲太陽將導致衛星帆板展開異常。采用地面數字故障/半實物仿真系統控制分系統仿真數據進行驗證,采用單測點、多工況分時序和多個測點同時注入的方式進行帆板無法正常捕獲太陽故障仿真,利用航天器健康管理地面系統的狀態監測與診斷軟件進行故障診斷,驗證相關性故障診斷模型,并生成故障診斷結果。以驅動機構堵塞卡死為例說明,主要步驟包括:
1)驗證開始。進入地面驗證效果評價軟件,選擇“ASS2無輸出傳動機構失效”用例,并查看用例故障描述及主要原因。如圖5所示。

圖5 地面驗證效果評價軟件進行典型故障診斷驗證設置
2)故障注入。在地面驗證效果評價軟件執行測試用例,在故障仿真設置之后驅動地面仿真系統開始仿真。該故障具體的仿真設置包括:工況設置:星箭分離消偏/帆板展開;工況判定:指向太陽;注入故障:驅動機構失效故障注入。如圖6所示。

圖6 地面仿真系統進行典型故障診斷仿真設置
3)故障診斷。在地面PHM系統中進入狀態監控與診斷軟件,進入帆板跟蹤太陽異常故障診斷任務,采用相關性模型對進行診斷,查看故障診斷結果。如圖7所示。

圖7 航天器地面健康管理系統典型故障診斷界面
4)結果確認。返回地面驗證效果評價軟件,查看用例執行后接收到的診斷結果與故障注入結果一致性,記錄驗證結果。對該故障的控制系統仿真數據進行15次診斷驗證,均能進行正常診斷。
該故障原因為太陽電池陣性能退化,表現為-Y或+Y分陣功率下降,與太陽輻照、太陽光入射角度、電池陣損傷因子等多因素相關。本驗證采用基于數據驅動的AR預測模型,利用某導航衛星2005-2008年的在軌遙測數據對太陽電池陣輸出功率進行預測分析驗證,主要步驟包括:
1)驗證開始。進入地面驗證效果評價軟件,查看太陽電池陣輸出功率下降故障模式,選擇相關用例,配置歷史數據回放文件進行回放,啟動驗證用例。如圖8所示。

圖8 地面驗證效果評價軟件進行典型預測驗證設置
2)故障預測。進入地面PHM系統的“故障與壽命預測軟件”,查看“太陽電池陣輸出功率下降”任務以及故障預測結果,按照預警門限進行監視。如圖9所示。

圖9 航天器地面健康管理系統典型預測界面
3)結果確認。返回地面驗證效果評價軟件,查看用例執行后接收到的預測結果,此次預測準確率為93%,確認預測成功和正確性。如圖10所示。

圖10 地面驗證效果評價軟件顯示預測性能評價
按照第3節所示方法和步驟選取多個衛星、分系統和診斷方法進行了航天器地面PHM系統的故障診斷驗證,綜合分析結果如表2所示,可見取得了較好的診斷效果。

表2 PHM驗證系統故障診斷驗證指標分析表
按照第3節所示方法和步驟選取多個衛星關鍵部件和預測方法進行了航天器地面PHM系統的故障預測驗證,綜合分析結果如表3所示,取得了較好的預測效果。

表3 PHM驗證系統故障預測指標分析表
航天器地面PHM驗證系統技術通過實現對現有PHM研究成果的有效驗證與評價,發現PHM系統研究和設計過程中存在的缺陷,為PHM系統設計提供信息一遍采取改進措施,從而推進PHM系統的實際工程應用,因此已成為一個非常富有挑戰性和迫切需要解決的問題。本文設計并實現了一種基于仿真和試驗驗證的航天器地面健康管理驗證系統,通過仿真和在軌數據試驗,可以提高PHM能力評估的準確度和效率,降低PHM驗證成本,將對航天器等復雜裝備測試保障工程產生積極的影響。