(中國衛星海上測控部,江蘇 江陰 214431)
S頻段統一測控系統是我國航天工程和衛星測控網的重要組成部分,主要任務是對S頻段航天器進行跟蹤測量、軌道和姿態控制及遙測監視,集跟蹤、測量、控制、通信于一體,確保航天器按照預先設計好的軌道運行與返回,以完成規定的航天任務。
隨著信息技術的發展,S頻段統一測控系統開始向集成化、自動化的方向跨越。然而,測控設備在功能和性能提高的同時,由于組成環節和影響因素的增加,發生故障或失效的可能性也隨之增大。個別部件故障常常會引起連鎖反應,導致任務過程失敗甚至整套設備癱瘓[1-2]。本文引入故障預測和健康管理技術,設計了一種故障診斷系統,主要完成S頻段統一測控系統可監控設備的故障狀態監測、生命周期管理、任務結果預測,通過對獲得的數據處理進行故障預測與故障診斷,在嚴重故障發生之前進行故障的預報與處理,避免出現嚴重后果,保證系統可靠、安全運行。同時與系統監控臺共用數據庫,具備全系統設備健康管理信息進行存儲管理功能[3]。
健康故障診斷系統架構分為故障信息采集、信息服務、應用服務等三層,總體架構如圖1所示。

圖1 健康故障診斷系統架構
故障信息采集層是對歷次系統/設備健康狀態預測、標校、測試、任務狀態以及任務數據分析的積累,不僅可供瀏覽與統計分析,還可用于后續健康狀態預測和任務執行狀態預測。故障信息采集的對象是地面站內所有設備,包括天飼饋分系統、發射及接收分系統、時頻分系統、基帶分系統、標校分系統、自動化測試分系統及記錄分系統等。
信息服務層是對故障診斷系統中的所有信息進行集中管理。除了對故障信息采集層信息的存儲,還包括專家知識、健康狀態評估模型、參數趨勢預測模型等。專家知識主要用于系統故障診斷與定位,是對傳統故障診斷系統知識庫的繼承;健康狀態評估模型存儲評估指標與評估方法;參數趨勢預測模型通過基于時間序列的預測算法對設備關鍵參數進行趨勢的預測。
應用服務層主要實現故障診斷定位、健康狀態評估、任務能力評估、趨勢預測等應用功能,它通過采集分系統或設備健康狀態信息、其它設備檢測信息、系統標校數據、系統測試數據以及任務數據作為系統健康管理的原始數據,結合歷史數據、健康評估模型、專家知識與推理,對系統健康狀態進行評估;應用服務層還能根據系統當前的健康狀態,安排維修保障計劃。
應用軟件包括健康管理軟件、數據服務軟件、數據庫管理軟件等組成,其中數據服務軟件、數據庫管理軟件與監控分系統軟件共用一套軟件。各軟件關系以及交互的信息如圖2所示。

圖2 故障診斷相關軟件組成及交互信息
健康故障診斷系統工作時,通過系統監控軟件定時查詢采集各分系統/設備監控單元上報的設備工作參數及狀態監測信息,實時將信息寫入綜合數據庫,同時向健康故障診斷系統發送故障監測點的監測信息;健康故障診斷軟件接收監測點信息,并實時檢查,若監測到有異常情況,則啟動故障樹診斷、鏈路測試等分析處理流程,在診斷處理過程中需要借助標校、測試手段進行輔助診斷時,健康管理軟件向系統監控軟件提交標校、測試請求;系統監控軟件接收故障診斷軟件的自動化測試請求,綜合考慮系統實際情況,為標校測試分配設備資源,并確定標校測試時間,生成標校測試計劃,控制自動化測試軟件完成測試,并將測試結果提供給故障診斷軟件,作為故障診斷及健康狀態評估的事實依據。自動化測試軟件是健康管理軟件測試執行者,接收系統監控軟件的測試命令,執行測試后將測試結果通過系統監控軟件上報健康管理軟件。
設備故障監測點基本類型大致劃分為兩類:枚舉型和數值型。設備故障識別時,依據故障監測點知識規則,作如下判斷:
枚舉型故障監測點是指上報的狀態數據固定為一個有限集合中的一個元素的設備故障監測點,當其上報狀態為有限集合中特定元素時,識別為故障。例如:設備電源故障監測點狀態數據集合為:{正常、異常},當其上報的狀態為“異常”時,可識別為故障。一般設置參數為:故障狀態數據和連續上報次數(默認為3)。例如,設備電源狀態監測點設置參數為:狀態數據:異常;連續上報次數:3。即:設備電源狀態監測點連續3次上報狀態數據為“異?!?,可判斷為故障。連續多次異常才能定位為故障,主要用于防止虛警。
數值型故障監測點是指上報的狀態數據固定為一個或數個有界區間,當狀態數據不在有界區間范圍內,識別為故障。例如:天線方位驅動電機電流狀態監測點狀態數據區間為[0,41](單位:A),當該故障監測點上報數據為46A時,可識別為故障。一般設置參數為:故障狀態數據區間范圍(上限、下限)、單位和連續上報時間(默認為5)。例如,天線方位驅動電機電流故障監測點設置參數為:上限:0;下限:41;單位:A;連續上報時間:10。即:天線方位驅動電機電流連續10秒鐘超過正常區間[0,41],可判斷為故障。連續一段時間超限才能定位為故障,主要用于防止突發值和虛警。
天伺饋設備健康管理通過天伺饋監控軟件采集設備傳感器信息,將設備狀態上報監控分系統,最終由健康管理分系統對設備采集數據的分析處理提取設備特征信息,完成對當前天線設備的故障診斷、健康評估和預測,并形成診斷、評估、預測報告,顯示診斷、評估、預測結果。采集傳感器信息有:電機的電樞電流、電樞電壓、測速機反饋、振動、溫度等信息[4-5];天線中心體溫度、濕度、攝像等信息[6]。
多功能數字基帶分系統的基帶硬件平臺、角誤差切換單元、時碼終端、測試信號切換單元的健康管理通過各自設備的監控軟件采集設備傳感器信息,將設備狀態上報監控分系統,最終由健康管理分系統對設備采集數據的分析處理提取設備特征信息,完成對當前基帶設備的故障診斷、健康評估和預測,并形成診斷、評估、預測報告,顯示診斷、評估、預測結果。
在高頻信道分系統設備中,對插箱內有源模塊設置了多個監測點,包括直流電源、本振信號幅度、變頻器供電等,可實時監測設備運行狀態及故障檢測并顯示,無源模塊及電纜的檢測需依據無源模塊前后相連的有源模塊來進行邏輯判別或通過自動化測試來輔助判別,確保所有模塊監測無遺漏,實現快速發現和解決設備問題。
基于故障樹的設備故障診斷流程分為設備狀態信號采集、設備故障識別、設備故障分析診斷及故障診斷決策四個階段[7-8]。
1)設備狀態信號采集。系統監控軟件采集全系統設備監測點的工作參數及狀態信息,并定時上報到故障診斷軟件作為設備故障診斷的事實依據。
2)設備故障識別。故障診斷軟件掃描設備監控信息中的故障監測點,檢測并識別設備故障。
3)設備故障分析診斷。發現設備故障后,根據故障設備的故障樹模型,依據故障檢測識別規則知識庫、各種閉環檢測結果,進行故障分析、推理判斷,定位故障設備。
4)故障診斷決策。故障診斷軟件識別判斷設備故障,定位到故障設備或模塊后,通知系統監控任務管理模塊相應故障設備資源離線維護,不再分配給下次任務計劃;同時在系統配置框圖上和設備機柜圖上加亮顯示故障設備。當最終出現系統無法理解或無法推理出結論的故障后,系統提示由操作員進行人工檢測處理,如中間產生新知識,可更新知識庫。設備故障診斷流程如圖3所示。

圖3 設備故障診斷流程
故障診斷軟件依據知識庫中故障監測點的知識和規則,從工作參數及狀態中提取設備故障監測點信息,檢測、判斷并識別故障;并依據需要,展開設備信號流閉環檢測。故障診斷系統中,故障分析診斷推理主要通過“故障診斷業務流程控制”、“規則引擎”、“知識庫”等三部分負責,其中故障診斷業務流程控制主要負責診斷過程調度,依據規則引擎反饋的規則推理結果反饋實現故障診斷過程的調度;規則引擎負責分析推理,主要通過ReteOO/Leap算法,實現測控系統領域知識(規則)與系統監控臺上報的事實依據(監測點狀態、測試結果等)匹配和推理,獲得推理結論;“故障診斷業務流程控制”、“規則引擎”協同工作,共同分析診斷,輸出診斷結果報告,如圖4所示。

圖4 規則引擎在故障診斷系統中的地位
設備故障樹,就是以單個設備或插箱作為故障診斷分析的目標,以設備故障作為頂事件,通過逐層分析原因而形成的故障樹[9-10]。為更好地進行設備故障分析定位,對設備故障樹的底事件進行了擴展、分類,設備故障樹分解到底層,最終底事件包括以下類型:
1)直接判斷事件:通過設備插箱設置的直接監測點進行故障原因判斷定位。
2)聯合判斷事件:通過前后有源模塊檢測點的狀態顯示,聯合判定模塊、電纜等是否發生故障,確定故障原因,定位故障單元。
3)交叉檢測事件:利用切換開關,對鏈路設備前后級設備進行相互切換,依據切換后不同表現,進行故障分析、判斷、定位,最后確定故障原因。
4)診斷測試事件:通過利用自動化測試分系統測試設備,將設備設置在射頻閉環或中頻閉環下,根據信號流或數據流,分級檢測信號特性,進行故障分析、判斷、定位,最后確定故障原因。
僅憑故障監測點是不能完全反映出設備健康狀態,有時需要根據診斷測試事件進行故障分析定位。如對于S頻段統一測控系統的低噪聲場效應放大器(LNA),雖然它的工作電流狀態(根據LNA各級放大器總的工作電流與參考值進行比較后得出)是正常的,但如果LNA的輸入輸出匹配電路、串聯的隔直電容出現了故障,都會導致LNA不能正常工作。噪聲溫度、增益等性能指標可以比較客觀地反映LNA健康與否。但受限于LNA接收信號的動態范圍和安裝的環境條件等客觀因素,噪聲溫度、增益等信息難以實時上報給健康管理分系統,需要借助自動化測試設備在非任務條件下進行測量和計算。以下是LNA+D/C增益的推導過程:
根據圖5所示的測試框圖進行LNA、D/C增益的測量。下行鏈路通過自動化測試設備、測試上變頻器閉環。在自動化測試軟件的控制下,控制信號源發送單載波信號,用頻譜儀監測下行輸出信號的頻譜;根據信號的頻譜特征,可判斷下行鏈路的狀態(其中X1~X10為各點信號幅度)。

圖5 LNA+D/C增益測試框圖
(1)
式(1)中,G為LNA+D/C的總增益(dB);P1為信號源輸出電平(dBm);P2為頻譜儀測量電平(dBm);LA為信號源輸出至LNA輸入端傳輸損耗(dB);LB為D/C輸出端至頻譜儀傳輸損耗(dB)。
LNA與D/C安裝在天線中心體的高頻箱內,它們之間沒有監測點。當測得的總增益正常時,可認為LNA與D/C均正常。當出現故障時,無法直接斷定具體是哪個模塊發生了故障,一般可采用交叉定位的手段進行分離,如圖6所示。當檢測到LNA1+D/C1鏈路增益不正常、而LNA2+D/C2鏈路增益正常時,改變鏈路連接關系,分別測量LNA1+D/C2鏈路增益、LNA2+D/C1鏈路增益,通過篩選,可分離出具體的故障模塊。

圖6 交叉定位法示意圖
本文從S頻段統一測控系統的特點出發,融合計算技術、數據存儲技術和軟件工程技術,設計了一種由船載測控系統構成的健康故障診斷系統集成框架,并分析了其系統組成和關鍵測試技術影響。所設計的健康故障診斷系統可以提高系統故障診斷和預測精度、擴展狀態監控和管理的對象,能在增長性能和降低成本的需求背景下,提高測控任務執行的成功率以及自動化率。雖然目前尚處于初步發展階段,但代表了未來航天測控故障診斷的發展方向,必將為航天測控站的無人化、自動化打下堅實的基礎。