鄭 錦
(91404部隊 秦皇島 066000)
水面艦艇作戰系統是由警戒探測設備、指控系統、武器系統、通信系統、導航系統諸多分系統和設備組成的復雜系統,在“正常”和“故障”兩種狀態之間還存在1~n種性能降級狀態,具有連續多態性。對于這種離散多態系統采用現有的“正常”和“故障”“二態性”可靠性理論進行可靠性建模、設計、分析、評估難以全面刻畫系統的整體特性[1]。
而系統彈性理論,關注于系統對擾動的承受和恢復能力,其度量的基礎是系統性能在擾動前后的變化,尤其適用于作戰系統這種連續多態系統。本文提出水面艦艇作戰系統可靠性彈性理論設計研究。
彈性的英文單詞resilience最早來源于拉丁語的“resiliere”,意思是“回彈”[1]。彈性一般是指一個物體或系統應對變化的能力。作戰系統可靠性彈性是指作戰系統在受到攻擊或發生問題與故障時承受影響、平滑降級并以最小的影響恢復到初始狀態的能力。彈性是作戰系統這種包含信息空間和物理空間復雜系統,在不同空間表現的生存能力;是所有分系統和設備在發生問題和故障下仍能正常工作的概率;彈性是作戰系統在發生問題或故障時保持最低正常運行的能力。主要體現在平滑降級能力、彈性生存能力、防御能力、恢復能力、魯棒能力、不中斷服務的能力等方面[1~3]。
根據彈性的定義,影響作戰系統彈性的因素主要在于對作戰系統功能、性能降級和恢復的影響,本節從作戰系統的物理結構與組成特點出發分析影響系統彈性的內部和外部因素。
水面艦艇作戰系統一般采用開放的分布式體系結構,統一的技術基礎設施(包括作戰系統網絡、分布式資源管理系統和協同工作環境),構建公共計算環境,支持探測、武器、通信、指揮決策、氣象水文等資源在系統內的共用;基于面向服務的設計思想,構建一體化、服務化的綜合作戰指揮控制系統,滿足作戰系統執行對空中、水面、水下警戒探測、打擊、防御和非戰爭軍事行動等多種作戰任務的需求,將一系列計算單元和傳感器天線、武器打擊單元、公共顯控等通過一體化網絡高度集成與交互來提高系統在信息處理、態勢融合、實時通信、精確打擊控制以及組件自主協調等方面的能力,是時空多維異構的混雜自治系統。
作戰系統以傳感器天線、武器單元、公共顯控、高性能運算計算機等硬件設施為基礎,在硬件上搭載基礎平臺軟件、支撐軟件、應用軟件等,同時,通過一體化網絡進行互聯互通,實現分布式計算、調度和控制。因此,從組成作戰系統的產品屬性角度,可將作戰系統劃分為硬件、軟件以及由連接硬件、軟件的一體化網絡。這種網絡架構是實現信息系統與物理系統融合統一的基礎,將系統的態勢感知、輔助決策、指揮控制和火力打擊能力等通過作戰網絡實現交互和協作,使得整個作戰系統處于最佳狀態,充分發揮其作戰效能。
造成作戰系統功能缺失或性能降級的根本原因是指系統內部出現的問題和故障,不同的問題和故障會導致同一性能指標產生不同程度的性能降級,問題整改和故障歸零的方式也不相同。
3.2.1 硬件故障
硬件主要包括機械產品與電子產品兩大類。機械故障主要包括如零位變化、船體變形、零件裂紋、老化、磨損、腐蝕、松動、間隙不當、限位受損、壓力不當等。電子產品的故障主要由偶然因素造成的,其故障模式較為簡單,主要有開路、短路或漏電、參數漂移等。
3.2.2 軟件問題
軟件的問題主要來源于:軟件設計的體系結構、邏輯流程、數學公式、算法模型等存在差錯;代碼編寫錯誤,程序編寫時沒有完全按照需求進行設計。某一小的軟件錯誤即可引起軟件缺陷,缺陷造成軟件功能失效。軟件問題在整改過程中很有可能會引入新的軟件缺陷,從而帶來新的軟件問題。甚至導致軟件失效率升高,影響系統作戰能力。同時,硬件故障有時也會帶來軟件的失效。
無論是硬件故障還是軟件問題,都會導致作戰系統部分功能或指標受到影響,甚至導致整個作戰系統不能正常運行,降低艦艇的作戰能力。減少作戰系統故障與問題,提高系統可靠性,采用彈性策略對系統可靠性進行設計[4~5]。
為使作戰系統在發生問題或故障而導致部分性能下降的情況下仍能具備一定作戰能力,并能夠盡快恢復到正常狀態,需要從作戰系統整個設計、建造過程中采取多項措施,使系統具備較好適應能力和最短恢復能力,即實現系統彈性,這些措施即為彈性策略。基于彈性的本質和對作戰系統的影響因素,提出彈性策略的定義。
彈性策略,記為S,是在一定的約束條件下,以作戰系統彈性為目標,對系統采取的彈性設計和建造措施的集合,如式(1)所示,即在一種彈性度量指標下,給定約束條件,對系統的彈性設計方法和建造措施進行設計和實現,以實現系統給定的彈性目標值[6]。

Ret為作戰系統目標彈性值;f(·)為計算系統彈性的函數;S為彈性策略;D為彈性設計方法;C為建造措施;c(·)為約束函數。
從彈性策略的定義可以看出,系統的彈性策略包含四個方面,即彈性目標、彈性設計方法、建造措施和約束條件。本文從作戰系統可靠性設計出發,重點探討彈性目標、設計建造措施等方面。
根據彈性策略的定義,使得作戰系統具有好的彈性是彈性策略要實現的目標,這一目標主要包含以下三個方面。
4.2.1 允許性能降級
作戰系統在運行過程中的問題、故障和性能降級是時常發生的。因此,彈性策略的第一個目標是允許系統發生問題故障、性能降級。對系統彈性策略的分析都是建立在系統發生問題故障和性能降級的基礎上[6]。
4.2.2 避免系統癱瘓
系統癱瘓是指系統功能的完全喪失。作戰系統作為復雜系統,承載水面艦艇作戰使命,是艦艇核心任務系統,執行全艦警戒探測任務,執行作戰系統對空、對海、對水下等方面作戰功能,系統的癱瘓會帶來致命危害,會給全艦帶來毀滅性打擊害。因此,彈性策略的第二個目標是在系統發生降功能后,避免全系統癱瘓,并且保證系統仍然具備一定水平的作戰能力。
4.2.3 期望損失最低
作戰系統在降級模式運行時,由于不能達到要求的性能水平,會影響部分作戰能力;且降級程度越高、持續時間越長,則造成作戰能力下降越嚴重,甚至由于作戰能力下降導致貽誤戰機而帶來毀滅性打擊。一方面,盡量減小作戰系統性能降級程度可以減少損失,另一方面,縮短恢復時間即提高性能水平恢復的速率可以減少損失。因此,彈性策略的第三個目標是在系統發生性能降級后,將性能降級帶來的損失減小到最低,提高系統生命力。
設計建造措施是指在系統設計實施階段,對系統的硬件、軟件、架構等進行合理配置。這類措施包括提高部件性能裕量、建立松耦合系統架構、提高系統環境適應性設計、加強安全性設計、實時系統狀態監測、增強系統冗余設置、提升系統容錯能力。
要使各分系統、設備、組成部件留出足夠的設計裕量,以確保作戰系統具備更好彈性能夠抵御或吸收更大的載荷或沖擊。根據作戰系統性能指標的望小(STB)、望大(LTB)和望目(NTB)特性,性能裕量采用的計算方法如式(2)所示[6]。

式(2)中,Q為性能指標;m為性能指標Q的性能裕量;Qth為性能指標為LTB或STB時的故障判據;Qth,U為性能指標為 NTB 時的故障判據上限;Qth,L為性能指標為NTB時的故障判據下限。
增加部件性能裕度設計,提高系統沖擊吸收、抗負載能力。性能指標的性能裕量m大小和不確定性分布,即部件性能裕量的程度和分散性是對彈性影響的重要因素。性能裕量值越大,表示該部件能夠承受的沖擊、負載越大;性能裕量的分散性越大,表示該部件承受沖擊能力的不確定性越大,尤其是在承受的環境或工作載荷變化時,發生故障的可能性越大。從設計最初充分考慮性能裕量參數,提高系統抗沖擊能力。
系統架構是指各部件的連接和層次關系。作戰系統網絡分層結構,分為物理層、鏈路層、網絡層、傳輸層、應用層,上層隱藏下層的細節,上層統一下層的差異,上層彌補下層的缺陷和不足,各層之間呈單向依賴關系。系統架構對彈性影響的因素在于系統各分系統或設備之間的依賴程度,即系統各部件之間的耦合程度。無論物理連接還是邏輯連接,都構成了分系統和設備之間的相互依賴。緊耦合的方式易造成故障在作戰系統內部的快速蔓延,使得開始的簡單事故造成嚴重的后果。因此,作戰系統在最初設計時應采取松耦合的方式,并且盡量使系統模塊化、簡單化,以減弱初始事故帶來的損失[7]。
在作戰系統設計最初,應充分考慮系統受到溫度、太陽輻射、淋雨、雷擊、鹽霧等自然環境影響;系統各部件應承受主機、螺旋槳引起的船體振動,承受傾斜和搖擺;系統各設備應能承受作戰和航行時受到的非重復性強烈沖擊;系統各設備在作戰和航行時,應能耐受由波浪沖擊(艏底沖擊、甲板上浪、艉擊等)引起的重復性低強度沖擊,提高系統在不同環境下能夠連續穩定工作的環境適應性。
環境適應性對彈性的影響因素在于環境適應性的粒度和層級。環境適應性的粒度根據作戰系統的系統層次可以劃分為系統層、分系統層、設備層等,環境適應性的粒度越細,對系統的保護越嚴密,覆蓋范圍越廣,能夠抵御的外部干擾越多[8]。
作戰系統的安全性包括艦員安全、設備安全、信息安全、使用安全,在進行安全性設計時,應采用彈性策略設計。在武器發射火焰排放和碎粒噴射、強功率射頻系統輻射、武器發射裝置調舷/射擊/排殼/補彈等設計時,應充分考慮艦員及設備的安全性;作戰系統應根據有關系統(設備)的特點進行有關機械、電氣、防火、防爆、防毒等安全設計,并應充分考慮彈道交叉等火力兼容問題對本艦船體、艦載機及艦員可能造成的傷害;作戰系統應充分考慮本艦平臺內以及跨平臺互連/互通/互操作過程中的信息安全問題。
加強安全防護設計,使系統能夠抵御或吸收更大的載荷或沖擊的彈性越高,同時安全防護的粒度和質量也可對彈性造成影響,安全防護的粒度主要體現在系統層次劃分上。劃分的系統層、分系統層、設備層等層級越多,安全防護的粒度就越細,同時對系統的保護越嚴密,覆蓋范圍也更廣泛,可抵御的外部干擾就越多。且安全防護的質量越高,能夠抵御或吸收沖擊的可能性越大。
作戰系統需具備對系統內所有組成分系統、設備的狀態監控能力。對系統狀態進行實時監控不僅能夠時刻了解系統運行狀態,也方便系統在發生故障時查找原因,迅速進行故障定位、隔離和復位。狀態監測需要使用數據獲取設備和信息監測設備,實現系統狀態監控需要配置視頻傳感器、監測傳感器等設備收集信息,并安裝相應狀態監測軟件和可視化界面。首先要確定需要監控的主要功能部件和必要監測的數據,其次是輸入系統正常運行時的數值變化范圍。監控設備實時收集這些數據并同時進行存儲、處理和顯示。監測系統將判斷這些數據是否在正常范圍內,出現異常即觸發警報,系統自動報警。如火力交叉沖突告警。
實時系統狀態監測,可時刻了解系統狀態,避免出現誤差積累,使作戰系統發生問題與故障時承受影響得以及時控制、且以最小的影響恢復到初始狀態。狀態監測的粒度、靈敏度和精準度是影響彈性的重要因素。狀態監測的粒度主要是指系統監控層級劃分,層級越多,狀態監測的粒度越細,同時對系統的監測就越嚴密,覆蓋范圍也更廣泛,可以監測的系統狀態越多。狀態監測的靈敏度是指對待監測系統、分系統狀態變化的敏感程度,敏感度越高,能夠監測到問題和故障越精細。狀態監測的精準度是指系統或分系統狀態監測的準確性,精準度越高,則故障定位的準確性越高[9~10]。
冗余配置是保證系統運行的一項常用的措施。在作戰系統中,關鍵設備冗余備份,主要包括四部分:數據網絡冗余備份,視頻總線冗余備份,顯控臺及應用軟件冗余備份、接口設備冗余備份。
增強系統冗余設置,使某一分系統或設備、部件等發生問題和故障時對系統的影響最小,冗余配置的粒度和質量是影響彈性的重要因素。冗余配置的粒度主要是指系統冗余配置層級劃分,層級越多,冗余配置的粒度越細,則發生問題和故障后可切換備份的部件越多,對作戰性能造成的影響越小。冗余配置的質量是指冗余切換的成功率,成功率越高,對系統正常運行影響的可能性越小,達到在系統冗余切換過程中不影響系統戰技性能[11~12]。
容錯能力一般是指系統對錯誤和故障的容忍能力,即在發生錯誤或故障后,也不會發生系統運行錯誤或狀態卡死。在最初設計時充分考慮系統容錯能力,提升作戰系統在發生故障和錯誤時的可靠性彈性。首先,系統可通過分系統或設備功能自檢模塊對錯誤或故障進行自動檢測,可提前發現問題。其次,系統在發生故障或問題后可通過參數自適應調整對物理層的結構變更實現彈性;再次,通過鏈路層的容錯拓撲構成改變傳感器、指控等網絡的拓撲結構實現容錯,提高系統彈性。
提升系統容錯能力,使系統在發生錯誤和故障時,仍能夠保持一定程度的正常運行。容錯設置對系統外部干擾和內部故障容忍和屏蔽的覆蓋程度是對彈性影響的重要因素,容錯設置的覆蓋程度越大,能夠屏蔽和隔離的外部干擾和內部故障就越多,則外部干擾和內部故障對系統作戰性能影響就越小。
可靠性作為水面艦艇裝備通用質量特性之一,是影響水面艦艇作戰能力發揮的重要性質,可靠性貫穿整個作戰系統全壽命周期。本文基于彈性理論對于作戰系統這種復雜物理系統的可靠性設計進行分析,提出可靠性彈性策略,旨在更好地提高作戰系統可靠性。