石李
摘 要: 為了分析計算通信系統的可靠性和可用性,基于軌道交通系統可靠性可用性的概念,介紹系統的主要量化指標和計算模型。結合實際工作經驗,通過實例闡述了如何計算通信系統中單臺設備及整個網絡的可用性,以及如何改善提高可用性指標以滿足客戶需求等。該方法不僅適用于軌道交通中通信系統的計算,也適用于其他各行業用到的通信系統的可用性的計算。
關鍵詞: RAMS; 可用性分析; 平均無故障時間; 平均故障修復時間
中圖分類號: TN915.05?34 文獻標識碼: A 文章編號: 1004?373X(2015)11?0156?03
Availability analysis and calculation of communication system in railway transportation
SHI Li
(Alcatel?Lucent Shanghai Bell Limited Company, Shanghai 201206, China)
Abstract: To analyze and calculate the reliability and availability of communication system, the major quantitative indexes and calculation model of the system are introduced on the basis of the reliability and availability concepts of railway transportation system. Combined with practical work experience, how to calculate the availability of the single equipment and the whole network is described, and how to improve the availability index to satisfy the customer requirements is also presented. The proposed method is applicable to the availability calculation of communication system in railway transportation and other industries.
Keywords: RAMS; availability analysis; MTBF; MTTR
0 引 言
隨著軌道交通的快速發展,市民出行的便利性大大提高,但諸多的隱患和災害也在威脅著軌道交通的安全,如火災、水災、觸電觸軌、機器故障等。一旦發生事故,乘客及員工的生命財產安全將會遭受巨大損失。因此必須采取一套行之有效的方法,統籌考慮軌道交通建設與運營的各個環節,切實有效提高軌道交通的可靠性與安全性。為此歐洲鐵路電工應用技術委員會 CENELEC制定了EN50126?1999標準,全面定義了鐵路設施可靠性、可用性、可維修性和安全性(Reliability,Availability,Maintainability and Safety,RAMS)的規范和論證[1]。國際電工委員會在此基礎上定義了IEC62278?2002[2]。而我國近年也開始引入RAMS管理體系,并制定了國標GBT 21562?2008[3]。
可用性(Availability)是RAMS管理體系中一個非常重要的指標,許多新建及規劃中的軌道交通項目都對其提出了具體的要求。如國內的成都地鐵,蘇州地鐵,國際上的吉隆坡地鐵,澳門地鐵,加爾各答地鐵,胡志明地鐵項目等。
軌道交通系統非常復雜,包括機車,信號,通信,監控,廣播等諸多子系統,它們的可用性的要求各不一致,計算方式跟步驟也各有其特點。本文將通過具體的實例來說明通信子系統的可用性的一般的計算方法與步驟。
1 可用性的量化指標及計算方法
1.1 主要量化指標
可靠性(Reliability):指產品在規定的條件下和規定的時間內,完成規定功能的能力。可靠性是產品的一種固有屬性,主要由設計決定。可靠性由MTBF(Mean Time Between Failure,平均無故障時間)來表征,單位是小時(h)。
可維護性(Maintainability): 指產品在規定的條件下和規定的時間內,按規定的程序和資源進行維修時,保持或恢復到規定狀態的能力。可維護性由MTTR(Mean Time to Repair,平均故障修復時間)來表征,單位也是小時(h)。
可用性(Availability,簡寫為A):可以維修的產品在某時刻具有或維持規定功能的能力,也就是說,產品在任一隨機時刻需要和開始執行任務時處于可工作或可使用狀態的程度。可用性的計算公式為:[A=MTBF][(MTBF+MTTR),]通常用百分數來表示,如99.999%。
不可用性(Unavailability,簡寫為U):相對于可用性而言,公式為[U=MTTR(MTBF+MTTR)]。因為在實際中MTBF遠遠大于MTTR, 所以可以使用近似等式,[U≈][MTTRMTBF,]從而給計算帶來方便。由定義可知,不可用性與可用性的和為1,即[U+A=1,]所以可以通過[U]得到A的值,從而簡化計算。
以上介紹了RAMS分析中最主要的四個指標,其他次要的指標如失效率等與計算可用性無關,暫不贅述,可參考相應標準與著作。
1.2 計算模型及方法
在對系統可用性建模時,通常使用RBD(Reliability Block Diagram,可靠性框圖)模型和Markov模型。Markov模型準確度高,便于細致量化分析,但建模過程繁瑣,求解分析困難,故多應用于理論研究或復雜系統。而RBD模型相對簡單,且符合大多數的工程指標要求,因此實際通信系統中使用的是RBD模型。RBD模型按單元功能結構又分為串聯模型和并聯模型。
1.2.1 串聯模型
假定系統由[n]個單元組成,只要有一個單元故障,系統就故障,此模型稱為串聯系統模型,如圖1所示。串聯系統可用性表示為:
[A=i=1nAi]
式中:[A]為系統可用性;[Ai]為第[i]個單元的可用性;[n]為單元個數。在實際中,為了方便起見,常使用另一種方法。可以先計算[U,]再通過[1-U]得到A。對于串聯模型,[U=U1+U2+…+Ui,]即:
[U=i=1nUi]
由上式可知,串聯系統的可靠性小于任一單元的可靠性,串聯的單元越多,總可靠性越低。因此,簡化系統結構,減少串聯單元,增加原可靠性最低單元的可靠性皆可有效提高整個系統的可靠性。
1.2.2 并聯模型
假定系統由[n]個單元組成,只有所有的單元都壞了,系統才失效,此模型稱之為并聯系統模型,如圖2所示。并聯系統可用性表示為:
[A=1-1n(1-Ai)]
式中:[A]為系統可用性;[Ai]為第[i]個單元的可用性;[n]為單元個數。因為[U=1-A,]所以并聯系統的不可用性 [U=U1×U2×…×Un]即:
[U=1-i=1nUi]
并聯系統的可靠性大于任一單元的可靠性。提高并聯系統中可靠性最高單元的可靠性,對系統可靠性的改善最明顯。
通過以上分析可知,串并聯系統的可用性都可通過不可用性得到,而不可用性只需通過簡單的加和乘即可得到,便于軟件計算,也便于查錯糾錯,所得誤差也在可接受范圍內。
2 通信子系統的可用性計算
下面以H城市的地鐵項目為例,具體介紹如何計算通信系統的可用性。
該項目有14個站點及1個運營控制中心(OCC),形成一個有15個節點的2.5G的SDH環。每個站的SDH設備下面又掛有2臺交換機,考慮最壞的情況,即鏈路最長的情況,就是以太網業務FE從OCC的SWITCH B的一個端口到STATION1的SWITCH B的一個端口,中間站點的SWITCH因為與此條鏈路業務無關,所以并未畫出,可得系統的RBD如圖3所示。
2.1 單臺設備的計算
SWITCH設備沒有分立的單板,作為一個整體有一個MTBF值,無需計算。而SDH設備由多塊單板組成,每塊單板都有自己的MTBF值,所以需要分析具體的單板配置,從而得到整個設備的MTBF值。由圖3可知,SDH設備有兩種配置: 第一種SDH1的節點位于環網的中間,主要起到東西向業務穿通,傳輸2.5G業務的作用;第二種SDH2的節點位于環網的兩端,主要作用是對以太網FE的業務進行復用與解復用。首先分析SDH1設備的單板配置,可得RBD框圖如圖4所示。
圖4中,SERGI是主控和電源板,1+1備份保護;TRU是電源濾波板,主要起到濾波及防浪涌作用;S16.1是2.5G光口板,東向西向各一塊。設備內還有其他一些單板,但是它們與這條業務無關,所以不必計算在內。根據上文分析,可以統一用不可用性[U]來計算。
對于SERGI,因為是兩塊1+1保護,符合并聯模型,所以它的總[U]等于兩塊單個[U]相乘,即[U總=][U×U=][MTTR2MTBF2。]
對于TRU,符合串聯模型,所以[U=MTTRMTBF。]
對于S16.1,雖然有兩塊,但是它們分屬不同的功能,不是1+1保護作用,所以按串聯模型計算,使用公式[U=MTTRMTBF。]
這里可以使用Excel表格方便的進行計算。表1中[U(1+0)]表示只有一塊單板,符合串聯模型。[U(1+1)]表示兩塊單板1+1保護,符合并聯模型。最終所有的[U]相加得到Utotal,然后[Atotal=1-Utotal,]計算結果見表1。
從而求得SDH1的可用性為0.999 990 16,通常只關心前5位,即99.999%。
同理對SDH2的RBD框圖分析如圖5所示。
圖5中ACCESS,PROT,TRU符合串聯模型。ES16,SERGI,S16.1符合并聯模型,計算結果如表2所示。
由表2可知,SDH2的可用性為0.999 999 044,取5位即99.999%。注意這里的S16.1屬于并聯模型,因為它向兩個方向傳送業務,任何一條業務斷了,另一條都會補上,不會使總的業務中斷,這點與SDH1不同。
2.2 整個網絡的計算
有了系統中每個節點的可用性(不可用性),再根據整個網絡的RBD框圖,就可以計算出整個網絡的可用性。先計算環路中上邊6個節點的不可用性,則根據串聯模型有:
[U上=Ustation3+Ustation5+Ustation7+Ustation9+Ustation11+Ustation13]
因為這6個節點的配置完全一樣,所以[U上=][USDH1×6=]9.839 97E-06×6=5.903 98E-05。
同理,[U下=USDH1×]7=9.839 97E-06×7=6.887 98E-05,而[U上]與[U下]屬于并聯模型,所以[U并=U上×U下=4.066 65E-09]
剩下的節點都是串聯模型了,直接用[U]相加得:
[U總=USWITCHB+USWITCHA+USDH2+U并+USDH2+USWITCHA+USWITCHB]
Excel表格計算如表3所示。可以看到,最終整個網絡的可用性為99.999%。
2.3 優化分析
在可用性的計算里,MTBF與MTTR是兩個關鍵的指標。MTBF主要由設備廠家給出,而MTTR是由系統集成公司或售后維護公司給出,有時合同中也會規定此值。通信設備的MTTR通常在0.5~2 h之間,上面的計算取0.5 h。如果取2 h,則最后的可用性為[A=]99.996%(計算過程略)。如果客戶在合同中規定了MTTR必須是2 h,并且可用性至少為99.998%,則此系統網絡拓撲就不達標,必須重新規劃。對系統計算表格進行分析,SWITCH和SDH2的值比較差。而[U并]高出它們兩個數量級,幾乎可以忽略不計,這也表明只要有一個設備做了1+1備份,那么它的可用性的結果就非常的好,更不用說多臺備份了。為了滿足要求,可以換一個MTBF值更高的SWITCH或者對SWITCH和SDH2增加備份,這樣都會提高可用性的值。不過,具體方案實施需要考慮成本,客戶,供應商,時間等多方面因素。
3 結 語
本文介紹了一種工程中比較簡便的計算通信系統可用性的方法。這套計算方法不僅適用于軌道交通項目,也適用于各行各業對通信系統可靠性可用性有要求的項目。這套方法既可為已有項目的可靠性可用性分析評估提供量化依據,也可以為新建項目的拓撲設計提供參考。同時還對其他系統的可用性可靠性的分析計算有積極的的參考和借鑒價值。
參考文獻
[1] British Standards Institution. BS EN 50126?1999 Railway application?specification and demonstration of reliability, availability, maintainability and safety [S]. Brussels: CENELEC, 1999?12?01.
[2] International Electrotechnical Commission. IEC 62278?2002 Railway application?specification administration of reliability, availability, maintainability and safety [S]. Geneva: IEC, 2002?09?01.
[3] 中華人民共和國國家質量監督檢疫檢驗總局.GB/T 21562—2008軌道交通:可靠性、可用性、可維修性和安全性規范及實例(RAMS)[S].北京:中華人民共和國國家質量監督檢疫檢驗總局,2008.
[4] 馬文·勞沙德.系統可靠性理論:模型、統計方法及應用[M].2版.張來鳳,郭強,王秋芳,等譯.北京:國防工業出版社,2010.
[5] 朱雅群,楊宇航.復雜機電產品MTTR仿真驗證研究[J].計算機仿真,2014(4):46?50.
[6] 周全,楊善林,曲玉琨,等.復雜系統的MTTR建模研究[J].火力與指揮控制,2010(2):82?84.
[7] 趙興華,王鵬聰.綜合監控系統RAMS及全生命周期成本分析與研究[J].電氣化鐵道,2013(4):35?38.
[8] 李云飛.空間通信中的網絡可靠性分析[J].現代電子技術,2012,35(23):45?48.
[9] 劉愛民,劉有恒.部件不可靠下的通信網業務性能分析[J].電子學報,2002,30(10):1459?1462.
[10] 陳勇.通信網可靠性的評價方法研究[D].南京:東南大學,2004.