王 毅
(中鐵第一勘察設計院集團有限公司,西安 710043)
?
基于異步動態的地鐵綜合監控系統可靠性分析
王 毅
(中鐵第一勘察設計院集團有限公司,西安 710043)
以綜合監控系統為研究對象,在對地鐵綜合監控系統整體架構進行研究的基礎上,將系統看作一個離散的異步動態系統,對系統主要設備的控制部分建立可靠性數學模型。運用Lyapunov函數的分析方法證明模型的可靠性,依據控制網絡可靠性理論對綜合監控系統的平均無故障時間及平均故障修復時間兩個指標進行計算,驗證系統在不同程度失效時的可靠性。
地鐵;綜合監控系統;可靠性;分析
近年來,城市軌道交通的飛速發展,對社會經濟和人民的日常生活都起到長期的重要影響。為保證軌道交通的正常運營并創造安全、舒適的乘車和候車環境,地鐵全線配備了信號系統、環境與設備監控系統、安防系統、電扶梯、火災自動報警系統、站臺門等機電系統。為確保以上這些系統的安全可靠運行,設置綜合監控系統(Integrated Supervisory & Control System,簡稱ISCS)。
綜合監控系統是城市軌道交通綜合自動化的一部分[1],它通過統一的軟硬件平臺,對地鐵環境與設備監控系統、電力監控系統等進行集成,對信號系統、通信系統、自動售檢票系統等進行互聯管理,有效提高了地鐵的服務能力,優化了運營組織結構。
目前,綜合監控系統已在國內的地鐵、輕軌工程中得到廣泛應用。作為全線機電設備的監控平臺,它的應用和工作性質決定了系統必須具備高可靠性和高安全性,而且必須保證24 h不間斷正常運轉。一旦系統中斷或故障,將會直接影響整個地鐵的正常運營。
綜合監控系統采用兩級管理、三級控制的結構體系[2]。兩級管理是在線路的控制中心和車站控制室進行系統管理,三級控制分別在控制中心、各車站和現場各被集成的子系統實現。
控制中心是綜合監控系統的中央級系統所在位置,負責監控沿線各車站的車站級綜合監控系統(含車輛段系統)、軟件測試平臺、培訓管理系統、維修管理系統、集中告警系統、綜合后備盤等[3]。綜合監控系統車站級構成如圖1所示。

圖1 綜合監控系統車站級構成示意
3.1 系統可靠性指標
綜合監控系統是一個綜合型的計算機監控網絡系統,它的軟件體系結構是層次組織劃分的,每個上層軟件的系統都是建立在低一層軟件系統的基礎上;其分布式系統由多個獨立運行的服務器、工作站和軟件等組成,分布在不同的地理和網絡位置。
綜合監控系統的可靠性來源于系統24 h不間斷的正常運行,當系統發生軟件閃斷或硬件宕機時,迅速地進行故障修復并遷移到熱備系統正常運行是其可靠性的保證手段。
系統平均無故障時間(Mean Time Between Failures,簡稱MTBF)和系統平均修復時間(Mean Time To Repair,簡稱MTTR)是衡量一個系統可靠性的兩個重要指標[4]。綜合監控系統單臺設備平均無故障時間(MTBF)要求不小于10 000 h,系統故障修復時間(MTTR)要求小于60 min[5]。MTBF反映了系統的時間質量,是系統在規定的時間內保持正常運行能力的一種指標;MTTR則反映了從系統故障時刻起,到系統恢復正常運行之前的所需時間,它有效地衡量了一個系統在可維護性和響應時間上的能力。由于綜合監控系統對軌道交通的正常運營具有重要意義,一旦系統發生故障,系統必須在第一時間發生修復響應。根據網絡控制系統可靠性理論,衡量綜合監控系統的可靠性指標之一,可以用系統有效性(Availability)來表示。有效性更加準確地反映了綜合監控系統網絡的性能,它是在部分軟硬件失效的情況下,系統能達到保障性能要求的概率。系統有效性通過平均無故障時間和平均故障修復時間兩個指標的比值關系來表示,計算公式為[6]
在綜合監控系統的控制網絡中,平均無故障時間和平均故障修復時間交替穿插在系統的運行過程中[7],他們的相互關系如圖2所示。

圖2 控制系統MTBF與MTTR關系
由圖2可見:
綜合監控系統的平均無故障時間和平均故障修復時間發生的可能性是隨機的,因此MTBF和MTTR均是一組隨機的概率統計數值,它們所表示的系統有效性A也是一個概率統計數值。
構成綜合監控系統的主要設備有前置機FEP、歷時服務器、實時服務器、磁盤陣列、網絡交換機、系統工作站,它們中的任何一組設備發生故障,都會導致系統中斷運行。這些主要設備的可靠性指標,直接影響到整個系統的可靠性。
3.2 系統可靠性分析
構成綜合監控系統的關鍵設備有前置機FEP、歷時服務器、實時服務器、磁盤陣列、網絡交換機、系統工作站。關鍵設備可靠性指標如表1所示。

表1 關鍵設備可靠性指標
綜合監控系統的前置機FEP、歷時服務器、實時服務器、磁盤陣列、網絡交換機、系統工作站全都采用完全冗余配置且并聯[8],并聯方式如圖3所示。

圖3 冗余設備并聯示意
地鐵綜合監控系統負責全線各個軟硬件設備及子系統的監管和控制,它自身所發出的指令依靠網絡和代碼實現。由于其與生俱來的架構特點和功能要求,使得綜合監控系統故障點數量巨大,任何一個節點的實效,都會影響到系統的有效性和可靠性。從綜合監控系統的網絡控制結構來看,它的工作流程如圖4所示。

圖4 綜合監控系統工作流程示意
對于任何一個控制網絡來說,系統7×24 h的無故障運行是不可能的,只能最大程度地提高其有效工作時間。綜合監控系統利用雙機熱備等技術,有效提高了系統的可靠性。根據圖4,可將綜合監控系統看作一個離散線性系統,系統主要設備的控制部分可以建立一個近似為離散時間方程的數學模型。
3.2.1 控制部分數學模型
系統控制部分的數學建模結構為[9-10]
式中,xt是系統狀態量;ut是指令輸入量;Ln是系統增益;n定義為綜合監控網絡傳輸時由于故障等原因發送的錯誤指令或失效數據;yt是系統數據執行后的輸出量。系統正常工作時,失效數據為零,即L0=0;當系統發生故障時,Ln即為非零向量。A、B為矩陣系數。系統模型的估計誤差值定義為
(1)綜合監控系統正常工作時,L0=0,離散時間方程為
式中,dt為t時間的網絡延時,將dt=0代入式(6)可得
那么同理可得系統模型的估計誤差值為
(2)綜合監控系統發生失效故障時,將故障時刻t之前已經完成發送的信息定義為y(t-dt),離散時間方程為
系統模型的估計誤差值為
結合公式,推導可得出
Δ1=A,Δ2=A-LC
3.2.2 數學模型可靠性分析
綜合監控系統在運行過程中發生的故障狀態可以劃分為狀態1,2,3,…,n,因此可以把這些發生的狀態看作是n個離散的狀態,實時運行的綜合監控系統看作是一個異步動態系統[11]。則系統的狀態變量[12]
代入Lyapunov函數Vxt,當函數滿足條件
此時認為此異步動態系統是穩定可靠的。當公式(11)滿足不等式矩陣組
那么系統就是穩定的,E和F為兩個正定矩陣,系統變量λ1>0,λ2>0,網絡傳輸的數據丟失比率為γ。

把Δ1=A,Δ2=A-LC代入公式(18),定義F=LTE

3.2.3 MTBF計算
綜合監控系統設備的總運行時間可以拆分為MTBF和MTTR,通過計算MTBF和MTTR的數值,得出系統有效性指標。
綜合監控系統主要設備采用冗余熱備的架構方式并行連接,因此系統的控制部分MTBF取平方值
以表1中的指標為計算數據,則
MTBF工作站=1×105h
與其他主要設備不同的是,磁盤陣列是放置在歷史服務器的機柜中,與歷史服務器為串行連接方式,它的MTBF為

MTBF服務器系統≈Min(MTBF服務器,MTBF磁盤陣列)=
1.67×105h
綜合監控系統前置機FEP、歷時服務器、實時服務器、磁盤陣列、網絡交換機、系統工作站組成的串聯控制系統中,當系統中有一個或一個以上的設備失效時,系統就失效,所以主要設備中的最小無故障運行時間即為系統的平均無故障運行時間。
根據上述公式,綜合監控系統控制部分MTBF計算為
3.2.4 MTTR計算
根據可靠性理論的MTTR計算公式,平均故障修復時間=系統故障總修復時間/系統故障次數,綜合監控系統的MTTR可以通過設備故障率λ和故障修復時間的加權平均關系來表示[15]
MTTR=(MTTR1×λ1+MTTR2×λ2+MTTR3×
λ3+MTTR4×λ4+MTTR5×λ5)/
將綜合監控系統主要設備的MTBF數值代入公式(20),公式(21)中,可得
以表1中的MTTR指標可得前置機FEP:MTTR1=1;服務器:MTTR2=1;磁盤陣列:MTTR3=1;交換機:MTTR4=0.5;系統工作站MTTR5=1。
經計算,
MTTR=(MTTR1×λ1+MTTR2×λ2+MTTR3×
λ3+MTTR4×λ4+MTTR5×λ5)/
(λ1+λ2+λ3+λ4+λ5)≈0.99h
據系統有效性公式(1),得出綜合監控系統的有效性為
計算得出的綜合監控系統有效性的數值高達99.997 8%,能夠保證系統的可靠運行,但不是100%。通過對系統的數學建模和函數方程的求解,推導出綜合監控系統適用于MTBF和MTTR公式計算的依據,從而得出綜合監控系統的有效性數值。
該有效性值是基于表1中關鍵設備可靠性指標的數據計算得出的。由于設備供應商的不同,設備的設計和工藝的差異,可靠性指標會有差別。因此計算出的MTBF和MTTR值也是不一樣的,有效性A的數值是隨著MTBF和MTTR的變化而變化,是一個變量。
(1)綜合監控系統是地鐵運營生產不可或缺的部分,數據的丟失以及系統的失效將會給運營生產安全、運輸效率以及社會服務造成重大影響,利用冗余、改變網絡連接架構等技術對系統進行改進和優化,對提高可靠性和安全性具有十分重大的意義。
(2)考慮到故障率、修復響應時間等多種因素對冗余系統可靠性的影響,經分析可知設備故障率對系統達到平穩運行狀態所需時間的影響較大,系統恢復到正常運行狀態的可靠性由平均無故障時間和平均故障修復時間兩個指標的比值關系來表示,增加無故障運行時間和減少維修時間是提高系統可靠性的有效方法。
(3)在綜合考慮硬件系統多種失效方式的基礎上,將綜合監控系統抽象為一個離散的異步動態系統,建立數學模型分析其可靠性,并提出利用Lyapunov函數的分析方法求解,可以得到在任意時刻系統處于各狀態的概率,通過對系統可靠性進行分析,驗證了硬件在不同程度失效時對系統可用度的影響。
[1] 李強.地鐵綜合監控系統應用發展研究[J].自動化與儀器儀表,2015(10):112-116.
[2] 程媛.軌道交通綜合監控系統區域式構成方案研究[J].城市軌道交通研究,2011(3):44-50.
[3] 徐杰.城市軌道交通綜合監控平臺系統集成的研究[J].鐵道學報,2007(6):107-112.
[4] 劉愛民.關于可修復系統的MTBF和MTTR[J].電子學報,1998(1):70-72.
[5] 中華人民共和國住房和城鄉建設部.GB50157—2013地鐵設計規范[S].北京:中國建筑工業出版社,2014.
[6] 孫建平.控制系統可靠性分析與設計[J].華北電力學院學報,1995(4):39-44.
[7] 陳鵬.平均無故障時間(MTBF)的概述與應用[J].電子產品可靠性與環境試驗,2012(5):272-276.
[8] 章揚.地鐵綜合監控系統的可靠性、可用性、可維修性、安全性設計[J].城市軌道交通研究,2009(4):64-66.
[9] 吳欽木,李葉松,秦億.網絡控制系統穩定性分析和控制方法[J].電氣傳動,2006(36):8-15.
[10]孫海燕,侯朝楨,趙奇.基于模型的網絡控制系統穩定性[J].控制與決策,2005(4):412-416.
[11]樊衛華,蔡驊, 陳慶偉,等.基于異步動態系統的網絡控制系統建模[J].東南大學學報,2003(3):194-196.
[12]RABELLO A,BHAYA A. Stability of asynchronous dynamical sys-teems with rate constraints and application[J]. IEEE Proceeding on Control Theory Application, 2003(5):546-550.
[13]李金娜,張慶靈,于海斌.網絡控制系統穩定性的圖理論[J].控制理論與應用,2009(11):1309-1315.
[14]莫毓昌,楊孝宗,崔剛,等.一般階段任務系統的任務可靠性分析[J].軟件學報,2007(4):1068-1076.
[15]王婷婷.城市軌道交通綜合監控系統數據規模和系統性能分析[J].無線互聯科技,2015(1):165-167.
Reliability Analysis of Integrated Supervisory & Control System in Metro Based on Asynchronous Dynamic
WANG Yi
(China Railway First Survey and Design Institute Group Co., Ltd., Xi’an 710043, China)
To study the Integrated Supervisory & Control System(ISCS), a reliability mathematical model is established for the control of the main equipment of the system, which is regarded as a discrete asynchronous dynamic system based on the study of the overall architecture of ISCS. The reliability of the model is proved with the analysis of Lyapunov function, and the mean fault-free time and mean fault recovery time of the comprehensive monitoring system are calculated based on the control theory of network reliability, and the reliability of the system in different degree of failure is verified.
Metro; Integrated supervisory control system; Reliability; Analysis
2016-05-23;
2016-07-14
王 毅(1985—)男,工程師,2010年畢業于中國鐵道科學研究院交通信息工程及控制專業,工學碩士,E-mail:894402933@qq.com。
1004-2954(2016)12-0128-04
U231+.6
A
10.13238/j.issn.1004-2954.2016.12.028