趙 歡
(天津軌道交通運營集團有限公司,天津 300000)
軌道交通無線通信系統中,在主、備用控制中心設備配置包括:集群交換控制設備、鑒權設備,調度服務器、行車調度臺、防災環控調度臺、乘客調度臺、總調度臺及中心網管設備組成。調度服務器在其中至關重要,它與時鐘系統進行校正,解析并轉發到調度臺(包括行車調度臺、環控調度臺和場調);接收在線列車信息(ATS),信號系統(ATS)連接到調度服務器上,調度服務器解析后將在線列車信息發送給行車調度臺、停車場調度臺、車輛段調度臺。調度臺根據ATS信號與地鐵運營信息表對應,這些信息用于顯示、呼叫、短信息和視頻等業務操作數據。實現多調度管理列車功能。所以調度服務器在主備控制中心需采用熱備方案,解決集群容災問題。
為了避免自動切換出現的不可控因素,主備控制中心的調度服務器軟件切換方式為手動切換。即通過手動點擊調度服務器軟件上面的軟件切換按鈕,實現切換。由于無線調度服務器軟件手動切換的時機是以信號系統切換為前提,同時各系統同步切換,確保了無線系統調度服務器軟件切換到備用控制中心后,能夠與信號、綜合監控、時鐘等系統的接口正常通信,保證無線系統各項功能正常運行。

圖 雙機熱備下的物理組網
雙機熱備下的邏輯連接如上圖,主備調度服務器(CAD)同時和大部分外部設備(除了時鐘服務器)都建立了TCP 連接,主備調度服務器都向時鐘服務器獲取時鐘信息,使得在進行主備切換時,切換時間在5秒之內。
雙機熱備切換分5種場景,下面描述各種場景的監測方法,處理方法。
監測軟件是獨立于調度服務器軟件運行的軟件,其作用是:與調度服務器軟件軟件相互監測,用于判斷
確認調度服務器軟件是否達到切換場景條件,當調度服務器軟件發生異常則進行切換操作;另外,監控軟件具備自監測功能,若當前程序被任務管理器關閉,監控軟件重啟自啟動。 監控軟件A、B、C、D 是平級的,沒有級別區分。為了示意 4 個不同的 調度服務器上的監控軟件,其功能沒有任何區別。
單中心沒有明確主備定義,當前工作即為主,上電運行根據監測軟件配置指定,主備是邏輯上的主備,誰處于工作狀態誰就是主服務狀態。當工作狀態下的服務出現異常時才會執行再次切換操作。
(1)監測方式。每秒監測當前業務網口(調度服務器上有個網口的網線連接到交換機上,這個網口稱為業務網口)的物理狀態,用來監測業務網口是否正常。監測軟件通過 WINDOWS API接口可以獲得業務網口的物理狀態,例如業務網口的網線拔掉,監測軟件可以監測到。監測到異常的時間是3秒(每秒獲取1次業務網口的物理狀態,連續3次都是異常,則認為業務網口有異常)。
(2)處理方式。檢測到當前業務網口處于異常狀態,則:
如果當前調度服務器為主用調度服務器,則啟動主備切換;如果當前調度服務器為備用調度服務器,則自啟動主備切換,網管會出現這個異常,報警。
(1)監測方式。每秒監測 ATS 網口的的物理狀態,用來監測 ATS 網口是否正常。監測軟件通過WINDOWS API接口可以獲得 ATS 網口的物理狀態,例如 ATS 網口的網線拔掉,監測軟件可以監測到。監測到異常的時間是3秒(每秒獲取 1 次 ATS 網口的物理狀態,連續3次都是異常,則認為ATS網口有異常)。
(2)處理方式。檢測到當前 ATS 網口處于異常狀態,異常包括物理異常和邏輯異常,物理異常包括:網口松動、網線破壞等邏輯異常包括ATS不回復位置信息,無法建立TCP通信;異常時網關有告警顯示,統一顯示為ATS未連接;備用服務器ATS故障時,網管可以監測到這些狀態:
如果當前調度服務器為主用調度服務器,則啟動主備切換;如果當前調度服務器為備用調度服務器,則自啟動主備切換,網管會出現這個異常報警。
(1)監測方式。監控軟件通過WINDOWS API接口查詢當前正在運行的進程里是否包含調度服務器軟件進程,通過這種方法可以判斷本機的 調度服務器 是否在運行。監測到異常的時間是1秒(每秒查詢一次,出現調度服務器軟件沒有在運行,立刻就可以判斷出這個異常)
(2)處理方式。檢測到本機的調度服務器軟件沒有在運行,則:
如果當前調度服務器為主用調度服務器,則啟動主備切換;如果當前調度服務器為備用調度服務器,則重啟本機的備用 調度服務器 程序。
(1)監測方式。監測軟件互 ping 其他調度服務器,通過這種方式,備可以監測主是否死機關機系統崩潰等;監測軟件使用.NET框架下的 ping API來實現 ping,根據返回值來判斷是否ping通,如果ping不通,為了確定是對方死機還是自身原因,需要ping第三方(例如時鐘)的連接。監測到異常的時間是3秒。
(2)處理方式。監測到其他調度服務器系統崩潰或者死機關機時,則:
如果當前調度服務器為主用調度服務器,監測到其他備機調度服務器關機等,則自啟動主備切換,網管會出現這個異常報警。如果當前調度服務器為備用調度服務器,監測到主用調度服務器關機,則啟動主備切換流程。
(1)監測方式。監測當前數據庫的狀態,用來監測數據庫服務是否異常。監控軟件周期讀取調度服務器數據庫中數據表的個數,每秒監測1次,連續3秒讀叏數據庫表個數返回值為0,則認為數據庫服務異常。監測到異常的時間是3秒。
(2)處理方式。檢測到當前數據庫處于斷連狀態,則:
如果當前調度服務器為主用調度服務器,則啟動主備切換;如果當前調度服務器為備用調度服務器,則自啟動主備切換,網管會出現這個異常報警。
當前調度服務器軟件第一次檢測到主用調度服務器時,該調度服務器軟件會向主用調度服務器申請必要數據(列車位置信息、電臺狀態);當主用調度服務器接收到電臺狀態信息發生改發時通知所有在線的備用服務器進行數據同步;因為列車位置消息特殊的時效性,其數據內容是從信號中獲取的所以不需要同步。
當手動修改列車位置時會屏蔽該列車的ATS信號,當主用調度服務器發現被屏蔽的ATS信號的列車其位置収生改發主用調度服務器會通知所有備用調度服務器的數據庫進行同步。
列車的信息從信號系統獲得,每個調度服務器和信號系統建立兩路連接,每路連接都會收到信號系統接收來的數據,周期是1秒,調度服務器對這兩路數據都解析,但是只處理其中一路。主備調度服務器都是如此,都可以從信號系統獲得車的信息,所以車的信息不用同步。
關于主備調度服務器上車的信息的一致性:如果信號系統給主備調度服務器的數據是一樣的,那么主備調度服務器上關于車的信息就是一致的;2)如果信號系統給主備調度服務器的數據不一樣,備用調度服務器 上關于列車的信息沒有必要和主用調度服務器上的車信息一致。因為在備機切換成主以后,它處理的還是原來備機連接的那路ATS數據,會繼續按原來那路ATS數據走。
列車機車臺、固定臺開關機信息的同步,分兩種同步操作:
(1)主備剛連接上時,備用調度服務器從主用調度服務器 獲得終端開關機信息;主調度服務器獲得新的開關機信息時,實時轉發給備調度服務器。
此方案經過多方論證,現場實測通過,已應用到某城市地鐵線路專用無線系統中。