董 會 娥
(太原鐵路局太原電務段TDCS中心,山西 太原 030001)
?
談鐵路調度系統主備用數據庫的倒切方案
董 會 娥
(太原鐵路局太原電務段TDCS中心,山西 太原030001)
論述了鐵路調度系統中備用數據庫的應用原理,介紹了主用數據庫向備用數據庫倒切的兩種方式,對比分析了前、后臺倒切方式的優劣點,并提出了一種基于后臺倒切的新的倒切方式,總結了這種新的倒切方式的應用要求,有利于保證整個鐵路調度系統的正常運轉。
鐵路調度,數據庫,倒切方式,調度臺
調度集中系統是以車站聯鎖和區間閉塞設備為基礎的集中監控、控制系統。我國鐵路調度指揮管理信息系統以列車調度指揮系統為平臺,以調度集中系統為核心,是基于現代化計算機技術、網絡技術、信息處理技術和智能化軟件的系統。該系統是實現鐵路各級運輸調度對列車運行實施透明指揮、實時調整、集中控制的現代化信息系統。作為現代化鐵路運輸調度指揮系統的核心,調度指揮管理系統和調度集中系統是鐵路信號發展的關鍵性技術,是實現鐵路提速、高速以及減員增效的跨越式發展的根本保證,其安全性和可靠性尤為重要。
調度集中系統和調度指揮管理系統的系統結構大致一致,都是由調度中心子系統、車站子系統和網路子系統三部分構成。如果說車站子系統和網路子系統是這兩套系統的基礎,調度中心子系統就是整個系統的核心。而數據庫作為數據存儲和配置存儲單元在鐵路局CTC/TDCS中心機房中是必不可少的,無論是調度集中系統還是調度指揮管理系統,數據庫作為系統運行數據和配置數據的存儲單元都非常重要,尤其是調度臺上的運行圖數據和調度命令數據直接影響著調度員的調度指揮工作。因此,常見的調度集中系統和調度指揮管理系統的數據庫都會在主用數據庫外配置一套備用數據庫,以應對緊急情況。同時在每套數據庫中又設有主、備用數據庫服務器。

由圖1可知,在正常應用中,主用數據庫是設置主用數據庫服務器和備用數據庫服務器互為冗余。一旦主用數據庫服務器出現異常或者宕機,備用數據庫服務器一般都會在1 min左右升為主機,從而保證數據庫的正常使用。但是在實際使用中由于數據庫的原因、磁盤整列的原因、控制器的原因或者其他意外情況等等,主用數據庫出現信息不能存儲或是讀取的情況還是存在的。因此,一般廠家會在主用數據庫之外單獨設置備用數據庫來應對該情況的出現。這種備用數據庫針對不同的線路、路局等情況設置上可能也會有所不同。一般來說會有兩種設置方式:多備一的方式和一備一的方式(見圖2,圖3)。多備一的方式一般在一些普通的線路上或者線路上車站較少或者多為TDCS車站時就會采用這種不同線路的多套主用數據庫共同設置一套備用數據庫。這種方式在節約成本和有效性上表現不凡。對于一些特別重要的線路一般采用一對一備用的方式,即一套主用數據庫對應一套備用數據庫。不管是多備一的方式還是一備一的方式,當主用數據庫出現故障的情況下,啟用備用數據庫的方式是一致的,我們稱之為主備用數據庫的倒切。而數據庫內的主用數據庫服務器向備用數據庫服務器的倒切我們稱之為數據庫的內部服務器倒切。


目前太原鐵路局的各個廠家提供的主用數據庫向備用數據庫倒切的方式基本上有兩種:一種是前臺倒切方式,比如交大微聯提供的FZj-CTC型調度集中系統。另外一種是后臺倒切方式,比如卡斯柯提供的FZk-CTC型調度集中系統。這兩種方式都需要我們的電務人員進行人工倒切。
1.1前臺倒切方式
前臺倒切方式是基于中心機房的備用數據庫不做任何處理,僅通過更改調度臺工作站的鏈接指向備用數據庫。這種方式的基礎是備用數據庫和主用數據庫在實時進行著數據同步工作。即主用數據庫和備用數據庫中的數據實時保持著一致。具體來說,主用數據庫通過軟件向備用數據庫實時提交自身擁有的運行數據和配置數據,因此我們認為主備用數據庫的數據是一致的。倒切時,電務人員需要通過前臺修改調度臺工作站的軟件配置,使得各個工作站改為連接備用數據庫。如圖4所示,圖中實線表示調度中心子系統中其他終端與主用數據庫的連接關系,虛線表示調度中心子系統中其他終端與備用數據庫的連接關系。同時我們要說明的是調度臺上的工作站可能有列調工作站、助調工作站、綜合調工作站、協助調工作站、施工調工作站、計劃調工作站、查詢終端等等,在圖中我們只列舉列調工作站軟件和助調工作站軟件,其他的工作站軟件的連接方式也是一樣的。

圖4中的粗實線表示的是主用數據庫向備用數據庫同步數據的同步關系。還需要說明的是圖中的主用數據庫IP節點和備用數據庫IP節點是在物理關系中不存在的,畫出來僅是方便于前后臺倒切方式的對比。其實質表示數據庫客戶端用于尋址鏈接的IP地址。這種前臺倒切方式在部署時應該完成一些關鍵的步驟,比如,數據庫客戶端應該同時配置主備用數據庫、主備用數據庫的表結構應該完全一致等等。
1.2后臺倒切方式
后臺倒切方式是基于調度臺工作站不做任何處理,僅通過處理中心機房的備用數據庫來實現后臺數據庫的更換。這種方式的基礎是主用數據庫必須脫網,因為此時備用數據庫的IP與主用數據庫相同。具體來說,在倒切數據庫時,電務人員拔掉主用數據庫的網線,再將備用數據庫的IP設置為主用數據庫IP并接入網絡,或者備用數據庫IP早已設置為與主用數據庫相同,只需將備用數據庫接入網絡。

如圖5所示,后臺倒切方式其實質就是后臺數據庫替換。將主用數據庫替換為備用數據庫。對外卻保持身份信息的一致。其中示意圖中的粗實線表示連接主用數據庫的物理通道,而虛線表示連接備用數據庫的物理通道。
這種后臺倒切方式在部署時雖然不要求主備用數據庫的連接關系,但也需要保證主備用數據庫的表結構一致。
在實際的操作使用中,我們發現這兩種倒切方式都存在著各自的利弊,我們通過日常的維護經驗總結如下。
2.1前臺倒切方式的優點
1)不需要人為去動調度中心機房的硬件(網線等),這樣就不會因為電務人員對硬件情況不熟悉或者誤操作而產生新的故障(比如高地網線接反之類的情況)。2)我們在主用數據庫正常使用時,也可以查看備用數據庫的實時狀態,即能確保在需要備用數據庫時備用數據庫能正常工作。因此,可以看出前臺倒切方式的可控性比較強。3)備用數據庫在日常的改造升級中也能扮演預升級的試驗對象,即在對主用數據庫升級之前可以先對備用數據庫升級,然后觀察升級效果進而再對主用數據庫升級。因此能達到一機多用的目的,提高服務器的利用效率。4)由于數據在主備數據庫間進行著實時同步,因此,備用數據庫一旦做主后,其歷史數據(調度命令、運行圖等)都是可以隨時查詢。如果主用數據庫出現故障導致數據庫同步機制失效,這時僅可能丟失當前數據中的部分數據,不會出現歷史數據的缺失。通過現場的實踐我們也相信這種方式對歷史數據的支持是非常有效果的。
2.2前臺倒切方式的缺點
前臺倒切方式雖然有如上的優點,但也存在一些不可避免的問題:
1)當主用數據庫發生故障后,數據庫同步的機制可能會出現失效的情況,即備用數據庫可能存在數據不完整的問題(從數據庫故障到故障表現至前臺工作站期間的數據可能丟失)。這樣導致倒切完畢后調度員工作站上出現部分數據丟失,可能是調度命令、運行線、小編組、報點、無線信息等等。
2)調度臺工作站涉及到列調工作站、助調工作站、綜合調工作站、施工調工作站以及計劃工作站等等,涉及的更改配置的對象眾多,倒切過程耗時耗力。對于線路簡單的調度臺涉及的調度臺工作站可能少的有一兩個。但像大秦臺這樣的調度臺涉及的調度工作站可能就有七八個,短時間內要更改這么多工作站的配置勢必會耽擱更多的時間。
3)在主用數據庫恢復后,由備用數據庫向主用數據庫倒切時還需要處理備用數據庫運行期間產生的運行數據向主用數據庫倒切的問題。這個問題更為復雜,向主用數據庫回倒備用數據庫產生的運行數據,需要借助廠家提供的專業工具,操作也更為復雜,幾乎都需要廠家技術人員的配合支持,而且從效果來看,也不理想。基本上都會丟失倒切期間產生的運行數據。
2.3后臺倒切方式的優點
后臺倒切方式相比于前臺倒切方式,確實存在著自身得天獨厚的優勢,比如:1)倒切過程更加方便快速。只需要讓主用數據庫脫網,備用數據庫接入網絡(或將備用數據庫IP改為主用數據庫IP)即可。這個過程只需要在調度中心機房內完成,相比于前臺倒切方式,其優點就在于倒切速度快。2)在實施和部署的時候不需要考慮數據同步的問題,從使用的穩定性和部署的方便性來說更優異。這種結構一定程度上減少了系統結構的復雜性,從而更容易部署。3)可以實現無縫切換,減小了故障的影響時間。由于這種后臺倒切方式的基礎是調度臺的工作站支持脫庫運行,因此在主用數據庫故障期間以及倒切過程中調度臺工作站都處于脫庫運行狀態,所以不管在工作站上編輯計劃還是下達調度命令等等都不受影響。
2.4后臺倒切方式的缺點
我們發現后臺倒切方式也存在著一些不可避免的問題:1)歷史數據(調度命令、運行圖等)無法查詢。2)在主用數據庫正常使用的情況下,備用數據庫的狀態不方便查看。3)在主用數據庫正常使用的情況下,備用數據庫并不能發揮一些其他的作用。
2.5兩種倒切方式的優劣比較
從倒切速度來說,后臺倒切方式更快,特別是當調度臺工作站越多其優勢更為明顯。從倒切效果來說,前臺倒切方式的效果更好,既能實現當前數據的存儲也能支持歷史數據的查詢。從倒切操作來說,后臺倒切方式更為方便,無論是主用數據庫向備用倒切還是備用數據庫向主用倒切都比較方便,易于操作。從日常維護來說,前臺倒切方式更方便于日后的維護檢修。
基于以上我們通過對前臺倒切方式和后臺倒切方式的優劣性對比,我們發現這兩種倒切方式由于倒切實施的對象截然相反。所以它們之間的優缺點也存在著互補的現象。因此,我們考慮是否可以將前臺倒切方式和后臺倒切方式進行整合,提出一致全新的主、備用數據庫倒切方案。我們從倒切快速有效性,故障影響時間短,倒切使用效果好等幾個方面綜合考慮,最終提出了這種基于后臺倒切的新的倒切方式。新的倒切方式示意圖見圖6。

這種新的倒切方式的實現基于如下幾個要求:1)調度員工作站可以脫庫運行,這樣不會因為數據庫的問題影響調度指揮工作,對于大秦臺的列調工作站和協助調工作站需要實時同步運行數據的協同工作站,我們建議采用脫庫后獨立運行的機制。不再進行同步,當再次鏈接到數據庫后,予以提醒調度員運行數據的差異,并提供人工同步的功能。2)在再次鏈接到數據庫時,不管是主用數據庫還是備用數據庫,都將調度臺當前數據自動導入數據庫。3)放棄前臺修改配置的操作,即保持前臺工作站不動,同時,要求工作站在脫庫情況下支持重啟。4)主用數據庫和備用數據庫之間沿用前臺倒切方式中的同步機制,這樣可以保證歷史數據可查。5)備用數據庫聯網,并與主用數據庫IP不同。這樣可以實現實時同步的同時,廢棄了后臺倒切方式中的備用數據庫入網的工作。6)開始倒切時,我們采用后臺倒切方式,主用數據庫拔掉網線,備用數據庫修改IP,整個倒切過程完成。7)當主用數據庫故障排除之后,備用數據庫向主用數據庫的回切操作時,備用數據庫改回IP,主用數據庫接上網線,整個過程完成。
這種方式集合了前臺倒切方式和后臺倒切方式的優點:歷史數據和當前數據不會丟失;可以實現無縫切換;不管是倒切還是回切,整個過程操作簡單容易,耗時短;不影響調度的指揮工作。
調度集中系統和調度指揮管理系統數據庫的倒切效率和倒切效果直接關乎著故障的影響范圍和影響時間,因此,我們站在使用者的角度重新梳理倒切的流程和倒切的方法,進而提出新的需求以提高數據庫倒切的效率和效果。無論從使用者的角度還是系統提供商的角度出發,都是有意義和必要性的。
新的數據庫倒切方式集合了各個廠家倒切方式的優點,同時也不需要增加硬件成本。在實際的操作中也是能有效的執行,執行的效果如上所述,可以快速有效的完善數據庫的倒切。所以,作者認為采用新的倒切方式是一種更為有效的方案。而我們在向廠家提出產品的需求時也可明確提出這種應用需求,極大的方便了后期的維護和運營。
長期的維護經驗告訴我們,設備的故障是在所難免的。如何通過提出明確需求,確定產品性能,達到故障無表現是我們每一個鐵路人都應該思考的問題。所謂故障無表現就是我們容許設備故障的出現,但是設備故障不應該影響整個系統的正常運轉。即不能將設備故障表現在前臺影響調度指揮工作。我們通過這種新的倒切方式可以發現這種目標是可以達到的。同理,針對于調度集中系統和調度指揮管理系統中的關鍵服務器,比如應用服務器、通信服務器、接口服務器等等,是否也能存在一種新的方式來達到設備故障無表現的效果。如果有一天,整個系統的所有故障都能在影響調度指揮和行車安全之前,通過后臺處理掉相應的故障。那么,這無論對于這兩套系統還是整個電務維護工作都有著非同凡響的意義。
Discussion on major standby database back-cutting scheme of railway dispatching system
Dong Hui’e
(TaiyuanElectricalTDCSCenter,TaiyuanBureauofRailway,Taiyuan030001,China)
The paper discusses the application principle of standby database of railway dispatching system, introduces two kinds of back-cutting from major database to standby database, compares their merits and defects, puts forward new back-cutting method on the basis of background back-cutting method, summarizes the application demands of new back-cutting method, which will be good for guaranteeing normal operation of the railway dispatching system.
railway dispatching, database, back-cutting method, dispatching desk
1009-6825(2016)08-0170-03
2016-01-05
董會娥(1966- ),女,工程師
U285.4
A