蘇豪育
摘 要:在對某長輸管線SCADA系統進行優化升級工作時,引發了服務器冗余故障,為了解決這一問題。該文針對SCADA系統服務器,提出了重啟服務器網卡后,依據802.3協議將A、B服務器設定使用相同的工作方式、速率及master attribute中的配置,同時在數據庫中重新下載AB通道控制器,最終成功地解決了SCADA系統優化升級中引發的服務器冗余故障。
關鍵詞:SCADA系統 服務器 冗余
中圖分類號:TP333.4 文獻標識碼:A 文章編號:1674-098X(2015)03(c)-0033-02
1 故障描述
按照《某長輸管線SCADA系統程序優化升級》的工作計劃,工作人員到某站進行程序升級,升級進行過程中發現STATION界面顯示A、B服務器出現不冗余(HMI系統配置頁面中,冗余服務器冗余狀態指示燈顯示:紅色,not synchronization),B服務器為停止狀態(紅色,stoped),且link 0、link 1均為紅色failed狀態。
在進行ping測試后發現B服務器的大小網段IP均不通,立即前往機柜間查看服務器狀態,發現A、B服務器狀態均為primary狀態。在停止B服務器server服務后,更換B服務器的交換機端處網線網口,重啟B服務器后。此時兩塊網卡均正常的收發包。
程序升級完成后,此時進行服務器同步,服務器能夠正常同步(A(primary)同步B(back up))。站上工作人員要求切換主備服務器,切換后再次出現問題。發現此次同步過程中在發送文件的過程中左上角提示“synchronization error occurred”。B服務器的link 0(active link)出現紅色failed(網卡狀態只有發包沒有收包)狀態。確認報警后再次同步,此時link 1正常(link active),同步過程中,出現與link 0類似的情況,即同步失敗。
此時北京中控電話告知該站通訊已中斷,將服務器A切為主時,通訊數據恢復;STATION報警中提示AB channel failed,且無論怎么使能,link A的錯誤率都是100%。此時有3個故障:
(1)服務器A、B無法同步。
(2)備服務器為主時,北調通訊中斷。
(3)AB的一個通道(channel)中斷。
2 故障排查
經過仔細觀察發現,服務器同步異??偸浅霈F于主服務器向備服務器發送文件“sending file 101-sending”至“sending file 104”的過程,且出現錯誤后,B服務器處于active狀態的link 均會failed; failed后的網卡只有發包,無收包;此時重啟服務器網卡不能恢復正常,分別重啟大小網段的交換機,B服務器的網卡才能正常。此時考慮原因可能為:交換機與服務器通信模式不對導致大量數據傳輸時出現問題。此時交換機端口狀態見圖1。
服務器網卡對應的交換機端口均為AUTO模式。查看A、B服務器網卡配置發現:A服務器兩個網卡設置均為AUTO,而B服務器兩個網卡均為100M FULL。將B服務器的網卡設置改為與A服務器一致的設置,再次同步發現A、B服務器能通正常同步。
3 故障原因分析
(1)A、B服務器全半雙工不匹配。
只有A發送快速鏈路脈沖,B只發送發送FAST ETHERNET IDLE流,以檢測鏈路是否UP。B(強行設定的站點)不會告訴A自己(B服務器)的速率和工作模式。由于B不進行協商,A無法知道B的工作方式。根據802.3協議A必須與B使用相同的速率。工作在半雙工方式下。不管速率如何(除了10Gig),半雙工是以太網的默認方式,這就造成了全半雙工不匹配的問題。避免此類問題有兩種方式:兩端均使用自動協商模式(AUTO),或者雙方均進行強行設定(100M,FULL)。
(2)與北調備用鏈路通訊中斷。
與北調對ping均能夠正常ping通,無丟包。104協議升級前后,都不能正常通訊。查看104配置后發現Localhost IP Adress設置為:172.16.153.1。正常的服務器104配置應該為A服務器為server小網段IP,B服務器server為大網段IP。對比master attribute中的配置將B改為與A一致。與北調通訊恢復。
(3)與AB通訊問題。
AB兩塊網卡均能ping通,且都能夠上載程序,在線程序。在線后AB程序未提示異常。AB硬件應該沒有問題??紤]數據庫同步時出現錯誤導致此問題,在數據庫中重新下載AB通道控制器,再次使能AB的兩路通道恢復正常。
4 結語
(1)PKS數據庫同步時最好不要對數據庫有別的操作(不要遠程桌面)。
(2)AB 的ENBT模塊的指示燈正常是OK綠色常亮,net綠色常亮,link(綠色閃爍:有數據傳輸;綠色常亮:數據準備完畢,但無數據傳輸);但是實際發現中net燈綠色閃爍也是正常的。
(3)通道出現問題,可以嘗試將數據庫中的重新下載通道控制器。
(4)與北調通信,采用冷備方式(一路通訊中斷,北調需手動切換另外一路。)在104配置中,A服務器填寫自己小網段網卡地址;B服務器填寫大網段網卡的地址。
參考文獻
[1] 鄧李.PLC編程基本教程[M].北京:機械工業出版社,2011.
[2] 王樹青,樂嘉謙.自動化與儀表工程師手冊[M].北京:化學工業出版社,201l.
[3] 石油化工儀表自動化培訓教材編寫組.自動控帶1理論基礎[M].北京:中國石化出版社,2009.
[4] James A.Rehg,Glenn J.Sartori.Programmable Logic Contrllers[M].Prentice Hall,2006.
[5] 鄧李.Control Logix系統實用手冊[M].北京:機械工業出版社,2011.
[6] 石油化工儀表自動化培訓教材編寫組.可編程序控制器[M].北京:中國石化出版社,2009.