常向陽 張志彬


摘 要:隨著DCS系統在國內大型電廠的廣泛應用,其網絡的安全性和穩定性變得越來越重要。文章通過某電廠機組在調試期間發生的DCS網絡故障事件進行了深入細致的分析,并提出了相應的解決措施,減少了突發事件對機組狀態的影響,同時對該DCS系統在其他電廠的應用也具有較好的參考價值。
關鍵詞:DCS;網絡風暴;網絡故障;信息網
1 DCS網絡結構
1.1網絡組成
非安全級DCS網絡包括信息網(MNET)和系統網(SNET),如圖1所示。
信息網(MNET)采用冗余快速以太網鏈路,采用TCP/IP通訊協議,介質主要使用五類屏蔽雙絞線或光纖,主要通訊節點包括操作員站、工程師站和服務器等;系統網(SNET)采用光纖介質組成交換機環路的快速以太網,基于TCP/IP協議;控制站、實時服務器、通訊站和工程師站通過采用五類屏蔽雙絞線或光纖與交換機連接,主要通訊節點包括實時服務器、現場控制站、通訊站和工程師站等。
2 事件經過
2020年3月19日10點45分,某電廠機組SNET A網發生網絡風暴,一層控制器及通訊站的SNET A網開始出現大面積的網絡故障,在短時間內所有控制器的SNET A網故障,大部分通訊站的SNET A網故障,并且部分控制器出現SNET A和SNET B同時故障的情況。
隨著時間的延長,新增較多控制器同時出現SNET A和SNET B網故障的情況,其中主、從控制器同時出現SNET A 和SNET B的情況新增了較多。
為了盡快恢復DCS一層網絡,現場對SNET A網交換機進行了斷電重啟,發現較多的控制器網絡已經恢復正常,但仍有部分控制器顯示SNET A網和SNET B網故障,后在機柜側通過對控制器進行復位后,控制器及網絡恢復正常。
該網絡風暴造成SNET A網失效8小時,整個故障過程中,DCS系統控制器邏輯處理功能正常,未對現場設備造成擾動;SNET A網故障的控制器成功切換到SNET B網,二層可對其正常操作和顯示;8小時內共有16個控制器出現雙網故障,其中有2個控制器互為冗余,該控制柜孤島運行,二層無法顯示和操作。
3故障原因分析
造成網絡故障的直接原因為SNET A網發生網絡故障。當SNET A網發生網絡故障時,數據幀在網絡內大量復制、傳播,造成SNET A網交換機超負荷,從而導致整個SNET A網絡癱瘓;造成網絡故障的根本原因是交換機電路板交換芯片外圍電路晶振相連的濾波電容一端焊錫少,造成晶振頻率偏差,MAC芯片由于濾波電容焊錫少出現功能異常,形成物理環路并造成網絡故障影響交換芯片功能。
為了防止網絡故障造成控制器超負荷,導致控制器復位,控制器具有網絡故障檢測功能。該功能的處理機制如下:
3.1當控制器檢測到網口超負荷時,關閉該網口;
3.2關閉網口后,控制器會不停重試該網口,檢測網絡故障是否消失,重試間隔為1分鐘。如果消失,則恢復網口;如果沒有消失,則繼續關閉網口;由于控制器處理能力有限,重試次數過多會造成控制器軟件錯誤,導致雙網故障。
4防范網絡故障措施
4.1設置RSTP 協議
非安全級DCS系統使用的交換機支持防范網絡故障的功能,在所有連接其它交換機的端口(以下簡稱互聯端口)設置了RSTP協議。該協議可應用于環路網絡,通過一定的算法實現路徑冗余,同時將環路網絡修剪成無環路的樹型網絡,從而避免報文在環路網絡中的增生和無限循環。環形網絡中所有站點組成環形連接,具有自愈特性。當環網上所有部件均正常工作時,交換機會通過RSTP協議自動設置斷點;當環網上一部件工作不正常形成開路時,網絡容錯機制能夠檢測到網絡故障,并連接自動設置的斷點,瞬時激活備用鏈路,使傳輸介質發生。
4.2開啟環路檢測功能
為了防止業務終端接入式故障影響整個網絡,交換機連接業務終端(如控制器、主機)的端口(以下簡稱業務端口)開啟了環路檢測功能。
端口環路檢測:為了能夠及時發現網絡中的環路,以避免對整個網絡造成嚴重影響,需要提供一種檢測機制,使網絡出現環路時能夠自動關閉出問題的端口以消除環路,這種機制就是端口環路檢測機制。當鏈路上存在環路情況時,最后會發現整個網絡中的所有的MAC地址都移動到了存在環路的端口上了(大多的情況是MAC地址頻繁在不同端口間切換),導致網絡癱瘓。在網絡中進行端口環路檢測非常必要。
4.3增加端口速率違背功能
為了防止RSTP協議失效,對特定交換機的互聯端口增加端口速率違背功能,輔助于RSTP協議,減少網絡中因故障引起的網絡震蕩和不穩定。如圖2所示的交換機端口上配置端口速率違背功能。
5結語
隨著我國工業化的快速發展,對DCS系統的要求要越來越高,DCS系統的應用使自動化儀表裝置向系統化,分散化,多樣化和高性能化的方向產生了一個質的飛躍,也大大促進了自動控制技術的發展。但在實際應用過程中,仍舊存在著一些問題,這些問題的存在對系統的整體運行的安全性、穩定性、可靠性產生了一定的影響,因此需加大對這些問題的重視和研究力度。本文通過介紹某品牌DCS系統的實際應用過程中發生的問題,提出了詳細的解決方法,經過驗證,效果改善明顯,有效避免了故障范圍的進一步擴大,對其他電廠的應用也具有非常實用的經驗價值。
參考文獻:
[1]魏東明 宋瑞蓮 王魯 淺談和利時DCS系統“域”的概念和應用,科技創新導報,2013,NO.04
[2] 蔣波 和利時DCS常見故障分析及解決措施,中國高新技術企業,NO.27.2016
[3] 劉一福 DCS通信網絡故障的分析及防范措施,華北電力技術,NO.9.2005
(中國核電工程有限公司華東分公司,浙江 海鹽 314300)