王 勇,馮雙雙,王宇宙
(兗礦國宏化工有限責任公司,山東 鄒城 273512)
DCS和ESD之間通訊故障導致氣化爐停車原因分析及處理
王勇,馮雙雙,王宇宙
(兗礦國宏化工有限責任公司,山東鄒城273512)
【摘要】隨著科技的發展,自動控制系統推動了工業發展。時至今日,大型化工生產對自動控制系統依賴程度達到前所未有的高度。一旦控制系統發生故障將會嚴重影響系統安全。本文通過一次控制系統故障,詳細介紹了事故發生的原因,問題排查的過程以及采取的措施,提高了自動控制系統穩定性。
【關鍵詞】ESD;DCS;自動控制系統
某公司德士古水煤漿加壓氣化控制系統采用的DCS(Distributed Control System)為ABB的industrial分散控制系統。該系統采用全局數據庫編程技術以實現全局一體化編程。緊急停車系統ESD(Emergency Shutdown Device)系統為德國HIMA公司的大型PESHS系統。在運行過程中因硬件故障等原因多次發生故障,嚴重時造成全系統停車。下文記錄了一次因DCS于ESD之間通訊中斷造成氣化爐停車的事故經過、處理過程以及所采取的措施。
2013年11月29日8時20分A#氣化爐因“氧煤比高高”聯鎖觸發跳車。跳車后DCS流程畫面仍然顯示A#氣化爐系統處于開車運行狀態。儀表值班人員立即對控制系統進行檢查,發現DCS系統和ESD系統之間的通訊出現嚴重的遲滯。在查找通訊遲滯問題過程中,B#氣化爐于11月29日08:25跳車,跳車信息ESD系統SOE記錄為no communication記錄。公司領導和儀表車間相關負責人到現場展開全面檢查,發現DCS和ESD之間的通訊狀態為:A#氣化爐與ESD的數據通訊完全中斷,B#和C#氣化爐與ESD的數據通訊延時時間約為5分鐘(正常時間為5秒左右)。
事故發生后,儀表車間相關負責人對所有硬件和軟件記錄信息仔細檢查和分析,并且采取了以下措施進行問題排查:
1)對DCS系統中的專用通訊控制器AC9進行冗余切換,排查是否是因為主控制器通訊故障,結果顯示兩冗余控制器不存在硬件故障,通訊故障未消除;
2)對所有的通訊接口的端子進行重新壓接、緊固,通訊故障未消除;
3)對AC9控制器進行斷電,重新上電自檢啟動,通訊故障未消除;
4)對AC9程序重新進行了整站下載,故障未消除;
5)對ESD系統每對控制器均進行了掉電后重新上電處理,通訊故障未消除;
6)對ESD系統每對控制器均進行了程序的重新整站下載,通訊故障未消除;
7)因DCS診斷軟件顯示AC9控制器通訊負荷為100%,嚴重超標,因此將AC9控制器下的其他通訊負載(氣化爐表面熱偶通訊、氣化質譜分析儀通訊)全部斷開,只保留ESD系統的通訊,通訊故障未消除;
8)從DCS的AC9控制器至ESD系統重新敷設一根MODBUS電纜,脫開原通訊電纜,對單套系統之間進行獨立通訊,通訊故障未消除;
9)將ESD系統至DCS AC9的通訊接頭更換為新的通訊接口,通訊故障未消除。
10)借鑒兄弟單位處理此問題的經驗,將CPU掉電并拆除CPU電池,徹底清除FLASH存儲,并重新進行程序的整站下載,通訊故障仍然未消除。
11月29日ABB和HIMA的工程師對各自系統進行內部通訊測試,DCS工程師通過MODBUS通訊測試專用軟件對DCS的內部通訊數據進行發送和接收測試,測試表明AC9控制器自身通訊狀態正常;ESD工程師通過MODBUS通訊測試專用軟件對ESD系統每個CPU進行通訊測試時發現:(1)A套ESD系統兩個冗余的CPU上的MODBUS接口通訊故障,無法響應發送和接收數據的請求;(2)B套ESD系統兩個冗余的CPU上的MODBUS接口通訊正常,完全響應發送和接收數據的請求;(3)C套ESD系統兩個冗余的CPU其中一個的MODBUS接口通訊故障,無法響應發送和接收數據的請求;(4)D套ESD系統兩個冗余的CPU上的MODBUS接口通訊正常,完全響應發送和接收數據的請求。隨后,在ESD系統上將MODBUS接口故障的CPU脫開,測試至DCS通訊,通訊恢復正常。經比對測試結果,最終確定此次通訊故障的根本原因為:在ESD至DCS的通訊鏈路中出現了三個故障點,造成了數據通路中涌現出大量故障診斷數據,并重復診斷,這些數據極大地占用了數據通訊通路,引起了數據擁堵,系統之間正常的數據交換變得非常遲滯,出現了通訊等待、延時的情況。
1)ESD系統通訊模塊故障,引起ESD至DCS之間的通訊故障,造成系統之間的數據不能正常傳輸,導致B#氣化爐跳車,引起后系統停車,是發生事故的直接原因。
2)系統停車大修期間未對DCS和ESD系統的通訊狀態和接口、線路、模塊進行檢測,點檢不全面、檢查不徹底,未要求廠家對DCS系統與ESD系統之間的MODBUS通訊模塊及其線路進行測試,僅對自身控制器冗余切換做了相應的測試,是發生事故的又一重要原因。
1)強化車間責任落實,積極整改儀表缺陷。儀表車間加強日常巡檢的管理,確保及時發現并處理儀控故障,計算機班巡檢人員要對控制室機柜間CPU運行狀態、風扇運行、機柜溫度濕度、IO卡件狀態、UPS輸出狀態等內容進行全面監控。
2)加強隱患排查治理工作力度,確保系統安全穩定運行。利用計劃停車機會將四套ESD至DCS的通訊完全分開,相互之間不再影響、制約。全面排查生產系統存在的問題、缺陷,制定改進措施,提高生產系統的穩定性和可靠性,計劃制定ESD系統單獨配置上位機軟件方案,將ESD系統開、停車所需要顯示的參數、畫面通過ESD專門的軟件繪制出來,并在操作臺獨立顯示、控制。
控制系統作為當今大型工業生產的一部分,它的穩定與否直接關系到系統能否安全穩定長周期優化運行。對控制系統的維護保養顯得尤為重要。在日常工作中總結經驗,摸索規律,不放過任何一個異常情況,及時發現異常點并進行有效處理。
【參考文獻】
[1]蘇春等.數字化設計與制造[J].機械工業出版社,2010第一版.
【作者簡介】
王勇,男,本科,助理工程師,從事空分行業5年,調度工作3年。