

摘要:介紹了DCS系統通信模件故障現象,針對不同的通信故障提出了不同的處理方法,有利于及時發現通信問題并做出準確判斷,防止事故進一步擴大,保證機組的安全穩定運行。
關鍵詞:Symphony系統;通信;故障;處理措施
0 ? ?引言
某電廠#1~#4機組ABB Symphony系統自2005年陸續投產至今存在一些通信故障,如單塊通信控制器NPM/NIS故障、主輔通信控制器NPM/NIS同時故障、環路異常中斷、通信版本不一致導致的信號翻轉等事件。本文對通信異常時通信模件故障進行了分析,并提出了機組運行期間DCS系統各種通信故障解決方法及處理措施。
1 ? ?單塊通信控制器NPM/NIS故障
每個PCU過程控制柜有兩對相互冗余的網絡接口模件——通信主模件(NPM12)和通信子模件(NIS21),當正在運行中的主通信模件NPM/NIS任一故障停運后,另一對輔通信模件NPM/NIS立即切換為主控制器,同時NPM及NIS故障狀態燈顯示相對應的故障代碼。通過查對常見的故障代碼及現象,便可基本判斷出故障原因及位置(表1)。
通信控制器故障時,一般用專用工具復位STOP/RESET按鈕,觀察NPM12中的狀態LED綠色且CPU LED的8燈亮,NIS21狀態燈綠色時,說明NPM12與NIS21處于熱備用運行狀態,可以隨時正常切換。當復位STOP/RESET按鈕無效,通信卡件仍然故障時,需要更換通信模件NPM/NIS;當確認通信模件是好的,但通信仍然故障時,需要逐步排查同軸電纜NKTL01-3、端子板同軸電纜NKTT01、連接電纜NKLS01甚至在線更換NTCL01端子板,在線更換NTCL01端子板時一定要記住更換順序,且工作時要細心謹慎,確認一路環路正常后方可更換另一路,避免整個環路斷開。
2 ? ?主輔通信控制器NPM/NIS同時故障
極端情況下,正在運行的NPM/NIS控制器異常,在迅速切換至另一對熱備用NPM/NIS時,可能由于冗余鏈異常、連接電纜異常、通信端子板異常等現象導致無法正常切換,此時主輔通信控制器NPM/NIS同時故障,PGP站中故障PCU柜內所有監視參數異常,造成控制柜內通信失去監視,運行監視人員失去畫面監視,柜與柜之間環路通信失去聯系,某些涉及重要保護的信號出現異常,嚴重時甚至會造成機組異常跳機。
2015年10月,#3機停機檢修期間,運行人員發現部分MCS畫面變成粉色,M22柜通信控制器NPM12報故障。熱控人員來到控制柜內看到主輔NPM12控制器狀態燈均變紅,查找故障代碼3、4、5、6對應原因是端子單元的繼電器或保險絲故障或電源出錯。通過重新復位故障NPM12,發現通信端子板NTCL01繼電器不停地吸合,然后NPM12繼續狀態燈紅;復位另一塊故障NPM12,M22柜通信恢復正常。因此,確認該通信端子板NCL01有異常,并更換一塊新的NTCL01。
事后熱控人員通過觀察#1~#4機通信故障檢修記錄,發現#3~#4機通信故障率較高,且其他電廠也出現過類似問題,經確認通信端子板NTCL01部分批次(THTJ09A0001~THTJ10J0200)存在質量瑕疵,端子板上的LED故障容易導致整個NTCL01異常。經統計,#3~#4機總共有55塊需召回的端子板,其中M22柜兩塊NTCL01都屬此批質量瑕疵的端子板,對機組造成了極大的安全隱患,因此利用檢修機會徹底更換了這批NTCL01端子板,通信故障率大大降低。
機組運行期間,若主輔通信控制器NPM/NIS同時故障,運行監視人員失去畫面監視,需立刻派人去現場將部分M/A硬手操站切至就地操作,并實時監視及匯報就地相關重要參數,熱控人員在做好足夠的事故預想及安全措施情況下,退出相應的保護及聯鎖,及時處理NPM/NIS異常現象,確保至少一對NPM/NIS通信模件工作正常,觀察無問題后再逐步處理和解決另一對NPM/NIS通信模件的異常,確保機組安全運行。
3 ? ?通信版本不一致導致的信號翻轉
(1)2009-05-01T07:14:39,#1機組在AGC—CCS方式運行,汽機#1~#4高壓調門及中壓調門突然快速瞬間關閉,經檢查初步判定原因為OPC保護輸出硬件回路中OPC保護繼電器動作或通信信號存在翻轉可能,并在機組停運期間取消了TPS02的端子板上的OPC和低壓遮斷TRIP的第四個繼電器輸出,防止OPC硬回路繼電器誤動作。
(2)2010-03-12T11:23:12,#1機組運行中#1~#4高壓調門及中壓調門突然關閉,約2 s后調門自動恢復正常,機組CCS切除、AGC退出、VV閥打開。由于關閉時間較短,未對機組負荷造成影響。經過排查分析,發現DEH控制邏輯中RUN AUTO開關量信號從2號控制器至4號控制器傳輸過程中出現了翻轉。
(3)2011-08-30T10:06:37,#1機組運行中#1~#4高壓調門及中壓調門突然關閉,DEH迅速切換到手動方式,約1 s后調門自動恢復正常,機組實際負荷從600 MW迅速降到200 MW后又返回至600 MW。經檢查,汽輪機調門關閉是DEH的調門嚴密性試驗信號發生翻轉所致(圖1)。
ABB Symphony這種DCS發生通信信號翻轉比較常見,同一個PCU過程控制站內,不同的BRC之間采用ControlWay進行通信,由于是偶發性的,比較難排除,但造成的影響卻是不容忽視的。為了保證機組的安全,盡量減輕信號翻轉造成的危害,采取以下優化措施:
(1)優化DEH控制器邏輯,梳理重要通信信號、汽機跳閘及其他重要保護類信號以及可能引起機組擾動的信號,尤其是BRC控制器之間的通信,采用可靠的三取二多重信號攝取方法,大大提高了各種重要通信信號的可靠性。
(2)梳理DEH控制器內某些重要功能或試驗性的通信信號,如主汽閥嚴密性試驗、高中主及調門活動試驗、噴油試驗及AST遮斷電磁閥試驗等,采用試驗信號與上機組并網信號或試驗投切按鈕信號進行屏蔽,防止信號異常翻轉現象而導致調門非正常情況關閉。
(3)減輕ControlWay的通信負荷,采用批量通信的功能碼來接收通信信號,即采用DIL/B來代替DI/B接收開關量數據,采用AIL/B來代替AI/B接收模擬量數據,這樣可以把ControlWay的通信負荷降低到原來的1/8。DIL/B或AIL/B可以用一個通信包傳輸8個信號,通信效率較高;而DI/B或AI/B一個通信包只能傳輸1個信號,通信效率低。
(4)對某些重要的通信信號增加質量檢測,當通信故障時,可以采用暫時保持1~2個通信周期的方法,以應對通信的翻轉。
(5)對DCS系統的ControlWay進行徹底的檢查測試,檢查MMU底板電壓、ControlWay通信線電壓、通信處理模件NPM等,排查ControlWay通信在硬件上可能存在的問題。
(6)對DCS系統進行通信測試、環路檢查、切換試驗、接地電阻檢查、網絡風暴測試、操作員站電腦升級及PGP軟件升級等,增強過程控制站及操作員站響應速度及數據處理能力。
(7)目前NPM12最穩定的通信C.W版本為A2(9D49),在相關ABB控制系統事件報告中仍然多次出現過通信開關量信號翻轉、通信上環點數值異常、通信負荷率高、通信模件故障率高等情況,這是因為NPM12通信本身版本存在缺陷。目前NPM22版本C.W為A4(6D18),是NPM12處理能力的4倍、整體性能的2倍,將控制器BRC300/BRC400的版本升級至M7,C.W為6D18(A4),系統抗干擾能力大大加強。#1~34機NPM12升級改造為NPM22后,到目前為止已運行5年以上,未見到任何通信異常現象。
4 ? ?結語
ABB Symphony控制系統對環境是有一定要求的,因此,要盡量做好電子室的溫度/濕度控制、防塵工作,同時機組檢修期間要做好電源、BRC、NPM通信網路的冗余切換工作,排查各種隱患,減少通信各環節出現故障的概率,避免處理DCS系統故障時誤動作,防止異常現象導致事故擴大,確保機組安全穩定運行。
[參考文獻]
[1] ABB公司培訓中心.Symphony系統操作手冊[Z],2002.
[2] 浙能技術研究院.浙能集團機組DCS運行、維護專題研討會資料匯編[Z],2014.
收稿日期:2020-07-28
作者簡介:楊雙朋(1982—),男,湖南益陽人,熱能動力工程工程師,主要從事大型火力發電廠熱工設備的管理與檢修工作。