陳德林
(海南核電有限公司,海南昌江 572733)
昌江核電廠集散控制系統(DCS,Distributed Control System)采用的FOX-BORO 公司的I/A 系統,為電廠過程控制層,其他控制系統通過網絡與DCS 進行信息傳送,并將其他系統控制、監視參數通過DCS 傳送至主控室。汽輪機數字電液調節系統(DEH,Digital Electronic Hydraulic Control)采用艾默生公司的Ovation 系統,主要用于汽輪機的控制、保護及監測。DEH 與DCS 通信正常與否對汽輪機正常運行有直接影響,在機組安全穩定運行過程中具有重要意義。
DEH 與DCS 之間的通信故障頻繁發生,直接影響操作員對汽輪機相關系統的監視及控制,進而影響機組安全穩定運行。為滿足操作員能實時、準確、可靠地對汽輪發電機的監測、控制和操作,DEH 與DCS 之間存在大量的數據通信。因此,確保DEH 和DCS 之間網絡通信、數據收發暢通尤為重要。基于昌江核電廠DEH 與DCS 系統之間存在的通信故障問題,研究如何準確定位DEH 與DCS 通信故障癥結及制定相應的處理方案。
DCS 通信部件主要包括FBM233(DCS 的通信卡件)和G427UC(DCS 通信控制器)。DCS 內部通信采用容錯機制實現,I/A Series 系統Mesh 網絡采用冗余機制,通過冗余線連接實現數據同步。當控制指令下達時,由服務器發給主控制站,主控制站通過冗余線將指令傳送給從控制站,主從控制站進行數據同步、同時分別輸出。接收第三方數據時,只有主站數據上傳進行運算,從站數據不上傳、不參與邏輯運算(僅作內部主從站之間的數據同步、運算)。兩個控制站一個為主站時,另一個默認為從站。
DEH 通信部分主要包括DROP(DEH 的控制器,相當于DEH 的大腦)、ELC(以太網連接控制器,DEH 的通信卡,通過該卡件對通信數據進行解析及傳輸)。DEH 與DCS 通信建立是通過以太網連接實現,DEH 與DCS 通信原理如圖1 所示。

圖1 DEH 與DCS 通信原理
根據TCP/IP 網絡協議,通過以太數據網實現DCS 側控制站與Ovation 系統服務端被控側之間的通信,兩者相互進行數據收發。由于DCS 側控制站與Ovation 系統服務端被控側都使用固定的端口號,因此每一個TCP 地址由一個IP 地址和一個端口號組成,確保數據傳送的正確性、可靠性、唯一性。
昌江核電廠1#、2#機組DEH 與DCS 通信故障頻繁發生,故障出現時主控畫面汽輪機相關的參數全部顯示為0 或是保持某一數值不變,嚴重影響操縱員對汽輪機實時狀態的監視、控制,儀控人員經常被主控On Call 去現場緊急處理通信故障問題。
收集某年5—10 月昌江核電廠1#、2#機組DEH 與DCS 通信故障總次數31 次,平均每月故障次數5.2 次。
為了找出通信故障根源所在,對收集數據采用分層法進一步分析。分別從電源波動、通信設備離線、控制器死機等方面進行分析。結果表明DEH 與DCS 之間通信故障主要出現在通信設備離線上,占比高達87.1%,因此認為DEH 與DCS 通信故障次數高的癥結在于通信設備離線。
針對DEH 與DCS 通信故障癥結在于通信設備離線,從人、機、料、法、環等方面進行剖析,采用頭腦風暴法,找到影響癥結的12 個末端因素,并繪制出因果分析圖,因果分析如圖2 所示。

圖2 因果分析
根據因果分析圖,通過現場測量、試驗、論證對比及調查分析等方式,針對影響通信設備離線的12 個末端因素進行逐條驗證和確認。
(1)安裝人員不按圖紙安裝。根據設計圖紙的安裝要求對現場DCS 機柜內安裝情況進行檢查,發現柜內的卡件、接線端口、布線要求等與設計圖紙一致,安裝正確。因此,判斷該因素為非要因。
(2)通信點名設置不正確。組織儀控人員對DCS 所有通信點名進行檢查,核實確認現場所有的通信點名不存在設置不正確的情況。因此,判斷該因素為非要因。
(3)FBM233 軟件版本低。現場檢查,FBM233 當前軟件版本為1.32/0304 版本,而最新版本為1.36.4/0420 版本。對FBM233兩個軟件版本進行試驗發現最新版本軟件在通信性能優勢更明顯、通信設備離線次數更少。試驗結果表明,軟件版本的高低對癥結影響大,因此,判斷該因素為要因。
(4)掃描周期設置錯誤。授權人員進入ICC 組態軟件中,檢查通信掃描周期的參數值為0.5 s,同步對比其他第三方通信正常的系統其掃描周期均為0.5 s、同時廠家答復掃描周期設置
(5)超時時間短。授權人員檢查通信故障系統超時時間參數(T0)設置為默認值0.5 s,并檢查其他三方通信正常的系統其超時時間參數值在2~3 s。因此懷疑通信設備離線與超時時間短有關。通過查閱資料、調研同行電廠、選取僅超時時間設置不同的通信設備進行試驗。試驗結果表明,超時時間設置長短對通信設備離線次數有影響,當超時時間設置越短時,通信設備離線次數越多。因此,判斷該因素為要因。
(6)FBM233 故障。通過總結已往通信故障現象、經驗反饋,發現當FBM233 出現故障時通信故障次數明顯增多。FBM233是DCS 側通信卡件,冗余配置。根據現象猜想:FBM233 故障對通信設備離線有影響。通過試驗發現當其中一個FBM233 出現故障時,通信設備離線次數高達6.7 次/月,明顯高于兩個FBM233 無故障時的1.5 次/月。因此,判斷該因素為要因。
(7)FBM233 使用年限超期。經檢查發現目前現場使用于DEH 與DCS 通信卡件FBM233 出廠時間分別2016 年10 月15日和2017 年01 月15 日,而該設備使用壽命一般為10 年,不存在FBM233 使用年限超期問題。因此,判斷該因素為非要因。
(8)FBM233 插針斷裂。對目前現場使用于DEH 與DCS 通信的兩塊FBM233 卡件進行檢查,經工作負責人、監護人、QC 人員三方共同確認。FBM233 插針未有斷裂現象,所有插針均完好無損。因此,判斷該因素為非要因。
(9)文件要求的FBM233 版本錯誤。FBM233 廠家(FOXBORO)提供的用戶指南中要求FBM233 版本為最新版本,滿足技術規格書要求。因此,判斷該因素為非要因。
(10)DCS 通信機柜圖紙錯誤。經核實,DCS 通信機柜圖紙均為最新版本D 版。同時對比電廠RGL(棒控棒位系統)、其他第三方與DCS 通信的DCS 機柜圖紙,未發現DEH 與DCS 通信機柜圖紙錯誤的情況,且其他第三方設備與DCS 通信未出現通信故障的情況。因此,判斷該因素為非要因。
(11)DCS 通信機柜溫度高。對現場DCS 通信機柜溫度實時測量,對一年內通信機柜溫度測量數據進行統計分析。結果表明,DCS 通信機柜環境溫度平均值、最高值、最低值均在5~35 ℃,均滿足通信機柜所要求的溫度(正常溫度范圍內(5~35 ℃)規定。因此,判斷該因素為非要因。
(12)DCS 通信機柜濕度高。對現場DCS 通信機柜濕度實時測量,對一年內通信機柜濕度測量數據進行統計分析。結果表明,DCS 通信機柜環境濕度平均值、最高值、最低值均在45%~65%,均滿足通濕機柜所要求的濕度(正常濕度范圍內(45%~65%)規定。因此,判斷該因素為非要因。
通過逐條要因驗證確認,最終確定影響DCS 與DEH 通信設備離線故障要因有3 個:①FBM233 軟件版本低;②超時時間短;③FBM233 故障報警。
(1)針對FBM233 軟件版本低:①先跟廠家溝通明確FBM233軟件對版本規定,做好版本升級前的工作準備;②現場實施FBM233 軟件升級操作;③確認已將FBM233 軟件升級到目標版本;③跟蹤觀察軟件升級后通信故障次數是否減少。
(2)針對超時時間短。根據要求:超時時間設置需兼顧靈敏度(指通信出現故障時,系統判斷故障的快速性、準確性、穩定性)。①通過試驗發現靈敏度、超時時間、通信故障次數三者之間的內在聯系;②綜合評估超時時間、靈敏度、通信故障次數三者關系,選擇最優值超時時間數值;③現場實施超時時間參數修正;④跟蹤觀察超時時間參數修正后通信故障次數是否減少。
(3)針對FBM233 故障報警。通常消除FBM233 故障報警的方法有:①硬件重啟;②軟件重啟;③卡件更換。通過對三個要因的對策實施,昌江核電1#、2#機組DEH 與DCS 通信故障次數大幅度降低,達到≤1 次/月。提高設備運行的可靠性,避免操縱員監視畫面頻繁出現故障報警,減輕操縱員的壓力,為機組安全穩定運行提供有力支持。
為滿足操縱員能實時、準確、可靠地對汽輪發電機的監測、控制和操作,保障DEH 與DCS 之間大量的數據通信,因此,確保DEH 和DCS 之間網絡通信、數據收發暢通,就顯得尤為重要。基于昌江核電項目,就Ovation 汽輪機保護控制系統與DCS系統通信故障次數高問題開展研究,對影響通信故障因素進行要因驗證及確認,根據要因癥結制定處理方案。