李光
摘? 要:本文分析了某燃機電廠T3000控制系統PDS進程發生故障,導致新開畫面均為壞點,影響機組監視異常情況,并給出了處理辦法,對同類型的系統有一定的借鑒意義。
關鍵詞:T3000控制系統;PDS進程;監視異常
0 引言
某電廠建設有兩臺F級一拖一多軸布置的燃氣-蒸汽聯合循環熱電聯產機組。機島設備采用上海電氣電站集團引進德國西門子技術生產的SGT5-4000F(4+)型燃氣輪機;汽輪機上海汽輪機廠生產的超高壓、三壓、再熱、反動式、雙缸雙排汽、LZC140-13.0/1.2/555/550型抽汽凝汽式汽輪機。燃機和汽機的控制系統TCS,采用的是西門子的T3000控制系統。
1事件經過
2020年6月14日,5號機組正常運行。15:40,5號機組T3000新開的畫面均顯示壞點,不能正常監視,維護人員檢查發現PDS進程故障,16:50,完成處理,系統恢復正常。
2檢查處理
2.1 15:50,維護人員現場檢查情況如下:
(1)T3000報警信息為:“Connection to PDS lost!”,即PDS服務進程故障。
(2)5號機組T3000系統的交換機、服務器運行狀態、所有操作員站運行狀態正常。
(3)進入服務器桌面,檢查T3000所有進程和硬件運行狀態也全部顯示為正常,其中PDS服務進程PDS-§-1400,也處于RUNNING狀態。與(1)的報警存在沖突的地方,不能確定系統故障的原因。
2.2 機組處于高負荷運行狀態,AGC投入,雖然已開的畫面仍然能夠顯示機組的狀態,但新開畫面已不能監視,存在很大的安全隱患。為進一步確認故障原因,加快問題處理,立即聯系西門子廠家咨詢。
2.3 按照廠家意見檢查歷史曲線正常,檢查服務器運行正常,檢查邏輯運行正常。廠家根據檢查情況,結合以往案例的經驗,判斷故障原因確為PDS(Plant Display Server)進程卡死。
2.4 處理方法:除工程師站外,所有T3000人機接口退出T3000系統;重啟PDS進程,所有T3000人機接口重新開啟軟件客戶端并登陸。
2.5 16:50分,T3000所有畫面恢復正常。
3原因分析
3.1? T3000系統檢查,歷史曲線正常,服務器運行正常,邏輯運行正常。
3.2 日志文件檢查,結果如下:
服務器冗余運行無報錯;
操作系統正常運行,無異常記錄;
PDS日志文件顯示內存溢出(OutOfMemoryError),記錄如下:
2020-06-14 15:38:32,357 WARN? ? ?[READ-THREAD-SUBSCRIBER(0)[5]]com.pg.orion.basic.connect.ReadFromSocketThread? -Exception? in
run()? of ReadFromSocketThreadjava.lang.OutOfMemoryError: Java heap space
log4j:ERROR No appenders could be found for category (com.pg.orion.basic.config.Configuration).
log4j:ERROR Please initialize the log4j system properly.
Exception in thread "RenewLeaseThread - //127.0.0.1:1099/monitor/ServiceFactory/EventManager#ORIGINAL"
Java.lang.OutOfMemoryError: Java heap space
3.3 因此T3000畫面顯示程序PDS服務進程故障的原因是內存溢出(OutOfMemoryError)。
3.4 PDS進程作用為在工作站上進行畫面數據顯示,不影響服務器和下層網絡、DPU內邏輯的正常運行。因此故障期間只影響畫面顯示,未影響到機組運行。
3.5 目前PDS的內存分配設置為226MB,而5號機組共有4個工作站(兩臺工程師站,兩臺操作員站),目前每臺工作站可以打開10個畫面,如果長時間同時打開過多的畫面,會大量占用PDS的內存,有一定概率導致內存溢出,發生故障。
3.6 綜上,本次事件的原因為:長時間同時打開畫面過多,PDS內存溢出,服務進程故障,新開畫面失去監視。
4改進措施
4.1減少每臺操作終端打開畫面的個數,根據廠家建議,結合公司實際使用情況,限制每臺操作終端最多能打開5幅畫面。
4.2 加強工程師站T3000系統畫面管理:工作結束后,及時關閉打開的畫面。
4.3 利用機組檢修的機會,完成如下優化措施:
(1)增加T3000畫面顯示程序PDS的內存分配,從目前226MB增加至380MB。
(2)對T3000系統軟硬件進行隱患排查,安裝T3000軟件補丁,提高系統運行穩定性。將目前的T3000版本為07.1.11.11,升級至最新版本07.1.11.29。
(3)每年檢修檢修期間,T3000系統的維護時,將重啟T3000服務器軟硬件列為必做項目。
4.4 加強熱控專業人員技術培訓,深入的學習T3000控制系統原理及問題分析,提高T3000系統故障處理能力。
5結語
目前電廠的自動化水平日益提高,對控制系統得可靠性及運行維護人員的技術水平也提出了很高的要求,在做好日常檢查維護的同時,良好的工作習慣,合適的參數設置,高效的故障處理能力,也是保證機組安全的重要條件。
參考文獻:
[1]肖麗.西門子T3000型汽輪機組自啟動控制步序解析[J].設備管理與維修,2018.
[2]韓翔.T3000系統在火電廠西門子汽輪機控制中的應用[J].熱力透平,2012,41(3):236-239.
[3]鄭玲紅. 1000MW超超臨界二次再熱機組T3000系統應用分析[J]. 電力科技與環保, 2018, 34(06):22-25.