李文學
(黃河鑫業有限公司,青海 西寧 810000)
分布式控制系統主要是基于現代計算機技術的應用對生產過程進行集中監視、管理、操作和分散控制[1]。該系統從構成上來看,作為縱向分層和橫向分散的控制系統,以多層信息網絡作為基礎,將分布于全廠內的控制設備信息數據處理連接起來,實現不同信息共建共享,并完成管控與決策。該系統運行過程中難免受到一些不良因素的影響,因此加強系統運行維護管理至關重要。
運維管理初期,應當全面熟悉DCS系統的構成架構。比如,XDPS系統由DPU、高速實時信息數據網和MMI組成,需熟記系統構成和相關設備,提高維護管理效率。要清楚各模塊功能,全面了解外部接線圖,清晰認知DCS內部數據流向和處理流程。實踐中,還應當熟悉DCS各模塊及地儀表的運行和故障狀態指示燈代表的意思,準確掌握各儀器設備的性能,便于及時發現和處理故障問題[2]。DCS軟、硬件備份也非常重要,硬件備份應當以易損部位為重點,如BCNET卡和DPU模塊等。軟件備份過程中,應當針對操作系統、DPU組態和歷史數據庫等定期備份,確保備份的多樣性。此外,要注意收集整理資料,包括硬件、軟件和廠家聯系方式等相關信息資料,便于系統維護過程中節約時間,使維護工作更具針對性。
實際中,既要做好各項準備工作,又要加強系統運行和停運兩個環節的維護與管理工作。
在DCS系統運行過程中,因機柜下層為電纜夾層,情況復雜且容易出現鼠害問題,所以應將機柜下的電纜入口封死,并且在機柜中放置一些粘鼠板或放置毒鼠藥物。系統運行時,應當注意故障卡件的更換。新卡件應當用防靜電袋進行包裹,防止人直接用手接觸相關元器件造成不利后果。在卡件更換過程中,應當做好防靜電處理,必要時應帶上防靜電手環,注意在卡件更換前對跳線地址進行確認[3]。實際運行過程中經常會出現測點跳變問題,多數情況下是因為就地接線端子松動或DCS機柜端子板通道受到損壞,也可能是因為強電磁干擾。因此,需嚴格檢查信號線屏蔽和接地狀況,確保信號線與干擾源保持一定的距離。實際運行過程中,應當注意對組態的優化處理,提前備份好組態并做好記錄。運行過程中,DCS系統應當對電腦磁盤進行檢查,尤其要檢查空余容量,優化整理磁盤,及時清除沒有價值的數據信息,同時定期將歷史數據導入移動硬盤予以保存。在系統運行過程中,還要定期檢查操作人員的權限,特別是網絡端口位置的配置情況,嚴格管理工程師授權,嚴禁非熱控人員擅自登錄并修改組態。
在DCS系統停運后,按照規程和要求清理DCS機柜和卡件中的清灰,并及時更換運行過程中不能更換的元件。要對操作員站、工程站內的電腦清灰,并且給CPU涂抹散熱硅脂,確保計算機正常運行。停機后,檢查各機柜、UPS和電源模塊供電,處理好低電壓電源模塊,必要時對其進行更換處理。對機柜內部的DPU、卡件和網絡進行冗余測試,詳細記錄冗余測試結果[4]。檢查DCS系統接線及插頭的牢靠性,防止出現虛接問題,緊固處理易松動之處。檢查機柜散熱風扇的實際運行情況,更換存在故障及老化而影響散熱效果的風扇。測量接地電阻,確保機柜接地銅排到大地的接地電阻不超過2.5 Ω。
系統停運后的維護管理過程中,需特別注意以下幾方面問題。在對DCS系統進行停電檢修前,確認生產設備停運且整個組態信息已保存完好,待停電手續完全辦理后再嚴格按照順序進行操作。先依次使單個電源停止工作,然后總電源停止工作。切忌隨意停總電源。清灰處理是應用干燥的壓縮空氣確保無水和無油污,壓力保持在0.05 MPa。清灰時所用的吸塵器應具有較大吸力,能及時吸走揚塵。在DCS機柜檢修過程中,防靜電處理也非常重要,而帶好防靜電設備及人體事先進行放電非常重要。同時,盡可能避免碰觸卡件上的電路部件,拆卸的卡件應當置于防靜電墊子上。DCS機柜中的電源模塊很容易發熱和老化,且容易產生電壓不足等問題,因此在對其進行清洗時,應先去掉觸頭上的銹蝕,然后清洗電源背板和接線處。實踐中若無法有效解決上述問題,則建議更換電源模塊。清理完畢卡件上的灰塵回裝至機柜槽位內時,一定要確保編號無誤,同時檢查卡件連接電纜插接是否到位,確保其牢固不松動[5]。機柜散熱扇清理過程中,應當更換轉動不靈活的散熱風扇。檢修工作完成后,嚴格按照規定進行通電測試,檢測各等級輸出電壓是否正常,尤其是DPU及卡件的狀態是否正常,并檢查切換功能是否正常。
2.3.1 系統現狀概述
某廠在運機組全部采用DCS控制系統,其中一些DCS系統已經實現了機組運行參數顯示、故障保護停車和聲光報警功能,同時實現了數據庫、自控控制邏輯組態、歷史信息查詢、數據顯示畫面和故障順序記錄等功能。2018年度1月份對上述各機組運行故障進行統計記錄,數據顯示DCS控制系統故障率最高可達0.56%,平均故障率0.4%。隨著系統規模的擴大及用時延長,控制系統中的問題逐漸暴露,如通信故障、組態文件信息丟失和無故監控畫面退出等。為此,需對DCS系統運行過程中的各種故障問題進行分析與處理,使故障發生率從0.4%下降至0.1%。
2.3.2 維護管理方案
第一,無故監控畫面退出。出現這樣的問題,主要是因為軟硬件兼容性差,系統物理內存與虛擬內存經長期運行,導致內存空間占用增大,使內存空間變小或者不足導致系統退出。也可能因為系統盤空間相對較小,在長期運行過程中導致磁盤碎片數量增大,導致文件讀取所需的時間增加,監控系統因此而退出。此外,如果操作人員進行非法操作,也會導致監控系統自動退出;周圍環境溫度過高或濕度太大,也會導致監控畫面無故退出。對于這一故障,應當從以下幾個方面著手。首先,每隔2~3個月對操作站進行一次除塵處理,優化設計除塵檢修方案,確保操作站硬件的清潔性,降低故障發生率;其次,清掃操作站時應當利用系統磁盤碎片整理程序整理磁盤,以此消除碎片;最后,對操作人員加強教育培訓,使他們能夠全面了解操作知識和技能。同時,要定期改變組態文件的存放分區,以免硬盤因系統長期讀寫和分區而損壞硬盤。
第二,組態文件丟失。究其原因,主要是系統控制站運行時間較長,后備鋰電池基本失效,當電源箱供電出現故障問題時,可能會導致組態數據丟失。對于這一問題,應當定期檢查與更換后備鋰電池,并利用系統大修契機制定有效的技術措施,全面監測與檢修供電系統。
第三,通信故障。系統采用的是共享式以太網,主要問題是用戶共建共享帶寬,各用戶的實際可用帶寬隨網絡用戶的增加而遞減。當網絡負荷相對較大時,會導致數據信息沖突而導致數據阻塞,嚴重威脅控制系統的安全運行。針對這一問題,應當升級DPU硬件通信卡,優化升級DCS通信網絡交換機和DCS軟件通信協議等。
經過對DCS控制系統的全面管理,從機組DCS系統運行狀態檢驗效果來看,未發生無故監控畫面退出問題、數據無法刷新以及通信故障。
DCS系統運行維護與管理關系著電廠的整體穩定性,維護工作應當落實到過程中,做到防患于未然。