黃漢群
摘 要:霍尼韋爾公司研發的PKS系統是一種新型的集散控制系統,該系統能夠有效提升系統穩定性,并且相對有號、簡單的操作界面使得工作效率顯著提升。但KPS系統也并非完美,其在運行過程中也會出現各種問題,對工作進度造成一定影響。對此,本文對發生于KPS系統中的常見故障進行分析并提出處理措施,期為一線工作人員提供一定指導作用。
關鍵詞:霍尼韋爾;PKS系統;故障處理
PKS系統是基于Windows Server 2003服務器的集散控制系統,系統整體具有較強穩定性,能夠有效實現操作人員、資產管理、過程控制及經營的有機結合[1] 。PKS系統在運行過程中會出現一些常見故障,這些故障雖不會造成較大危害,但在一定程度上也會影響正常工作進度,故本文對此進行簡要分析。
1 常見故障一
系統中一對冗余控制器中的備用控制器出現故障,無法正常工作,當前控制系統處于單控制器運行狀態。在此情形下,若唯一處于運行中的單控制器出現故障,便會使所有控制點失控,進而導致裝置停車,嚴重者甚至對工作人員的生命安全造成威脅。因此,當遇到該問題時必須及時解決,將故障帶來的危害降至最低。
造成該故障的原因或有以下幾點:
(1)控制器內部電子元器件損壞;
(2)控制器底板電子元器件損壞;
(3)控制器底板保險燒毀;
(4)控制器底板24VCD母排電源接觸不良;
(5)控制系統中存在相同IP地址導致IP地址沖突而無法正常工作;
(6)服務器歸檔數據過于龐大,導致服務器內存量在極短時間內攀升至某一臨界點,導致控制器出現“死機”現象;
(7)主備控制器在外力干擾下出現切換而導致主控制器出現“死機”現象;
(8)操作人員非法操作故障控制器,致使故障控制器無法找到IP地址及服務器。
若該故障由上述原因導致時,需要采取相對應的處理措施:
(1)更換控制器;
(2)更換底板;
(3)更換保險;
(4)更換底板;
(5)使用Ctools軟件對IP地址是否產生重復進行檢查;
(6)重啟控制器;
(7)重啟控制器;
(8)對底板保險及元器件的接觸情況、控制器螺絲緊固情況進行檢查,并進行重啟。
2 常見故障二
PKS系統中存在兩種IOLink電纜,即紫色電纜與灰色電纜,兩種電纜用于區分開關量點與模擬量點[2] 。每種電纜又有兩根電纜與I/O卡件的底板相連接,在控制系統中的定義為“Channel_A”、“Channel_B”。“Channel_A”與“Channel_B”主要用于對兩根IOLink是否能夠正常工作的檢測,通常每隔3min進行一次切換,以此來避免單根電纜在較長時間工作后因另一根電纜的故障而無法完成檢測[3] 。在運行過程中,會出現兩根IOLink電纜中的一根發出錯誤率及報警,當數值累積到一定成熟后,“Channel_A”及“Channel_B”便無法完成每隔3min一次的切換,此時若另一根電纜也出現故障,便會導致所有I/O卡件中的數據全部丟失,嚴重者也會對工作人員的生命造成威脅。
造成該故障的原因主要有以下幾點:
(1)“Channel_A”與“Channel_B”的不斷切換會導致錯誤率及報警數值不斷上升,當數值上升到某一程度時,便會導致“Channel_A”與“Channel_B”之間無法完成自動切換;
(2)I/O卡件中的某個或多個回路出現過線路接地;
(3)I/O卡件底板上的“Channel_A”與“Channel_B”接觸不良或接觸點氧化;
(4)其中一根IOLink電纜出現短路等現象;
(5)回路電纜在輔助機柜內的接地出現問題;
(6)I/O卡件中某個回路被強電壓或強電流擊中,致使底板損壞;
針對上述原因,虛采取針對性措施:
(1)采取Reset Error對錯誤率及報警數值進行清除;
(2)采取Reset Error進行清除后觀察錯誤率及報警數值是否有增長;
(3)對IOLiunk電纜或底板進行更換;
(4)逐根檢查并更換損壞部分;
(5)對電纜接地是否滿足要求進行檢查;
(6)對IOLink電纜進行插拔操作,逐條排查導致錯誤率及報警數值上升卡件,找出問題部位后進行更換。
在由上述原因導致的故障及處理措施中,(1)、(2)(5)可在系統運行過程中進行檢查、處理,(3)、(4)、(6)則必須在系統關系期間進行處理。
3 常見故障三
一般情況下,中央控制室的操作員站只有一臺,工作人員在操作PKS系統過程中若過于頻繁,便會導致畫面切換出現明顯延時,這會在一定程度上對正常工作造成影響,若此時操作員站控制系統出現故障,便會對中控人員失去對操作現場的監督與指導,導致生產過程出現不確定因素,嚴重時會對設備及工作人員造成嚴重危害。即便操作員站系統控制不出現故障,畫面切換延時也同樣會對工作人員操作PKS系統造成較大干擾,無法滿足日常工作所需[4] 。
造成該故障的原因主要在于PKS系統廠家為節約成本在系統建設初期時采取DSA網絡結構進行網絡配置,中控臺接受到的數據及畫面要先通過中央控制室值班長服務器中轉。因此,一旦數據傳輸出現異常波動或數據持續運作時間過長,便會導致畫面切換延時、操作面板彈出慢等問題。
對于由該原因造成的故障,應采取以下步驟進行處理:
首先,中央控制室增加一臺操作站。當因數據傳輸而引發畫面延時后,若中央控制室操作站出現故障,便會直接失去對操作現場的控制。因此,應于中央控制室增加一臺操作站以作備用,確保其中一臺出現故障后另一臺能夠及時使用。新增操作站之前必須對整個FTE網絡鎖使用的IP進行檢測與分析,確保新增站臺所使用的IP未被使用,避免因IP地址沖突而導致其他故障。
其次,對FTE網絡進行整體優化。新增2臺新Cisco 2960交換機并對其進行組態及相關配置,時增加中央控制室機柜間至新操作員站之間的一對網線。
最后,實現新增站臺的正常運行。當中控操作員站與中央控制室之間的網絡優化完成之后,通過多次、反復檢測,確保新增站臺能夠正常運行。此舉能夠在出現故障三后有效將由故障引起的危害降至最低,也確保有足夠的時間對故障進行處理而不影響正常工作。與此同時,通過對新增站臺的FTE網絡優化,也有效解決了因數據傳輸而導致的畫面切換延時問題,極大提高了PKS系統操作人員的工作效率。
結語
隨著PKS系統運行時間的增加,其出現故障的可能性也隨之提升。本文僅就其中三個較為常見的故障進行分析并提出處理措施,旨在為指導一線工作人員更有效排除故障盡一份綿薄之力。但囿于筆者學識所限,并未找出故障出現的全部原因,所提出的處理措施也相對基礎,有待于學者進行更為深入的研究。
參考文獻:
[1] 梁恩泉,巨林倉,歐偉.Honeywell公司PKS系統簡介[J].儀器儀表用戶,2004,11(1):97-98.
[2] 吳偉.霍尼韋爾PKS系統的組成與維護[J].科技創新導報,2018,v.15;No.435(03):150+152.
[3] 劉成,徐繼友,張祥.淺談HONEYWELLPKS控制系統故障及處理方案[J].化工管理,2018(13):142-142.
[4] 邢艷萍,司源,王志海.HoneywellPKS系統運行中存在的問題及解決方案[C]//中國石油化工重大工程儀表自控技術高峰論壇.2011.
[5] 魯紅梅.霍尼韋爾ExperionPKS系統SCADA通信解決方案[J].自動化應用,2012(8):63-65.
[6] 魏正澤.基于PKS的空分裝置控制系統設計與應用[D].西安建筑科技大學.
(作者單位:中海石油化學股份有限公司)