盧 剛,肖 靜,段建軍,楊曉濱
(山東電力集團公司檢修公司,山東 濟南 250021)
當前,隨著我國電力工業快速、持續的發展,各省級電網也得到了長足發展,超高壓電網500 kV變電站的容量和規模不斷增大,變電站綜合自動化技術得到了廣泛的應用,其對電網的生產、運行、維護產生了積極而深遠的影響,并且隨著技術的進步而得到不斷完善和發展。目前,山東省內正在運行的29座500 kV變電站全部采用了綜合自動化計算機監控系統。2009年10月建成投運的500 kV聞韶變電站就采用了基于IEC61850標準協議的分層分布式變電站綜合自動化系統。結合該站綜合自動化系統的主要結構和功能特點,對該站發生的一起典型的數據停止更新的故障進行了深入分析,提出了反措和改進建議。
500 kV聞韶變電站是山東電網500 kV網架的重要組成部分,主要承擔著與山東主網聯系和功率交換的任務,是山東500 kV主網架中重要的樞紐變電站。該站500 kV電氣主接線采用3/2接線,500 kV出線6回;220 kV主接線為雙母線雙分段接線,220 kV出線16回;35 kV系統采用單母線接線。該站主變容量為4×750 MVA,采用三相一體自耦變壓器;500 kV,220 kV設備均采用GIS設備;35 kV設備采用敞開式設備;保護、監控及自動裝置全部微機化并下放至就地保護室。
該變電站采用基于UNIX平臺的NS2000變電站綜合自動化系統。該系統在硬件架構上遵循面向對象的設計思想,采用分層、分布式網絡結構,按橫向分為500 kV,220 kV,35 kV以及主變壓器部分,按縱向分為站控層、通信層和間隔層3層。在軟件架構上,采用組件對象模型(COM)技術和面向對象技術進行系統設計,軟件采用C++、TCP/IP、OLEDB、SQL、DCOM、ActiveX等,具有良好的開放性。
該變電站應用基于IEC61850的通信規約體系,實現保護信息和控制信息等的數字化通訊控制,使整個變電站的保護自動化系統提升到一個較高的水平,能滿足未來系統全信息化和升級方便的需求,并適應未來若干年系統運行要求及電力系統信息化改造的要求,同時使系統易于擴展升級。500 kV聞韶變電站的綜合自動化系統結構如圖1所示。

圖1 500 kV聞韶變電站綜合自動化系統的結構
500 kV聞韶變電站自2009年建成投運以來,其計算機監控系統一直運行正常。2012-08-31T01:03,變電站運行人員發現該站監控后臺所有母線電壓、線路負荷等遙測數據均為零,2號、3號主變及220 kV所有線路光字牌閃爍,實時告警報文停止上傳更新。變電站運行人員重啟工作站后,仍未解決問題。隨后,聯系監控系統廠家,在廠家指導下檢查1號與2號服務器的通訊程序engine進程后,判斷為2號服務器的engine無法啟動。運行人員將2號服務器關機后,站內操作員工作站數據恢復正常刷新。2012-09-01 T08:30,廠家技術人員到達現場對2號服務器開機啟動,發現engine啟動時需調用到的libacsi.so文件丟失。將該文件恢復后,可以啟動2號服務器的engine進程,啟動后檢測2號服務器的運行數據一切正常,站內所有監控恢復正常。
該站計算機監控系統主網采用單/雙10/100 M以太網結構,通過10/100 M交換機構建,SCADA功能采用雙機冗余熱備用,完成網絡數據同步功能。在監控后臺服務器主程序中,engine程序是服務器用于站內設備通訊的主進程。在engine啟動過程中需要調用系統目錄/NS2000/lib/中的libacsi.so文件,在engine啟動之后則不會再調用該文件。
從2012-08-31凌晨聞韶站監控后臺現場出現的情況來分析,2號服務器因為某些意外造成了engine進程的退出。這些意外包括機器意外掉電,或進程從網絡上收到因誤碼等原因導致的錯誤報文等。而服務器的監護進程監測到engine進程退出后立即自動重新啟動engine進程,此時engine進程因為讀不到有效的libacsi.so文件導致啟動失敗,造成2號服務器實時數據無法正常更新。此前,1號服務器一直都是運行正常的,操作員站讀取的是主服務器的數據。當2號服務器進程啟動異常后,無法判斷出網絡中已存在主服務器,故運行狀態由備服切為主服。操作員工作站隨即去讀取網絡中新的主服務器(即2號服務器)的數據,從而造成了操作員工作站遙測遙信都不刷新的情況。
在操作員站數據不刷新的這段時間,1號服務器本身的數據一直都是正常的,且自己作為主服務器在運行,因此網絡上出現了2臺主服務器,而操作員站讀取的是網絡中最新升為主服務器的2號服務器的數據。故障情況發生后,運行人員在廠家技術人員的指導下,在關閉2號服務器,操作員站重新尋找網絡中的主服務器即1號服務器,并正確讀取到1號服務器的數據之后,數據更新就恢復正常。而2號服務器系統目錄/NS2000/lib/中的libacsi.so文件的丟失,則有可能是由于系統程序錯誤或維護人員誤刪除所導致。
聞韶站計算機監控系統2號服務器發生軟件故障,導致運行人員在故障當日凌晨對全站設備失去監控,暴露出該站計算機監控系統本身在主備機切換機制方面存在設計缺陷以及變電站在運行管理上存在問題。因此,必須在對故障進行深入分析的基礎上采取積極有效的預防措施。
(1) 聞韶站計算機監控系統主網雙網配置的目的是完成負荷平衡及熱備用雙重功能。在雙網正常的情況下,雙網以負荷平衡工作,保證實時系統的可靠性,而SCADA服務器負責整個系統的協調和管理,保持實時數據庫的最新最完整備份,負責組織各種歷史數據并將其保存在歷史數據庫服務器中。理論上,當某一臺SCADA服務器故障時,系統將自動進行切換,切換時間小于30 s。當出現聞韶站所發生的某臺服務器進程啟動異常后無法判斷出網絡中已存在主服務器并自動將運行狀態由備服切為主服的情況時,監控系統應增加心跳機制的邏輯判斷。一旦在網絡中出現2臺主服務器的情況,就自動打開終端窗口并啟動STOP命令,強制停止其中1臺服務器的進程,確保網絡中始終只有1臺主服務器。同時,系統還應增加自監測功能,提供相應的告警提示給運行人員,使其能對計算機系統的安全與穩定進行在線監測,能夠在線診斷系統硬件、軟件及網絡的運行情況,一旦發生異常或故障應立即發出告警信號并提供相關信息。
(2) 聞韶站計算機監控系統的硬件布局方案,是按照《國家電網公司輸變電工程500 kV變電站二次系統部分典型設計》要求設計的。計算機監控系統的服務器和操作員工作站采用機架式服務器,組屏(柜)布置,放置于計算機通信機房,服務器在屏(柜)上設置維護用機架式顯示器,操作員工作站經KVM延長器的方式延長至主控室。這種方式下,運行人員在主控室只能查詢和維護操作員工作站的內容,而無法掌握服務器的運行情況。當主控室內操作員站顯示器數據不刷新時,站內運行人員就會誤以為全站數據中斷。如果運行人員能夠在主控室監視到服務器的信息,就不會導致對監控系統的運行狀況發生錯誤判斷。因此,計劃對該站計算機通信機房內的監控系統服務器屏進行改造,通過2臺服務器KVM延長的方式,將其顯示器放置于主控室,使運行人員能夠全面掌握監控系統的運行工況,解決因服務器發生問題而操作員工作站不能監盤和及時消缺的問題。
變電站是電力系統中不可缺少的重要環節,它擔負著電能轉換和電能重新分配的繁重任務,對電網的安全和經濟運行起著舉足輕重的作用。隨著數字化變電站技術的不斷創新和發展,對變電站計算機監控系統的可靠性與穩定性、保障實時數據的準確性和及時性都提出了越來越高的要求。變電站綜合自動化系統不僅要滿足站內值班監控的要求,還要滿足各級調度部門對信息的實時性、準確性的要求,以及“大運行”體系下集控建設對站內設備控制和操作的可靠性要求,所以監控系統的技術方案設計以及信息流的合理流向問題都是需要進一步研究和探討的課題。