摘" 要:過程層作為智能變電站系統中的主要結構,由于存在較大的數據流量,容易導致網絡風暴故障的出現,對設備安全和信息傳輸造成威脅。文章將對智能變電站及過程層網絡風險進行分析,探索智能變電站過程層網絡風暴的故障解決辦法,對項目實施的效益進行預測并分析其應用前景。
關鍵詞:智能變電站;過程層;網絡風暴故障;解決辦法
中圖分類號:TM76 文獻標志碼:A" " " " "文章編號:2095-2945(2021)13-0105-03
Abstract: As the main structure of the intelligent substation system, the process layer is easy to lead to network storm failure due to the large data flow, which poses a threat to equipment security and information transmission. This paper will analyze the network risk of the intelligent substation and the process layer, explore the solution to the network storm fault in the process layer of the intelligent substation, predict the benefits of the project implementation, and analyze the prospect of its application.
Keywords: intelligent substation; process layer; network storm fault; solution
智能變電站是對傳統變電站的改進,符合當前智能電網的建設要求,有助于提高電力系統的運行安全性與穩定性,為人們提供良好的供電服務。網絡風暴的存在,是當前智能變電站通信網絡運行的主要問題,對于報文傳輸造成負面影響。加強對該類故障的有效預防及控制,可以有效增強過程層的運行可靠性。當前社會各領域對于電力資源的需求逐漸增長,智能變電站集成了多種先進技術,包括了傳感技術、電力技術、智能決策技術等等,為電力信息檢查和電壓變化工作提供了可靠保障。在數據共享中對于過程層的依賴程度較高,而網絡風暴的存在,則會威脅設備的運行質量及安全,甚至引發嚴重的電力事故。因此,應該根據過程層的運行特點制定針對性解決方案,實現對電力系統的有效掌控。
1 智能變電站概述
智能變電站運用了大量的智能電子設備,真正實現了變電站的自動化、數字化和智能化,能夠在信息的快速共享中實現對各個設備的有效控制,具有低碳環保和性能可靠的特點。在信息的采集和控制當中更具實效性,智能化調節系統運行,為電力協同工作機制的構建提供保障。變電站中的多種一次設備都能夠實現智能化運行,包括了互感器、高壓開關和變壓器等。中速傳輸連接網絡、高速傳輸網絡和總線型網絡等,是智能變電站的基本組網形式,以太網技術的應用也較為常見,包括了環形拓撲結構、總線型拓撲結構和星型拓撲結構等類型。尤其是在光纖以太網出現后,能夠有效增強智能變電站的抗干擾能力,大大提升了其通信容量。在連接一次設備中主要依靠過程層,包括了各類智能終端和合并單元等;各類二次設備組成間隔層,包括了測控裝置和繼電保護裝置等;通信系統、對時系統和監視控制系統等共同組成變電站層[1]。數據流的報文形式存在一定的差異性,這是決定其運行狀況的關鍵。在快速報文當中,跳閘報文較為常見,傳輸時間在10ms以內。數據報文是中速報文的基本形式,能夠反映智能變電站的設備狀態。控制命令的傳輸需要借助于訪問控制命令報文,在過程層當中發生轉換。
2 過程層網絡風險分析
智能變電站運用了大量的先進技術,其組成結構呈現出復雜化的特征,當存在故障問題時,將會對通信業務造成影響。網絡性能會由于廣播報文的復制和網絡拓撲的設計等問題而下降,這是導致網絡風暴出現的主要因素之一[2]。組播傳播是報文傳輸的基本形式,能夠有效提高輸出的效率,對于寬帶要求不高。缺乏對二層交換機的有效控制,會導致寬帶的浪費,同時其傳輸負荷增大,運行安全性受到威脅。此外,在智能變電站當中的網絡設備出現質量問題,或者由于網絡病毒的攻擊等,會引發不同程度的網絡風暴。電網運行中的局域網內出現某些網絡設備通信流量異常過大甚至形成網絡風暴源,從而影響到局域網內其他設備的網絡正常通信,嚴重情況下會導致交換機死機致使整個網絡癱瘓。因同一局域網內設備較多,很難精準發現是哪些設備網絡異常所導致的網絡故障;對于二次檢修人員來說前置主站系統至底下變電站遠動層級的網絡通道由很多個設備串聯在一起,整條網絡通道一旦出現故障很難定位到是中間的哪個環節段出現問題;目前沒有針對上述問題的診斷工具,某些單一功能的檢測儀器多為windows操作系統存在安全隱患。
3 智能變電站過程層網絡風暴的故障解決辦法
3.1 性能要求
在對智能變電站過程層的網絡風暴進行檢測時除了應該保障快速性外,還應該增強實時性,使風暴抑制算法更具低耗性特征。當過程中不存在網絡風暴時,防止檢測過程對系統功能和響應速度造成影響。在接收網絡風暴報文時應該確保良好的響應速度,通過警告提示對隱患問題進行處理,降低對設備運行安全造成的威脅。算法的安全性也是在故障處理中應該考量的關鍵點,防止錯誤信息出現在算法當中,保障響應的正確性[3]。網絡風暴的監測和抑制,需要能夠對其進行快速定位,這是保障良好處理效率的關鍵。此外,可觀測性也是在工作中應該遵循的基本原則,對網絡風暴的持續時長、強度等進行全面分析,滿足故障處理的工作要求。
3.2 監測與抑制流程
IP報文、SV報文、廣播報文和GOOSE報文等,是過程層當中的主要報文形式,其中SV報文和GOOSE報文屬于必須接收的報文形式,而IP報文和廣播報文屬于非必須接收的報文形式。廣播報文會響應ARP指令,在下載配置文件時借助于IP報文,當存在IP報文和廣播報文時,將其進行丟棄處理后,能夠使設備保持良好的運行狀態。在監測和抑制工作當中,首先需要組播保溫MAC地址過濾,抑制大流量廣播報文和IP報文。在過濾APPID時,對實施以太網的預解碼處理,對無效報文進行丟棄處理,在FIFO緩沖區對有效報文進行填入[4]。在判斷網絡風暴時,需要采用流量監控的方式,對GOOSE模塊和SV控制塊進行全面監測。在抑制GOOSE報文類型的網絡風暴時,則需要對其內容固定性與否進行判斷。報文舍棄法在不固定的報文處理中較為常用,而CRC哈希值比對法在固定報文中的應用較多。針對局域網內某些網絡設備流量過大而造成的網絡風暴,研發局域網內被動嗅探接收數據包的程序將其部署在linux平臺的手持終端上,通過接入待測局域網交換機快速檢測并統計出整個局域網內所有設備的網絡流量情況,若存在網絡風暴會標記出風暴源設備并告警提示;針對常見網絡異常,應用ping、ARP嗅探分段測試的方法從而查找到故障段,ARP嗅探不受防火墻限制;研發能承載上述功能要求的linux移動終端,從而保障實際應用中平臺的安全性。
3.3 監測與抑制方法
3.3.1 ping嗅探監測
主機中安裝TCP/IP協議,為嗅探器的運行提供了可靠保障,通過請求的發送,能夠快速響應。將ping包發送至可疑主機當中,完成對網絡風暴的監測和抑制,是ping嗅探監測的基本原理,其中包含了錯誤MAC地址和正確IP地址。運用該方法能夠實現對網絡風暴故障段的有效查找[5]。
3.3.2 ARP嗅探監測
采用ARP嗅探監測時,不會受到防火墻的影響,這是該監測方法的最大特點,其使用了ARP包,在發送時采用非廣播方式,當出現回應時,那么表示主機運行在混雜模式當中。發送方和目標方的映射信息包含在ARP當中,通過相繼發送ARP包和ping包,可以找到網絡風暴。
3.3.3 無效報文發生網絡風暴的監測和抑制
在MAC地址查找表的構建中,需要以6位目的MAC地址為依據,滿足組播報文MAC地址過濾要求。對CID文件進行解析,在地址表中完成MAC地址的添加,對其是否存在于接收表當中進行判斷,如果不在接收表中則進行丟棄處理。FPGA是實現有效過濾的關鍵環節,對于CPU運行的影響較小。對報文完成接收后,向CPU傳輸Ethertype字段,通過分類處理采用針對性處理方式,以實現對網絡風暴的抑制。廣播報文的網絡風暴類型響應ARP指令,在抑制IP風暴報文和廣播風暴報文時,需要對報文流量進行分析,根據其具體值確定是否存在網絡風暴。在網絡風暴門檻值的確定當中,需要明確過程層的基本運行需求,同時以配置文件為依據加以優化,使其更具合理性。如果未能超過該值,那么可以在緩沖區當中填入廣播報文和IP報文,在預解碼當中依靠FPGA實現[6]。在SV報文網絡風暴的抑制過程中,需要對比APPID接收表和SV報文APPID,當其處于該表當中時,則需要對流量進行計算,同時設置相應的門檻值進行限制,超出該限制時對SV控塊網絡風暴標志置1并對SV報文丟棄處理,否則放入到緩沖區當中。在GOOSE報文當中,也是通過上述原理進行監測和抑制,通過比對APPID接收表并設置門檻值對報文進行處理。判斷Ethertype和APPID是CPU在運行當中的主要工作內容,在很大程度上降低了其自身負荷,可以起到良好的抑制作用。
3.3.4 有效報文發生網絡風暴的監測和抑制
在有效GOOSE報文當中,應該判斷網絡風暴的標志位情況,當其為1和0時分別代表存在網絡風暴和不存在網絡風暴,為后續抑制處理提供依據。為了能夠對網絡風暴進行處理,需要想CPU傳輸CRC32,在構建統計報文數量的數組時,需要及時獲取CRC32的低16位,滿足GOOSE報文網絡風暴的處理要求。如前所示,根據其內容固定與否,也可以采用不同的處理方式。以風暴門檻值為依據,當報文數量在80%以上時,那么網絡風暴的內容固定,主要是采用CRC32哈希值比對法進行抑制。在此過程中通過CRC32的比對選擇丟棄或者接收處理,在采用開辟緩沖區實時比對的方式時,緩沖區字節為1518,對比緩沖區內容進行處理。當報文數量不超過80%時,則不存在錯誤內容[7]。
3.4 硬件設計
運用測試儀開展交換測試、智能終端設備測試、一致性測試和接入測試工作,自主選擇合適的光電模式,完成風暴報文的發送,其中Spirent TestCenter測試儀的應用效果較好。采用智能繼電保護測試儀,能夠明確GOOSE報文數據屬性,在開關量輸入中進行映射。為了能夠對報文記錄文件進行提取,需要采用網絡分析儀,同時能夠滿足實時監測的工作要求,提供可靠的告警說明。
4 項目實施效益及應用前景
本研發強調應用的專用性,當出現上述網絡問題時可快速診斷出問題點,縮短故障處理時間、提高工作效率、保障電網通信正常運行;當前運維工作中局域網內的網絡風暴問題時有發生,平均每月都會有2-3次因部分設備網絡流量過大引起的網絡異常,而花在查找問題根源上的時間平均都在4小時左右,全年花在這上面的時間初步計算:12個月*3次*4小時=144小時,即使不計算人力成本也會造成時間大量的浪費[8]。本裝置的研制成功可將每次故障檢測時間縮短至10分鐘以內,則全年所花費的時間是:12個月*3次*10分鐘=360分鐘=6小時,由此可見將大大縮短了該類網絡問題的檢測時間,極大地提高了運維工作效率。本裝置的成功研制可用于電力系統二次設備網絡通信中的檢修及測試診斷,提高了作業效率。亦可廣泛應用于其他行業中網絡通信故障檢測與診斷。
5 結束語
網絡風暴出現于智能變電站的過程層中,會對其正常運行造成影響,如果未能采取有效的預防及處理措施,將會導致供電服務質量下降,不利于電力行業的快速發展。在本文研究當中,研發局域網內被動嗅探接收數據包的程序,同時通過ping、ARP嗅探分段測試對網絡風暴進行定位和查找。在處理無效報文類型網絡風暴和有效報文類型網絡風暴時,應該根據其具體的特點選擇合理的監測和抑制方法。
參考文獻:
[1]劉升鵬.基于FPGA的變電站過程層設備網絡風暴過濾技術[J].電子世界,2019(15):132-133+136.
[2]羅美玲,劉海濤,丁寧,等.網絡風暴對智能變電站設備和系統的影響研究[J].寧夏電力,2018(6):35-38+60.
[3]王志華,杜振華,董志平,等.智能變電站網絡風暴抑制技術研究[J].電氣工程學報,2016,11(2):40-46.
[4]陳浙.智能變電站過程層故障快速診斷與定位關鍵技術設計與研究[D].濟南:山東大學,2015.
[5]李志堅,姜憲國,姚剛,等.智能變電站過程層網絡虛擬局域網劃分的應用[J].電氣應用,2015,34(S1):373-377.
[6]吳溫翠.智能變電站過程層網絡風暴抑制方法研究[D].北京:華北電力大學,2015.
[7]黃天嘯,劉平,辛光明,等.智能變電站過程層網絡風暴的分析與處理[J].中國電力,2014,47(11):112-115+120.
[8]王曉虎.智能變電站過程層網絡分析及典型配置研究[D].北京:華北電力大學,2013.