陳獻政
摘 要:IEC61850標準是電力系統自動化領域唯一的全球通用標準,是變電自動化系統的發展最新趨勢。同時,IEC61850也是建設智能化變電站的主要技術。因為當時技術條件和硬件系統發展不夠成熟,導致了大部分廠商對基于IEC61850的第一代建設的變電站網絡結構的設計上存在局限性,進而在后期的工作中頻繁地出現網絡上的故障問題,因此,我們需要深入研究IEC61850變電站網絡頻繁中斷的原因,同時找到有效的解決方案。本文介紹了IEC61850監控系統的構成,探討了IEC61850變電站網絡頻繁中斷原因分析及解決方案。
關鍵詞:IEC61850變電站 網絡中斷 原因分析 解決方案
中圖分類號:TM63 文獻標識碼:A 文章編號:1672-3791(2018)11(c)-0028-02
因為當時的變電站是基于IEC61850標準而進行設計,又因為該技術當時存在一定的不足,也就導致了監控系統的穩定性受到了很大的影響。其中最主要的影響就是流通大量的網絡報文而造成通信堵塞,或者是報文異常而導致了網絡的頻繁中斷。當前,我們只能通過重啟或是漫長的等待恢復的過程才能夠使其恢復正常。所以說,當務之急就是對網絡中斷的原因進行深入分析,找到與其對應的解決辦法。
1 監控系統構成
早期的基于IEC61850技術標準進行設計的變電站的監控系統所使用的是RCS-9700分散式微機監控系統,根據安裝的地點和功能的不同可以分為主控樓內的站控層和室內間隔層設備。其中網絡結構則主要采用的是開放式分層和分布式結構。站控層和間隔層的網絡構造主要是由雙以太網組成的,其中站控層是按照全站終期規模進行設置裝備,間隔層則是利用具有接口的測控單元直接與網絡相連接,從而達到與站控層通訊的目的。
2 原因分析及處理方案
出現網絡中斷的原因有很多,對監控系統中的信息傳輸進行分析,我們得知網絡通信頻繁掉線的原因主要有下面幾點:第一,系統內一些裝置的MAC地址發生沖突,導致不能正常連接通信。第二,交換機網口和裝置網口的芯片使用時間過長,從而出現老化的情況。第三,網絡處于過負荷狀態,CPU的處理速度慢。
2.1 MAC地址沖突現象分析
如果說MAC地址發生沖突,那么后臺就只能在同一時刻接受一臺設備傳輸的報文,但我們不能確定該傳輸的報文是否是我們需要的。對于傳輸中判斷為不需要的報文,則會直接被丟棄,這也就導致了網絡通信的中斷狀態,直到正確的報文被接收,這時候才會重新聯接。于是這樣,在宏觀上就會造成頻繁出現網絡中斷和連接的現象。
2.1.1 MAC地址沖突異常查找
要想找出MAC地址沖突的原因,我們可以抓取傳輸的報文進行分析,找出其中的原因是IP/Mac沖突還是A/B網絡被串聯,因為理論上要想通信系統正常運行則要不同的網絡在物理層上分離開來。
2.1.2 MAC地址沖突處理方法
當我們由上述方法找到MAC沖突的原因是IP/Mac沖突的話,解決的辦法很簡單,只需要將設備的MAC地址手動更改就可以恢復正常了。同時在后臺做靜態ARP綁定。如果MAC沖突是A/B網絡發生串聯造成的話,那就應該找到串聯的地方,從而將其斷開。如果不是以上兩種情況的話,那我們可以直接排除MAC地址沖突導致網絡頻繁中斷的定論。
2.2 交換機網口芯片老化
2.2.1 交換機網口芯片老化現象
造成網絡頻繁中斷最重要的原因還是交換機網口芯片老化的問題,而交換機方面最重要的是主控室的核心交換機,當這個部分的交換機的網口芯片出現老化問題,那就會導致后臺和遠程設備都無法正常的接收發送的報文,也就出現了網絡的頻繁中斷。我們可以在后臺抓取傳輸中的報文,判斷是否出現頻繁的網絡報文重發現象,或者觀察交換機的運行指示燈和登錄交換機查看運行情況。
2.2.2 交換機網口芯片老化處理方法
如果是交換機老化問題,因為其會影響到對通信報文的處理,因此需要進行及時的更換,如果發現并不是該問題造成的中斷問題,那就說明是最后一種的可能性極大。
2.3 網絡負荷增加導致裝置CPU處理通信報文速度變慢
網絡出現頻繁中斷的最后一種情況就是網絡負荷增加導致設備的CPU處理速度變慢。眾所周知,設備的CPU不僅有處理報文的能力,而且還需要進行采樣和邏輯運算等工作。如果說站內的通信報文突然增多的話,就會導致CPU處理不過來,造成網絡堵塞。
3 現場排查情況及采取方案
3.1 站內報文類型
利用一些抓取報文的軟件對變電站內的報文進行抓取分析,深入研究可以知道網絡報文主要有以下類型:一是采用點對點傳輸方式的報文,包括MMS、TCP等,其特點是只對特定的裝置起作用;二是采用組播或廣播傳輸方式的報文,包括APR、UDP和GOOSE等,其特點一般是數據量大或者涉及的裝置比較多。
3.2 站內報文分析及處理方案
當變電站的監控系統運行穩定時,所測量的值只會發生很小的變化。在這種狀況下,從后臺的一段網絡中抓取部分報文。從圖1、圖2可知,第138.786~138.806s、139.786~139.806s的兩段20ms間隔中,出現了10幀ARP。從以往的工作經驗得知,這種規模的ARP報文在設備的正常處理范圍內,不會造成通信的異常。若在很多個連續的500ms時間段內出現了至少40幀的ARP報文,使后臺發送來的MMS命令報文得不到及時的處理,這也在一定程度上提高了通信異常的概率。如果此時再有APR、UDP和GOOSE遙信/遙測量報文增加,并持續一段時間,裝置很容易出現通信“通/斷”現象。
ARP報文的影響解決很簡單,只需要在后臺采用“靜態ARP綁定”方案即可。如今,隨著一系列技術的發展,我國的變電站中已經運用了該方案,并且與以往的情況相比較,可以很明顯地發現ARP報文出現的頻率和數量得到了很大的改善。
4 結語
對我國早期的變電站分析,發現網絡報文量的迅速增加是導致網絡頻繁中斷的主要原因,并根據報文特點采取相應的方法限制報文流量,從而達到解決變電站中出現網絡頻繁中斷的問題。對早期的變電站結構設計進行分析和探討,能夠有助于變電站的發展,對變電站的完善和創新上有很大的幫助。如今,上述的問題已經得到了很好的解決,有關的技術也得到了也得到改進,變電站內的監控系統的穩定性也得到了很大的提高。
參考文獻
[1] 陳安偉,朱松林,樂全明,等.IEC61860在變電站中的工程應用[M].北京:中國電力出版社,2012.
[2] 樊陳,倪益民,竇仁輝,等.智能變電站過程層組網方案分析[J].電力系統自動化,2011,35(18):67-71.