胡欣洋 王曉龍 劉嘉明
【摘 要】電量采集系統是非實時業務中的典型系統,處在生產控制大區的II區,它的主要功能是自動采集數字化變電站中各類電表的數據,并提供給上級調度中心側電量采集系統主站進行數據分析和監控。目前供電公司、變電站、電廠所應用的電量采集系統大部分是由南京華瑞杰公司生產的COM3000系統,廠站側采用MPE-V型終端。本文對目前常用的COM3000系統典型網絡故障進行分析,在工程實施中具有現實意義。
【關鍵詞】電量系統 網絡故障分析 采集系統
目前供電公司、變電站、電廠所應用的電量采集系統大部分是由南京華瑞杰公司生產的COM3000系統,廠站側采用MPE-V型終端。該設備通過485線纜連接各個電表,用于采集電表各類數據。每5分鐘采集一次,并將數據自動儲存在電量采集裝置中。具有多種上傳方式,如以太網、GPRS等。
在數字化變電站施工完成后或在后期的維護工作中,經常會出現下級數字化變電站側到上級調度中心側業務不通的問題。包括實時業務、非實時業務等。現在我將依照自己的工作經驗,提出一種業務不通問題的解決方法。
當某個調度中心側主站監控系統發現有廠站業務不通后,我們需要對其進行分析和故障排除。比如某個變電站側的實時監控系統實時數據無法上傳上級調度中心主站時,我們按步驟進行檢查:
(1)判斷該變電站的其他實時業務系統是否正常。比如在調度中心主站的交換機上用ping命令分別ping一下該變電站的實時監控系統和PMU系統。實時監控系統因為故障,可能會ping不通。如果PMU系統可以ping通,一般可以排除是調度數據網的問題。這時主要檢查實時監控系統是否掉電,網關添加是否正確,是否設置了多個網關等問題。
(2)如果PMU等其他實時業務系統也無法ping通,那么懷疑是調度數據網出現故障。這時,我們ping一下變電站側的路由器和交換機,如果ping不通,可能是通訊通道故障或變電站側設備故障,需要檢查通訊通道以及現場設備。如果能ping通,說明主站、廠站之間的通訊通道正常,變電站側路由器、交換機也都在線運行,沒有發生掉電等情況。
(3)通過telnet命令登錄到現場路由器上,在路由器上用帶vpn參數的ping 命令進行同網段業務測試,如果ping不通實時監控系統,可能是交換機與實時監控系統之間的網線故障或是實時監控掉電或IP配置錯誤。如果能ping通,說明路由器到實時監控系統之間連接正常,需要檢查路由器。
(4)因為已經可以登錄到路由器上,因此排除通道原因。首先我們檢查BGP的狀態,用dis bgp peer命令查看bgp鄰居的連接狀態。如果是Established狀態,說明BGP協議建立成功,那么實時監控系統業務不通的問題可能出現在BGP和MPLS的配置上。檢查BGP配置,查看ipv4-family vpnv4里是否peer了對端地址,ipv4-family vpn-instance vpn-rt里是否引入了靜態路由、直連路由等。如果以上配置都正確,再檢查E1接口下,是否配置了mpls協議以及mpls ldp,應該能解決問題。如果bgp peer的狀態是Active,請仔細檢查廠站、主站路由器的BGP配置。如果確認BGP配置都正確的情況下,進行下一步OSPF路由協議的檢查。
(5)當廠站、主站BGP配置完全正確的情況下,BGP狀態仍然為Active,一般開始進行OSPF路由協議的檢查。用命令dis ospf peer查看ospf路由協議協商狀態,如果什么都不顯示,說明OSPF主站、廠站路由器的OSPF協議配置上存在問題。最有可能的是OSPF的area對應關系錯誤。或者是network的網段錯誤。仔細檢查主站、廠站路由器OSPF路由協議的各種配置參數。確認OSPF配置正確后,用命令dis ospf peer會發現顯示內容中有對端的LOOPBACK地址或互聯地址,說明OSPF路由協議正常。這時,我們進入VRRP路由冗余協議的檢查。
(6)在兩臺變電站側路由器上分別用dis vrrp來查看vrrp協議狀態。正常的狀態應該是第一臺路由器實時業務是Backup,非實時業務是Master;另一臺路由器的實時業務是Master,非實時業務是Backup。如果出現Initialize的初始狀態,說明VRRP協議協商有問題。我們需要檢查兩臺路由器實時業務子接口的VRRP配置。首先檢查一下virtual-ip是否一致,優先級是否一高一低,優先級高的路由器是否配置了當關聯接口故障后自動降低優先級的功能。其次檢查一下VRRP的VRID號是否正確,是不是實時業務子接口的VRID配置成了非實時業務子接口的VRID。如果所有VRRP配置都正確,狀態依舊是Initialize的話,那么懷疑是路由器與交換機之間的連接問題。我們在第一臺路由器上用帶VPN參數的ping命令ping一下第二臺路由器的實時業務子接口的IP地址。Ping不通的話,我們需要檢查連接兩臺路由器與交換機的網線是否損壞,以及交換機與路由器連接的以太口trunk配置是否正確,有沒有允許實時業務VLAN 101通過。如果主站、廠站的路由器、交換機所有的配置都正確,網線連接也正確,實時業務依然無法由廠站上傳到主站的話,我們考慮是主站、廠站之間,處在縱向邊界的電力專用縱向加密認證網關的問題。
(7)是否是縱向加密認證網關出現故障的判斷方法很簡單。因為縱向加密認證網關有一種旁路的功能,有些廠家生產的縱向加密認證網關還支持關閉電源自動變成類似網線的功能,相對網絡來說是透明的。我們只需將縱向加密認證網關變成旁路的工作模式或直接關閉掉。這時我們在調度中心主站側測試一下實時監控的業務,如果業務恢復正常了,說明是縱向加密認證網關配置有錯誤。我們需要對縱向加密認證網關的各項配置進行逐一檢查。包括是否導入了足夠的證書;IP配置是否正確;VLAN ID是否正確;填寫的路由器、交換機的IP地址、MAC地址是否正確;隧道是否成功建立;策略配置是否有阻擋等。一般在策略配置上出現問題的情況居多。
經過以上的經驗總結,應該可以初步判斷業務不通的原因了。電力二次系統網絡技術是一種多元化技術,是需要長期研究的項目,本文提出的七種典型故障只是基礎,供維護人員參考。