李旭,楊哲,王德松
(1. 云南電力調度控制中心,昆明 650011;2. 云南電網有限責任公司昭通供電局,云南 昭通 657000)
目前,電力調度數據網組網方式受調度站點距離影響,除部分核心站點設備或同站點設備端口互聯鏈路采用光纖或網線直連外,其余核心層設備與匯聚層設備、匯聚層設備與接入層設備間端口互聯采用傳輸設備MSTP或CPOS接口方式接入。當傳輸設備中間鏈路出現故障時,傳輸設備與調度數據網設備連接端口正常,調度數據網設備無法檢測傳輸設備故障,容易造成調度數據網設備路由協議無法及時發現某通道路由中斷進行本側設備路由切換。而傳輸設備或調度數據網設備常用的檢測方式有以下兩種:
1)傳輸設備檢測:例如通過傳輸設備告警檢測傳輸鏈路故障。傳輸設備檢測的優點是可以很快發現故障,缺點是傳輸設備檢測出故障后除鏈路自愈保護方式可快速恢復外,單鏈路通道或鏈路自愈保護雙通道同時中斷時只能人工檢測恢復。
2)調度數據網設備慢Hello檢測機制:通常采用路由協議中的Hello報文機制。這種機制檢測到故障所需時間為秒級。對于高速數據傳輸,例如吉比特速率級,超過1秒的檢測時間將導致大量數據丟失;對于時延敏感的業務,例如語音業務,超過1秒的延遲也是不能接受的。并且,這種機制依賴于路由協議。
為了減小通道故障對業務的影響、提高網絡的可用性,調度數據網設備需要能夠盡快檢測到與相鄰設備間的通信故障,以便能夠及時采取措施,從而保證業務繼續進行。
雙向轉發檢測BFD(BidirectionalForwarding Detection)是一套用來實現快速檢測的國際標準協議,提供一種輕負荷、持續時間短的檢測。一對系統在它們之間的所建立會話的通道上周期性的發送檢測報文,如果某個系統在足夠長的時間內沒有收到對端的檢測報文,則認為在這條到相鄰系統的雙向通道的某個部分發生了故障。BFD的主要功能是在兩臺調度數據網設備上建立會話,用來監測兩臺調度數據網間的雙向轉發路徑,為調度數據路由器或三層交換機的協議服務[1-2]。BFD本身并沒有發現機制,而是靠調度數據網設備的上層協議通知其與哪臺調度數據網設備建立會話,會話建立后如果在檢測時間內沒有收到對端設備的BFD控制報文則認為發生故障,通知本側調度數據網的上層協議,上層協議進行相應的處理。通過配置BFD可以設置毫秒級的時間檢測間隔,從而可以在毫秒級的時間內快速檢測到鄰居故障,應用可以依靠BFD的快速檢測來提供快速的流量切換[3]。
電力調度數據網組網主要應用MPLS VPN、邊界路由協議(BGP)、開放式最短路徑優先(OSPF)、虛擬路由器冗余協議(VRRP)等數據網絡設備技術,針對以上技術可與BFD進行聯動設置,以達到快速檢測電力調度數據網通過傳輸設備連接后的通道故障目的。
在調度數據網以太網鏈路上建立雙向轉發檢測(BFD)會話,利用雙向轉發檢測機制快速檢測鏈路故障。雙向轉發檢測以太網鏈路支持單跳檢測和多跳檢測,聯動檢測示例如下:
2.1.1 單跳檢測
單跳檢測是指對兩個直連調度數據網設備進行以太網連通性檢測,該項故障檢測涵蓋了鏈路中間傳輸設備故障時的檢測,“單跳”是以太網鏈路的一跳[4]。
如圖1所示,雙向轉發檢測(BFD)檢測兩臺設備之間的以太網單跳路徑,BFD會話綁定出接口。當BFD會話檢測不到對端發來會話信息后,交換機A(SwtichA)和交換機B(SwtichB)判定以太網鏈路中斷。

圖1 IP鏈路單跳檢測
2.1.2 多跳檢測
多跳檢測是指雙向轉發檢測可以檢測兩個系統間的任意路徑,這些路徑可能跨越很多跳或是很多設備(包括傳輸設備),也可能在某些部分發生重疊[5]。

圖2 以太網鏈路多跳檢測
如圖2所示,雙向轉發檢測(BFD)檢測交換機A(SwtichA)和交換機C(SwtichC)之間的以太網多跳路徑,BFD會話綁定對端地址但不綁定出接口。當BFD會話檢測收不到對端地址發來的會話信息時,交換機A和交換機C判定以太網鏈路中斷。
開放式最短路徑優先(OSPF)使用雙向轉發檢測來進行快速故障檢測時,OSPF可以通過HELLO報文動態發現鄰居,OSPF將鄰居地址通知雙向轉發檢測(BFD)就開始建立會話。BFD會話建立前處于DOWN狀態,此時雙向轉發檢測(BFD)控制報文以不小于1秒的時間間隔周期發送以減少控制報文流量,直到會話建立以后才會以協商的時間間隔發送以實現快速檢測。聯動檢測示例如圖3所示,交換機A(SwtichA)分別與交換機(SwtichC)和交換機(SwtichD)建立開放式最短路徑優先(OSPF)鄰居關系,交換機A到交換機B的路由出接口為Interface 1,經過交換機C到達交換機B(SwtichB)。鄰居狀態到達FULL狀態時通知雙向轉發檢測(BFD)建立BFD會話。當交換機A和交換機C之間鏈路出現故障,雙向轉發檢測(BFD)首先感知到并通知交換機A。交換機A處理鄰居Down事件,重新進行路由計算,新的路由出接口為Interface 2,經過交換機D到達交換機B。

圖3 OSPF與BFD聯動檢測
調度數據網中應用的邊界路由協議(BGP)的keepalive時間間隔缺省為60秒,最小可以配置為1秒,這樣保持時間缺省為180秒,最小為3秒,鄰居關系的檢測比較慢,對于報文收發速度快的接口會導致大量報文丟失。通過BFD進行快速故障檢測,可以實現鄰居關系的快速檢測,加快了協議收斂。聯動檢測示例如下:

圖4 BGP與BFD聯動檢測
如圖4所示,交換機(SwitchA)和交換機(SwitchB)分別屬于AS100和AS200,兩臺路由器直接相連并建立EBGP連接。使用雙向轉發檢測(BFD)檢測交換機A和交換機B之間的BGP鄰居關系,當交換機A和交換機B之間的鏈路發生故障時,雙向轉發檢測(BFD)能夠快速檢測到故障并通告給邊界路由協議。
多協議標記交換(MPLS) 運行雙向轉發檢測(BFD)用于鄰居快速檢測,檢測到的故障一般用于主備轉發表項的切換:即MPLS將業務從主路徑切換到備份路徑上。聯動檢測示例如圖5所示,只考慮從區域邊界設備PE1到用戶邊緣設備CE2的流量。當PE1到骨干設備P1之間的鏈路發生故障時,區域邊界設備PE1可以通過和骨干設備P1相連的接口感知到故障。但是如果P1到區域邊界設備PE2之間的鏈路發生故障,則區域邊界設備PE1無法通過接口感知,這時需要結合BFD與動態標記交換路徑(LSP)聯動來進行快速故障檢測。在PE1上有到區域邊界設備PE2的動態LSP,配置BFD與動態標記交換路徑(LSP)聯動為這條動態標記交換路徑(LSP)建立BFD會話并進行檢測,同時在區域邊界設備PE1上配置私網快速重路由(VPN FRR)的相關策略,指定保護路徑為區域邊界設備PE1到區域邊界設備PE3。當區域邊界設備PE1到骨干設備P1或者骨干設備P1到區域邊界設備PE2之間的鏈路發生故障時,區域邊界設備PE1上能迅速感知到標記交換路徑(LSP)故障,并觸發私網快速重路由(VPN FRR)切換,使流量切換到區域邊界設備PE1到區域邊界設備PE3、區域邊界設備PE3到用戶邊緣設備CE2,實現保護。

圖5 MPLS 與BFD聯動
電力調度數據網中,地調或電廠調度數據網設備為雙配置,該配置模式下業務應用虛擬路由器冗余協議(VRRP)方式較多,當主用設備(Master)出現故障時,虛擬路由器冗余協議依靠備份設備(Backup)設置的超時時間來判斷是否應該搶占,切換速度在1秒以上。將雙向轉發檢測(BFD)應用于備用設備(Backup)對主用設備(Master)的檢測,可以實現對主用設備(Master)故障的快速檢測,縮短用戶流量中斷時間。雙向轉發檢測(BFD)對備用設備(Backup)和主用設備(Master)之間的實際地址通信情況進行檢測,如果通信不正常,備用設備(Backup)就認為主用設備(Master)已經不可用,升級成新的主用設備(Master)。

圖6 VRRP與BFD聯動
如圖6所示,交換機A(SwitchA)和交換機B(SwitchB)之間配置虛擬路由器冗余協議(VRRP)備份組建立主備關系,交換機A為主用設備,交換機B為備用設備,用戶過來的流量從交換機A出去。在交換機A和交換機B之間建立BFD會話,虛擬路由器冗余協議(VRRP)備份組監視該BFD會話,當BFD會話狀態變化時,通過修改備份組優先級實現主備快速切換。當BFD檢測到交換機A和交換機C之間的鏈路故障時,上報給虛擬路由器冗余協議(VRRP)一個BFD檢測Down事件,交換機B上虛擬路由器冗余協議(VRRP)備份組的優先級增加,增加后的優先級大于交換機A上的VRRP備份組的優先級,于是交換機B立刻升為主用設備,后繼的用戶流量就會通過交換機B轉發,從而實現VRRP的主備快速切換。
雙向轉發檢測(BFD)現在越來越多地應用在重要網絡、重要鏈路上,并結合了路由、MPLS、VPN、流量工程等技術。而電力調度數據網的建設是調度數據網技術及傳輸技術的融合,通過在調度數據網中應用雙向轉發檢測(BFD)技術,可以對重點調度業務流量提供高可靠性保障,從而保證生產實時業務通道的可靠性,保障電網的安全穩定運行。