鐘清平
網絡服務虛擬化是未來一段時期計算機網絡技術的發展方向,其通過利用軟件虛擬的形式打破品牌、工藝等硬件架構層面上的差異,為用戶提供更為理想的使用環境。然而,在實際建設過程中網絡服務虛擬化依賴于數據中心的建設,且對于通訊帶寬及穩定性具有更高的要求。本文以數據中心為研究對象,探究其鏈路故障的產生與檢測,希望為后續建立完整的快速檢測、自動處置體系提供必要基礎。
現階段虛擬化技術主要分為計算機虛擬化及網絡服務虛擬化等兩個層面。二者根據虛擬對象的不同來進行區別,其中計算機虛擬化更多的是通過軟件架構來虛擬替代計算機的硬件架構;而網絡服務虛擬化則是通過提供計算中心服務器的方式為用戶客戶端的計算強度進行“減壓”。無論何種虛擬化技術,數據中心的建設是必要的硬件基礎,而數據中心與用戶間的通訊穩定性則是重中之重。筆者根據其常見的故障類型,系統對鏈路故障的檢測加以分析,旨在為后續的相關研究與系統升級提供必要基礎。
從一般的數據中心建設實踐中我們不難發現SDN的應用廣泛度相對較高。本文以SDN架構的服務中心為例其網絡結構大致分為應用層、控制層及基礎設施層等三個環節,而所謂的鏈路結構則是對上述不同層級間計算機設備形成有效連接的物理通徑。從其具體的特征角度來看大致分為如下幾個方面:一是去中心化建設思想提高了鏈路的復雜度。去中心化的核心目的是為系統提供多個(一般等于節點數)的中心結構,相互節點間在系統中的權重相同,同時允許相關數據的跨節點傳輸。這一特征性建設客觀上增加了鏈路的復雜度;二是自定義網絡為鏈路通訊提供了更多可能,在相同的網絡下,按照不同的數據復雜度及應用模式可以采用不同的協議方式來進行分別構建,即增加了鏈路的復雜性,同時也提高了鏈路的靈活性與自主性。三是鏈路互補性相對較高。在不同層級關系中形成的鏈路結構并不是傳統的線性結構,而是采用網狀結構來進行合理構建。這一構建基礎形成了不同鏈路通徑下形成有效的互補,在單一鏈路存在故障時信息可以采用“繞道”的形式進行替代傳輸,而過程中所產生的系統差異則為檢測提供了必要依據與信息來源。
上文對數據中心的鏈路特征進行了系統分析,在實際的故障檢測體系中核心方法大致分為如下兩種:
一是PUSH模式。PUSH模式即心跳模式,指的待測對象周期性發送心跳數據至檢測器。檢測器將根據是否在有限時間內接收到心跳數據,作為判斷待測對象狀態的依據,其關鍵參數為待測對象的屯、跳周期和檢測器對心跳消息的接收超時時間。若未能在有限時間內收到心跳數據,檢測器則認為待測對象發生故障。二是PULL模式。模式也稱為輪詢模式,檢測器將周期性向待測對象發送詢問消息,并對響應消息進行驗證,其關鍵參數為檢測器的檢測周期和響應消息的接收超時時間。若未能在有限時間內接收對應待測對象的響應消息,檢測器則認為待測對象發送故障。
分析兩種不同的檢測模式我們不難發現一種作為服務器內設序號的主動發送,一種作為檢測服務器的主動問詢。二者在架構與原理層面上存在一定的差異,且檢測的工作重心與主要負載也存在一定的不同,其他針對服務中心鏈路故障的具體檢測方式均依托于上述兩種類別而存在。
分析了數據中心鏈路故障的具體檢測模式,從實際的應用角度來看,針對不同的常見鏈路故障對應不同的檢測方式是一種可行模式,其具體應用主要分為如下幾個方面:
第一,在交換機端口故障方面的檢測:此種檢測采用LOS檢查技術整合交換機自身的管理機制采用心跳式自主發布的模式來進行。此種模式將檢測工作交由交換機自身的端口管理來完成,在頻次層面一般以1-5秒自動發送檢測報告,系統匯總的方式來進行。
第二,在鏈路故障方面的檢測:此種檢測主要檢查非端口的鏈路故障,其自身不具有檢測與管理功能,需要通過服務器自主訊號的形式來進行。在實際的構建過程中常以LLDP技術為主要實現模式。該技術可以對鏈路的直接狀態進行分析,采用與交換機端口故障同頻次檢測的方式來進行架構,同時能夠對故障狀態進行交互性表征。
第三,在交換機失效方面的檢測:除了交換機端口故障之外,實際鏈路檢測還應該考慮交換機總體失效的可能。此種失效在故障特征層面上表現為總體功能的缺失。而實際的檢測體系可以從其特征的角度入手,采用PULL回文方式對其進行構建。具體而言是在PULL技術框架下對全部端口進行回文要求,回文符合OpenFlow協定下的應用失效報文模式則可以判斷其故障類型。
第四,在鏈路狀態方面的檢測:鏈路體系除了總體失效情況下還會存在一定的非失效故障,如帶寬降低、延時增加、數據丟包等。這就需要在故障檢測的同時構建完整的信息收集系統,對鏈路狀態進行實時的監控,并通過對狀態的分析來完成鏈路有效性與可用性的總體評價。在檢測應用層面上則可以基于OpenFlow協定,對其中的STATS字段的回文狀態進行評估,通過此種模式確立鏈路狀態的一般表現形式,從而對其可能存在的故障加以分析。
數據中心在現代計算機技術虛擬化進程中尤為重要,而鏈路穩定性更是其中的關鍵一環。本文以此為研究對象,在系統分析數據中心鏈路特征的基礎上,對其檢測模式的分類與特征進行討論,并按照常見的不同故障模式對自動化檢測技術的具體應用加以分析,希望能夠為后續實際開發與建設提供必要依據。
(作者單位:贛西科技職業學院)