□ 文 程東亮 曹小剛
(作者單位:中國人民銀行武漢分行;中國人民銀行黃石市中心支行)

近年來,隨著移動互聯網技術不斷向縱深發展,以大數據、人工智能為代表的現代信息科技正在逐步從根本上改變現代金融的運營模式。作為大數據、人工智能底層的云計算技術也得到蓬勃發展。傳統金融業IT架構中,網絡僅具備高穩定與高性能,但靈活性和敏捷性不夠,如根據業務需求部署上線周期較長,如果業務需求發生變動,重新修改相應網絡架構及配置是一件非常繁瑣的事情。同時,多數據中心及多活數據中心成為關鍵業務在現實中的新常態,數據中心間網絡流量調度問題影響資源效率。此時,迫切需要一種網絡技術,與應用實現一定程度互動,既能實現網絡靈活彈性管理,也能實現網絡流量精細化控制。軟件定義網絡(Software-Defined Network,SDN)成為一個重要解決手段。

圖1 B4網絡整體架構圖

SDN于2006年誕生于美國GENI項目資助的斯坦福大學Clean Slate課題。SDN是一種新型的網絡結構,它的設計理念是將網絡的控制平面與數據轉發平面進行分離,通過集中的控制器去實現可編程化控制底層硬件,實現對網絡資源靈活的按需調配。SDN的核心是網絡可編程。一個典型的SDN架構分為三層:最上層是應用層,通過控制器層編程接口控制底層網絡設備,實現各種業務應用;中間為控制器層,集中管理整個網絡設備,并提供網絡資源;底層為設備層,負責與控制器層通信,實現相應功能。
本文重點分析和研究SDN行業應用較為成功的三個案例:谷歌、阿里巴巴和騰訊,提出金融行業應用策略,以此推動金融網絡下一步發展。
谷歌SDN應用主要用于其世界各地的數據中心之間流量傳輸。其傳輸的數據可以分為三大類:(1)用戶數據備份,包括視頻、圖片、語音和文字等;(2)遠程跨數據中心計算資源和存儲資源訪問;(3)因分布式訪問負載均衡而進行的大規模數據同步。這三類從前往后數據量依次變大,對延時的敏感度和優先級依次降低。
B4網絡從低到高分為三個層次,分別是物理設備層(Switch Hardware)、局部網絡控制層(Site Controllers)和全局控制層(Global)。第一層的物理交換機和第二層的Controller在每個數據中心出口的地方部署,而第三層的SDN網關和TE服務器是在一個全局統一的控制池。第一層是谷歌自行設計并請其他廠商代工的物理交換機,運行OpenFlow協議,把BGP/IS-IS協議報文送到Controller層進行處理。第二層在每個數據中心出口有一個Controller服務器集群,下層交換機可連接到多個Controller,由Paxos來選出leader(即決定工作狀態的Controller)。第三層中全局的TE Server通過SDN Gateway從各個數據中心的控制器收集鏈路信息、路徑信息。這些路徑被以IP-In-IP 隧道的方式創建,通過Gateway到Onix Controller,最終下發到交換機中。當一個新的業務數據要開始傳輸時,應用程序會評估該應用所需要耗用的帶寬,為它選擇一條最優路徑(如負載最輕的但非最短路徑,不丟包但延時大),然后把這個應用對應的流,通過Controller安裝到交換機中,并跟選擇的路徑綁定在一起。B4網絡整體架構圖如圖1所示。
改造前,谷歌使用基于靜態Hash的負載均衡方式,需使用過量鏈路,提供比實際需要更多的帶寬,實際鏈路帶寬利用率只有30%-40%,網絡無法對上述三大類數據進行精細匹配分流,數據傳輸路徑無法做到最優。改造后,通過使用程序來控制網絡,實現流量大小及方向的控制。鏈路數量減少,成本明顯降低,但B4網絡鏈路帶寬利用率提高了3倍以上,達97%,并且簡化了網絡的流量管理和控制。

圖2 阿里云網絡架構圖

圖3 SDN數據中心整體架構視圖
阿里云主要利用SDN技術構建一張Overlay虛擬網絡,來實現海量的租戶相互之間的隔離以及高性能、安全、互聯、可靠性要求。網絡分為上下兩層,上層是虛擬網絡,下層是物理網絡。在虛擬網絡的里面,租戶可以看到路由器、交換機、ECS主機以及在主機里運行的各種服務(如SLS負載均衡服務、RDS數據庫服務、OCS cache服務等)。在虛擬網絡上,它既可以從ECS去訪問對應的RDS,也可以從ECS通過交換機和路由器來訪問公網。實際承載的是它之下的物理網絡。通過Overlay技術,物理網絡不再是一個復雜的節點,減少了網絡出問題的概率,網絡結構穩定。

阿里通過自研設備來實現互通需求。在網絡的架構圖中部署了三類自研設備:虛擬交換機、數據層自研網絡設備和自研控制器。如圖2所示,左側是數據面,右側是控制面。虛擬交換機的主要作用是實現ECS之間的私網互聯(東西向流量)。自研網絡設備主要用于連接兩個不同的網絡,完成南向流量的下發,流量主要來自用戶的IDC和公網。所有的虛擬交換機和自研網絡設備中的轉發表都是由控制器下發,在控制器之上的是控制臺,它的分流策略架構保證了網絡能夠滿足互通的需求。
不同于傳統的SDN,阿里云將SDN開放給云上的每個用戶,讓用戶可以調用Open API。在基于云的網絡上可以自由地連接,配置路由、劃分子網、進行流量控制。同時在ECS上,用戶可以按照自己的需求創建、釋放虛擬機來承載其流量,以實現彈性伸縮。通過阿里云彈性伸縮的能力,微博能應對除夕當天或春晚直播期間的大規模流量。微博可以在10分鐘內使它云上的上千臺ECS規模翻倍,擴充能力超過了流量增長的數量級,成本比使用SDN技術前下降了40%左右。
騰訊是目前流量最高的門戶網站、國內用戶數量最大的即時通信在線社區。騰訊SDN應用于數據中心內部和數據中心之間。在數據中心內,集中控制器進行控制,采用VXLAN+Service Chain,負責串接和虛擬網絡與物理網絡的解耦。流的轉發利用控制器openflow協議進行控制。采用兼容現網的漸進式南向協議,構建基于騰訊運營場景的控制器和業務編排系統,借助SDN彈性的網絡架構模型來應對數據中心云化帶來的復雜多變的網絡需求,如圖3所示。
在數據中心之間,SDN控制器與路由器之間運行BGP-LS/SNMP協議,路由器將通過IGP搜集的網絡拓撲和帶寬情況通過BGP-LS傳遞給SDN控制器,使用集中式路徑計算與調整,來實現流量的差異化實時調度。通過SDN思路和技術解決廣域網絡利用率、差異化QoS網絡質量保障、業務冗余調度等問題。
三個典型案例對比分析如表1所示。
金融行業網絡面對金融科技發展浪潮,必須結合自身實際,積極應對業務快速發展和變化的需要。SDN為未來金融業網絡發展插上了智能和開放的翅膀,成為重構金融業數據中心網絡和數據中心互聯網絡的重要技術。
一是主動適應傳統數據中心向云數據中心、虛擬化數據中心發展趨勢,積極引入SDN技術和思想,采用VXLAN等大二層技術,結合SDN控制器,實現多租戶的云化、自動化運維的數據中心虛擬網絡,大幅提升網絡運維效率,支持更靈活和更便捷的業務發展需求。
二是基于金融業普遍“兩地三中心”甚至多中心的格局,積極在數據中心間互聯的廣域網部分引入SDN技術,實現更加高效、便捷的廣域網流量調度和運維管理,進一步提升廣域網帶寬價值。
三是盡量采用公有、標準化的SDN技術和產品,實現最廣泛軟硬件兼容,提升投資價值。
四是利用SDN全局視角特點,進一步采集各種流量、告警、狀態等數據,結合大數據分析、人工智能等技術,分析應用流量和安全流量,逐步實現真正智能的SDN網絡。■
