“VMware可以解決私有云問題,Amazon AWS可以解決公有云的問題,而在公有云、私有云這兩個方面都有一個完整、可靠的解決方案的,我相信只有我們能做好”。青云QingCloud CTO甘泉平靜而堅定的話語擲地有聲。
甘泉能夠如此自信,源于QingCloud網絡架構的SDN/NFV 2.0成功升級給QingCloud帶來的幾乎無限的水平擴展能力,以及由此給QingCloud帶來的在公有云和私有云領域進一步鞏固其領先地位的契機。
雖然基于SDN/NFV 1.0網絡架構的QingCloud擁有眾多用戶,但是隨著用戶規模的逐漸擴大,QingCloud在運營的過程中發現,如果網絡架構不做改變,未來將會面臨非常大的挑戰。

青云QingCloud CTO 甘泉
甘泉表示,QingCloud從2013年上線至今,經過兩年多的發展,QingCloud的用戶在規模上有了質的變化,而且從現在的用戶規模發展的趨勢來看,很快就會有超級用戶落戶QingCloud。這些超級客戶可能會有上千臺物理機的規模,從而使得虛擬機的規模達到上萬臺。而面對上萬臺虛機規模的部署,QingCloud現在的SDN/NFV 1.0網絡架構就會遇到很大的挑戰。
首先,青云QingCloud的SDN/NFV 1.0網絡架構實現的虛擬網絡是對物理網絡的模擬。所以青云QingCloud的SDN/NFV 1.0網絡是一種樹狀結構。樹狀結構在中小規模部署的時候沒有問題,這是為什么QingCloud的SDN/NFV 1.0網絡能夠一直用到現在的原因。然而,當大規模部署成為現實的時候,這種樹狀結構就會導致節點之間的交互、延遲越來越高,整個系統的性能也會隨之快速降低。這是QingCloud的SDN/NFV 1.0網絡架構最根本的一個問題,除非對網絡架構進行改變,否則無法從根本上解決這個問題。此外,對于私有云用戶而言,他們通常會把虛機當作物理機來用。這樣的話,用戶將不能忍受IP的改變。因為對于物理主機而言,IP地址是這臺機器的惟一標識,因此,在虛擬環境中,用戶也需要每臺虛擬機的IP地址固定,即使該虛機在虛擬環境中隨意遷移。這在小規模部署的時候,矛盾并不突出,但在大規模部署時,面對成千上萬臺需要保持IP地址不變的虛機,這將是一個巨大的挑戰。
其次,從功能性的要求方面來說,青云QingCloud的SDN/NFV 1.0虛擬網絡架構和物理網絡的架構并沒有本質上的區別,整個虛擬網絡與外部網絡也是通過虛擬的交換機或者路由器來進行鏈接。這樣虛擬網絡中所有的流量最終都會集中在某一個虛擬路由器上,而這個虛擬路由器的性能將會對整個系統的性能產生巨大影響。所以,可以想象,當大規模部署發生的時候,這臺虛擬路由器有限的性能將會成為整個系統的瓶頸。
因此,QingCloud必須對現有網絡架構進行變革,搭建新一代的網絡來適應用戶未來的需求。
為了適應未來的挑戰,青云QingCloud提出了新一代網絡的三大目標:第一,新一代網絡要能適應超大規模的部署要求;第二,新一代網絡要有接近物理硬件的虛擬網絡性能;第三,新一代網絡要功能完善,適應各種組網的需求。
基于以上需求,Qing Cloud SDN/NFV 2.0應運而生。QingCloud SDN/NFV 2.0可以實現幾乎無限的水平擴展,虛擬機可以在集群里任意遷移,而IP地址保持不變。同時,QingCloud大型的VPC能力,可以在保證性能的情況下,讓多達6萬臺虛擬機實現可用。
甘泉表示,QingCloud SDN/NFV 2.0接近物理硬件的網絡性能主要是通過將智能下移至Linux Kernel層來實現。通過在Linux Kernel層實現智能,使得虛擬機之間的網絡通訊實現最優路徑,摒棄了對軟交換機和軟路由器的依賴。同時,將所有智能控制集中在Linux Kernel層,大幅提升了網絡的性能,并且不會隨著規模的擴大而降低性能。
QingCloud SDN/NFV 2.0能夠同時保證公網IP全網綁定。即公網IP不僅能夠綁定基礎網絡的主機,也可以綁定私有網絡內的主機。通過QingCloud SDN/NFV 2.0的支持,在QingCloud創建的任何一臺虛擬主機都可以直接綁定公網IP,這樣私有網絡跟Internet之間就可以得到幾乎無限的帶寬,同時,這些私有網絡之間還可以實現水平的擴展。此外,負載均衡器也一樣可以做到全網直達,并且私有網絡的每一臺主機都可以綁定防火墻。
甘泉表示,實際上,青云QingCloud新一代的網絡架構SDN/NFV 2.0相對于1.0從架構原理上來說沒什么太大的變化,只是在實現細節上發生了變化。
首先,QingCloud SDN/NFV 2.0將QingCloud SDN/NFV 1.0的二層網由原來的樹狀結構變成網狀結構,從而實現了所有的交換和通訊都是點對點的。即虛擬主機之間、控制器之間的通訊都是點對點的,不再通過第三方來實現,從而大大提升了通訊效率。
其次,QingCloud SDN/NFV 2.0將QingCloud SDN/NFV 1.0 的 VR(Virtual Router,虛擬路由器)拆分成了一個ER(Edge Router,邊緣路由器)以及若干個DR(Distributer Router,分布式路由器),這些DR和一個ER實現了以前一個VR的功能。同時,在控制層面,將一個VPC的控制器分解成若干個分布式控制器,從而實現了系統性能的水平擴展。
第三,相對于QingCloud SDN/NFV 1.0,在 QingCloud SDN/NFV 2.0中,EIP、公網IP不僅可以綁定在ER(Edge Router)上,更可以直接綁定到VM上。這就使得整個網絡的通道變得非常寬廣,整個網絡的效率也有了一個質的變化。
簡單的講,QingCloud的SDN/NFV 2.0版本相對于1.0版本的重要變化就是使用網狀網絡取代樹狀網絡;分布式網關取代傳統的集中式路由器,分散流量到每個計算節點;基礎網絡結合了物理網絡和虛擬網絡。
通過這些實現細節的改變,青云QingCloud獲得了水平擴展的能力,從而給系統提供了近乎無限的性能擴展能力,解決了未來大規模部署遇到的難題。同時由于使用了分布式控制器,青云QingCloud將不需要用戶擁有支持SDN/NFV 2.0的交換機或路由器,這就使得用戶的網絡變得靈活而具有彈性,并且不會依賴于任何廠商的硬件,從而在保護IT投資的同時又避免了廠商綁定。
甘泉透露,采用全新SDN/NFV 2.0架構部署的北京三區將會在近期對用戶全面開放,北京三區不僅在內部的網絡結構上有所變化,在機房結構上有了很大的變化,同時,還具備了更強的抗DDoS能力。青云QingCloud相信這個新的采用SDN/NFV 2.0網絡架構的北京三區會對所有私有云用戶具有非常強烈的吸引力。同時,從2016年起,青云QingCloud的私有云以及公有云都會采用新的SDN/NFV 2.0網絡架構來部署。
甘泉最后表示,青云Qing Cloud之所以要做SDN/NFV 2.0,絕不是為了噱頭,只是為了更好滿足用戶的需求,無論過去、現在和未來,青云QingCloud都將遵循這一理念繼續的走下去。