萬寶秀 王智鋼 顧蕓涵 陳珠
摘 要:近年來,云計算作為一種新的服務模式已成為計算機科學領域的一個研究熱點。本文首先介紹了云計算的概念、特征及關鍵技術,然后對云計算下的網絡通信從4個方面進行了簡單的分析,最后提出了筆者下一步研究的方向。
關鍵詞:云計算 通信 虛擬化 網絡技術
中圖分類號:TP3 文獻標識碼:A 文章編號:1672-3791(2014)02(a)-0068-02
隨著輸水管道的日漸成熟,我們從自家打井取水逐漸過渡到通過水龍頭獲取來自自來水廠的水;隨著金融業的發展,人類從自己保藏財物逐漸過渡把錢存到銀行;同樣,隨著網絡通信技術的飛速發展,人類正在由通過利用個人存儲設備過渡到向數據中心獲取信息。云計算(cloud computing)是“第三次 IT革命”,它集中體現了信息時代網絡通信發展的方向。
1 云計算的概念
近年來,云計算作為一種新的服務模式,已經成為IT業討論最多的話題。云計算是讓用戶在不了解資源的情況下做到按照需求分配,把資源虛擬化為一片云,我們可以通過網絡的按照需求擴展方式來獲得所需的應用軟件及互聯網相關的服務。自從2007年IBM提出云計算的概念時,許多專家學者、相關產商以及專門的研究組織都相繼給出關于云計算的不同定義。結合自己的理解,筆者認同云計算是將存儲、通信、網絡、管理解決方案以及相關業務應用相聯系,以虛擬技術為核心,以用戶為主體,以網絡為載體的大型資源共享型商業服務模式。
2 云計算的特征及關鍵技術
“云”是存儲在互聯網集群上的資源,它包括硬件資源(服務器、存儲、CPU等)和軟件資源(應用軟件、集成開發環境等),本地計算機只需要通過互聯網發送一個需求信息,遠端就會有成千上萬的計算機為用戶提供需要的資源并將結果返回到本地計算機。云計算的主要特征總結為以下五點:共享模式;盈利模式;良好的擴展性;更低的成本;良好的可伸縮性。云計算的關鍵技術概括為以下四點:簡單的程序模型;數據存儲與管理;分布式數據庫;虛擬化技術。
3 云計算下的網絡通信分析
3.1 網絡虛擬化的實現
而隨著云計算的涌入,我們在思考如何實現網絡虛擬化,如何實現物理機內部的虛擬網絡,外部網絡又如何靈活調整以適應虛擬機對網絡不斷變化的要求,又如何確保網絡環境的安全性。
主機網絡虛擬化技術主要包括虛擬網卡技術和虛擬網橋技術,現在一般每臺物理機均有兩塊物理網卡,其中一塊物理網卡用于連接外網;另一塊網卡用于連接內網交換機。在虛擬機內部,虛擬機會看到兩塊網卡,一塊分配內網IP地址;另一塊分配了公網IP地址。很顯然,虛擬機對外發送的數據包的路由選路是根據虛擬機自身的路由配置決定的。同一臺物理機中的多臺虛擬機,我們還可以劃分VLAN,控制不同虛擬機間的通訊。
那么多塊虛擬網卡在同一臺物理服務器中共享一塊物理網卡的同時對外仍然表現為多塊獨立的網卡。這就借助于虛擬網橋,它是將多個虛擬網卡綁定到物理網卡并對虛擬網卡的流量進行可控的一種技術手段。
除了主機網絡的虛擬化,網絡設備的虛擬化也是很重要的技術,網絡設備虛擬化除了對于交換機核心架構的無阻塞的要求外,我們可以將多臺設備邏輯的看成一臺,類似于VSS(Virtual Switching Systems)技術,可以將兩臺設備邏輯地堆疊在一起,能夠做到相互的備份。網絡設備虛擬化可以將多臺網絡設備虛擬成多臺虛擬網絡設備,管理員接入任何一個設備都可以對該虛擬設備進行管理,從而在網絡部署和管理上都大大簡化了工作量。
3.2 網絡通信流量監控和性能
我們一般通過虛擬機交換機解決同一臺物理服務器內部的虛擬機二層網絡互訪問題,但其實使用虛擬機交換機還存在兩大問題:一是虛擬機之間的流量監控問題;二是性能問題,當虛擬機網絡流量越大,虛擬交換機就會占用越多的CPU資源,同時也會降低了服務器支持更多虛擬機的能力。
為了解決這兩大問題,采用兩種技術標準是802.1Qgb-edge virtual bridging(邊緣虛擬橋技術)和802.1BR-Bridge Port Extension。
邊緣虛擬橋技術是當前用于解決虛擬化環境中的虛擬機與互聯網之間的溝通與管理邊界問題而產生,并在此標準802.1 Qbg定義的框架基礎上可以實現VM生命周期與網絡的自動化關聯、網絡屬性的靈活變更。EVB技術中,VEB/VEPA各種部件位于服務器一側,對服務器的流量進行轉發,VEB/VEPA各種部件轉發的流量包括虛擬服務器之間,和虛擬服務器與邊緣交換機(與物理服務器直連)之間的全部流量。從技術實現的角度,以及某些特殊應用場景下,802.1Qbg的不同模式是可以同時存在的,并且技術上要求能夠多層級聯,這在標準預備文檔中也進行了描述。但在更多的場景下,并不需要復雜的級聯拓撲和層次,標準在使用上建議了一個基本的EVB架構。
802.1BR-Bridge Port Extension是CISCO提出的新技術,通過引入端口擴展技術,運用了MPLS技術的思想,為以太網報文增加TAG標簽,外部端口擴展設備使用TAG中的信息來實現報文轉發和策略控制。當然如何分發TAG必須新的協議的支持,雖說8021.Br提供了一整套的網絡虛擬化解決措施,但還是需要改變硬件設備來達到這樣的要求。
這兩種處于發展中的標準,我們還不能說誰更好,就像IP協議和ATM協議的發展一樣,隨著云計算技術的飛速發展,最終會有這樣的一種技術標準占據主流。
3.3 網絡通信中大數據的處理
我們正處在一個信息化的時代,據工業和信息化部電信管理局公布的最新統計數據顯示,我國網民數量達到5.64億人,手機網民規模4.2億,網民人均周上網時長達20.5小時。伴隨著上網的人數激增,我們在互聯網中產生的數據也是呈指數級增長。大量信息在給人們帶來方便的同時也帶來了很多的問題:第一是信息量大,難以消化;第二是信息真假難以辨識;第三是信息安全難以保證;第四是信息形式不一致,難以統一處理。這樣的網絡環境下,人們開始提出一個新的口號:“要學會拋棄信息”。人們開始想:“如何才能不被龐大的信息量淹沒,而是從中及時發現有用的知識、提高信息利用率?”這時出現了新的技術,能夠挖掘有用信息,“綠色”了網絡存儲環境——數據挖掘(Data Mining)技術便應用而生了。
數據挖掘的研究包括多個不同學科領域的技術和成果,使得目前的數據挖掘方法呈現多種多樣的形式。數據挖掘技術分為很多類,其中一種知識發現數據類挖掘技術,它包括關聯規則、人工神經元網絡、支持向量機、決策樹、粗糙集等多個方面。我們重點研究分布式并行關聯規則挖掘算法,該算法針對分布式應用數據架構,不需要產生全局FP-tree,避免了FP-tree可能過大而內存無法容納的問題,算法在各個主要步驟上都實現了并行處理。
結合現實,比如交通事故,它產生的數據本質是多維的,甚至是雜亂無章的,那么如何組織這些比較分散的數據呢?有必要研究一下車輛事故屬性。車輛事故屬性是指某次車輛事故發生時,人車路環境和時空狀態,以及車輛事故本身的特點。通過解析這些屬性,對其整理分析,進行數據挖掘。然后,我們可通過建立一些交通事故屬性的模型,以層次圖的形式,列出這些事故屬性,并且找出這些屬性之間的相關聯系,比如車輛屬性、天氣屬性、道路屬性、駕駛者屬性、時間屬性等等類似,考慮到各屬性之間的相關性,可以結合數學建模的方法,構建出星型全連接結構的數據結構i。最后我們可以借助關聯規則挖掘的算法求出所有的頻繁項集。
3.4 云計算下通信網絡的擁塞
由于遷移往往帶來服務器之間橫向流量的增加,導致云計算內部的流量模型從以縱向流量(用戶訪問服務器流量)為主轉變為以橫向流量(服務器之間的流量)為主,這樣的轉變會使我們對網絡的要求也會隨之調整,否則肯定帶來網絡的擁塞問題。
現在數據中心的網絡架構大多是分為核心、匯聚、接入層,這個時候如果當兩臺不同分支的設備進行互訪,仍然需要通過核心層,一方面增加了時延;另一方面也不適應云計算環境下的橫向流量的通訊,因為當橫向流量激增,肯定會造成網絡的阻塞。如果我們能夠將三層網絡結構簡化為二層結構(如圖1),雖說簡化,我們還是不能忽略網絡本身性能要求,在二層架構下我們還是有很多問題需要處理,比如環路問題,傳統的方式我們主要采用STP,阻塞相應的端口,這樣某個角度是浪費了帶寬,將某條鏈路閑置。因此,在云計算環境下,研究者重新從數據層(Data plane)和控制層(control plane)角度,目前生成樹方面采用的MSTP,根據鏈路的條數,創建MSTP的實例,在解決環路的同時,也做到充分利用了帶寬。
4 結語
伴隨著很多廠家對云計算開發的投入,眾多領域已經融入云計算技術及思想,筆者也開始自己關于云計算的探索,文章僅從四個方面對云計算下網絡通信進行了分析,就目前我了解的其他方面,包括云計算通信平臺架構搭建問題、數據關聯實現問題,想法還不夠成熟,我將會在后期的研究中加以探索。
參考文獻
[1] 雷萬云,夏兆彥.云計算-企業信息化建設策略與實踐[M].清華大學出版社,2010(10):1-51.
[2] 王占京.VPN網絡技術與業務應用[M].國防工業出版社,2015(5):11-103.
[3] 802.1Qbg - Edge Virtual Bridging ,http://www.ieee802.org/1/pages/802.1bg.html.
[4] 802.1BR - Bridge Port Extension ,http://www.ieee802.org/1/pages/802.1br.html.
[5] 徐雷.云計算下的網絡技術研究[J].通信學報,2012(12):45-89.
[6] 吳昊.基于關聯規則的道路交通事故數據挖掘[C].長春:吉林大學碩士學位論文集,2005.
[7] 王智鋼,王池社,馬青霞.分布式并行關聯規則挖掘算法研究[J].計算機應用與軟件,2013(10):100-119.
[8] 王云.關聯規則挖掘在道路交通事故分析中的應用[J].數據挖掘,2008(4):
[9] RyszardS.Michalski,IvanBratko,MiroslavKubat.機器學習與數據挖掘:方法和應用[M].張洋,譯.子工業出版社,2004.