崔超
摘 要:現階段,計算機和網絡正在快速發展,并在生產、生活中發揮著越來越重要的作用。與此同時,人們對計算機和網絡的有關功能也提出了更高要求。在此推動下,云計算和云數據管理應運而生,能夠為不同的用戶提供相應的計算服務、存儲服務、其他軟件服務。本文將基于云計算和云數據管理技術進行相應的分析,以期為同行提供一些有益的參考。
關鍵詞:云計算;云數據;管理技術
1 云計算概述
1.1 工作原理
云計算工作原理如下:無需借助本地計算機(或者是遠程服務器)[2],便能夠將計算合理分布在一系列分布式計算機上,以實現對企業數據中心運行的有效優化,并和互聯網形成有效對接。如此一來,企業便能夠將所需資源及時而準確地切換到相關應用上,然后結合實際需求對相關計算機及存儲系統進行即時訪問。云計算屬于一項極具實用價值的新技術,使計算能力具有商品性質,并通過網絡予以兜售,不僅節約了銷售成本,同時還具有實用快捷的優點。
1.2 體系結構
云計算體系結構具有一定的復雜性,且較為龐大,以“云”網絡為中樞,連接一系列并發的網絡計算以及相關服務,能夠在虛擬化技術的幫助下,對各個服務器的能力進行擴展,并借助云計算平臺把一系列資源有機地結合在一起,從而為用戶提供強大的計算能力及存儲能力[3]。一個相對完整的體系主要包括四大部分,一是云端用戶,二是服務目錄,三是管理系統,四是部署工具、監控、服務器集群。
2 云數據管理技術
2.1 特點
云計算中數據主要具有三大特點,一是海量性,二是異構性,三是非確定性。
2.2 相關技術概述
GFS技術,Google文件系統是一個大型的分布式文件系統;BigTable技術,建立在GFS和MapReduce之上的一個大型的分布式數據庫;Dynamo技術,是一個高可用,專有的鍵值結構化存儲系統,或分布式存儲系統;MapReduce技術,即MapRedace編程模式。
2.3 云數據管理技術分析
隨著研究的不斷深入,以GFS為代表的一系列云計算數據管理技術也得以不斷完善,并圍繞云計算所涉及的海量數據計算、存儲以及應用問題,提出了諸多創新,云數據管理技術的總體架構如圖1所示。
云計算數據管理可被歸結為4個層次:⑴數據組織與管理。在分布式存儲技術的幫助下,可對大型數據予以訪問,可對分布式數據予以訪問,還可對大量數據予以訪問,以GFS技術為代表,能夠適應于一系列相同或者類似的普通硬件上,具有強大的容錯功能,從而保證了用戶對數據的訪問、獲取及存儲需求,不僅可靠,而且高并發,還具有高性能的特點。⑵數據集成與管理。針對數據所具有的海量性、異構性以及非確定性特點,借助以Bigtabe為代表的一系列分布式數據管理技術以實現對大規模數據的高效分析及系統處理,從而為用戶提供更為及時、準確、優質的服務。⑶分布式并行處理。在分布式環境下,為了實現對數據的深層次挖掘和高效處理,采用建立在云計算這一基礎之上的并行編程模式,以MapReduce技術為例,能夠對任務予以自動劃分,使其成為多項子任務,先后經過映射及化簡處理,便能將任務在大型化規模計算節點中進行理想調度和有機分配。在此過程中,無論是后臺并行執行,又或者是后臺任務調度,均以透明、公開的形式面向編程人員及用戶。⑷數據分析。對于云計算數據管理而言,在最后階段,需對數據展開相應分析及深層次發掘,并為一系列應用提供服務,通常借助專業的數據挖掘引擎以實現對數據的綜合布局和合理調度。另外,還可借助淺(深)層語義分析技術以實現在不完全確定知識的前提下對數據展開深層次的挖掘,如此一來,便能夠從結構化關系數據庫所包含的一系列數據、文本(有可能以半結構化存在)、圖形及圖像信息中提取出潛在的、事先尚未獲知的、有價值的、且能夠為用戶所讀懂的數據。
3 結束語
云計算由于具有海量性、異構性以及非確定性等一系列優點,因而在現階段得到了廣泛應用,且展現出了良好的應用前景。然而云計算的云計算管理畢竟發展時間不長,還存在諸多不完善之處,機遇和挑戰共存,有鑒于此,本文提出了基于數據組織與管理、數據集成與管理、分布式并行處理、數據分析的4層次云數據管理方式,這也是未來一段時間內,云計算數據管理的一個主要發展方向。
[參考文獻]
[1]全快.分析云計算和云數據管理技術[J].無線互聯科技,2012,10:84.
[2]高偉.淺淡云計算和云數據管理技術[J].無線互聯科技,2013,02:29.
[3]南志海.云計算和云數據管理技術探討[J].硅谷,2013,06:7+3.