企業數據呈幾何式增長,超大規模、動態可伸縮以及快速的并行分析能力對數據庫提出了更高要求。
隨著企業數據的呈幾何指數增加,數據存儲、管理和在線分析能力要求越來越高; 尤其是面對激烈的市場,企業只有更好地使用數據才能面對日益激烈的競爭。
近日,GreenPlum公司推出了最新的GreenPlum Database 4.0數據庫和首個商用企業數據庫云端運算平臺GreenPlum Chorus。GreenPlum的數據庫倉庫產品采用了MPP(Massively Parallel Processing)并行處理的架構,數據庫引擎是基于軟件的引擎,不依賴一些專有硬件平臺,同各種硬件和操作系統平臺有很強的兼容性,可以很輕易地使用10G的以太網絡、SSD存儲還有虛擬化技術來服務于數據分析。同時該架構具有很強的伸縮性,支持從幾個TB的數據到幾個PB(1PB=1000TB)的數據。
MPP中所使用的MapReduce是一種新的處理技術或者說是一種新的處理的框架,是谷歌發明的一種主要用于文本的分析檢索功能,使用這種技術,只需要增加節點就可以線性地提高系統的存儲容量和處理能力。Luke Lonergan說,為了充分發揮MapReduce這種特性,在GreenPlum數據庫系統中提供相應的API可供不同的編程語言調用。
除此之外,新產品在工作負載管理、自我恢復容錯和數據分析方面有了重大的突破。工作負載管理就是既要保證工作負載的全部完成,又要保證處理的優先級。Luke Lonergan說,工作負載管理利用資源隊列管理實現按用戶組的進行資源分配,比如: 保證公司的高層管理人員早晨一到辦公室就能夠拿到數據,同時保證其他被分配的任務全部順利完成,而且還有防止低質量的SQL對系統資源消耗的管理。
在數據分析方面,GreenPlum Database 4.0增加了更快的單行操作(選取、更新、插入和刪除)等的優化,加強了深度分析功能,引入新的分析方法。更為突出的是,是對在混合工作環境下的服務級別協議和請求的優化,Luke Lonergan說,當前越來越多的客戶在做數據分析處理的同時,也在做在線交易的處理,即OLTP(在線事務處理)和OLAP(在線分析處理)同時進行,GreenPlum數據庫能夠進行不同的分類和重新導向以便有效地加速交易處理的速度。
對于云端數據庫平臺Chorus,Luke Lonergan說,Chorus是一個具有數據庫能力虛擬化的云平臺,企業用戶可通過GreenPlum的數據庫和Chorus,建設強大的企業級的數據“云”系統: Chorus包括了三個主要的功能,自助服務供應、數據庫實例(DataBase Instance)、數據集市管理。