數(shù)據(jù)庫(kù)市場(chǎng)歷來(lái)是廠商的必爭(zhēng)之地,幾大軟件廠商都有相關(guān)的產(chǎn)品。但是,對(duì)于用戶而言,現(xiàn)在的問(wèn)題不是數(shù)據(jù)庫(kù)不能用,而是數(shù)據(jù)庫(kù)中的數(shù)據(jù)越來(lái)越多。
曾經(jīng)有一家上市網(wǎng)絡(luò)公司,會(huì)定期向股東提交財(cái)務(wù)報(bào)表,但是由于數(shù)據(jù)量巨大,往往到了提交報(bào)告的前一天晚上才能把數(shù)據(jù)分析出來(lái),這給該公司的財(cái)務(wù)部門(mén)和IT部門(mén)帶來(lái)很大壓力。后來(lái)該公司采用了Greenplum公司的數(shù)據(jù)倉(cāng)庫(kù)解決方案,從以往的65小時(shí)提取數(shù)據(jù)縮短到了48分鐘,為數(shù)據(jù)分析工具留出了充足的時(shí)間。
Greenplum公司成立于2003年,公司成立的頭三年內(nèi),一直在開(kāi)發(fā)產(chǎn)品,而非開(kāi)拓市場(chǎng),等產(chǎn)品投向市場(chǎng)后,迅速贏得了諸如eBay、納斯達(dá)克、紐約證券交易所等重量級(jí)的用戶,在數(shù)據(jù)分析市場(chǎng)占據(jù)了一席之地。
Greenplum大中華區(qū)總裁Stanley Chew認(rèn)為,向用戶提供高性能的超級(jí)數(shù)據(jù)引擎,并將強(qiáng)大的并行計(jì)算能力融入到大規(guī)模數(shù)據(jù)倉(cāng)庫(kù)分析領(lǐng)域中,這是Greenplum公司即將做的,也是公司的強(qiáng)項(xiàng)。
為什么Greenplum在中國(guó)市場(chǎng)進(jìn)入一年多,就能贏得中信實(shí)業(yè)銀行、東方航空公司、阿里巴巴等大公司的青睞?Chew認(rèn)為,這些大公司在行業(yè)中發(fā)展速度快,數(shù)據(jù)增長(zhǎng)快,很看重?cái)?shù)據(jù)分析軟件。而市場(chǎng)中大部分的BI分析軟件和數(shù)據(jù)庫(kù)管理軟件的通病是,對(duì)數(shù)據(jù)的管理能力很弱,往往提取、整合數(shù)據(jù)的時(shí)間比分析數(shù)據(jù)的時(shí)間還要長(zhǎng)。
傳統(tǒng)的OLTP(On-Line Transaction Processing,聯(lián)機(jī)事務(wù)處理系統(tǒng))數(shù)據(jù)庫(kù)在TB級(jí)別以上數(shù)據(jù)管理中已經(jīng)是捉襟見(jiàn)肘,采取MPP(Massively Parallel Processing)架構(gòu)的數(shù)據(jù)庫(kù)系統(tǒng)才能對(duì)海量數(shù)據(jù)進(jìn)行管理。而Greenplum的做法是,將來(lái)自不同源系統(tǒng)的,不同部門(mén)、不同平臺(tái)的數(shù)據(jù)集成到數(shù)據(jù)庫(kù)中集中存放,利用強(qiáng)大并行處理能力提供并發(fā)支持。
Greenplum的MPP采用并行處理架構(gòu),在MPP架構(gòu)中增加節(jié)點(diǎn)就可以線性提高系統(tǒng)的存儲(chǔ)容量和處理能力。Greenplum在擴(kuò)展節(jié)點(diǎn)時(shí)操作簡(jiǎn)單,在很短時(shí)間內(nèi)就能完成數(shù)據(jù)的重新分布。數(shù)據(jù)處理請(qǐng)求會(huì)被拆分為N個(gè)節(jié)點(diǎn)并行處理,每一個(gè)節(jié)點(diǎn)處理一部分?jǐn)?shù)據(jù)的提取和整合,再歸納到BI工具“可以讀懂”的數(shù)據(jù)倉(cāng)庫(kù),從而縮短了數(shù)據(jù)提取的時(shí)間。
Stanley Chew說(shuō),Greenplum不做數(shù)據(jù)倉(cāng)庫(kù),也不做數(shù)據(jù)分析,而是要做數(shù)據(jù)“提取和整合”,通過(guò)準(zhǔn)實(shí)時(shí)、實(shí)時(shí)的數(shù)據(jù)加載方式,實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)的實(shí)時(shí)更新,進(jìn)而實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)(ADW)。基于動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù),業(yè)務(wù)用戶能對(duì)當(dāng)前業(yè)務(wù)數(shù)據(jù)進(jìn)行BI實(shí)時(shí)分析——“Just In Time BI”,能夠讓企業(yè)敏銳感知市場(chǎng)的變化,加快決策支持反應(yīng)速度。