大數據已經成為繼云計算之后又一受追捧的熱點。日前,EMC全球副總裁兼中國區總裁蔡漢輝表示,企業的大數據之旅包括三個階段,第一個階段是以技術為重點的大數據基礎架構,靈活且可擴展;第二個階段是以人員和生產力為重點的靈活的分析和以數據科學家為中心的協作和自助服務,即社交化階段;第三階段則是以應用程序為重點,具有預測分析能力,即提供敏捷的環境。
在第一階段,EMC憑借Isilon、Atoms以及針對結構化數據分析的Greenplum Database和非結構數據分析的Hadoop平臺Greenplum HD,幫助用戶構建大數據基礎架構及分析引擎。而近日EMC推出的Greenplum Chorus則是一個基于協作分析的大數據的社交平臺,使大數據的腳步邁進第二階段。
據EMC全球副總裁兼中國卓越研發集團總經理李映介紹,EMC中國研發集團目前有超過100名研發工程師在從事大數據和與大數據相關的研發,尤其是Chorus產品從想法產生、市場需求收集、產品基礎研究、后期測試以及市場推廣,都是中國研發集團主導的。據介紹,Chorus主要包括個人沙盒、數據發掘、協作分析、開放架構四個重要的功能。
Greenplum這三款產品組成了EMC統一分析平臺。不過,在這個統一分析平臺中,還有一個重要的人物——EMC稱其為“數據科學家”,數據科學家是負責進行數據分析和解釋的。
蔡漢輝認為,數據科學家不同于首席數據官(CDO),他們應該具備扎實的數學計算基礎,懂得數據庫,擁有商業智能經驗,了解企業業務。在企業中,CDO應該是一個團隊,包括數據科學家、數據工程師、數據分析師、商業情報分析師以及事業部用戶,他們共同組成數據科學家團隊。不過,現階段勝任這一“頭銜”的人并不多見,因此,EMC Greenplum在全球有100多位具備“數據科學家”素質的服務咨詢人員為用戶提供服務。同時,EMC還與大學合作,共同培養“數據科學家”。相信,隨著大數據的步步深入,“數據科學家”將成為一個新的熱門崗位。
對于EMC中國大數據市場,蔡漢輝說,EMC的目標是未來3年每年翻一番。為了實現這一目標,EMC首先將依托核心市場銷售和咨詢顧問團隊,加強行業覆蓋;其次,利用在中國的3000多個渠道合作伙伴,重點挖掘和培養針對不同行業的二級渠道;第三,發揮中國本土研發團隊的優勢,開拓大數據市場。