王永
“從去年與Hortonworks完成合并后,Cloudera的定位和愿景是成為一家企業(yè)數(shù)據(jù)云的公司,包括Cloudera即將推出的下一代產(chǎn)品都是以企業(yè)的數(shù)據(jù)云作為主要方向。” Cloudera大中華區(qū)總經(jīng)理徐晉在接受筆者的采訪時(shí)表示,Cloudera希望能夠賦能于用戶把復(fù)雜的數(shù)據(jù)轉(zhuǎn)化成為清晰可行的洞察力,且能夠適用于任何云環(huán)境或者數(shù)據(jù)中心,提供數(shù)據(jù)全生命周期的云原生服務(wù)和軟件平臺(tái)。
關(guān)于數(shù)據(jù),幾乎全球所有的企業(yè)都數(shù)字化轉(zhuǎn)型,同樣也在尋求轉(zhuǎn)變成為數(shù)據(jù)驅(qū)動(dòng)類(lèi)型的企業(yè)。尤其是在國(guó)內(nèi)新冠疫情后,企業(yè)的數(shù)字化轉(zhuǎn)型也進(jìn)一步提速,在這一過(guò)程中,數(shù)據(jù)的價(jià)值日益重要。
在這樣一個(gè)大的背景下,各行各業(yè)在數(shù)據(jù)方面投入越來(lái)越多的資源來(lái)實(shí)現(xiàn)盡快將企業(yè)經(jīng)營(yíng)各個(gè)環(huán)節(jié)數(shù)字化,以促進(jìn)整個(gè)數(shù)字化轉(zhuǎn)型的進(jìn)程,這也勢(shì)必使整個(gè)企業(yè)收集的數(shù)據(jù)量越來(lái)越大。
去年哈佛商學(xué)院曾發(fā)布一個(gè)研究報(bào)告數(shù)據(jù)表明,無(wú)論是企業(yè)還是政府機(jī)關(guān),他們?cè)诓煌沫h(huán)境中收集、處理和管理數(shù)據(jù)。而且,在云環(huán)境中,不管是在組織內(nèi)部,還是在私有云、混合云,還是在多云或者單云,都有大量客戶把他們的數(shù)據(jù)存放在不同的地方進(jìn)行運(yùn)維和管理。
此時(shí),帶給企業(yè)的挑戰(zhàn)主要體現(xiàn)體現(xiàn)在兩個(gè)方面:面對(duì)復(fù)雜多變的環(huán)境,企業(yè)要如何正確的收集、管理數(shù)據(jù),以及如何形成一個(gè)統(tǒng)一的數(shù)據(jù)戰(zhàn)略,做到真正的把數(shù)據(jù)轉(zhuǎn)化成為真實(shí)可見(jiàn)的業(yè)務(wù)價(jià)值。
“對(duì)于Cloudera而言,我們是希望從數(shù)據(jù)安全、管理影子IT、云原生服務(wù)、完整的數(shù)據(jù)周期以及AI五個(gè)方面賦能企業(yè)客戶,”徐晉表示,安全問(wèn)題是企業(yè)上云過(guò)程中首要考慮的問(wèn)題。Cloudera希望客戶在任何地方運(yùn)行其數(shù)據(jù)資產(chǎn)都能夠確保一致的數(shù)據(jù)的安全性。實(shí)現(xiàn)對(duì)數(shù)據(jù)可行進(jìn)行有效的治理,很大程度上在整個(gè)企業(yè)范圍內(nèi)能夠確保這些數(shù)據(jù)的安全。
影子IT是Gartner提出來(lái)的概念,是指企業(yè)員工使用沒(méi)有經(jīng)過(guò)IT批準(zhǔn)的應(yīng)用程序。很多時(shí)候,IT往往在跟隨業(yè)務(wù)需求方面會(huì)有一定的遲滯,這造成很多業(yè)務(wù)部門(mén)會(huì)自己在外部去采購(gòu)很多的業(yè)務(wù)系統(tǒng),這就會(huì)造成很多數(shù)據(jù)孤島,對(duì)企業(yè)實(shí)現(xiàn)統(tǒng)一的數(shù)據(jù)戰(zhàn)略形成障礙。
“如何解決好業(yè)務(wù)部門(mén)和IT部門(mén)之間不同步的問(wèn)題,這需要通過(guò)諸如云原生數(shù)據(jù)技術(shù)來(lái)增加整個(gè)IT部門(mén)的敏捷來(lái)得以解決。”徐晉表示,Cloudera希望賦能客戶跨公、私有云的云原生的服務(wù)。幫助企業(yè)IT能夠連接完整的數(shù)據(jù)生命周期,從邊緣計(jì)算到經(jīng)過(guò)粗加工、精加工、以及數(shù)據(jù)科學(xué)和AI等能夠提供前瞻性預(yù)測(cè)的端到端的解決方案,為客戶提供一致的使用體驗(yàn)。
Cloudera Data Platform(CDP)是Cloudera與Hortonworks合并后推出的全新一代的數(shù)據(jù)平臺(tái)產(chǎn)品。它結(jié)合了Cloudera原產(chǎn)品CDH以及Hortonworks原產(chǎn)品HDP當(dāng)中最精華的部分融為一體,。它基本上是基于Apache開(kāi)源社區(qū)的將近30多個(gè)開(kāi)源項(xiàng)目,經(jīng)過(guò)研發(fā)、測(cè)試、整合后提供的一個(gè)可靠的基礎(chǔ)的大數(shù)據(jù)運(yùn)營(yíng)環(huán)境。
在此基礎(chǔ)之上,它還可以提供六方面的能力——數(shù)據(jù)中心、Data Flow & Streaming,用于數(shù)據(jù)的采集、Cloudera Data Engineering,做批量數(shù)據(jù)處理的組件、數(shù)據(jù)倉(cāng)庫(kù)、Operational Database,基于Hbase等一些實(shí)時(shí)的非結(jié)構(gòu)化的數(shù)據(jù)庫(kù)、以及機(jī)器學(xué)習(xí)平臺(tái)。
值得一提的是,在六大核心能力之上是Cloudera非常獨(dú)特的數(shù)據(jù)管理的一層——SDX,即共享數(shù)據(jù)體驗(yàn)。存放在Cloudera平臺(tái)上的數(shù)據(jù),用戶無(wú)論是把這些數(shù)據(jù)用做批量處理還是報(bào)表,都會(huì)提供統(tǒng)一的數(shù)據(jù)管理、統(tǒng)一的數(shù)據(jù)目錄、統(tǒng)一數(shù)據(jù)的安全管控。


除此之外,CDP的特點(diǎn)是可以在運(yùn)行不同的環(huán)境當(dāng)中,包括企業(yè)自己內(nèi)部的數(shù)據(jù)中心、私有云環(huán)境或者是多云/公有云,可都可以去運(yùn)行CDP,而且用戶的體驗(yàn)也是一致的。
近日,Cloudera發(fā)布了CDP的兩個(gè)最新版本:CDP的public cloud——基于PAAS層,以公有云服務(wù)的形式提供。以及 CDP的private cloud,這是Cloudera私有云的產(chǎn)品,主要是部署在企業(yè)的數(shù)據(jù)中心內(nèi)部。
“Cloudera的私有云版本跟傳統(tǒng)方式有些不同,我們會(huì)借用容器化的private cloud方式,一次性的去安裝CDP的private cloud版本,在設(shè)計(jì)好環(huán)境之后,可以在幾分鐘之內(nèi)就可部署好環(huán)境。”大中華區(qū)技術(shù)總監(jiān)劉隸放表示,部署在新的環(huán)境里面,用戶的安全管控機(jī)制是跟DC版本完全一致的,這完全符合Cloudera企業(yè)級(jí)的客戶對(duì)數(shù)據(jù)管控的要求。所以說(shuō)Cloudera私有云為用戶提供了一個(gè)上手更快、且真正意義上多租戶的版本。
劉隸放強(qiáng)調(diào),Cloudera會(huì)在公有云和私有云平臺(tái)上,用一種開(kāi)發(fā)模式在兩種云上都部署,這樣既可以保證產(chǎn)品的開(kāi)發(fā),又可以保證用戶的使用體驗(yàn)。也就是說(shuō)如果客戶有需求,比如從公有云往私有云上面去移自己的應(yīng)用或者反向去移自己的應(yīng)用都是可以實(shí)現(xiàn)的。
“邁向私有云是基于裸數(shù)據(jù)中心的數(shù)據(jù)分析體驗(yàn)的版本,這樣在已有的環(huán)境上面能夠快速去部署,用戶的IT或者業(yè)務(wù)部門(mén)可以自動(dòng)化的去做自主服務(wù)。” 劉隸放表示,Cloudera的私有云產(chǎn)品會(huì)為客戶帶來(lái)兩點(diǎn)改變——企業(yè)級(jí)的安全性和管控的機(jī)制,這是Cloudera在市場(chǎng)生存的重中之重,以及跨云的環(huán)境,讓用戶公有云、私有云,包括私有平臺(tái)上面得到一致的體驗(yàn)。
“Cloudera整個(gè)企業(yè)數(shù)據(jù)云在整個(gè)市場(chǎng)當(dāng)中,跟其他一些解決方案不一樣的地方。”在徐晉看來(lái),Cloudera的產(chǎn)品可以運(yùn)行在任何云環(huán)境里面,不管是私有云、公有云還是公有云中。其次,Cloudera提供的是全生命周期的平臺(tái),并且在整個(gè)數(shù)據(jù)生命周期里面提供了全套的數(shù)據(jù)安全跟數(shù)據(jù)治理這方面的功能。更重要的是,Cloudera平臺(tái)的開(kāi)放性。
“在Cloudera進(jìn)入中國(guó)這5年之內(nèi),可能我們最大的友商就是我們自己的開(kāi)源的版本。”徐晉表示,接下來(lái)Cloudera的各類(lèi)Apache組件依舊會(huì)按照Apache的協(xié)議提交到Apache社區(qū),任何對(duì)Apache社區(qū)的貢獻(xiàn),Cloudera會(huì)100%的開(kāi)源,繼續(xù)在社區(qū)做開(kāi)源項(xiàng)目的貢獻(xiàn),這也是Cloudera接下來(lái)產(chǎn)品發(fā)展堅(jiān)持的最重要元素。