文 人民郵電出版社 何鵬
盡管大數據時代的風暴早已席卷全球,EMC、微軟、甲骨文、IBM等巨頭早已在風暴中手擎閃電,爭當大數據時代下新世界的宙斯主宰,但是大數據和云計算的雙駕馬車卻以神速疾馳,在“諸神之戰”中為大數據未來留下一片澄澈的藍海。而大數據和云計算之所以同車同軌、交蔓相生近乎唇齒,正因為它們對彼此的需求正盛,而數不盡的分析報告競相表明,大數據和云計算將在長到難以預知的一段時期內保持這種緊密的關系。
難能可貴的是,不論未來技術趨勢如何風云變幻、商業模式怎樣演繹更迭,我們都可清晰的辨識大數據和云計算在企業應用領域交織的發展方向:以信息價值為企業的核心資產。高森明晨所提出的企業信息聚合論,正是將云計算平臺所承載的大數據技術更好地應用在企業信息價值領域。
不知哪天開始,知名的互聯網企業、平臺服務商在各類招聘渠道中增設了一個職位:大數據分析師。也許在茫茫消費者大軍中我們無法感受到這個職位的重要性,但對數據挖掘、分析人才資源的競爭,卻悄然拉開了大數據時代的序幕。
這個時代最為顯著的特征是“數據成為企業核心資產”,簡單的說,企業需利用大數據更加貼近消費者,接近消費者的最真實的需求。消費者充分成為數據的提供者和分享者,這得益于現今時代的兩個顯著變化:第一,消費者和網民兩個角色的界限逐漸消失。第二,網民因移動互聯網而提升到一個全新的量級。可以說在移動互聯網高速發展的基礎上,大數據時代才真正到來,移動互聯網用戶對大數據體系的構筑、信息類別的產生、信息量的擴容都是大數據形成氣候必不可少的因素。
亦如移動互聯網,大數據時代具有不可逆性,任何企業都將置身其中,疏遠大數據所造成的價值體衰落不是依靠管理就能逆轉的。而實際上,大數據在移動互聯網時代對企業產生的價值不僅僅局限于企業面對的消費者個體信息,同樣也有市場信息,通路信息,競爭對手信息等等,它們通常作為非結構化數據出現,在移動互聯網應用普及之前,企業是無法掌握、把控這些信息的,而在大數據分析技術產生之前,企業又無法處理和利用這些信息,可以說,移動互聯和大數據是企業開始獲取非結構化數據價值的兩個必備技術條件。
高森明晨公司作為一家立足于移動互聯網企業級應用,并致力于通過構建云平臺與數據挖掘共生體系,為企業提供智慧管理服務的研發型企業,專門組建了由云計算和數據挖掘人才共同擔綱的研究團隊。長期以來,高森明晨從“企業信息聚合”的自主創新理念出發,幫助企業在大數據時代的新形勢下,緊抓游離在銷售一線、市場周圍、競爭對手附近的的海量價值數據。前文說到移動互聯網是大數據時代的使者,是大數據流云集的管道,也是大數據分類的基礎。高森明晨同樣認為,移動互聯網更區分了大數據與數據倉庫、BI(商業智慧分析)等數據技術領域,因為數據倉庫和BI并沒有嚴格的時間限定,而是一個看似漫長的積累和沉淀的過程,只有擁有一定時期的一定量的數據,數據倉庫才能夠成立,BI才具有實際意義。但是大數據卻并非如此,實時性是大數據挖掘和分析一大特征,也是必備條件,大數據相對于數據倉庫、BI的分析結果,實時性要求往往是一秒與幾天的差距。所以在大數據兩大管道中,“大交易數據”包含著來自企業、消費者和供應鏈的交易信息,“大交互數據”則包含了SNS、互聯網、物聯網以及移動終端數據。我們明顯看到,在“大交互數據”管道中,移動互聯網技術的占有率是極高的,可以說是SNS、互聯網、物聯網、移動終端這四個數據渠道未來發展的方向和載體。
高森明晨的一款基于企業信息聚合理論,面向企業零售終端管理業務的應用產品GRIRMS(中國電信“銷售管家”),就充分挖掘和利用了大數據時代移動互聯網的技術特點,在一些大型零售企業的終端管理中,GRIRMS使移動互聯網成為了企業快速收集結構化和非結構化的各類數據信息的工具管道,使云計算真正成為了妥善貯存大數據,分析處理大數據、合理利用大數據的最佳平臺。GRIRMS的客戶企業中,不乏傳統的快消行業、家電行業、制造業等行業、企業,但這些企業幾乎在同一時間意識到終端數據信息對于自身發展所起到的決定性作用。在這些行業、企業的零售終端,銷售人員已經可以按照GRIRMS內置于移動終端中的工作流程開展一天的工作。而在GRIRMS 4代新版本的企業級社交SNS模塊中,一線人員可以各抒己見,發表對工作中周遭一切的看法,這些看法可能是赤裸裸的市場數據、競品動態,也可能是他們充滿個人情感意味的觀點。而這所有的信息都將被利用移動終端采集起來,經過大數據聚類分析等手段,把最為可靠的信息篩選出來,并通過GRIRMS的BA模塊,將這些雜七雜八的可靠信息還原成直觀的結構化數據,呈現在管理者面前,作為企業管理團隊最重要的策略調整依據。這就完成了一個企業信息聚合的過程,在此之前,管理者對企業外部數據信息的需求、分類、篩選和利用都是帶有偏見和個人性質的,很有可能誤導決策,企業信息聚合的過程可以大大降低這種偏見、不產生任何副作用。
在此基礎上,GRIRMS從企業的長遠價值角度出發,完整覆蓋了盤踞在企業終端的,企業所急需的大數據信息流(包括類似進銷存等結構化數據),不斷為企業專屬數據倉庫、BI資源添磚加瓦。
從移動互聯網獲得的消費者信息、終端數據、經濟地理信息無限迫近消費市場的真實需求,儼然成為企業商家的“必知”,只有知曉洞悉這些“必知”,才知道何時何地是“必爭”。然而謂之大數據,更因為它所涵蓋的信息類別,信息數量之巨大寬廣無極,海天方容,當眾多企業級聚合大數據流匯集一處的時候,儲存容納、分析處理、結果分發就對原有的群組服務器式IT架構產生了較大的負荷。
現在,大數據運算具備了沒有邊際和上限困擾的云計算來承載,云計算主導貫穿了大數據儲存、挖掘、分析、利用的幾個最重要的環節,是云計算使得大數據價值充分體現,使得聚合信息效應能充分涵蓋企業業務流,而不會因為過高的信息化平臺投入而降低大數據對企業的價值回報。
自2009年公司成立之初,高森明晨就著手組建自有云計算平臺,進行云計算技術企業應用基礎理論的研究。在高森明晨剛剛發布的《廣泛應用型云計算技術(GAC)白皮書》中,公司CTO金晨博士明確指出隨著GAC平臺衍進至第二代,高森明晨為客戶企業提供的大數據挖掘、分析服務將逐漸從行業應用這種產品形式的服務末端,成為行業應用服務的重心,并將逐漸成為高森明晨所提供的重點服務方向之一。目前,以GAC平臺為依托,高森明晨已向國內國際多個知名大型企業提供綜合管理解決方案。對于大數據挖掘和云計算平臺的平行校驗正在有序進行,在不久的將來,高森明晨將成為大數據時代云計算平臺和數據分析解決方案的整合提供商。
回顧大數據的四個主要特征,即4個V:多樣性(Variety)、體量(Volume)、速度(Velocity)、價值(Value),正體現云計算的重要性支撐,云計算不但能提供容納大數據流的空間,更重要的是提供給大數據分析以所需的運算能力,云計算的分布式并行計算能力讓企業在進行大數據分析的過程中,再無需架設低性價比的服務器集群,也不再擔憂現有的服務器集群多數時段空閑、少數時段又不夠用,或者碌碌無為又或者徒勞無功。
大數據的價值毋庸置疑,但是進行大數據挖掘有如沙河淘金,大數據由24小時不間斷的各類數據流組成,對于企業來說,在信息聚合的過程中就有大量冗余數據和不相關數據需要通過數據挖掘、聚類進行有效篩選和排除。因此,大數據的價值密度是比較低的。這就需要大量的反復運算和并行運算來保證信息的實時性,確保信息價值不會因處理不及時或不當而流失。如果采用無限增置集群服務器的方法,要達到這種瞬間的巨幅運算能力,顯然要付出高昂的代價。而隨著云計算技術的誕生和發展,這個問題就迎刃而解,高森明晨正在努力通過自有云平臺,實現不額外收取企業客戶費用的企業數據信息挖掘、分析服務,為企業客戶實時呈現直觀的數據分析結果。
與此同時,對終端大數據信息的利用成為了繼ERP、CRM、財務軟件和協同辦公等等企業級信息化服務之后的又一大產業鏈,相比上述軟件服務,圍繞大數據展開的移動互聯網企業信息化服務則更易形成規模、也更具藍海特質。
在這個行業中,誰更具有洞察企業需求的目光,更能夠將移動互聯網、云計算與大數據三大技術領域相融合,誰就更容易存活和發展。也正因為有了這樣一個專業領域,企業同樣可以在不搭建信息化平臺、不雇用專門的技術人員,不投入專項資金的條件下,獲得有針對性的服務。這不但大幅降低了大型企業進行數據分析的成本,對中小企業的幫助尤大,中小企業同樣具有獲知消費者信息的剛性需求,專業的大數據挖掘和云計算平臺服務提供使大數據采集、挖掘、分析和利用的門檻日益消失,也使得中小企業和信息化之間多年的隔閡消弭。
拿GRIRMS舉例來說,它歷經了為企業量身定制服務的1.0和2.0版本,在3.0到3.5版本區間完成了從“按需定制”到“功能配置”的過渡,而從已發布的4.0版本開始,GRIRMS已經實現讓企業客戶完全通過SaaS(軟件即服務)的方式,選配適合自身的系統服務,而完全無需事先采購服務器,招聘相關技術人員,甚至使用培訓環節也大大簡化了,這也讓中小企業有了更多樣、更便捷、更輕松的選擇。
言而總之,移動互聯技術讓企業和信息化服務提供商高效率的獲取數據信息,云計算則作為基礎讓信息化服務提供商和企業分別從過程和結果兩方面更專注于信息的聚合。信息聚合讓大數據有更加廣闊的應用空間,讓非結構化的價值信息有了用武之地,讓更多企業通過更智慧的數據分析接近消費市場,接近企業管理的本源。