文 / 王 冰
編者按:如果說在過去的三十年時光里,很多企業家是靠著膽識與魄力崛起的話,那么,這樣一個時代正漸行漸遠。在全球化和信息化時代,整個社會都發生了巨大而深刻的變化——當年的雙軌制和資源的匱乏與信息的不對稱,迫使人們力圖改變現狀;改變生活狀態,于是造就了一大批先知先覺、敢為天下先的企業精英與社會中產階級。而今天,那種依靠自己的直覺打拼的人們會發現,你如果還停留在“昨夜星辰昨夜風”里,可能前面的路就不那么好走。“跟著感覺走,緊抓住夢的手,腳步越來越輕,越來越快活”的歲月已到了夢斷時分。
隨著大數據時代的來臨,掌握和應用大數據來指導一個企業、一個地區乃至一個國家的決策正變得越來越迫切,這也是當今每一位政府官員以及CEO們每天都要面對的問題。而那些看起來難以量化的問題,在大數據應用上都有一套完整的方法,都是可以量化的,而且并不復雜。這些問題范圍廣闊,上到人口、環境、空氣污染對健康的影響,比如北京的PM2.5到底對市民有多大影響,下到典型的行業問題,如在中國的四線城市、人壽保險市場容量有多大等等,這些都是可以量化的,這個“大數據”就是一門通用的量化學問,而這種學問并非玄虛,實際上是一種“應用信息經濟學”。許多具有靈敏嗅覺的企業家正逐步地認識到,如果我們不能應用好這門學問,不管是企業的產品銷售還是創新的方向都缺少根基。其實今天這樣一個信息化的時代,盡管各種各樣的信息紛來沓至,弄得我們精疲力盡,甚至對自己企業所處的行業環境和社會環境都不甚了了,只憑著感覺往前走。這種心態和運作模式在以這個工具,往還說得過去;可是到了今天,如果不能應用大數據來幫助企業看清前路,把握眼下,十有八九會摔跤的。
我們常常看到一些企業或者園區編制的可行性研究報告或建設方案,對于其中所用的數據實在不敢茍同,因為與實際情況相差太遠。往往報告撰寫者是從一些報章雜志上摘取一些相互矛盾的數據作為支撐,如何過僅僅是說說而已也罷,關鍵在于后面的許多項目還要依次為依托,這背后是巨大的企業流向與建設資金的投入。往往一些項目建設之日便是無休無止的虧損之時。這不能不讓人扼腕浩嘆。且看今天中國再生資源產業這么多園區,又有幾個能夠走入良性發展之路;這么多的再生利用項目,又有幾個真正盈利?今天,我們已經走入了全球化時代,任何一個項目的建設都與整個經濟環境相連;都與整個產業緊密相連;都需要對與項目相關聯的數據進行大量的收集與歸納工作,在大數據支撐下的項目盡管不那么“耀眼”;不那么“光鮮”,但是它實實在在建立在海量數據的分析之后對項目的精準定位。這一點,一些發達國家企業在確定項目之前的“慢”與“迂”卻為我們提供了一個很值得參考的例證。大數據時代已經來臨。盡管不少的企業和部門在決策項目和開展業務的時候還在過去“瞎著買,瞎著賣,還有瞎子在等待”的混沌度日的舊窠臼中懵懂前行。但是,時不我待。在科學的決策的指導下,走出一條符合客觀規律的發展道路。人們常說,對一件事物,你如果你不能正確描述,那你就無法衡量,你要是無法衡量,那又如何正確的管理與駕馭呢?不管人們怎樣認識這個世界,大數據的應用將是一個必然的趨勢,認識得越早,應用得越快,成功的把握越大,這就是現實。
大數據時代的來臨,互聯網基礎架構的成熟,云計算技術的助推,催生了一系列新的商業模式,數據或信息服務成市場寵兒。如何通過對海量數據的挖掘與分析,發現數據中蘊藏的商業機遇,成為企業尋求決策依據、提升競爭力的重要途徑。
最早提出“大數據時代到來”的是全球頂級管理咨詢公司麥肯錫,而托夫勒1980年在《第三次浪潮》中就預言過大數據,但真正把大數據推向公眾視野的是潛心研究大數據10年之久的牛津大學教授維克托·邁爾·舍恩伯格,他思維的神髓之處在于,點出了大數據時代最大轉變——放棄對因果關系的渴求,取而代之的是關注相關關系。只要知道“是什么”,而不需要知道“為什么”。這是對千百年來人類思維慣性的顛覆,對人類的認知及與外界交流的方式提出了全新的挑戰。

大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過目前主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。大數據具有4V特點,分別是:Volume、Velocity、Variety、Veracity。這四個特點的含義是:第一,數據體量巨大。從TB級別,躍升到PB級別;第二,數據類型繁多。前文提到的網絡日志、視頻、圖片、地理位置信息等等。第三,價值密度低,商業價值高。以視頻為例,連續不間斷監控過程中,可能有用的數據僅僅有一兩秒。第四,處理速度快。1秒定律。最后這一點也是和傳統的數據挖掘技術有著本質的不同。
對于“大數據”,研究機構Gartner給出了這樣的定義。“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
從某種程度上說,大數據是數據分析的前沿技術。簡言之,從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。明白這一點至關重要,也正是這一點促使該技術具備走向眾多企業的潛力。
物聯網、云計算、移動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數據來源或者承載的方式。
大數據技術的戰略意義不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化處理。換言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。中國物聯網校企聯盟認為,物聯網的發展離不開大數據,依靠大數據可以提供足夠有利的資源。
隨著云時代的來臨,大數據(Big data)也吸引了越來越多人的關注。《著云臺》的分析師團隊認為,大數據(Big data)通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢。大數據分析常和云計算聯系到一起,因為實時的大型數據集分析需要像MapReduce一樣的框架來向數十、數百或甚至數千的電腦分配工作。
大數據分析相比于傳統的數據倉庫應用,具有數據量大、查詢分析復雜等特點。《計算機學報》刊登的“架構大數據:挑戰、現狀與展望”一文列舉了大數據分析平臺需要具備的幾個重要特性,對當前的主流實現平臺— —并行數據庫、MapReduce及基于兩者的混合架構進行了分析歸納,指出了各自的優勢及不足,同時也對各個方向的研究現狀及作者在大數據分析方面的努力進行了介紹,對未來研究做了展望。
大數據的價值和未來前景
谷歌搜索、Facebook的帖子和微博消息使得人們的行為和情緒的細節化測量成為可能。挖掘用戶的行為習慣和喜好,凌亂紛繁的數據背后找到更符合用戶興趣和習慣的產品和服務,并對產品和服務進行針對性地調整和優化,這就是大數據的價值。大數據也日益顯現出對各個行業的推進力。
大數據時代來臨首先由數據豐富度決定的。社交網絡興起,大量的UGC(互聯網術語,全稱為User Generated Content,即用戶生成內容的意思)內容、音頻、文本信息、視頻、圖片等非結構化數據出現了。另外,物聯網的數據量更大,加上移動互聯網能更準確、更快地收集用戶信息,比如位置、生活信息等數據。從數據量來說,已進入大數據時代,但硬件明顯已跟不上數據發展的腳步。
以往大數據通常用來形容一個公司創造的大量非結構化和半結構化數據,而提及“大數據”,通常是指解決問題的一種方法,即通過收集、整理生活中方方面面的數據,并對其進行分析挖掘,進而從中獲得有價值信息,最終衍化出一種新的商業模式。
雖然大數據在國內還處于初級階段,但是商業價值已經顯現出來。首先,手中握有數據的公司站在金礦上,基于數據交易即可產生很好的效益;其次,基于數據挖掘會有很多商業模式誕生,定位角度不同,或側重數據分析。比如幫企業做內部數據挖掘,或側重優化,幫企業更精準找到用戶,降低營銷成本,提高企業銷售率,增加利潤。
未來,數據可能成為最大的交易商品。但數據量大并不能算是大數據,大數據的特征是數據量大、數據種類多、非標準化數據的價值最大化。因此,大數據的價值是通過數據共享、交叉復用后獲取最大的數據價值。在他看來,未來大數據將會如基礎設施一樣,有數據提供方、管理者、監管者,數據的交叉復用將大數據變成一大產業
伴隨著中國制造業在全球制造業中扮演的角色越來越重要,如何保持中國制造業的可持續發展,如何在全球范圍內進行合理的資源配置和使用,如何進行設計、采購、制造、銷售以及提供服務,從而實現利潤的最大化?尋找適合企業自身發展的全球化戰略和運營模式已經成為一個緊迫的議題。
從本質上說,大數據本身沒有太多價值,是基于大數據的處理和分析為企業帶來了巨大增值價值。大數據包含企業運營的各種信息,如果能及時有效充分地整理和分析,就可迅速有效地幫助企業業務決策,響應客戶需求,提升競爭力。所以,在大數據時代,數據為王,數據本身就是資產,包括EMC、惠普、IBM、微軟在內的全球IT巨頭紛紛通過收購與大數據相關的廠商來實現技術整合。
在中國,互聯網公司圍繞大數據的爭奪也風急浪高,近期,奇虎360、百度、騰訊正在競購搜狐旗下搜狗。有消息稱奇虎360擬出價14億美元,以現金加換股的形式全盤收購搜狗。而搜狗的價值就在于大數據。
日前,全球最大數據公司之一的IBM正式宣布和搜狗合作成立聯合實驗室,共享平臺、技術資源和人才以研發基于System x的下一代數據中心和大數據運算平臺。該聯合實驗室是IBM在中國的首個面向互聯網行業的技術研發聯合實驗室,旨在通過研發前瞻性的技術來推動互聯網行業基礎架構的進一步優化,幫助互聯網企業應對大數據挑戰。這也使搜狗的身價扶搖直上,成為互聯網公司拼搶的“唐僧肉”。
科技在進步,時代也在改變。隨著互聯網的興起,供應鏈、物流、運營為越來越多的企業所關注。大數據無疑是未來影響各行各業發展的最受矚目的技術之一。有研究顯示,到2015年,大數據市場前景將達到169億美元的規模。