葉雷
“大數據時代的預言家”、牛津大學網絡學院互聯網研究所治理與監管專業教授維克托·邁爾·舍恩伯格在《大數據時代》一書中,首先給出了“大數據”的含義:你的一個習慣動作,你的一次消費行為,你的一份就診記錄……文字、方位、溝通等一切事物皆可以量化為數據,不僅人類生產和生活中“有意義”的信息海量產生,相比以往呈幾何數級的爆炸式增長,“無意義”的數據的膨脹速度也同樣驚人。
數據采集存儲技術讓所有的一切信息都可能被數據化,互聯網特別是移動互聯網技術讓所有的數據可以串聯起來,無遺漏數據分析技術幾乎可以讓所有的數據都派上用場。“大數據時代”,沒有了“有意義”信息和“無意義”信息的邊界,誰能得到信息并善于利用信息,誰就會搶占先機。“大數據時代”不僅影響著我們每一個人,甚至連世界經濟格局也在醞釀著巨大變革。因此,《大數據時代》的作者認為,大數據從根本上改變我們認識世界和改變世界的方式,開啟了一次重大的時代轉型。
歷史是一面鏡子,照向未來。毫無疑問,已有的大數據也屬于歷史的范疇,但大數據時代卻是指向未來的。大數據時代,我們分析的數據因為“大”,擺脫了傳統對隨機采樣的依賴,而是面對全體數據;因為所有信息都是“數”,可以不再糾結具體數據的精確度,而是坦然面對信息的混雜;信息之“大”之“雜”,讓我們分析的“據”也由傳統的因果關系變為相關關系。
人們在大規模數據的基礎上可以做到的事情,在小規模數據的基礎上是無法完成的。全球新產生數據年增40%,即信息總量每兩年就可以翻番,而且這一趨勢還在加速。倘若能夠更有效地組織和使用大數據,人類將得到更多的機會發揮數據對社會發展的巨大推動作用。研究證明,通過大數據和冪律分布分析,人類行為93%是可以預測的,成為“已經發生的未來”。
大數據時代,決策將日益基于數據和分析而作出,而并非基于經驗和直覺。雖然目前大數據預測的還只是參考答案,不是最終答案,但其威力已經顯現。在《大數據時代》中,作者舉的3個例子令人印象特別深刻。
一是谷歌僅憑網民留下的相關痕跡,就能得出與事實相符度高達97%的結論,2009年比疾控中心提前兩周、具體到了特定的地區和州、準確預測了甲型H1N1流感的爆發。2013年,又成功預測了美國流感的暴發。
二是奧巴馬2008年的選舉,競選團隊里設置了首席數據科學家,他利用Facebook和Twitter進行數據分析,不但利用社交媒體來發布信息,幫助奧巴馬團隊定位目標選民,甚至篩選出一些潛在的競選志愿者。
三是微軟公司通過大數據分析處理,對新一屆奧斯卡金像獎作出“預言”,結果除“最佳導演”外,其余13項大獎全部命中。
正如維克托教授所說,我們目前看到的大數據和大數據應用,還只是“冰山的一角”。一定程度上,大數據就是新財富,價值堪比石油,正因為如此,賽門鐵克公司的調研報告顯示,全球企業的信息存儲總量年增67%。目前包括谷歌、IBM、微軟、EMC、惠普,以及我國的百度、騰訊、阿里巴巴等眾多巨頭,已早早開始布局大數據,為在即將來臨的大數據時代做好競爭鋪墊。
大數據已經滲入到了生活的方方面面,將逐漸成為現代社會基礎設施的一部分,就像公路、鐵路、港口、水電和通信網絡一樣不可或缺。更有人說,大數據是繼邊防、海防、空防之后的第四個大國博弈的空間。美國奧巴馬政府已經把“大數據”上升到了國家戰略的層面,投資2億美元啟動“大數據研究和發展計劃”。我國的國家973計劃中已經部署相關的科研項目,有中國硅谷之稱的中關村,大數據產業已經納入《中關村戰略性新興產業集群創新引領工程(2013-2015年)》。
大數據時代,可以讓人成為上帝,通過各數據匯總,俯瞰世界中你想知道的任何一面。大數據時代,也可以讓你困擾不堪,因為你面臨個人隱私被不斷泄露和基于數據預測偏見的麻煩和危機。維克托教授在《大數據時代》中表達了“數據主宰一切”的隱憂,并提出了“責任與自由并舉”的信息管理設想,這也是我們在擁抱大數據時代時必須思考和解決的問題。