大數據正成為時代主流,大數據作為互聯網發展下一個焦點已經是公認的事實,在此時代潮流中,Facebook緊抓機遇,厚積薄發,成功從社交網絡轉型成全球領先的大數據公司。
大數據時代已經來臨,大數據正在成為主流。據國際數據公司(IDC)預測,全球大數據技術和服務市場將從2010年的32億美元增長到2015年的169億美元,其復合年增率將達到40%,大約是整個信息和通信技術市場的7倍。大數據對于企業發展的影響力,已不可忽視。
2012年是大數據爆發的一年,諸多科技巨頭紛紛投身大數據領域,基于大數據的創業公司也紛紛涌現,而其中,Facebook在今年厚積薄發、抓住機遇,成為大數據領域當之無愧的領頭羊之一。
Facebook的大數據戰略
從社交巨頭到大數據公司,Facebook的成長歷程中一向不乏精彩,但它成功的根本原因卻并非社交,而是其社交網絡產生的海量數據以及基于此的大數據戰略。
2012年5月18日,Facebook在納斯達克上市,IPO定價為38美元,融資規模達160億美元,而按照發行價計算,Facebook的估值達到1040億美元,成為美國有史以來上市時市值最大的企業。中信證券研究部發布的薦股書中更是稱,Facebook的IPO代表了全球互聯網商業模式的第三次浪潮,它的上市引領互聯網進入了大數據時代。
而數據收集、數據分析和數據應用正是構成了Facebook大數據戰略的三駕馬車。
數據收集是Facebook的長項,從成立之初,Facebook就已經在有意識地收集用戶數據。Facebook去年底發布的大數據產品Timeline(時間線)——用戶可以在這條時間線的頁面上記錄自己的生活故事,更是將Facebook收集數據的范圍從實時數據擴大到了歷史數據。而2012年,Facebook對圖片分享應用商Instagram等公司的收購行動也為它帶來了大量細分數據。
在這個社交網絡幾乎全民化的時代中,社交大佬Facebook已經成為當之無愧的數據收集巨頭,“海量+非結構化/復雜類型”的數據從這些社交網絡中產生,間接推動了大數據產業的發展。
但僅僅將數據收集起來并不能產生價值,挖掘這些海量數據背后的商業價值成為大數據產業鏈中不可或缺的一環。
正如有學者所說:“Facebook之前數年的努力讓超過10億數字移民建立了聯系和紐帶,這個世界的邊界仍要擴張,而下一步更重要的則是考慮如何讓關系產生的海量數據更有價值。”
在數據收集后,Facebook需要對這些雜亂的數據進行歸類,結構化處理,然后對其解讀并加以分析,從而獲得數據對應的用戶的具體信息,為大數據應用打好基礎。
“我們所做的一切,歸結起來只是一件事,就是大數據處理,”Facebook基礎設施技術部門副總裁Jay Parikh說,“大數據就是利用你的洞察力,發現數據背后的潛在價值,并利用它來為你的企業創造利益。這個道理非常簡單,如果你不能很好的利用在業務中收集和保存的數據信息,那么你擁有的就僅僅是一堆數據而已,我們越來越感興趣并正在做的,是研究怎樣利用收集來的數據做一些更價值的事情。”
而數據應用在Facebook的大數據戰略中還沒有完全定型,主要集中在廣告營銷、產品服務和用戶管理三個層面。
通過前期對數據的收集和分析,Facebook可以了解用戶的需求,及時調整產品設計及服務,滿足不同用戶的需求。
同時,這些數據對廣告投放也大有裨益,Facebook可以依此制定出有針對性的廣告方案,并針對用戶進行有針對性的營銷活動。而作為Facebook主要盈利模式之一的廣告營銷,在Facebook的大數據戰略中一直是主要發展方向之一,大數據能幫助Facebook獲得更多廣告主的青睞,將數據創造出更多的價值。
正如2012年Facebook第三季度財報顯示的那樣,在第三季度12.62億美元的營收中,來自廣告業務的營收占86%,為10.9億美元,比去年同期增長36%。
Facebook的核心數據資產
在投資人眼中,相對于sns概念,他們更愿意把Facebook看作是大數據概念,因為Facebook的核心競爭力還是在于它的核心數據資產上,而Facebook在俄勒岡州Prineville自建的數據中心更是可以說明它對自身海量數據的重視。
Facebook在今年8月份披露了一組數據,Facebook系統每天需要處理25億條消息、500+ TB的數據、27億次用戶點擊Like按鈕的次數、3億張用戶上傳照片,而每半小時通過 Hive 掃描的數據大約為105TB。并且,Facebook擁有世界上最大的單一Hadoop系統,每個單獨的Hadoop磁盤集群內存儲了超過100 PB的數據,甚至以現今增長速度之快,也許很快,100 PB的磁盤集群也就不再令人吃驚了。
目前,Facebook在全球擁有超過10億用戶,44%的全球網民使用Facebook,移動用戶高達6億之多,美國巴西印度是使用的前三大國家,一共有1403億個好友連接,照片的上傳量為2190億,有6260萬音樂被播放,次數高達220億。
Facebook的社交網絡每秒鐘都在生成海量的數據,如文本、圖片、音樂、視頻、地理信息、web鏈接等,并且這些數據實時更新、海量聚集,而且不會被搜索引擎抓取,構成了Facebook最核心的數據資產。
雖然一開始,Facebook也是并不完全知道這些收集來的數據有什么作用,他們只是“想知道是誰訪問該網站,他們的動態,以及他們在網站的哪個板塊活動,所以這一切對我們來說都是有趣的。” Jay Parikh這樣說。但隨著數據背后的價值逐漸被發現,Facebook越來越重視網站數據的收集,并借此奠定了自己的數據基礎。
而單純地采集數據卻不加以分析的話,就不能體現出數據真正的價值,也就不能稱之為大數據。“大數據的意義在于真正對你的生意有內在的洞見。如果你不能好好利用自己收集到的數據,那你只是空有一堆數據而已,不叫大數據。”Jay Parikh說。
對于這些海量的數據,Facebook抓住了它們背后真正的價值,不只是單純粗暴地使用,而是對這些數據進行分析處理并加以應用,真正實現了大數據。從原材料生產者進步為原材料加工者和使用者,對數據的利用不止上了一個臺階。
Facebook作為社交媒體,在數據資源的采集上有著先天的優勢,超過10億的用戶給Facebook帶來了海量的數據資源,這在如今這個大數據正要爆發的時代,是一筆無法估量的寶貴財富,而Facebook正是抓住機遇,在2012年厚積薄發,將這筆數字財富轉化成了真正的財富。