大數據正在經歷從看到用、從說到做的歷史拐點。
讀《決戰大數據:駕馭未來商業的利器》的前言有種奇怪的感覺。一般來說,序言是作者交待寫作動機、闡明主要內容,并對各類師長朋友同事表達感謝的文體。而車品覺為這本書所寫的前言一上來就要人“忘掉大數據”——按理說,不是應該強調大數據的趨勢重要性、對企業的戰略意義更常見的嗎?
不妨看看車品覺是怎么寫的:“大數據的概念紛繁復雜,媒體上充斥了各種關于大數據的報道,但其中不乏牽強附會、濫竽充數的言論,某些媒體甚至把簡單的統計也冠上了‘大數據的頭銜”。所以目前人們最應該做的,“就是暫且忘記大數據的概念”,因為“行勝于言,只有具備實效性的數據才是正道”。車品覺試圖告訴每個人大數據的具體運作應該是什么樣的,而且數據量絕對不是一個最重要的問題,我們要的不是數據的量,而是有“質”的量。如車品覺所言,這便是他寫作《決戰大數據》一書希望有的效果。
所以這就不難解釋,為什么在書的正文第一章,當我們想當然地以為會是“何謂大數據”等類似入門、啟蒙的章節時,車品覺卻直奔主題、一針見血,討論“大數據,為什么很多人只會談,不會做”。能有如此論調或寫出這樣文字的,多半來自業界一線;也只有真正做過大數據,用過大數據的,才有底氣談大數據以及“如何成為決勝未來的商業利器”。
本書的作者車品覺,現任阿里巴巴集團商業智能部副總裁、數據委員會會長,擁有十幾年豐富的數據實戰經驗。可以想見,自身長期的從業經歷,加之互聯網巨頭阿里巴巴的事業平臺,車品覺對大數據認識的角度、高度和深度自然不同尋常。就拿相關作品來說,在前有維克托·邁爾·舍恩伯格的《大數據時代:生活、工作與思維的大變革》開啟了“大數據商業應用之先河”,后有涂子沛從歷史文化提出“數據時代的到來”的《數據之巔》,同時還有被稱為“大數據商業應用的引路人”的大衛·芬雷布的《大數據云圖》、埃里克·西格爾的《大數據預測》,以及講技術算法和統計思維的Anand Rajaraman寫的《大數據:互聯網大規模數據挖掘與分布式處理》、馮啟思(Kaiser Fung)的《數據統治世界》等。這意味著,要再寫一本大數據話題之作,很不容易。
《決戰大數據》的一個主要看點是阿里巴巴的大數據實例——它做了什么,又是怎么做的?身為阿里數據委員會的“家長”,車品覺的言行勢必會引起業界同行的關注。其實早在該書出版前,車品覺或多或少就阿里的大數據戰略與策略向外界透露過。譬如在2013年下半年某一期的雜志上,車品覺就向記者表示:“一開始,我們在用好數據,但是隨著數據戰略與平臺戰略緊密結合,我們開始刻意地去管理數據(保證數據安全、質量和對于商家的可用性),養數據(有意識地收集外部數據),沉淀數據。”在談及“如何將大數據用好”轉變為“讓大數據更好用”的問題上,阿里巴巴又是從以下六個地方入手的:確保數據安全(保護商家和個人的隱私)、保證數據的質量(去除虛假數據)、實現各個部門數據標準的統一(如轉化率)、讓原始數據變得更精細化(更符合商家的應用情景)、獲得外部數據(如并購新浪微博、收購高德地圖,和其他平臺合作、購買數據信息等)、建立數據委員會。
時間再往前推,2012年,馬云正式公布了阿里巴巴三步走的發展策略,即“平臺、金融、數據”,這意味著阿里巴巴誓要轉型成為一家“互聯網數據公司”;2011年,“頁面點擊”誕生,它可以監控每個頁面上每個位置的用戶瀏覽點擊情況。緊接著,天貓攜手阿里云、萬網宣布聯合推出聚石塔平臺,為天貓、淘寶平臺上的電商及電商服務商等提供數據云服務;2011年,阿里巴巴開發數據魔方,通過淘寶數據魔方平臺,商家可以直接獲取行業宏觀情況、自己品牌的市場狀況、消費者在自己網站上的行為等情況;2009年,阿里巴巴的大數據應用開始走向外部,讓淘寶商戶分享數據;2005年,阿里巴巴就意識到數據時代的到來,開發了專門供內部運營人員使用的數據產品——淘數據,公司員工可以利用平臺海量的消費者和商家數據,來完善自身經營狀況。當然,這還不包括阿里旗下基于大數據理念、布局互聯網金融的“牛刀小試”作品——阿里小貸。
到了《決戰大數據》,車品覺的思路更為清晰、深入,而阿里巴巴的大數據做法也被首次系統地闡述。在這其中,車品覺細化了馬云當年提出的“數據化運營”和“運營數據”兩個概念,換言之,當人們談起大數據實踐時,至少在阿里巴巴企業內部,它是分為以上兩步展開的。所謂數據化運營,簡單講就是使用數據幫助企業/客戶解決問題;而運營數據就是在原有的數據基礎上,搜集、整理、分析,進而產生新數據的過程。對此,車品覺分別以“用”和“養”兩個精準的動詞來區分。
緊接著,車品覺用“混、通、曬”來歸納數據化運營,并描述成“內三板斧”,而用“存、管、用”來總結運營數據的“外三板斧”。車品覺指出,作為一名卓有成效的數據分析師,如果不和業務部“混”在一起,商業敏感度就無從談起。堅持帶著業務問題來觀察數據或者帶著數據來觀察業務,兼備二者的敏感,就做到“通”,更深層次的通是存在于公司組織中的數據(部門和部門之間的數據分享)。數據能不能做到在獲取、使用、分享、協同、連接、組合之上讓自己變得超級簡單和便捷,這時數據化運營里面非常重要的一點,正是“曬”的內容。與此同時,“存”是指積極地收集數據,但這不是根本目的,讓收集起來的數據如何產生價值才是最終的目的;學會用數據產品來解決獲取及使用數據的問題。“管”不僅僅是把收集來的分類、存儲那么簡單,阿里巴巴數據管理最不一樣的地方(也可以算作“競爭力”體現)在于非常依賴數據產品,希望用數據產品來解決獲取以及使用數據的問題。在“用”數據的問題上,通過數據的分裂和重組,來實現顛覆性創新。
在今年召開的一次“西湖品學”大數據峰會上,車品覺和與會者分享了一個有趣的發現。他說,縱觀這幾年美國O'Reilly媒體公司舉辦的Strata大會(美國大數據技術會議)的主題詞演變,你就可以看清世界大數據的發展趨勢。2010年是“Data”,2011年是“Talk Big Data”,2012年是“Apply Big Data”,2013 年是“Data Engineering”。——車品覺特別強調了最后一個用詞的變化:Data Engineering(數據驅動)。他認為這是大數據從看到用、從說到做非常重要的一個歷史拐點。結合他在《決戰大數據》中總結的“數據十戒”中的第二、第三條,即“在實踐中提煉數據”和“讓數據變成科技,惠及更多人”。他的理論核心再清晰不過:讓數據科技(Data Technology)成為一種生產力!
(作者楊吉,法學博士、浙江傳媒學院網絡與新媒體專業系主任)