孫泠

什么是真正的數據驅動型公司?LinkedIn的答案是:從數據分析中得出成功需要的硬性條件,團隊朝著這個方向全力優化產品,這就是數據驅動型公司。
四年前,來自中國天津的張溪夢加入LinkedIn的“數據科學家”部門,負責基于數據挖掘的產品開發,比如LinkedIn 最著名的“你可能認識誰”,“你可能喜歡的工作”,“你可能會聘用的人”等產品功能都是這個部門開發的。但LinkedIn高層認為,即使如“數據科學家”這樣的部門依然與實際業務“貼”得不夠緊密。于是入職9個月后,張溪夢得到了第一次提拔,組建了一個與業務緊密聯系到極致的新部門——商業分析部。
張溪夢說,LinkedIn的所有業務都基于數據模型——LinkedIn.com上的用戶增長和體驗生成大量數據,LinkedIn根據這些數據開發新產品為用戶提供新產品和服務,這些新產品和服務又進一步刺激增長,增加客戶黏度。這是LinkedIn最基本的業務模型,維系這三點反復作用并在其中流動的正是數據。
分析就是謀略和決斷
通過在誠信、精準的職業用戶平臺上搭建與企業用戶、個人緊密聯系的高價值生態體系,截至2014年4月,LinkedIn在全球30多個國家已經擁有3億用戶;超過300萬家公司在LinkedIn上建立公司主頁,提供產品、服務、招聘信息和廣告。2014年LinkedIn的營收預計會達到20億美元,主要來自3條主產品線:人才解決方案(招聘者付費進入人才數據庫),營銷方案(廣告主付費)以及高級版定制(個人用戶為了更多網絡功能以及新發現而付費)。
而張溪夢領導的商業分析部,可以解釋為“負責所有和錢相關的分析”。商業分析部直接支持的業務部門有5個——產品、銷售、市場推廣、開發和運營,其中運營又分不同部門,比如廣告運營、銷售運營、市場運營、商業運營等。商業分析部將數據分析過程透明化,讓業務部門不需了解技術細節而直接看到分析結果,“LinkedIn并不希望所有員工都成為數據分析師。”張溪夢說。
“你可能認識的人”是LinkedIn最受歡迎的功能之一,它可以幫助用戶找到自己想要保持聯系的人。而從后臺運營角度看,這項功能要求數據時刻保持更新狀態,這就需要時刻跟蹤用戶在不同應用間的數據。而最早這項功能基于傳統的關系型數據庫,因此計算一次需要幾天到一個星期的時間,LinkedIn的數據基礎設施團隊搭建了一個包括針對特定工作負載設計的在線、離線、近線系統的數據架構——在線系統處理用戶的實時交互信息;離線系統主要是Hadoop和Teradata的數據倉庫,處理批量數據和分析工作負載;近線系統處理類似“你可能認識的人”這類的功能、搜索以及LinkedIn社交圖譜數據,這類數據對處理和更新速度的要求不像在線系統那么高。
LinkedIn內部大概有25種不同的數據庫和數據解決方案,其中一半以上是由LinkedIn內部開發的。和其他公司一樣,過去LinkedIn的數據分析結構是一個“金字塔”形狀,最底層是公司的全部業務數據,數據之上分為分析層、報表層、深度分析層、戰略分析層和決策層等。“金字塔最精華的部分是塔尖,底層花費90%的時間卻沒有多大價值。”于是,張溪夢力主將底層做小,由“金字塔”變為“菱形”。首先,需要把待分析數據做得很“薄”,再把很薄的數據切得更“細”,然后把已經又“細”又“薄”的數據放入Teradata、Aster Date以及內部開發系統里繼續做分析。這種“在數據模型上做模型”的方式不僅降低了存儲成本,也保證了數據分析速度從幾小時到20毫秒的飛躍。另外,對于非結構化數據,LinkedIn會首先將非結構化數據結構化。商業分析部技術部門開發了很多基于Java的工具,比如將一份簡歷的內容打散,進行重組——現任及過去任職的3家公司的信息最被看重,于是會順序出現在最前面,包括起止時間、任職時間、職位等。
“中國歷史上第一個分析師是姜子牙,他是第一個做分析和策略的人。”從小的中國傳統文化熏陶讓張溪夢從獨特的角度去看商業分析,武王子牙、房謀杜斷,在他眼里都是做分析的,而分析就是謀略和決斷。
第四大產品方向
在銷售最初的階段,張溪夢的商業分析部會先基于數據進行四步的預測工作:第一步,預測客戶公司的目標費用是多少;第二步,定位該公司內購買LinkedIn產品的決策者;第三步;判斷LinkedIn內部哪個人對該決策者產生的影響最大;第四步,基于以上三步制作完善整體方案后,銷售再去談客戶。
LinkedIn最核心的競爭力就是分析人。在人才獲取環節,LinkedIn在整個2億用戶的巨大數據庫中進行過濾搜索,打破以往只能招聘到崗位申請者的局限,同時招聘企業通過設定地點、技能、以往公司、教育背景等多個關鍵詞,迅速、準確地錨定最匹配的人才,從被動等待“愿者上鉤”變成了主動獵取。LinkedIn對一些公司人力資源部門的了解往往比他們自己還多,“比如去年他們招了多少人,從哪個地方招的,都是什么樣的學歷、資歷、職位;流失的員工都去了哪個公司,得到什么樣的職位,這些數據LinkedIn全有。”張溪夢說。
對于并非崗位申請者的匹配人才,LinkedIn的信息服務InMail則可以幫助招聘人員與他們感興趣的人取得聯系。但即使他們不想發送InMail信息,也可以隨時關注和了解潛在候選人的動向。他們還可以將此人加入到“招聘項目”中,以便了解該公司還有誰在關注此人。甚至還有一項新的測試功能,可以幫助招聘人員從公司內部尋找有關候選人的反饋消息,這一切都可以在與候選人取得聯系之前完成。
商業分析部針對銷售階段開發的分析工具,經過不斷改進和完善,已經成為公司內部使用率最高的熱門工具。“LinkedIn的銷售有3000人,而據我們統計,這款產品每天的使用者有3000~4000人,說明很多非銷售部門的員工也在用。”用戶的選擇說明價值,由于功能太過好用,在內部使用3年后,LinkedIn在今年7月將這個產品的一部分功能放到網站上,做成了企業級銷售解決方案,同時也成為LinkedIn未來的第四大產品方向。
對于這種內部產品輸出,張溪夢對數據驅動的商業分析有更高的夢想——將內部分析、內部產品、外部產品三個層次理順,形成常態化的商業模式。
相比Facebook和Twitter的強互動,LinkedIn就是弱互動。“有多少CEO每天都有時間上LinkedIn?但就是因為他們很忙,用得沒有那么多,所以對LinkedIn來說,小數據反而反映很大的價值。”張溪夢認為,這正是LinkedIn產品的獨特價值——很多人一輩子都想跟這些公司的CEO聯系上而不可得,而這種聯系確實能產生價值以及商業機會。通過社交網絡數據,LinkedIn甚至可以分析出各個公司的權利結構,等同于太陽系中的引力關系,“比如,CEO在公司矩陣中的引力最大,跟CEO接近的人引力一定也大,然后和他離得越遠的人,如果質量再小的話,引力就小,這是100%可以分析出來的。”
與Facebook圍繞“社交圖譜”概念打造真實社交網絡一樣,LinkedIn目前所圍繞的概念是“專業圖譜”。
實名、高端社交與弱互動(即有限分享),此三者正是LinkedIn取得成功的前端原因。這三個定位保證了LinkedIn可以沉淀下真實世界中最有商業價值的那部分社會關系并作為數據金礦來挖掘。