如果你某天正好跟大數據學領域的數據分析師們交談,你問他們:大數據可以用來干什么?可能你問10個分析師就會得到十種不同的答案。分析師所服務的行業不一樣或是解釋的角度不同,都可能導致不同答案的出現。不過,這些答案并非雜亂無章沒有規律,這里就給大家總結一下吧。
描述型:發生了什么?
這種數據類型是最為常見的一種,每位數據分析師在使用大數據時都得通過這一類型的數據來了解企業機構的情況,進而衡量出初步的概況,以提供更精細的服務做好準備。
比如,一家商場每月的利潤和損失賬單,分析師從這一類的賬單中可以分析出大部分客戶的基本數據,對客戶進行初步的評判衡量:45%的超市客戶是自雇型;80%的游戲玩家不愿意在游戲裝備上直接付費;65%的VR體驗客戶年齡低于14……
值得注意的是,通常這類描述型的數據會被分析師們利用一些可視化的工具進行更加形象生動的描述,一來可增強分析師們對數據特性的敏感,二來也能更形象的將數據展示給其他人。
診斷型:為什么會發生?
在通過描述型的數據了解了大致狀況后,想要解決問題就得搞清楚為什么會有這些問題,大數據里同樣藏著這個秘密。通過評估描述型數據,診斷分析工具使得分析師們能夠深入分析問題的核心原因。
這樣的數據類型一般更多維,一種類型是按照時間序列整合數據,在多個聯系時間點上同時導入數據進行分析。比如企業通過客戶在不同時間里對網購物品的需求傾向。一家招聘網站發現在半年里發布過的某一職位有下降趨勢,如果要求一個比較完整的診斷結果,需要的大數據就應該包括市場競爭對手近期行為、用戶使用習慣的變化、招聘需求隨時間的變化等等。這樣多維度的研究大數據所得出來的“原因”才更加準確。
預測型:可能發生什么?
在消費品市場里有這樣一個被業界默認的規律,品牌的持續發展需要產品不斷迭代來支撐,否則容易走向衰敗。哇哈哈、可口可樂公司就是最好的正面例子。當然這是因為產業的長期發展,業界人士才能總結出來這樣具有預測性參考價值的規律,但對于那些新興產業未來會發生什么呢?換做以前可能需要大量的實踐經驗,但有了大數據以后就不同了。我們可以通過大數據去分析未來會發生什么!

想要預知某事件在將來發生的可能性,預測一個可量化的值,或者是估計事情可能發生的某個時間點,這些都可以通過預測模型完成。預測模型通常運用各種可變數據來作出預測。數據成員的多樣化與可能預測的目標是相關聯的(如,人的年齡越大,越可能發生心臟病,我們可以說年齡與心臟病風險是線性相關的)。隨后,這些數據被放在一起,產生分數或預測。
在一個充滿不確定性因素的世界里,能夠預測允許人們作出更好的決定。預測模型在很多領域都被用到。比如說從QQ預測演化出微信,從《英雄聯盟》預測演化出《王者榮耀》,從線上打車工具的流行到共享單車的走紅,這些都是可以通過大數據來預測的。
指導型:我需要做什么?
從價值和復雜度的角度而言,指導性模型是最直接作用于企業的數據模型。指導性模型基于發生了什么、為什么會發生以及一系列“可能發生什么”的分析,幫助用戶確定要采取的最好的措施。很顯然,指導性分析不是一個單獨的行為,實際上它是其他很多行為的主導。
交通應用是一個很好的例子,當你下班準備回家的時候,一些定位導航軟件就會根據種種因素,包括了實時的交通狀況,天氣等各種因素,為你找到最優的回家路線,這就是指導型大數據的直接應用。(編輯/有慶)