宋茜
盡管大數據分析聽起來很有希望,但公司對其數據的期望與現實之間仍然存在巨大差距。現在的公司喜歡大數據但缺乏有效使用大數據的策略,哈佛商學院分享了他們的一些見解:“問題是在很多情況下,大數據沒有得到很好的利用,公司更擅長收集關于他們的客戶、他們的產品以及競爭對手的數據,而不是分析這些數據并圍繞它設計戰略。”
這不僅突出了對大數據的需求,而且強調了學習如何設計包含大數據的業務戰略。
大數據:利用高級分析
大數據是一種消耗大量空間(體積)、以前所未有的速度(速度)并以不同格式(種類)存在的東西。大數據本身并不能為業務流程或戰略增加價值,必須用好它才能從中提取所有見解和好處。
如果大數據使用得當,那么它可以通過利用收集到的有關產品、客戶和市場的洞察來幫助優化運營和業務流程。
制定結合大數據的有效商業戰略
BillSchmarzo被稱為大數據院長,他對使用大數據來實現業務目標過程進行逆向工程的操作,做出了最好的解釋。
確定預期的業務成果
首先,必須確定業務需要的成果,嘗試考慮能夠改變業務的舉措,或使其離成功更近一步。例如,在未來12個月內將在線商店銷售額增加10 %。
確定支持用例
此步驟是關于了解哪些用例將幫助實現第一步中的成果。例如,如果在線銷售額增加10 %是期望的業務成果,那么其支持用例將是:在高流量網站上做廣告促銷、開展電子郵件營銷活動以及增加在線潛在客戶生成等。
一旦實現了每個業務成果的支持用例,需要評估每個用例的財務影響、潛在價值和實施風險。
優先考慮用例
在此步驟中組織需要對所有用例進行優先級排序,以便可以一次專注于一個用例,這可以通過對比業務價值、用例的實施可行性來完成。
確定每個用例的數據源
每個用例的實現都需要使用數據來完成。例如,為了提高客戶交叉銷售,需要來自社交媒體、購物籃、站點流量信息等數據。在這一步中,每個用例都與一個或多個數據源相關聯。

計算每個用例的經濟價值
一旦了解了成功執行每個用例所需的數據源,就可以計算數據源所擁有的財務價值。
剛剛看到了每個數據源如何擁有經濟、財務價值,以及如何使用它來成功執行任何有助于實現預期業務成果的用例。每個組織都可以訪問其數據,它一定很簡單,每個人都應該這樣做,對吧?
數據源具有這種經濟價值,因為它們要具有衡量數據質量的6個關鍵維度:數據準確性、有效性、一致性、唯一性、完整性和及時性。
有一個挑戰比其他挑戰更復雜,就是在所有數據源中擁有獨特的數據記錄。
很多時候,需要來自多個來源的數據才能完全執行單一用例,為此,數據首先被合并和整合,以便可以存儲在一個地方,并且可以用于分析。
公司通常在數據庫中有許多關于同一個人/實體的數據記錄。這是因為很多完整的信息會導致創建新聯系人而不是更新現有聯系人,或者信息存儲在不同的系統中,例如網站跟蹤應用程序、電子郵件活動工具等。
不管是什么原因,這是降低大數據分析結果準確性的最常見障礙。例如,如果數據包含與同一個人相關的重復記錄,最終可能會向這個人發送2次電子郵件。這不僅會損害客戶體驗,還會使用例結果不準確,可能會多次計算來自同一個人的點擊率,并高估了電子郵件活動的有效性。
介紹數據匹配
當不同的數據集被合并和清除在一起時,數據值會變得重復和不一致。如果將大數據業務戰略建立在不準確的數據記錄上,則會產生有偏見的結果。另一方面,如果執行數據匹配技術,就可以輕松地利用這些數據來執行任何用例或業務流程。
數據匹配如何工作
當數據集包含唯一標識符(例如社會保險號、身份證號)時,數據匹配非常簡單。在這種情況下,可以簡單地比較2個記錄的標識符并將它們分類為匹配或不匹配。
當數據集中沒有唯一標識符或由于保密目的而無法使用時,事情就會變得復雜。在這種情況下,多個變量被分配權重,然后一起評估并配進行分類。
組織采用各種數據匹配技術,例如語音、數字、模糊匹配或其他專有算法。匹配后,可以決定合并記錄或清除它們,以便大數據中的每條記錄僅與單個實體相關,此過程也稱為實體解析。在整合大數據設計業務戰略時,數據匹配和數據質量的作用非常重要,會對業務成果產生重大影響。