袁 波
中國電信股份有限公司江陰分公司
隨著《Nature》和《Science》等相繼出版專刊探討大數據在未來的應用,大數據逐漸成為社會各界關注的熱點。大數據被譽為“未來的新石油”,甚至被認為將決定著國家的競爭力,因此數據所有權的爭奪和數據處理技術的發展將成為新的戰略焦點。
屬性定義:2011年,大數據研究的先驅國際數據中心(IDC)在報告中定義大數據:“大數據技術描述了一個技術和體系的新時代,被設計于從大規模多樣化的數據中通過高速捕獲、發現和分析技術提取數據的價值”。這個定義把大數據特征歸納為“4Vs”,即大容量(volume)、多樣性(variety)、更新快(velocity)和高價值低密度。毛波認為大數據應該符合數據量大、相互關聯、場景多、實時性高、對未來有影響5個特點。大數據的大體現在數據的關聯性和連通性。大數據是前向傾銷后向變現的手段。工業界普遍認為從關注交易數據到關注行為數據是推動大數據發展的重要原因,由于交易數據和行為數據為1:100的關系,這時數據容量是傳統的工具無法處理。大數據表現為行為數據的一致性并不重要,缺失10%沒有很大關系,大數據是解決那些采樣后處理結果迅速下降的問題,一般為個性化問題。大數據的結果一般不是給人看的,是給機器看的。
比較定義:2010年Apache Hadoop組織將大數據定義為“普通的計算機軟件無法在可接受的時間范圍內捕捉、管理、處理的規模龐大的數據集”。2011年麥肯錫(McKinsey)定義為:“超過了典型數據庫軟件工具捕獲、存儲、管理和分析數據能力的數據集”。研究機構Gartner給出了這樣的定義:“大數據是需要新處理模式才能具有更強的決策力,洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產”。
菲利浦·科特勒教授把細分市場視為具有相似需要和欲望的顧客組成的群體。
市場細分的策略很多,按照地理變量、人口統計變量或者心理變量等。除此之外,有兩種特殊的細分場景:利基營銷和個體營銷。
1993年唐舒·爾茨、史丹利·田納及羅伯特·勞特朋提出了以客戶為中心的理念最終合著《整合營銷傳播》。在市場細分方面,整合營銷傳播理論是建立在客戶或潛在客戶的“行為”上,以可以分辨的個人為起點,然后把他們歸類成行為近似的團體,稱之為“集中”。
大數據技術作為革命性力量推動科技進步、提升生產效率的同時,在社會各行業必定創造巨大的商業價值。大數據“商品”,大數據服務和大數據軟件應用將進入競爭市場銷售,為大數據價值鏈中的企業創造價值。市場細分策略主要是為大數據價值鏈下游企業確定技術采購和營銷方案提供理論依據。
當前大數據技術仍處于成長期,大數據應用的市場正在逐步形成但還沒有成熟,對于市場的細分主要還是采用傳統做法。本節在大量文獻基礎上,將歸納幾種目前常用的細分方法。
(1)按行業或領域細分
工信部將大數據應用按照行業分為:工業領域、能源電力、政務服務、金融財稅、資源環保、交通運輸、醫療健康、農林畜牧、科教文體、旅游服務和商貿服務等。麥肯錫提出了五個潛在的大數據應用領域:醫療康護、公眾部門管理、零售、全球制造和個人位置信息。大數據應用可以分為企業內部的大數據應用、物聯網大數據應用、社交網絡大數據應用、醫療健康大數據、群智感知。
按照領域細分簡潔直觀,易于理解。但是,由于領域和行業這兩個概念較為寬泛,使得這種分類方法過于靈活,無法形成一個公認的標準,找不到一個統一的依據。大數據應用是一個龐大的知識和產品體系,它的應用對象涵蓋所有行業,并且呈現:相同行業具有不同應用需求以及不同行業的特定業務可能具有相同需求的特點,因此基于行業或者領域的分類有很大局限性。
(2)按數據源細分
聯合國統計署大數據工作組將大數據按照數據源進行分類(詳見表1),包括人類數據、傳統業務系統產生數據、物聯網和機器生成數據。

表1 聯合國統計署大數據分類及編碼
大數據一般分為以下四類:互聯網數據、科研數據、感知數據和企業數據。以大數據分析的視角,可以分為六類:結構化數據分析、文本數據分析、多媒體數據分析、Web數據分析、社交網絡數據分析和移動數據分析。
由此可見,按照數據源分類劃分標準清晰,容易達成統一。然而,數據源與市場變量之間沒有直接的關聯性,無法在營銷過程中運用。
(3)按數據處理模式細分
程學旗、靳小龍和王元卓等學者將大數據應用按照采用的處理技術類型進行分類,批量處理系統應用于社交網絡中關系和主題推薦,電子商務領域的產品推薦,搜索引擎廣告投放效果提升,金融領域欺詐行為預警等等。
流式處理系統應用在日志信息挖掘、動態提醒與預警,物聯傳感信息采集挖掘實時分析動態信息展示,Web數據采集、網絡爬蟲程序抓取互聯網內容挖掘價值等。
交互式數據處理系統應用于政府、醫療以及對操作序列有嚴格要求的工業控制領域,如搜索引擎、電子郵件、即時通訊工具、社交網絡等互聯網交互式業務。
圖數據處理系統解決社區發現,信息傳播與影響力最大化問題,網頁PageRank評分,分子查找和DNA測序,城市交通規劃,郵路優化等。
按照處理系統分類,必須要求所有營銷人員熟悉大數據技術原理,顯然,這種分類不會是最優方案。但是,上面論述中不難發現,每種分類標簽中又存在基于領域的再細分,因此提供了一種二維細分的思路。
(4)按算法細分
不同的算法對應于不同的應用場景,因此基于算法細分可以很好契合市場需求。Manimom等對數據挖掘算法進行了分類,將其分為描述性(descriptive)、預測性和驗證性(veryfying)。Blackett等根據數據分析深度將數據分析分為三個層次:描述性(descriptive)分析,預測性分析和規則性(prescriptive)分析。大數據分析可以分為探索性數據分析技術、描述統計、數據可視化。
按算法分類可以關聯到客戶需求體現出一定的優越性,但是文獻研究多集中在算法本身,并未將算法關聯市場變量進行合理分類。
哈佛大學商學院訪問教師托馬斯·H·達文波特(Thomos H.Davenport)說:“大數據及其分化將會在未來10年改變幾乎每一個行業的業務功能。任何一個組織,如果早一點著手大數據的工作,都可以獲得明顯的競爭優勢”。大數據應用將滲透到所有行業和所有組織,因此提供了一個廣闊的市場前景。深入研究大數據應用的細分策略勢在必行,綜合上一節各細分策略的特點,大數據應用的市場細分策略應該遵循以下條件:
(1)為了讓選擇的維度與市場變量相關聯,應該以潛在客戶的行為為考察對象進行細分,即從行為出發歸納出行為背后的需求,然后對不同需求進行分類;
(2)所選的細分維度應具有閉合性易于形成普適性的“范本”;
(3)細分的維度盡量使用通用詞語,避免太過專業的用語帶來晦澀難懂和溝通障礙;
(4)大數據應用內涵及其豐富,一個維度無法達到細致分類的情況下,可以采用相關性較弱的二維模式細分。
經過上一節的討論得到了細分選取細分維度的原則,本節將確定一個基于大數據應用的市場細分的普適性模板。
基于算法的細分在關聯市場需求方面體現出天然的優越性,并且公認的主流算法并不多所以也滿足閉合性要求。聯合國統計署在對大數據進行初步分類時,采用數據源的維度。數據源劃分簡明并且易于表達。算法和數據源是合適的維度,但細分規則有待完善。
(1)以算法作為細分維度研究
2006年ICDM國際會議上總結了影響力最高的10種數據 挖 掘 算 法,包 括C4.5,k-means,SVM,Apriori,EM,PageRank,AdaBoost,kNN,樸素貝葉斯和CART。根據算法的功能和形式的類似性可以把具體的算法分為:回歸分析、分類算法、聚類算法、關聯分析。如表2所示,回歸分析和分類算法屬于監督學習算法,回歸問題是對數值型特征進行預測,例如:搜索量與票房趨勢預測、紅酒品質的判斷等;分類問題是對類別性問題進行預測,比如:垃圾郵件判別、信用貸款資質審核等。聚類算法和關聯分析屬于無監督學習算法,聚類算法通常被用于探索性分析,以“物以類聚”為主要思路,適合識別客戶群體對市場細分的應用;關聯分析是找出對象之間存在的強相互關系,協助商家進行捆綁銷售,除了探索物物之間的關系,關聯分析還可以尋找人物之間的關聯,比如“猜你喜歡”、“為您推薦”等應用,主要采用協同過濾算法,它可以視為關聯算法的特殊情況。

表2 算法的細分規則
(2)以數據源作為細分維度研究
大數據應用要求數據源間開放共享,打通各數據庫系統和數據存儲系統之間的壁壘,因此根據數據的來源分,可以更好的指向使用者所采集的主要數據集來源同時指明數據的應用場景。
20世紀90年代的商業智能(BI)被稱為大數據應用的雛形,21世紀出現了Web搜索引擎,之后大數據技術突飛猛進滲透到各學科各領域,縱觀歷史和應用現狀可以把大數據應用根據數據來源分為:結構化數據、文本數據、Web數據、移動數據,進一步可分為:結構化數據、個人文檔數據、計算機日志數據、Web文本數據、多媒體數據、社交網絡數據、定位數據、傳感數據。數據源的細分規則,詳見表3。

表3 數據源的細分規則
綜上所述,本文采用算法和數據源兩個細分維度變量對大數據服務和大數據應用的市場進行細分,最終建立二維細分模型。模型說明:
維度一:算法;
細分規則:回歸分析、分類算法、聚類算法和關聯分析。
維度二:數據源;
細分規則:結構化數據、文本數據、Web數據和移動數據。
按照以上模型便可以對市場進行便捷細分,例如:客戶需求是預測銷售量,那么提供的大數據應用圍繞回歸分析和Web數據獲取開發;客戶需求是特定學科研究熱點分析,那么提供的大數據應用系統要滿足聚類算法和文本數據;如果客戶的需求是出行線路優化,那么提供的大數據應用可以用分類算法、移動數據和Web數據進行標識。如表4所示,典型應用實例。

表4 基于大數據應用的市場細分模型的典型示例
數據是對自然和客觀世界的記錄和觀測的量化,是人、機、物三元世界互動的痕跡,隨著人類認識水平的不斷提高,今后數據的生成和應用會和人對客觀世界的認識一樣沒有終點。大數據從產生的那一刻起,就必定成為人類歷史中不可或缺的角色,本文在大量有關大數據技術及應用文獻基礎上,找出了大數據應用市場化過程中有待完善的環節,通過維度變量的研究找到了適合目前大數據應用發展要求的市場細分規則的模板,建立了基于大數據應用的市場細分模型。