馬 亮
(慧辰資訊,北京 100016)
從傳統研究模式穿越到大數據“星際”
馬亮
(慧辰資訊,北京100016)
大數據通過多維化的研究模式讓我們認知了一個不同的數據探索模式,對于未來的預知和探測將是未來大數據開發的重要目標。本文通過對比大數據研究與傳統市場研究模式的區別,比較分析了大數據研究與傳統研究模式的互補關系,并提出如何結合二者的優勢將數據研究進行深化;由于大數據模式仍然在開發和探索階段,所以對于其研究的各項內容及方式仍舊存在不足,本文將例舉大數據研究的幾個主要問題并提出研究行業應當通過哪些形式合理利用大數據探索方法。
大數據;傳統研究;方法論
在電影《星際穿越》中,一個傳統的故事被諾蘭放置于新的超維空間,立刻產生了眾多遐想,激起了人們對宇宙神秘特性的熱議。而現實生活中,面對新的大數據時空,那浩繁如星際的數據量,多維化的研究模式,也具備著同樣神奇的吸引力。大數據不再只是通過傳統的研究方式影響世界,它所擅長的預測和探索未來趨勢的能力,成為其當下最受熱議的話題。
大數據(Big Data)21世紀初最早作為技術術語出現于海量信息檢索領域,后續在IT領域逐步傳播,并在2009年后隨著云計算應用逐步受到更多關注。IBM首先對其進行商業化定義,并于2011年率先推出業務解決方案。此后,大數據更多作為業務概念迅速應用到社會各領域,并在近兩年引發無限的價值遐想和業務熱潮。
其實,相對層出不窮的各種商業化包裝和定義,4V(Volume-規模體量大、Variety-格式多樣、Velocity-高速處理、Value-巨大價值)理論通過4個核心特征樸素而準確地來描述了大數據。由于相關的介紹頗多,這里不再贅述,我們主要從價值開始對大數據的討論。
2.1大數據下的價值法則沒有變化
如果根據大數據的4V特性進行暢想,當我們以Velocity能力達到了Volume和Variety的處理需求,Value是否就水到渠成了呢,答案并不是這樣。因為數據的價值法則并沒有變:數據只有分析后才有價值,而價值的多少取決于分析的深度和能力。
市場研究行業作為一個通過深入分析數據產生價值的行業,更有希望在大數據環境下獲得廣闊的發揮空間。但實際上,相對于技術性驅動的新興的跨界競爭對手(互聯網平臺性企業/技術性數據服務企業等)的活躍,傳統市場研究公司反應相對遲緩而被動。
針對這個問題,技術決定論認為是研究公司技術能力短板問題;而代替論則認為傳統研究方式不適用于大數據,大數據下的研究方式(如個性化/預測)將徹底代替傳統研究方法。
筆者在大數據相關技術領域有深入的背景,近幾年又在市場研究行業工作,對研究業務特性相對比較熟悉。因此,更適合從一種綜合的角度看待這些問題。
2.2傳統市場研究與大數據研究的方法論
針對前面技術決定論的觀點,筆者作為資深IT人員,實際也不敢茍同。大數據業態下,技術對市場研究的推動力是大了很多,但不是包打天下,它更多提升了分析的能力,并不是深度和專業性。而研究方法替代論的觀點,則是把傳統研究和大數據的研究方法論置于一種對立的角度來看問題。
正如天體物理學是我們離開地球遨游新星際的理論基礎,研究方法論也是研究公司遨游數據空間的基本依據。如何從傳統數據空間快速進入大數據空間,首先我們要從研究方法論角度進行辯證的分析。
傳統研究方法論和大數據下的新方法論,是不是真的對立或者替代的呢?我們不妨從更高的角度(以數據為統一點,把傳統數據與大數據納入一個數據時空)來看兩者的特點與關系(見圖1)。

圖1 方法論比較
從圖1可以看到:一是市場研究公司的傳統方法論,其關注是全局/群體的特性,力求發掘現象原因(Why),從而去做改進或者變化。而大數據的新方法論則更關注個體性/局部,更擅長對未來的預測(Future)。也就是說,兩者適合各自適合解決不同研究目的的問題。二是傳統方法論與大數據方法論在數據空間可并行應用,并不割裂。尤其是前者的分析思路仍然可以適用于大數據環境,而后者是在更大數據空間下對分析方式的擴展。
所以,兩種研究方法論,類似于物理學中牛頓經典力學(適合宏觀低速)與狹義相對論(適合微觀高速)的辯證關系,各自更適合不同的業務場景,在大數據空間下是可以互相借鑒和補充,并不是對立或者替代。理解了這種關系后,我們進一步從大數據產品的角度,來深入討論市場研究與大數據的關系。
近兩年來,各種企業(尤以技術驅動企業為代表)推出的大數據產品/服務層出不窮,但如果從研究產品核心的三個要素(數據特性、分析方法論和產品類型)來看,無非以下幾種模式。
(1)大數據+傳統研究方法。這類大數據產品,是當前眾多大數據研究產品的重要形態。比如各種基于大數據的市場份額、移動App分析、電商交易分析和用戶分組等。實際上,這是一種“舊瓶裝新酒”的模式,本質只是把數據從小規模替換為更大規模的數據源,分析方法論(甚至包括思路/指標)仍是傳統研究所采用的那一套體系。這個也證明了之前的觀點:傳統研究方法論同樣適用于大數據分析(只要選擇合適的應用場景)。在這種模式中,研究公司的劣勢是在數據源,并不在分析方法論上。
(2)行為類大數據+行為大數據方法論。這種模式關注的是人/消費者(這也是市場研究的重要目標),數據源是人的行為性(如瀏覽、交易、評論和位置等)歷史。這是純大數據的產品模式,相關的產品服務將會是近幾年大數據應用的重點。其研究方法論與傳統模式不同,主要聚焦在如何進行個體特征(如標簽分析)+精準定位+預測/推薦的思路。就當前相關產品的深入分析來看,各家(無論傳統研究還是技術驅動企業,甚至包括學術機構)相關的方法論和分析建模思路都還處于比較淺的階段,并未出現成熟而優秀的方法體系。而消費者行為研究原本就是市場研究企業的傳統業務,相對純技術驅動性企業,研究公司在新方法論相關的深度研究建模上應該具有更大的先發優勢。
(3)狀態類大數據+行業性大數據方法論。這也是當前大數據業務的一種重要模式,實際業務距離市場研究當前業務較遠,這里只是作為介紹,供大家開闊思路。數據來自分析目標的狀態信息,分析方法更加多樣并與行業特性緊密相關,分析目的集中于監控、智能管理和優化。所有的物聯網類(包括車聯網)、智能家居服務以及可穿戴設備(記錄人的狀態)行業的大數據應用,大多是此類。其他更多應用模式(如生物大數據的尋找分析),這里不再一一介紹了。
雖然大數據業務有著無限的未來空間,但從研究領域的角度看,有幾個基礎性問題仍然需要注意。
(1)數據分布的缺陷仍然存在。大數據仍然存在著傳統的數據分布缺陷,只是表現形式不同。雖然其極大擴展了數據的空間,但大數據仍然不是全數據。傳統數據存在的抽樣性的缺陷是降低了,但并沒有完全解決。更重要的是,數據覆蓋的提升更多是在垂直維度,而水平化的缺陷仍然存在,并且難以彌補。當前的大數據都只是數據在某個應用場景的深度上不斷增加。以消費者的互聯網行為為例,特定場景的行為數據(百度的搜索數據、阿里的電商數據、騰訊的社交數據)被極大化,但所有行為場景的橫向數據的融合,實際更有價值,由于商業利益等原因,卻更難以做到。阿里通過投資各類互聯網服務(高德、新浪微博、優酷、陌陌、神馬等),在為打通消費者全場景行為大數據做布局,也實際無法解決這個問題。從這點講,未來垂直類場景的大數據的交換服務會成為一個新的巨大的空間。
(2)大數據的基礎方法論模型仍然存在不足。相比傳統研究的方法論,大數據主要優勢是在個性化和預測方面,但相關的理論模型,還在迅速發展和變化,并未達到成熟期。而且大數據環境下,數據規模和數據有效期的不同,使得傳統研究中相對容易的模型驗證也變得困難許多。這導致了很多大數據預測出現問題。遠的不說美國大選的兩周預測結果,百度對電影《黃金時代》票房預測的失敗就是最好的例子。這說明相關分析模型還有很多的改進空間,也意味著市場研究企業未來能夠在相關領域有更多的專業發揮空間。
(3)特定群體的研究仍然存在困難。研究業務中,大量任務是需要對特定群體的行為進行研究。傳統研究中,當目標群體比較小或者特殊時,研究困難會比較大。在大數據下這些是否迎刃而解呢?根據HCR(慧辰資訊)實踐經驗發現并不是這樣。首先,由于大數據分布的缺陷問題仍然存在,在大數據中尋找這個群體往往也很不容易。其次,對這個群體的行為記錄數據,也未必更有效的能夠表征其特征。最后,如何基于這些數據量化描述群體,也缺乏令客戶信服的解釋理論。此時,傳統的方式(比如定性座談會),往往比大數據方法更快,效果也更好。
進入大數據時代,市場研究企業面臨更多跨界型對手的競爭,表面上看好像毫無優勢。實際上,就大數據應用的核心競爭力——分析能力方面,研究公司無論是傳統研究方法,還是大數據分析方法,都具有相應能力或者潛在優勢。關鍵是如何揚長避短,構建自己的大數據競爭優勢。以下是幾個建議:
(1)傳統企業的大數據研究是最重要的目標戰場。當前的大數據產品更多基于線上/互聯網用戶產生的數據引發相關分析。實際上,研究公司所服務的大量傳統/線下企業,其自身業務大數據(尤其業務環節積累產生的內部大數據)的分析和價值挖掘,對企業價值更大,是企業更為關注和迫切需要解決的。而大部分的企業受條件所限,不可能構建大數據分析的專業資源和團隊,需要專業的第三方服務型企業來完成。所以,面向企業內外業務大數據的相關研究分析,將是研究公司未來大數據服務的重要領域。
(2)堅持研究的深度。針對市面上各種純技術驅動競爭對手的大數據研究產品,如果仔細分析后會發現,這些產品往往受企業基因的影響,其研究的深度和角度都不能令人滿意,傳統企業研究的客戶常會反饋其業務價值并不大。而研究洞察的深度和專業性,是企業客戶對研究服務首要關注的能力,這是當前技術驅動類企業的不足,卻正是市場研究公司所擅長的重要競爭優勢。
(3)聚焦消費者研究。大數據應用領域眾多,基于消費者行為類大數據的研究,是市場研究公司具有背景優勢且能夠在未來產生巨大價值的主要領域(不限于快消行業)。市場研究公司應該積極學習掌握現有的大數據研究的思想,并從消費者研究角度提出更好的分析方法論模型,樹立相對于競爭對手的分析優勢。同時,由于人性的復雜和大數據的分布覆蓋仍存在缺陷,研究公司擅長的一些傳統研究方法(如調研和定性座談會),仍是一種快速、有效的方式。
(4)注意數據源的構建。數據是研究分析的基礎和首要環節。在大數據環境下,數據源的重要性迅速提升成為業務鏈條中基礎一環。如何構建數據源資源,是研究公司需要考慮的重要問題。
(5)建立適合大數據業務的業務流程和支持體系。大數據環境下,在實際業務處理流程和操作過程中,具體實現方法和模式與傳統方式有了較大的變化。如果不能夠積極改變和適應這些變化,將無法有效完成大數據的相關產品業務。
(6)重視和加強大數據相關的技術能力。如今,研究公司普遍認識到大數據處理技術體系(技術人員與平臺)的缺乏,是其與跨界競爭對手的最大短板,需要后續亟待加強。但同時要注意到另一個問題:很多研究公司中IT人員(如DP)常被定位為研究業務的輔助支持。但在大數據時代,技術人員將與研究人員具有同樣的重要性(甚至有些環節要超過),如果還是之前的定位和配合方式,那難以有效發揮他們在大數據研究業務中的作用。
面對新的大數據星際,市場研究公司并非只能躑躅不前,數據價值法則說明大數據價值所需的分析深度正是其最大的優勢。只要在傳統的研究模式上,積極學習和拓展新的大數據方法論,以專業研究優勢結合技術能力作為自身的動力,一樣能自如穿越廣闊的大數據星際,發現更多的迷人寶藏。
Transform from the Traditional Market Research Mode to the Big Data Mode
Ma Liang
(HCR Co., Ltd, Beijing, 100016)
The research mode of many dimensions gives us a different way to search the data, which is resulted by Big Data. Handling the aims to foresee and search the future is an important thing for the development of Big Data. Compared the traditional market study with the Big Data, I have a conclusion on the complementary between the two methods and how to make their advantages together to deepen the investigations. It's normal that the Big Data lies in the original development and exploration stage so that we need to face the main obstacles and I will supply the suitable ways to make the Big Data's research into reality.
Big Data; Traditional Research; Methodology
10.3969/j.issn.1672-7274.2015.02.009
TP3文獻標示碼:B
1672-7274(2015)02-0037-04