■ 肖志良 博士生(1、佛山職業技術學院 廣東佛山 528000 2、武漢大學 武漢 430071)
從歷史客戶的消費行為和傾向中尋找啟示,這便是學習型大數據的重要前提和假設。隨著企業逐步涉足電子商務營銷,依賴傳統訂單生存的發展模式發生了根本性的轉變,企業不再是面對幾個傳統的、熟悉的老客戶訂單,而是面對所有不確定性的潛在客戶群,這時構建和提供精準服務顯得尤為重要。電子商務營銷的背景下,企業的競爭越來越趨向競爭情報的競爭,企業往往注重來自于外部環境的競爭情報,卻忽略了企業內部環境的競爭情報,對企業營銷活動進行大數據分析與挖掘同樣是提高企業競爭力的有效手段(黃曉斌等,2012)。
1.數據的學習性。數據學習(Data Learning,DL)源于機器學習(Machine Learning,ML),機器學習的本質上就是包含各種算法的數據學習模型。數據學習是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科,專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能,它是人工智能的核心,其應用遍及人工智能的各個領域,它主要使用歸納、綜合而不是演繹。本文研究的重要前提是假設數據具有學習性,所謂數據學習性就是指在特點環境條件下既往發生的數據邏輯和規律會預示未來在相同或相似環境條件下新數據產生的趨勢和邏輯,利用這種預示的規律可以幫助人們對未來某一事物的發展趨勢做出研判。事實上,所有數據都具有二重性:描述性和參照性。數據的描述性是數據本身描述事物的屬性度量值,數據的參照性是數據對其他同類事物的同一屬性具有相對參考性,因此,數據既可學習其他同類的數據,同時也成為被學習的目標數據。數據的這種特征為人工智能、智慧服務的實現提供了良好的手段和支撐。
2.數據的多維性。數據的本質是描述某一事物的某一屬性的特征值,由于被描述的事物往往復雜而又多面,因此準確描述事物特征屬性需要從多個維度加以考量,這就是數據的多維性。比如描述某人的身高用一維數據即可,而描述某人在地球上的位置信息則需要二維數據:經度和緯度,如果要描述這個人的體重狀態(體重是否達標)就需要三維數據了:身高、年齡、體重。本文研究的是客戶的消費行為趨勢,首先需要描述客戶的消費行為(這需要采用二維數據:消費種類和消費量),然后再針對多次消費行為描述其消費趨勢(需要增加一個維度:消費的時間節點),因此本文的研究采用了三維數據模型。
3.消費的行為與趨勢。本研究假設客戶對商品的多次消費行為蘊含并預示著某種消費趨勢,并且客戶在一段時期內會基本遵循這一消費趨勢。筆者曾經對某一大型品牌服裝企業的客戶消費行為進行了詳細研究分析,發現約80%的客戶遵循自身的消費習慣和規律。因此,本研究對企業營銷服務的指導作用仍然是顯著有效的。
本文研究的基本思路是:在二維結構化數據的基礎上加入“時間戳”,構建三維數據模型,將采集的原始數據按照三維數據的結構進行部署和存儲;然后以數據的時間戳為基準,構建數據的趨勢特征模型,這種趨勢特征模型由多個特征參數來描述,不同的應用應該具體確定這些特征參數及其權重;最后是通過數據學習進行數據挖掘分析,預測事物發展趨勢,數據學習的具體方法是通過趨勢特征模型的特征參數構建搜索引擎,動態生成作為被學習的參照樣本模型,并將樣本模型的發展趨勢作為被預測對象的未來趨勢,為營運者提供決策支撐。
在探討企業營銷精準服務模式之前,首先需要研究數據的內在特征,也就是企業過往營銷歷史數據之中包含了哪些能反映客戶消費行為規律、傾向、趨勢的特征,對已經發生過多次消費行為的客戶,通過大數據分析的手段將客戶的消費行為傾向抽象成一個樣本模型,并將這個樣本模型作為學習的對象,供正在發生消費行為的客戶學習模仿使用,也就是按照樣本模型的消費傾向和趨勢,向正在發生消費行為的、與樣本模型具有同樣消費行為特征參數的同類客戶提供精準服務。因此,研究的關鍵是如何通過特征參數來描述客戶的消費行為傾向和趨勢,并由此創建客戶消費趨勢模型。

圖1 消費行為三維大數據模型

圖2 消費趨勢度E折線圖

圖3 學習型消費預測模型結構
本文需要解決以下主要問題:一是通過引入“時間戳”的概念,構建三維數據模型,解決二維結構化數據對事物的動態性和趨勢性描述乏力的問題;二是通過對三維數據的分析,構建描述事物發展趨勢的參照樣本模型,這種參照樣本模型通過搜索引擎動態生成,為學習型大數據分析模型提供參照學習對象;三是通過引入“數據學習”的方法,解決大數據分析成長性問題,也就是隨著數據逐步增加,數據的價值性與潛在真理性也逐步成長,而不是簡單的數據樣本堆積。
企業營銷精準服務的推送和目標功能的實現很大程度上依賴客戶消費行為數據的支撐,要科學、客觀描述客戶的消費行為,用簡單的二維關系型結構化數據已經不能滿足系統的設計需求,尤其是預測客戶消費傾向和趨勢時,二維數據顯得力不從心。對于消費行為數據的描述,時間節點因素十分重要,比如,某個客戶在不同時間節點分別購買了三件服裝,三件服裝的檔次分別為高、中、低檔,如果是按照時間先后順序分別購買低、中、高檔服裝,便可以推斷這個客戶的消費能力在持續增強,他的未來消費傾向應該是高端產品;反之,這個客戶的消費能力在持續下降,他的未來消費傾向應該是低端產品。
本文采用HBase數據庫技術構建三維大數據模型,在傳統二維結構化數據的基礎上增加“時間戳”,形成三維結構化數據。對于半結構化數據和非結構化數據采用標識索引,使之轉化為三維結構化數據。有了“時間戳”這個強有力工具,分析微觀客戶消費行為和宏觀消費趨勢就方便了。三維結構化數據具有三個軸,X軸對客戶的消費量進行測量,Y軸描述客戶的消費行為,Z軸記錄客戶的消費時間節點。其中Y軸(消費行為)是一個綜合性參數,代表客戶的消費規律、傾向和趨勢。消費行為三維大數據模型結構圖如圖1所示。
構建了三維大數據模型,就可以創建企業營銷數據庫了。大數據的價值關鍵在于數據的價值性和可用性,因此企業必須嚴格對客戶的每一次消費行為進行原始數據采集。大數據的可用性至少要滿足五個特性:一致性、精確性、完整性、時效性、實體統一性(李建中等,2013),確保數據質量是構建服務模式的關鍵。
大數據計算是構建消費趨勢特征模型的基本手段,目前大數據計算分為批量計算和流式計算(孫大為等,2014),消費趨勢特征模型反映的是一種趨勢,顯然需要采用流式計算的方法。
首先確定消費趨勢特征模型的特征參數。以客戶在電商平臺購買某一品牌的服裝為例,這些特征參數應該能夠充分反映客戶的消費行為,經過反復調研和分析,本研究對消費趨勢模型的特征參數的設定方法如下:
設一個數據挖掘周期內客戶消費行為發生次數為n(即客戶共發生過有效消費行為的次數),客戶消費產品總數量為m(即客戶所有消費行為的消費產品數量),每一次的消費總額分別為P1、P2、…Pn,D1為第1次消費行為發生的日期,Dn為第n次消費行為發生的日期,Dn-D1為第一次消費到第n次消費之間的相隔總天數。則定義趨勢模型的特征參數如下:
平均消費單價A:用以描述客戶消費產品的檔次。

平均單次消費額B:用以描述客戶消費能力。

消費行為密度C:用以描述客戶消費的頻繁程度。

消費離散方差D:用以描述客戶消費產品檔次的變化大小程度。

其中A1為第一次平均消費單價,…,An為第n次平均消費單價。
消費趨勢度E:用以描述客戶消費檔次及能力的變化總趨勢。

其中Pn-Pn-1為兩次相鄰消費行為的消費金額之差,Dn-Dn-1為兩次相鄰消費行為的時間之差實際上是兩次消費行為的變化斜率,可見消費趨勢度E反映的是客戶每次購買行為變化趨勢之和,E值越大,說明客戶消費能力、檔次(或者欲望)增強明顯,E值為負數,說明客戶消費能力、檔次(或者欲望)在逐步減弱,E值為0,說明一段時間內客戶消費能力、檔次(或者欲望)基本穩定,變化不大。消費趨勢度E折現圖如圖2所示。
以上定義了趨勢模型的五個特征參數,現在可以用這5個參數來構建消費趨勢特征模型。本研究認為,一個客戶的消費行為趨勢特征模型是這5個特征參數的函數,即:

其中,k1,k2,k3,k4,k5分別為特征參數A,B,C,D,E的測量權重,不同的應用應該通過數據測試分別設定特征參數的權重。為確保準確測量消費趨勢模型,在沒有條件的情況下(如數據樣本數不夠多),可以定性確定特征參數的權重,所謂定性確定就是根據實際應用的特點,對5個特征參數的權重由強至弱進行排位,然后按照這個順序分別構建搜索引擎,權重越大的特征參數先進行數據搜索,權重小的特征參數后進行數據搜索,并逐步縮小搜索結果限制。
信息技術的學習功能是未來信息消費的重要趨勢,也是人工智能技術的理論基礎。本研究將學習功能用于構建客戶的消費預測模型,具有嚴謹的科學性和嚴密的邏輯性。客戶的消費行為盡管千差萬別,但都具有一定的邏輯性。在大數據背景下,某一個客戶的消費傾向模型往往能從歷史的客戶群中找到線索,這就是學習型模型的構建基礎和假設。學習型消費預測模型主要針對公司的長期客戶和有成為長期客戶潛力的消費者,每當客戶的消費行為發生時,系統將通過消費趨勢特征模型構建搜索引擎,搜索其他曾經有類似消費行為的多個客戶,將這些客戶的消費行為描繪成一個“虛擬參照客戶”,對“虛擬參照客戶”的消費邏輯進行科學分析,形成消費樣本模型,繼而向目標客戶推出精準服務。學習型消費預測模型的構建流程圖如圖3所示。

表1 消費趨勢模型特征參數權重排列表

表2 消費趨勢模型數據結構
1.創建消費趨勢模型數據結構。前述所知,消費趨勢模型是由5個特征參數來描述的,這五種特征參數的權重分別為k1,k2,k3,k4,k5,用定性分析的方法來創建消費趨勢模型M。假設5個特征參數按照權重從大到小的排列順序如表1所示。
由于是定性處理權重,本文并未對權重確定具體的值,只是按照權重由大到小的順序安排數據搜索,首先對權重最大的特征參數(消費趨勢度E)進行搜索,結果的樣本數定為50個,然后對權重次之的特征參數(消費行為密度C)進行搜索,結果的樣本數縮小為40個,以此類推,直到搜索完成5個特征參數,并保留10個搜索樣本。搜索的結果需要暫存到中間數據表,這個數據表實際上就是樣本的消費趨勢模型數據結構,本文創建的消費趨勢模型數據結構如表2所示。
2.創建消費趨勢學習樣本參照模型。本文希望對正在發生消費行為的客戶提供精準服務,首先應該通過對該客戶的消費行為數據進行特征參數計算,確定該客戶的消費趨勢模型,然后以該客戶的消費趨勢模型作為標準,在企業的海量歷史客戶數據中進行搜索,找到若干個與該客戶消費趨勢模型最為相近的消費趨勢模型,并以此作為供學習的樣本參照模型。這樣,便可以認為當前正在發生消費行為的客戶未來的消費傾向應該跟樣本參照模型的歷史客戶消費傾向相似,并以樣本參照模型已經發生的消費行為作為精準服務項目向當前客戶推送。
假設通過數據搜索和分析,當前客戶的消費趨勢模型為M(e0,c0,d0,b0,a0),歷史客戶的消費趨勢模型為M(ei,ci,di,bi,ai),我們便以M(ei,ci,di,bi,ai)≈M(e0,c0,d0,b0,a0)作為搜索引擎的條件進行搜索,步驟如下:
搜索消費趨勢度E最接近e0的50個客戶樣本;在50個樣本中搜索消費行為密度C最接近c0的40個客戶樣本;在40個樣本中搜索消費離散方差D最接近d0的30個客戶樣本;在30個樣本中搜索平均單次消費額B最接近b0的20個客戶樣本;在20個樣本中搜索平均消費單價A最接近a0的10個客戶樣本;按照表2的格式將最后10個樣本保存在消費趨勢樣本參照模型數據結構表中。至此,創建了10個可供某一當前客戶學習的消費趨勢參照樣本模型。
3.營銷精準服務的實現。前述所知,已經成功為當前客戶找到了10個可供學習的消費趨勢參照樣本模型,為了向當前客戶提供精準服務,還必須解決如下問題:
向誰學習?—虛擬參照樣本模型的構建。由于創建了10個可供學習的消費趨勢模型,究竟以哪一個模型為樣板來為當前客戶提供學習目標呢?雖然這10個樣本參照模型具有非常類似的特征參數,但也不宜用單個樣本模型作為學習對象,而是要將10個樣本模型進行抽象,形成虛擬參照樣本模型。設10個參照樣本模型分別為:M(e1,c1,d1,b1,a1)、M(e2,c2,d2,b2,a2)、…、M(ei,ci,di,bi,ai)、…、M(e10,c10,d10,b10,a10),虛擬參照樣本模型為M(ev,cv,dv,bv,av),則:

學習什么?——精準服務項目的推送。虛擬參照樣本模型M(ev,cv,dv,bv,av)為當前客戶提供了學習的對象,這個模型同樣由5個特征參數來描述,需要將這5個特征參數轉變成精準服務產品,以便向當前客戶推送服務,也就是通過這5個特征參數的分析向當前客戶推薦合適的企業產品,讓客戶感覺到企業猜透了自己的購買意圖,從而提高客戶感受度。
消費趨勢度ev代表客戶消費能力的趨勢,用此參數作為增長率(或者下降率)計算客戶的預測消費產品的價格,然后向客戶推送大于(或小于)這個價格的企業產品。
消費行為密度cv代表客戶消費行為發生的頻繁程度,用此參數計算當期客戶下一次可能發生消費行為的時間節點,適時向客戶推出營銷服務。
消費離散方差dv代表客戶消費產品檔次的波動程度,參數的值越大,說明客戶消費產品的檔次和數量跨度很大,反之,參數的值越小,說明客戶消費產品的檔次和數量基本停留在某一穩定的價格段或某幾種型號。前者應該擴大向客戶推送的企業產品范圍和型號范圍,后者應該向客戶推送既往的類似檔次、類似型號的企業產品。
平均單次消費額bv代表客戶的消費能力,用此參數作為參考預測客戶每次可能的消費額,然后向客戶推送大于(或等于)這個額度的企業產品組合。
平均消費單價av代表客戶消費企業產品的檔次,用此參數作為參考預測客戶未來可能的企業產品檔次,然后向客戶推送類似這個檔次的企業產品。
“大數據”正以各種方式和路徑影響著企業的商業生態,它已經成為企業商業模式創新的基本時代背景(李文蓮,2013)。在大數據背景下,企業營銷進入了一個嶄新環境,企業必須主動適應這種新的營銷模式,樹立以服務精準化、個性化為核心的企業營銷理念至關重要。精準服務的構建無疑離不開對大數據科學的分析和挖掘,數據樣本橫向學習功能的研究,使得在相同數據量的情況下,學習型數據更具挖掘潛力,大數據更加具有動態性和成長性。將三維大數據模型與數據學習功能結合起來,大數據挖掘將更有可能、更加容易預測事物發展的趨勢和內在邏輯。
1.李建中,劉顯敏.大數據的一個重要方面:數據可用性[J].計算機研究與發展,2013(6)
2.黃曉斌,鐘輝新.大數據時代企業競爭情報研究的創新與發展[J].圖書與情報,2012(6)
3.孫大為,張廣艷,鄭緯民.大數據流式計算:關鍵技術及系統實例[J].軟件學報,2014(4)
4.李文蓮,夏健明.基于“大數據”的商業模式創新[J].中國工業經濟,2013(5)