鮑俊穎,吳瑤瑤
(重慶第二師范學院 數學與信息工程學院,重慶400065)
伴隨“互聯網+”網絡時代的沖擊,網絡銷售逐漸取代傳統銷售,網絡銷售行業競爭日趨嚴重。本文以淘寶某高級禮服商家為例,該店鋪為淘寶皇冠店鋪,近期銷售額持續下滑,通過促銷、聚劃算等營銷手段能夠在短暫時期內增加較多的客流量,但是新流量的后期維護問題困擾著商家。同時,買家的回頭率與回購的訂單價的把控都存在嚴重缺陷[1]。而這些問題的存在主要是對顧客的資源發掘不充分,通過選取店鋪銷售數據中的11 013個樣本進行分析,根據有效客戶制定營銷計劃,實現精準營銷(如提供價格折扣、產品對比等服務),使銷售商在有效預算下獲得利益最大化。此外,本文通過有效客戶預測近期購買力,還能為商家減少貨物積壓等,有助于改良現有的銷售模式、提高銷售收益[2]。
以RFM模型度量買家價值及買家盈利能力,構建3個要素動態展示客戶的整體輪廓,即最近一次交易的時間(記為R)、近期交易次數(記為F)和近期交易金額(記為M)。將時間段內客戶的交易金額進行分等級評分,3類指標計算得到“有效”評分數為RFM=100R×10F×M[3]。
本文對店鋪某季度的銷售數據11 013個樣本進行RFM分析,構建RFM模型所需數據(交易時間、金額、次數)。作出離散化之后的RFM塊計數圖和RFM熱圖,如圖1。RFM塊計數圖呈現根據離散化方法設定的塊的分布,每個條的高度代表著對應RFM得分的客戶數量。該圖主要用來查看每個RFM得分的客戶數量分布是否均勻,我們期望均勻的分布。若不均分,則需要重新考慮RFM的適用性或者試驗其他分箱方法[4]。圖1中生成的125個組段樣本數量大致上是相等的。RFM熱圖是交易金額均值在交易時間和交易次數上繪制的矩陣圖,用于表示不同購買時間*購買頻次分組時該組段的平均購買金額分布,從而能夠快速確定高價值組段所在的區域;用顏色深淺表示交易金額均值的大小。其中頻率分值為5分的幾個組段其平均購買金額更大,并且其中又以時間順序分值為3~5分的幾個組段更大[5]。
根據離散化之后的數據計算樣本的RFM值,選擇RFM得分大于500的作為“最有價值”客戶作為本次活動的促銷名單,本文共選擇出2 145位客戶作為本次活動的促銷名單,成為“最有價值”客戶[6]。

圖1 RFM塊計數和RFM熱圖Fig. 1 RFM block count and RFM thermal map
RFM模型的結果顯示,購物頻率和購物金額正相關,且購買頻率為5的購物金額明顯較大,商家可以針對RFM得分大于500的客戶開展相應的促銷活動,為進—步分析,研究頻率得分和交易數間的關系,其結果見表1。

表1 頻率得分和交易數對比Tab. 1 Frequency score and transaction number comparison
由表1可知,頻率得分為5的這一組包括全部交易頻數大于1次的客戶,表1中呈現了交易頻次多于1次的客戶和只有1次交易的客戶之間的差異。因此,將消費者分為1次購物客戶和重購客戶2組,比較這2組消費者之間的差異[7]。
本文研究對象為多變量,且不同變量對于客戶群體具有不同方面的重要意義,根據數據屬性,結合變量取值特點,需要考慮不同因素下不同客戶群體的構成。本文運用分類樹模型分析重購客戶群體特征,分類樹模型首先瀏覽全部變量來確定最優分組,再根據不同變量對客戶依次遞歸劃分。選取變量買家信譽、性別、年齡、地區、是否重購、次均交易金額,將是否重購變量視為響應字段,其結果見表2。

表2 樹模型分析結果Tab. 2 Tree model analysis results
由表2可知,只有次均交易金額和買家信譽2個變量為模型提供顯著貢獻,響應率最高的一組次均交易金額介于49~107.743 33元,買家信譽高于4星級,這731人中有26.54%為重購買家;其次為次均交易金額小于或等于37.955元的人群,其中有25.77%為重購買家;以此類推,第11組的重購率只有7.1%。而11個亞群大致根據次均交易金額和買家信用劃分的,意味著重購群體并不存在明顯的性別、年齡、地區等差異。
前5組的響應率較高,但5,6組之間有較大差距,通過分析前5組,總結重購客戶特征為:信用等級在4星級以上,而次均交易金額小于150.95元,并且如果次均交易金額小于107.743 33元,信用等級將更高,購買比例較大。
不同的客戶群體可看做是不同的客戶類別,故可運用聚類分析對客戶進行分類,為確定各類型特征,通過方差分析評估每個類別變量的重要性,根據變量在不同類別中的作用識別客戶購買特征,定位有效客戶群體。本文運用兩步聚類法,選擇買家性別、買家信譽、是否多次交易、RFM得分、次均交易金額和買家年齡為分析變量進行聚類分析,結合聚類圖和預測變量重要性圖,如圖2將客戶群成功地分成了4類,每個客戶群的特點為:

圖2 聚類分析每組類別詳細信息和預測變量重要性圖Fig. 2 Cluster analysis of each group of category details and the importance of predictive variables
類別1:人數占比為23.5%,男性為主,單次交易為主,年齡均值為28.65,次均交易金額均值為167.61,RFM得分均值為328.51,4星級買家居多。
類別2:人數占比為15.5%,女性為主,多次交易為主,年齡均值為28.08,次均交易金額均值為121.38,RFM得分均值為378.77,1鉆買家居多。
類別3:人數占比為28.9%,女性為主,單次交易為主,年齡均值為27.81,次均交易金額均值為150.25,RFM得分均值為323.57,5星級買家居多。
類別4:人數占比為32.1%,女性為主,單次交易為主,年齡均值為27.83,次均交易金額均值為148.46,RFM得分均值為325.81,1鉆買家居多。
上述4個客戶群體中類別2多次交易占比為100%,與研究目標群體重購人群一致,則將類別2作為研究的特定群體。預測變量重要性圖反映預測變量的重要程度,顏色越深,重要性越突出,則買家信用、性別、是否多次交易對該聚類模型更重要一些[8]。即定義重購行為特征為:以女性為主,買家信用大于1鉆,RFM得分大于378.77,次均交易金額大于150.25。
在得到有效客戶群體后,往往有針對性地根據這部分客戶定制專門的營銷方案,需要監測廣告投放或營銷方案的有效性,進而對更多未知客戶的購買行為進行預測,從而更加精準地營銷,同時為產品設計、生產和存儲提供依據,實現利潤最大化。購買傾向分析根據已有響應測試結果的少數客戶作為訓練數據,建立預測模型,運用該模型對其余客戶預測評分,從而預測響應推廣信息繼而購買產品的客戶。
將變量是否重構作為響應字段,選取買家信譽、性別、年齡、次均交易金額和RFM得分作為預測傾向。經測算整體模型質量為0.62,大于一般標準0.5,說明模型整體水平較好。作出檢查分類表,如表3,訓練樣本中實際正響應的正確率為14.86%,測試樣本的正確率為16.2%,即以此模型選擇的客戶中有16.2%發生購買行為,它大于指定的最小響應率2%,故此模型可以用于確定超過指定的最小響應率的客戶。

表3 檢查分類表Tab. 3 Inspection classification table
根據已有響應數據建立的購買傾向分析模型,對待確定客戶的購買傾向進行量化打分,可以選出有可能發生購買的客戶群體,實現精準營銷。建立購買傾向分析的二項Logistic模型,二項Logistic模型可以根據不同自變量,計算每個客戶的響應概率,即預測客戶發生購買行為的概率,達到預測和判別的目的。設定閾值為0.25,根據計算結果,從1萬多個客戶中,共選出2 017個客戶,針對這組客戶制作活動方案,投放廣告可以得到更高的購買響應率,提高購買率。
基于RFM模型對客戶的細分[9],計算最近一次消費時間、消費頻數、消費金額得分的均值,將得分小于均值的視為低,記為0,其他視為高,記為1,再依據下述標準將客戶分為8類[10],將每個客戶定位到不同的類型,匯總如表4。

表4 客戶類型匯總表Tab. 4 The summary of customer types
重要價值客戶(111):最近一次交易時間間隔短、消費頻數及金額均很高。這類客戶具有很高潛在價值,是帶來企業利潤的最重要群體,此類客戶的維系是企業利潤的重要保證。
重要保持客戶(011):最近一次交易時間間隔長,但消費頻數和金額均很高。說明這是較長時間未消費的忠實顧客,需要主動發生聯系。
重要發展客戶(101):最近一次交易時間間隔短、消費金額高,但頻數不高。雖然忠實度不高,卻擁有很大潛力,如果企業適應他們的需求,通過針對性的營銷策略迎合他們,即可提高購買次數,獲得更可觀的利潤,故需著重發展。
重要挽留客戶(001):最近一次交易時間間隔短、消費頻數不高,但消費金額高??赡転榧磳⒘魇Щ蛞呀浭サ挠脩?,對這類客戶企業應盡量挽回,是企業利潤的潛在來源之一。
一般價值客戶(110):最近一次交易時間間隔短,消費頻數高,但消費數額較小。這類客戶是活躍客戶,但存在經濟實力不夠或者經濟實力較強而產品不符合購買意愿的問題。若對于此類客戶的銷售投入較大,可能不能達到銷售目標,但適當保持關系仍可使企業獲取一定收益。因此,持有一般重要態度。
一般發展客戶(100):最近一次交易時間間隔短,但購買頻數和購買金額都較小,不能馬上為企業贏得可觀收益。
一般保持客戶(010):購買頻數較高,但長期不和該企業交易,并且消費金額很低,企業從這類客戶得到更多收益已經較為困難。
無價值客戶(000):無論是購買頻數、購買金額,還是購買時間間隔,這類客戶均不能為企業帶來價值,因此不再需要維系和他們的關系。
由表4知,重要價值客戶有704人。根據RFM模型,重要價值客戶為分值最高的一類,故將這704名重要價值客戶定位為有效客戶。
本文運用分類樹模型,在RFM模型基礎上進行優化,考慮潛在客戶價值與創收能力;結合聚類分析,基于所有客戶數據的分類,找到影響銷售的關鍵因素,定位客戶群體;運用二元Logistic回歸模型,有效預測客戶購買行為;針對分析結果,提出了客戶當前價值和潛在價值在客戶細分中的應用。通過數據挖掘技術,采用真實數據進行量化分析,可以清楚直觀地定位更有價值的顧客,從而根據顧客群體制定銷售方案,推廣銷售信息,預測銷售數據,實現精準營銷。同時,通過有效客戶定位的結果,同樣可以分析潛在客戶的特征,如將預測購買力接近0.25的作為潛在客戶,同時也可將客戶分類中的重要保持客戶、重要發展客戶作為潛在客戶進行促銷。