張 蕾 陳素波
〔中國石油規劃總院 北京 100083〕
加油卡是成品油零售行業中進行客戶管理的重要工具。企業通過加油卡獲得顧客信息、記錄顧客行為、分析顧客偏好;顧客和企業通過加油卡進行溝通互動,以方便、快捷、安全的方式完成交易。從企業來看,用卡客戶是重點關注和營銷的對象。具體來說,用卡顧客可以分為兩種:一種是持續用卡的客戶,他們對品牌的忠誠度高,對企業的讓渡價值(指整體顧客價值與整體顧客成本之間的差額)也大,是企業的核心客戶群體;另一種是用卡后,容易出現流失的客戶,他們容易受其他因素的影響不再使用加油卡或者流失成為競爭對手的客戶,是企業重點關注和營銷的對象[1]。因此,企業從客戶角度切入,要解決兩個基本問題:讓在用卡客戶的使用頻率或者單次消費額度提升,提高顧客讓渡價值;提高有流失傾向的顧客對企業的關注程度,防止該類型顧客流失。個人加油卡用戶長時間沒有使用加油卡消費,可能的原因分為兩類:一類是忠誠顧客,有加油需求時仍然會繼續使用加油卡;一類是流失顧客,不會再繼續使用加油卡。因此,對于一定時間內沒有消費或者充值、查詢行為的加油卡進行分析,了解不同消費者背后的動機和需求,對企業開展針對性營銷具有重要作用。同時,大量積累的這類加油卡,既浪費制作和營銷的成本,也沒有及時帶來長期的收益,發揮應有的作用。因此,有必要分析該類型客戶特點,針對性地選擇發卡或者開展營銷。
人們一般把在一定時間或者在一個時間段內沒有使用過的卡,或者新申領卡但沒有啟用和激活的卡稱為“睡眠”卡。“睡眠”卡一方面代表著部分客戶的流失,另一方面也為企業的系統資源帶來較重的負擔。因此,對睡眠卡的研究也是各企業的重中之重。
目前對“睡眠”卡等相關的研究主要集中在以下三個方面:一是對卡片“睡眠”原因的分析,包括單純追求發卡數量、售后服務不到位、用卡環境復雜化、產品同質化、用卡人觀念限制等[2]。二是對該類型卡帶來的問題和風險進行研究,包括增加企業成本、形成資源浪費;分析過程冗雜,數據清洗困難等。三是對“睡眠”卡處理方式的討論,包括提前防范、重視發卡質量;提升服務質量,改善用卡環境;整合產品,提高用卡頻率等。從方法上來看,現有文獻主要通過博弈論模型[3]、嶺回歸模型[4]、logistic回歸模型[5]等方法對“睡眠”的原因、影響因素、顧客行為等進行預測分析。為此,本文應用Python2.7軟件分析了某省的加油卡消費數據,對 “睡眠”加油卡的管理進行探討。
本文研究數據來源于某公司在某省的所有加油站, 2010—2015年的個人記名卡消費(交易)數據、充值數據、卡片數據。根據研究需要,分兩步對數據進行清洗和連接:先將不同年份的數據進行合并,再將三類數據按照卡號、時間順序連接,進行信息整合,最終得到用于分析的源數據。
數據的清洗過程如下:先對用非標準時間表示的數據等進行轉換、排序;對于異常空格等數據進行清洗,皆轉為可處理數據。同時將異常格式的數據進行刪除,在2010—2015年的個人記名卡消費(交易)數據中,存在31行異常格式數據,而原數據約有785萬條,共計1000多萬行,認為刪除不會造成影響。數據清洗還包括:刪除年齡不在18~80歲之間的數據、刪除“非法數據”(如在填數字的地方填了字符等,但仍保留該條數據的其他有用信息)、在需要的時候對某些數據進行標準化處理,再還原、刪除異常值。
從行業內外對“睡眠卡”的定義情況來看,主要包括兩個方面的內容:一是對時間標準的確定,二是對時間以外其他特征的確定,比如余額、卡的類型等。鑒于此,本研究從這兩個方面切入,分別選擇不同的樣本進行測算和驗證,為成品油零售行業中加油卡的“睡眠”情況提供參考。
第一步,計算合理用卡時間間隔。本文把加油卡的消費數據和充值數據按照卡號分組,并按照時間順序進行排序,依次求出每個卡號中消費與消費之間的時間間隔(消費時間差)、充值與充值之間的時間間隔(充值時間差),消費與充值之間的時間間隔(消費時間差、充值時間差及消費與充值之間的時間間隔統稱為行為時間差)。篩選出兩次行為時間差小于一個月的數據,并計算出其行為時間差、消費時間差、充值時間差的中位數和均值。統計結果(表1)顯示,對于兩次行為時間差小于一個月的數據片段來說,大部分數據的消費時間差集中在5 d(中位數)。換言之,對于用戶來說,每個月的消費次數大部分集中在6(30/5)次。

表1 行為時間差統計結果 d
第二步,分析典型顧客的時間分布。本研究使用的樣本數據是2010—2015年的數據。由于客戶開卡的時間不統一,因此需要根據典型顧客的行為進行分析,以避免由于顧客開卡時間的差異引起系統誤差。本文定義“典型用戶”為一直使用加油站卡的用戶,其識別情況如下:①2015年以前開卡的客戶,只要在2015年內至少使用1次加油卡,就認為是在用卡顧客;②2015年當年開卡的客戶,以2015年數據段用卡時間間隔5 d(由于樣本數據分布存在非對稱特點,平均數不具有代表性,在此使用中位數對不同類型卡用戶進行數據特點描述)作為計算標準,將消費次數大于用卡月份乘以6(比如第一次記錄時間為2014年5月,則把2015年消費次數大于36次的卡定義為在用卡),篩選出用卡頻率較高的客戶作為典型用戶;③將樣本卡中每兩次消費作為一個時間段樣本(共計約785萬條數據),以月為單位統計消費時間間隔分布情況;④顧客99.8 %的消費時間間隔處于3月以內,停用3月以上的行為占比迅速減少,且停用行為的分布較為平均。2010—2015年間開卡且持續在用卡顧客消費時間間隔和樣本數量占比見表2。

表2 持續在用卡顧客消費時間間隔和樣本數量占比統計情況 %
第三步,全部顧客的停用時長及流失情況統計。本文對卡用戶的“流失”進行定義,認為顧客在最后一次用卡后連續12個月無消費、充值、查詢等行為定義為自然流失。在此基礎上,本研究以全部顧客為樣本,按顧客停用時間的長短進行統計,發現停用間隔在3個月以內的加油卡,一年內自然流失率為57 %,較間隔時間在2月內流失率增加了19個百分點;如能在2-3個月期間對該類卡用戶進行溝通,能減少該顧客的流失。3個月以后的自然流失遞增情況較穩定,營銷干預效果偏弱(見圖1)。

圖1 顧客自然流失率及其變化情況統計
第四步,加油卡的特點分析。本文使用方差分析法對加油卡內余額分布情況進行了驗證。方差分析是用來研究分類變量對數值變量的影響,即研究某些因素對于指標有無顯著的影響。由于余額變量是非正態分布,不滿足方差分析的假定,因此采用Kruskal-Wallis 檢驗的非參數方差分析方法。結果(表3)顯示,卡內余額越多,繼續使用該卡的概率越高;停用時間在3月以內的加油卡,卡內余額基本保持在100元左右。

表3 不同停用期卡余額數值(中位數)情況
統計結果(表4)顯示,金卡、鉑金卡和鉆石卡用戶在停用3個月以上時,有55%左右的加油卡在一年內再次消費,其概率遠高于普通卡。

表4 不同級別加油卡的再使用情況
綜上所述,根據本文進行的數據統計,可以根據“睡眠加油卡”的使用及余額情況進行如下定義:睡眠加油卡是指連續3個月以上持卡人無主動發起的消費、充值(不含積分兌換、查詢)行為,且卡內余額在100元以下的普通個人記名卡。
根據“睡眠卡”的概念,定義加油卡的“復蘇”和“流失”。對比復蘇卡用戶群體與流失卡用戶群體在基本屬性、用卡行為、時間間隔方面的差異,能夠為顧客營銷預警提供研究基礎。本研究中,為了能夠區分樣本行為,復蘇卡是指發生睡眠行為以后重新使用的卡,流失卡是指未使用時間在12個月以上的卡。
在全部樣本中,根據定義清洗數據后,得到適于分析的顧客數量176 758名,其中流失卡用戶有171 040名,復蘇卡用戶有5 718名,整體復蘇率為3.2 %。通過對“復蘇”和“流失”兩類樣本的數據統計(表5)發現,流失卡余額明顯低于復蘇卡復蘇前余額,從營銷上來看,若一個客戶卡內余額很低,且很久未發生任何行為,則有很大可能徹底流失,需引起重視。睡眠卡用戶消費行為統計情況詳見表5所示。

表5 睡眠卡用戶消費行為統計情況

圖2 復蘇卡及流失卡汽油最后一次消費間隔時間分布
睡眠卡的流失率整體較高,發現流失卡的主要特點并采取針對性的營銷措施是提高顧客粘性的有效方式。本文分別對卡用戶的汽油消費行為和柴油消費行為進行了統計分析(圖2 和圖3),結果發現,流失卡在流失前,會出現較為明顯的高頻消費行為(平均間隔13.16 d),時間間隔明顯小于復蘇卡(平均間隔11.99 d);從休眠以前最后一次消費金額情況的統計來看,流失卡的最后一次消費金額明顯偏高(521元),遠高于復蘇卡的消費金額(363元),其中柴油顧客的大額消費行為更加明顯。復蘇卡及流失卡平均柴油最后一次消費金額見圖3。

圖3 復蘇卡及流失卡平均柴油最后一次消費金額
根據分析結果,對加油卡用戶的營銷建議如下:一是密切關注個人卡停用時間、余額等關鍵信息,在停用接近3個月左右時與顧客進行互動溝通,比如短信、微信、站內活動通知等,盡量避免卡片成為“睡眠卡”;二是針對停用時間在3個月以上的“睡眠卡”或者非普通卡(金卡、白金卡、鉆石卡),要根據其“睡眠”以前的消費頻率和額度進行識別,對于消費頻率不高、消費額度較為平均的客戶,及時進行提醒溝通,有助于加強“睡眠卡”的復蘇;三是針對“睡眠卡”用戶,可以開展復蘇獎勵等相關活動,提高“睡眠卡”的復蘇率和使用率,降低成本浪費。此外,本研究的相關成果能夠對CRM系統的客戶行為或消費判斷提供幫助,也能為石油企業顧客的忠誠度建設提供參考。本研究仍然有一定的改進空間:一是使用某企業內一個省的數據,可能會受到政策環境、消費習慣等因素的影響,結果并不能完全代表其他顧客行為;二是計算方法可以進一步創新;三是可以針對微信、支付寶等“虛擬加油卡”用戶進行進一步的分析。