魯 燚 張國發 劉 茂
(遵義醫科大學 貴州 遵義 563000)
電商行業利用本身優點,如阿里巴巴旗下的達摩盤營銷系統,能夠根據客戶消費信息迅速進行數據分析,不僅能留住老會員,還能吸引用戶消費。造成實體商場壓力很大,商場若想要謀求更多利益,需要根據會員消費情況進行精準化運營,刺激消費。
本文用2018年全國大學生數學建模競賽題C題(鏈接:http://www.mcm.edu.cn/)做研究。針對附件1(會員信息表),將表中錯誤的入會時間信息刪除;找出表中重復卡號,有選擇地刪除數據,保證卡號的唯一標示性;附件2存在金額(je)、數量(sl)為負的情況,作以下規定:Sl<0,je>0表示商品被退回,消費金額為正,視為數據異常,進行刪除。最后,由于附件3中的會員消費明細是該商場所有會場的總的消費記錄,而我們只針對附件1中的商場主會場會員進行管理。所以根據卡號將附件1和附件3進行對比,只保留附件1中的會員消費明細,從而得到本商場會員消費明細表。為了將非會員與會員進行區分,將附件3中消費記錄時間區間與附件2統一,再將本商場會員消費明細表與附件3進行對比,于是可以得到2016年1月9日至2017年9月23日的會員消費流水表。
從消費總金額來看會員∶非會員=431994698.9∶790624190.7;從消費商品總數來看會員∶非會員=344725∶707705。其次統計各年齡段會員的消費能力:由于數值間差距過大,所以將各個數值轉為倍數關系,方便進行數據可視化。以<18歲的數據為分子,如,<18歲的消費總金額是1031196元,而18-43歲的消費總金額為414291445元,后者消費總金額數值大小為前者的401倍,則導入兩者的消費總金額數據為1,401。

圖1 各年齡段消費情況柱狀圖
統計男女會員消費情況:從消費數量來看女性∶男性=308463∶29638;從消費金額來看女性∶男性=381209838.7∶43334214.3。可以看出女性為本商場消費的主力。
會員分類,不但可以讓會員被商場管理者識別,還能為商場對會員的服務性營銷策略提供支撐。首先對數據進行限定:選取2017年1月(31天)時間段的數據進行研究,能夠得出會員短期內消費情況以及平均價值。接下來對改進的RFM模型進行解釋。
1.RFM模型介紹
由Hughes發現并建立的RFM模型是衡量客戶價值重要工具。對RFM模型,在本文R指時間段(本文指會員在2019年1月1日-1月31日的消費)里,會員最后一次消費的時間距離統計時間(2019年1月31日)的天數;F指時間段里會員消費次數;M是時間段里會員消費總金額。
2.改進的RFM模型
對于原模型M指標僅反映會員指定段時間的消費總金額,從長期來看,取統計時間里會員的平均消費金額能夠很好地反映該會員的實際消費水平。因此本文在基于RFM模型的基礎上提出了RFA模型,其中將M這一指標替換成了A(Average)會員在規定時間內的平均消費金額。
首先,數據標準化[1-2]。第二步,層次分析法[3-4]確定權重。對RFA各指標權重問題,本文認為會員價值受各指標的影響并不一致,因此采用層次分析法對各個指標賦予不同的權重。第三步,進行K-Means聚類。最后,計算會員價值得分。
Score=Ri×WR+Fi×WF+Ai×WA
公式1
其中Ri表示第i個會員對R指標的得分,WR表示,R指標所占的權重,Score表示會員價值得分。
第一步,采用max-min標準化。數據導入R-Studio,根據公式編寫自定義函數,得到三個指標標準化后的數據。在第二步,對于各指標權重,首先要將相關因素分解成三層,得到基于RFA的層次結構模型。

圖2 基于RFA的層次結構模型
其次,根據Saaty等人提出1~9尺度[4]確定權重。邀請兩位專家給出判斷矩陣,作為權重的數量依據。通過使用層次分析軟件yaahp可以得到各要素最終占的比例為
WA:0.6189、WF:0.2266、WR:0.1545
結果表明A(Average)權重最大,對會員價值的影響也最大,F指標次之。在第三步,對1月消費數據(5763條記錄)進行聚類分析,得到between_SS/total_SS=87.0%。經過多次試驗,發現該值在分為7類的時候為85.3%;在分為6類的時候為83.4%。由組間距離越大,組間距離盡越小,聚類效果越好,則該值越大,可以知道分為8類的聚類效果非常好。
在第四步,根據權重,結合聚類分析的結果將每類會員價值得分排序。對于每一類會員的價值總分采用公式
Total Score=Rj×WR+Fj×WF+Aj×WA
公式2
其中Ri表示屬于第j類會員的R指標的均值,WR表示該指標的權重。Total Score表示該類會員價值總分。將8類的R指標均值按照從小到大排序,得到一個取值區間,其中規定數值在0-0.036時該類會員R值得分為1,在0.036-0.07時R值得分為2;在0.07-0.11時得分為3;高于0.11時得分為4。對F、A指標分別按照R指標的處理方法,得到取值區間并進行排序,規定數值段分值。最終得到各類會員價值得分排序表。最后將8類會員的價值得分進行排序,得到會員的8個級別。總分越大,級別越高,如總分為3.3811的這類會員,為最高級別第8級。

表1 會員價值得分排序表
總分越大則會員價值越高。數據表明,該商場會員中等級為5的會員人數最多,等級為6的人數最少。也就意味著本商場的中高級會員是本商場的主要銷售對象,且為商場帶來的利益最多,商場可以不僅根據這部分會員的消費習慣和消費愛好進行有針對性的推銷,還可以根據三指標中得分情況,指定銷售策略,有針對性地提高某一低指標的得分。
為了將改進的模型與傳統RFM模型進行對比,將兩模型數據進行指標間的相關性分析。最后得到傳統模型中F指標與M指標存在線性相關,相關系數為0.613。而改進的模型避免了指標間的共線性。
通過對傳統RFM模型的M指標進行改進,得到RFA模型。改進模型對會員得分進行量化,能夠很好地衡量各類客戶的價值。且能夠規避指標間的相關性。存在的不足在于,指標過于單一,聚類效果還沒有達到最好的效果(95%以上),應該參考更多因素進行建模,以希望能將聚類效果得到提高。