季杰 陳強仁 朱東


摘要:隨著各大航空公司的業務競爭越來越激烈,在知名度與航空服務的競爭已經分不出太大差異的情況下,怎樣努力提高用戶客戶滿意度是當前航空公司最要注重的問題,可在海量的用戶數據面前,傳統的方式顯然不夠用,所以筆者嘗試用機器學習技術處理航空公司客戶價值分析問題。解決方案就是使用K-Means聚類均值算法將現有航空公司客戶進行分群,這樣航空公司就好針對不同的客戶群體進行不同的營銷方案。
關鍵詞:機器學習;客戶價值分析;K-Means算法
中圖分類號:TP3 文獻標識碼:A
文章編號:1009-3044(2020)14-0238-02
1引言
在經濟發展快速的現代社會,飛機出行已經不是難事,各大航空公司的競爭也開始愈演愈烈,從價格戰轉到服務戰,但由于其之間差異又不是很大,導致競爭一直沒有分出個勝負。但隨著航空客戶體系越來越成熟,企業開始注重“以人為本”,注意到以前的營銷方式只會造成資源傾斜,所以新時代下不同的客戶要有不同的營銷方案。而本案例做的就是針對客戶以往的消費以及飛行情況進行分析,然后進行分群,這樣航空公司就可以針對不同的客戶群體制定不同的個性化服務,從而達到留住客戶,吸引客戶的目的。
2航空客戶價值分析流程&數據預處理
2.1航空客戶價值分析流程
想要對客戶價值進行分析,我們首先要對航空客戶信息數據進行預處理操作,因為其中存在一些異常數據,這些數據將會影響到我們的結果,而預處理結束后,我們就可以進行特征構建了,畢竟用戶信息那么多的情況下,我們必須選取出我們適用的特征指標,所以我們采用了LRFMC模型來構建特征模型,最后我們使用K-Means聚類算法來進行客戶人群分類。
2.2航空客戶數據預處理
航空公司客戶數據中存在著少量的異常值,若是不處理的話會對之后結果產生影響。
1)通過對原始數據的觀察發現,在數據中有票價為0,折扣率為0,總飛行里程卻大于0的數據,這很顯然是不正常的,其中還有票價為空值的數據,這可能是客戶乘機記錄不存在導致的,所以我們將這類數據丟棄掉。
2)數據中也可能存在折扣為0,客戶乘坐0折飛機的情況發生,由于原始數據集數量大,所以我將這類數據也丟失掉,以免影響分析結果。
3構建航空客戶價值模型
3.1客戶價值分析常青樹-RFM模型
想要對用戶進行分群,除了進行預處理以外,還要構建用戶的特征模型,這樣我們好將用戶區分開來,而各行業最常用的客戶價值模型就是RFM模型。
1)R指的是客戶最后一次消費與這次觀測結束時間的間隔。
2)F指客戶的消費次數,消費越多的自然客戶價值也就越大。
3)M指客戶的消費金額,消費金額越大的他們的消費水平也自然越高。
3.2航空客戶價值分析-LRFMC模型
與尋常的客戶分析不同,RFM模型的客戶消費金額并不能體現航空客戶的價值水平,所以本案例去掉了客戶的消費金額,并選擇了客戶的飛行里程與購買機票的平均折扣系數,一共五個特征指標,記為LRFMC模型。下面是特征詳細解釋:
1)客戶入會時間L:客戶第一次購買機票距離現在的時間;
2)消費時間間隔R:客戶最近一次乘坐飛機距離現在的天數;
3)消費頻率F:客戶在觀測期間乘坐飛機的次數;
4)飛行里程M:客戶在觀測期間飛行里程;
5)平均折扣系數C:客戶在觀測期間獲得的機票折扣的平均值。
4基于K-Means算法進行客戶分群
之所以選擇K-Means算法,因為這是最普及的聚類算法,也是比較適合我這類新手的聚類算法,下面我簡單地介紹下步驟:1)Kmeans算法先要假設將數據分成多少類,我認為航空客戶群體可以分為5類。2)隨機選取k個目標點,它們作為聚類中心3)計算數據集中每個點到K個聚類中心的距離,然后將它們分配到距離它們最近的聚類中心,這樣就能形成5個簇。4)因為本案例的數據量比較大,所以以上步驟得到簇是比較散的,而我們要的結果是要相似的越接近,不相似的越遠,所以算法會重復上面的步驟,直到得到合適的客戶群。
總體來說,K-Means算法的結果符合我的預期想法,我們可以從下圖中詳細地看出各類人群的人數以及他們分布的原因,比如圖中第三類客戶群體,他們折扣系數高,人數少,他們的其他特征指標都不突出,但卻能帶來很多利益,所以航空公司要提升這類重要發展客戶的價值,又比如第5類人群,他們飛行里程高,飛行次數也多,為航空公司創造了很多價值,這類重要保持客戶群的高消費水平是航空公司要穩定保持的,平時要多給些優惠和折扣讓他們對公司產生依賴,除了上面兩類人群外,航空公司還要防范重要挽留客戶的流水并積極進行關系修復。至于一般客戶,平時公司可以給些小優惠和福利折扣來進行吸引消費,但不用太多太勤,至于無價值客戶,建議航空公司不要在這類客戶群身上花功夫,趁早選擇保留還是放棄。
5結論
在本次航空客戶價值分析案例中,首先我對航空客戶數據進行了探查與預處理,得到了無異常值的數據,確保之后的模型訓練中不會影響結果,然后我根據客戶信息,選取并構建特征指標,構建了LRFMC航空客戶價值模型,最后我通過K-Means聚類算法將航空公司客戶群體分為了特征需求比較明顯的五類。這次案例的結果符合我的預期,也符合市場銷售的法則,并且在流程結尾我也對航空公司怎樣針對這五類客戶群體進行了建議,最后我感覺不管在哪個行業,在新時代對不同客戶群體進行精準營銷勢在必行。