楊倩倩,生佳根,趙海田
(江蘇科技大學 江蘇 鎮江 212000)
近年來隨著國內航空業的迅速發展,航空公司之間的競爭愈演愈烈。如何利用民航信息系統中海量的旅客行為數據進行客戶細分,針對不同的旅客群體制定最優的營銷策略,以此來保持老旅客,吸引新旅客,充分挖掘潛在的價值旅客,提升企業的競爭力和經濟效益,已經到了刻不容緩的地步。
目前,航空公司傳統的信息系統已經積累了大量的包含旅客人口統計特征和行為特征的數據,但是,這些數據僅僅局限于簡單的記載,缺乏深層次的分析,采用數據挖掘方法進行數據挖掘,發現數據里面蘊含的規則和知識,可以為航空公司提供更有效的客戶關系管理方法。本文利用A航空公司的旅客訂票行為數據,采用聚類算法中的K-means方法構建民航客戶細分模型,并根據客戶細分結果分析相應的客戶行為特征,針對不同群體的客戶提出相應的營銷策略建議。
客戶關系管理[1](CRM)是一種經營戰略,該戰略利用信息技術整合企業的客戶信息,為企業提供一種全面可靠的認知,賦予企業更完善的客戶交流能力,從而有助于維系和拓展這種互利的關系。CRM系統的目的是通過技術和營銷策略的結合來改進客戶服務、提升客戶滿意度,實現客戶收益率的最大化。
從管理理念講,CRM是一種以客戶為中心的管理理念與經營策略,是將企業的客戶作為最重要的企業資源,通過深入的客戶分析和完善的客戶服務來滿足客戶的需求,保證實現客戶的終身價值。
從技術手段講,CRM是一種管理軟件和技術,它將商業活動和數據挖掘、數據倉庫、銷售自動化以及其他信息技術緊密結合起來,在企業與客戶之間建立一種實時的、互動的交流系統。
客戶細分[2]是客戶關系管理(CRM)的重要組成部分,是企業實現客戶關系管理的重要工具和環節??蛻艄芾韺W中的二八法則表明,企業80%的利潤是由20%的客戶創造的,即相對較少的大客戶創造了極大的利潤。因此,如何維持與高價值客戶的良好關系,進一步挖掘潛在價值客戶,合理分配有限的資源,提供有針對性的差別服務,是企業在激烈的市場競爭中制勝的關鍵。
K-means算法是一種得到最廣泛使用的基于劃分的聚類算法,把n個對象分為k個簇,以使簇內具有較高的相似度。相似度的計算根據一個簇中對象的平均值來進行。K-means算法采用迭代更新的思想,首先隨機地選擇k個對象,每個對象代表一個簇的初始均值或中心。對剩下的每個對象,根據其與各個簇中心的歐式距離,將它分配到最相似的簇。然后K-means算法迭代地改善簇內變差。對于每個簇,它使用上次迭代分配到該簇的對象,計算新的均值。然后使用更新后的均值作為新的簇中心,重新分配所有對象。迭代繼續,直到分配穩定,即本輪形成的簇與前一輪形成的簇相同[3]。
K-means算法的具體步驟:
輸入:聚類個數k和包含n個對象的數據集X={x1,x2,…,xn};
輸出:k 個簇{S1,S2,…,Sk}
方法:1)從數據集中隨機選定k個對象作為初始聚類中心 c1,c2,…,ck;
2)逐個將對象 xi(i=1,2,…,n)按歐式距離分配給距離最近的一個聚類中心

其中Nj是第j個聚類Sj所包含的對象個數;
4)若聚類中心不再變化,目標函數最小,算法終止,否則轉步驟2)。
隨著民航信息化程度的日益加深,航空公司快速準確的客戶分析將成為制定差異化營銷策略、提升企業競爭力的必然需要。本文為A航空公司提供科學合理的客戶細分模型,能夠正確地對該航空公司的旅客進行分析,確定不同的客戶群對該航空公司的價值,以此方便A航空公司針對不同客戶群的行為特征制定有差別的營銷策略,提升A航空公司對客戶的吸引力,從而提升A航空公司在民航市場中的競爭力。
數據處理是模型實施的保障,數據預處理所得到的數據質量將直接影響到民航旅客細分結果的精度和性能。本實驗采用A航空公司的旅客訂票數據,包含旅客的訂票記錄、旅客個人基本信息等。使用SPSS作為數據預處理的主要工具,通過數據清理、數據細分變量的選擇來實現對數據的預處理[4]。
首先對數據進行清理,主要對數據集中缺失的數據進行缺失值處理,采取SPSS自帶的臨近點中位數的方法為缺失值進行填補,如圖1所示。
細分變量的選擇是數據預處理的關鍵步驟,細分變量不僅關系到模型的實施,而且關系到后期的結果分析[5]。本文使用SPSS軟件對這些數據變量進行分析,篩選出對民航客戶細分模型有意義的屬性項,得到的結果如表1所示。由于涉及客戶和航空公司隱私,省略了一些屬性項的列舉。

圖1 SPSS數據缺失處理Fig.1 SPSSmissing data process

表1 A航空公司的訂票數據Tab.1 The ticket data of A airline
本文根據客戶價值將客戶分為高價值客戶、普通客戶和低價值客戶3類。因此建模的聚類個數k設為3,實驗所用數據集為A航空公司的1 000條訂票數據,預處理后利用K-means算法進行聚類,得到結果如表2所示。

表2 聚類結果Tab.2 The results of clustering
分析表2各個客戶群的特征:就艙位而言,Y艙在每個客戶群中都占有較重的比例,由此可見商務型旅客應該是航空公司今后的重點營銷對象??蛻羧?的主要特征是提前訂票時間較短,并且折扣較低,可知這類旅客對票價不敏感,但對時間敏感,且以商務旅客為主,應該是高價值客戶??蛻羧?多為常旅客,提前訂票時間為5天左右,對時間的敏感度僅次于客戶群1,折扣也相對比較低,應是普通價值客戶,航空公司可提供一些營銷策略,將該類客戶向客戶群1發展??蛻羧?提前訂票時間長,折扣較高,應是低價值客戶,以學生、游客為主。
客戶管理和營銷是目前我國民航運輸企業發展的一個難點,如何將航空旅客劃分為不同的客戶群,針對不同的客戶群制定有差別的營銷策略,從而提供不同的服務與管理成為民航企業發展的關鍵問題[6]。本文利用K-means聚類算法實現對航空旅客的劃分,航空公司可以根據旅客細分的結果進行分析,結合實際條件,為不同價值的客戶提供不同的服務,從而提升企業在民航市場中的競爭力。
[1]郭雯.基于客戶認知價值的CRM戰略[J].商業研究,2003,8(268):9-12.GUOWen.CRMstrategy based on customer cognitive value[J].Commercial Research,2003,8(268):9-12.
[2]朱金福,劉鳳.航空貨運客戶細分與客戶價值分析方法[J].交通運輸工程學報,2005,5(2):73-76.ZHU Jin-fu,LIU Feng.Analysing method of customer segmentation and customer value of air cargo[J].Journal of Traffic and Transportation Engineering,2005,5(2):73-76.
[3]閆相斌,李一軍,葉強.基于購買行為的客戶分類方法研究[J].計算機集成制造系統,2005,11(12):1770-1774.YAN Xiang-bin,LI Yi-jun,YE Qiang.Research on customer segmentation based on purchase behaviors[J].Computer Integrated Manufacturing Systems,2005,11(12):1770-1774.
[4]胡少東.客戶細分研究[J].工業技術經濟,2005,24(7):63-69.HU Shao-dong.The research of customer segmentation[J].Industrial Technology and Economy,2005,24(7):63-69.
[5]劉英姿,何偉.基于不同視角的客戶細分方法研究綜述[J].商場現代化,2007(31):271.LIU Ying-zi,HE Wei.The research of customer segmentation method based on a different perspective review[J].Market Modernization,2007(1):271.
[6]羅彪,閆維維.基于ANP和K-means聚類的客戶價值分類模型及應用[J].計算機應用,2013,33(10):2954-2959.LUO Biao,YAN Wei-wei.Customer value classification model and application based on analytic network process and K-means clustering[J].Journal of Computer Applications,2013,33(10):2954-2959.