□ 李晴雯,涂 敏,段李杰
(湖北經濟學院 工商管理學院,湖北 武漢 430205)
隨著互聯網時代的來臨和經濟全球化的發展,客戶更加注重產品的個性化,企業和公司也紛紛把營銷的重心從產品至上轉移到客戶至上。中國民航局2016年12月21日發布了《中國民用航空發展第十三個五年規劃》,里面明確指出了未來十五年內我國航空業的發展計劃,為航空產業的積極發展提出了很多切合實際的目標。在這種背景下如何準確識別有效的客戶,借助價值分析獲取穩定的忠實客群就成為廣大公司企業決策的重要因素。
在目前的航空業市場中,隨著行業中的放松管制,需求的不斷增長,行業進入障礙減少,同行業競爭者之間的競爭壓力越來越大。從前處于主導地位,甚至在某些市場,由于市場保護處在壟斷地位的航空公司,受到了大量的來自于新興航空公司,甚至私有化航空公司,廉價航空公司的沖擊。當前,全球航空業約有2000多家航空公司,存在行業產能過剩現象。
在航空客運市場上,乘客面對眾多的航空公司、航班、時刻、機型、票價、服務等,選擇度越來越大,而乘客真正看重的是“讓渡價值”,即總希望把有關成本,包括:貨幣成本、時間成本、精力成本、心理成本等降到最低限度,同時又希望獲得更多的實際利益,包括:服務價值、個人價值、形象價值等,這就對航空公司提出了更高的要求。
如今在航空客運銷售市場上,航空公司在銷售上過分依賴代理人,把過多的財力、精力用在了鼓勵和管理代理人上,支付代理費成了我國航空公司最大的銷售成本,而最終取得的效果并不盡如人意,航空公司越來越處于被動地位,并且離其真正的消費主體――航空乘客越來越遠,這嚴重影響了航空公司的可持續發展,沒有建立顧客型的銷售組織體系。
針對以上三個問題,本文通過K-means聚類的航空客運數據分析,幫助航空企業尋找客戶價值,通過此模型的建立,找出各類客戶的有效特征,并提出精準營銷策略,為公司提高經濟效益。
①所采用的數據:航空客運數據(數據來源于www.wldl.org/)。
②所運用的分析方法:聚類分析K-means算法。
①對數據進行預處理;
相關的地方性立法目前還不健全,特別是自然地理環境特殊的省份,例如西藏自治區發展高原農業和河谷農業,東北三省有廣袤的東北平原發展專業化農業,都沒有出臺相關文件。“各地可結合當地的優勢農產品布局,形成各具特色的農業機械化區域,進一步拓展農業機械化的服務和作業領域,突出綜合性、多樣性、優質高效性,實現農業機械化的跨越式發展,促進農業機械化與地區經濟協調統一發展。”[5]即形成地理單元與行政區劃緊密連接的農業機械化發展格局。伴隨著我國經濟的發展和全面深化改革進程的加快,農業機械化立法已經明顯滯后于現實的發展,制約了農業機械化在發展農業現代化中的作用。
②分析數據結構,并觀察特征;
③建立聚類分析模型,運用K-means算法進行分析;
④根據模型輸出,得出結論;
⑤制定合理的營銷策略,挖掘更多有價值的客戶。

圖1 方案設計流程圖
本文使用的數據來源于合作公司提供的數據,因此它的航空客運數據,包括乘客基本信息、乘坐次數信息、積分信息等(數據來源于www.wldl.org/)。
K-means算法是輸入聚類個數k,以及包含n個數據對象的數據庫,輸出滿足方差最小標準的k個聚類。
k-means算法接受輸入量k;然后將n個數據對象劃分為k個聚類以便使得所獲得的聚類滿足:同一聚類中的對象相似度較高;而不同聚類中的對象相似度較小。聚類相似度是利用各聚類中對象的均值所獲得一個“中心對象”(引力中心)來進行計算的。
通過對原始數據的觀察,發現原始數據中的若干數據存在缺失值,建立一個數據表格,發現數據總缺失率為0.2%,因此,選用缺失值補充來使原始數據更加完善。為了能更大程度地反應航空客戶群的普遍情況,在該分析中選用全局處理中的“按字段所在列平均值/出現頻次最高值補全”的方法補全表格中數據。
在進行了數據預處理之后,為了觀察該航空公司客戶的乘機次數、加權飛行公里數、以及平均時間間隔等維度在時間上的變動情況,采用時間序列的手段進行數據觀測及分析,以下通過序列圖和螺旋圖來展示該部分數據。
4.3.1 序列圖

圖2 乘機次數、加權飛行公里數和平均時間間隔序列圖
從以上序列圖中可以發現,該航空公司在乘機次數、加權飛行公里數以及平均時間間隔這三個維度上都是隨機的不平穩序列,在局部出現明顯的、差異度較大的波峰。
4.3.2 螺旋圖

圖3 乘機次數螺旋圖
從乘機次數螺旋圖中可以發現,客戶乘機次數隨著是隨著年份的推移逐漸增大的,說明該航空公司擁有一個不斷增大的市場。
在分析中我們以航空客戶信息的總乘機次數、加權飛行公里數、平均時間間隔和總票價為聚類標準,根據客戶的這四個指標的相似性將客戶分為4簇,基于聚類分析能實現對不同客戶的分類,進行精準營銷,提高航空公司收益。
4.4.1 新變量定義
為了使聚類指標更準確,在使用K-means算法前可以定義新的特征變量,在本次分析中,定義總票價為第一年票價和第二年票價之和。
4.4.2 特征變量的選擇
本分析中選取元特征變量為會員卡號,即代表所有的客戶;特征變量為總乘機次數,加權飛行公里數、平均時間間隔和總票價。
4.4.3 K-means聚類
設置簇的數量為3,將客戶分為三類,從特征表格里面可以看到已經分類的數據。
表1 客戶群細分特征表

4.4.4 箱線圖檢查
為了檢驗聚類模型的效果以及了解各個類別在不同維度上的分布情況,引入箱線圖組件。可得出客戶在總乘機次數、加權飛行公里數、平均時間間隔和總票價四個維度上的箱線圖。下面列舉出客戶在總乘機次數、加權飛行公里數兩個維度上的箱線圖。如圖4和圖5所示。

圖4 客戶在總乘機次數維度上的箱線圖分布

圖5 客戶在加權飛行公里數維度上的箱線圖分布
從整體上觀測,聚類模型性能大致符合預期。
從以上箱線圖中可以觀測到,三類客戶在不同維度上的均值如下表所示:

表2
通過對以上數據整合,獲得三類客戶在不同維度上的排名如下表所示:

表3
從聚類以后的客戶量來看:

表4
依據上述分析,可以總結如下結論:C3類客戶數量最多,在總客戶群中占比百分之八十以上,該類客戶的單位總乘機次數、加權飛行公里數和總票價都較低,但是群體龐大,是公司收益的主要來源。C1類客戶數量其次,各維度也占中等水平。C2類客戶數量較少,占比不到2%,但是該類客戶在總乘機次數和票價上都排名最前,平均時間間隔低,說明該類客戶乘機頻繁且為公司帶來的單位收益較高。
中國航空市場競爭進入白熱化,客戶對產品和品牌定位的認知度越來越高。通過對消費者的消費行為的精準衡量和對建立的數據體系的分析,進行客戶優選,并通過市場測試驗證來區分所做定位是否準確有效。
通過對客戶的細分,按照客戶的特征將其分成了三類,針對數量龐大的客戶群,可采用廣告、群發短信等方式進行溝通,而針對數量較少但能為公司帶來高價值的客戶群,建議設專人一對一跟蹤服務,及時了解客戶具體需求并及時反饋。
建立顧客型的銷售組織體系,使各模塊的銷售人員專業針對自己擅長的模塊的客戶進行營銷。每個銷售人員都能了解到消費者的特定需要,有時還能降低銷售人員費用,更能減少渠道摩擦,為新產品開發提供思路。
對于不同的客戶群體,設置企業個性化產品也是加強核心競爭力的重要手段。根據客戶細分類別,可為價值最高的VIP大客戶設立服務專區,讓VIP大客戶在專區內辦理快遞手續和進行結算服務;消費額一般的潛在客戶群具有較大的提升空間,可對其采取積分制,當服務次數達到一定量時,給予價格優惠,加強合作減少流失。