吳濤 申騰飛 莊明軒 閆新男 段莉華



摘要:開放式收費停車場是解決城市道路管理和路邊規(guī)范停車的新型手段,停車場的管理運營公司常常面臨停車計時困難和收費率低等問題。為了降低成本和增加營收,運營公司需要對停車用戶分析行為進行建模和分析。本文通過分析開放式收費停車場的停車數(shù)量隨時間的變化,發(fā)現(xiàn)用戶的停車行為與用戶的通勤時間、日常作息時間和假期之間存在相關性。結合用戶行為的周期性特征,本文提出運營公司可以周期性地管理和維護停車場。基于RFM模型和K-means算法,本文實現(xiàn)對開放式收費停車客戶的準確分類,并挖掘用戶的潛在價值以最大限度地提高收入。
關鍵詞:開放式收費停車場;RFM模型;K-Means聚類
中圖分類號:TP37? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)17-0001-03
開放科學(資源服務)標識碼(OSID):
1 引言
隨著我國經濟水平提高,科技力量不斷增強,計算機性能、網絡技術不斷成熟提高,用戶行為分析[1]技術愈發(fā)成熟,傳統(tǒng)的商業(yè)模式正在被一個新的營銷模式—“數(shù)據(jù)化營銷”所替代,尤其是用戶行為分析技術在如今的商業(yè)領域的優(yōu)勢十分明顯。信息化時代來臨使得數(shù)據(jù)焦點從企業(yè)產品轉向用戶群體,用戶行為分析成為公司部門的核心問題。企業(yè)借助大數(shù)據(jù)技術對用戶行為檢測獲取數(shù)據(jù),分析比較不同的客戶群體,通過建立合理的客戶價值評估模型[2],對客戶進行分群,分析比較不同客戶群的客戶價值,并制定相應的營銷策略[3],對不同的客戶群提供個性化的客戶服務提高企業(yè)受益,減輕企業(yè)負擔。用戶行為數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這個定義包括好幾層含義:數(shù)據(jù)源必須是真實的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識要可接受、可理解、可運用,企業(yè)從中提取輔助商業(yè)決策的關鍵性數(shù)據(jù)能更加準確區(qū)分客戶群體,將資源更準確地投入用戶手中。
2 數(shù)據(jù)來源和預處理
2.1數(shù)據(jù)來源
本文數(shù)據(jù)取自某三線城市的開放式收費停車場平臺2020年的用戶數(shù)據(jù),數(shù)據(jù)中存在部分缺失數(shù)據(jù)、無效數(shù)據(jù)、重復數(shù)據(jù)、為了減少數(shù)據(jù)冗余提高數(shù)據(jù)準確性,剔除無效數(shù)據(jù)和非法數(shù)據(jù),在數(shù)據(jù)分析之前先對數(shù)據(jù)進行簡單的清洗和預處理。
2.2數(shù)據(jù)預處理
1)屬性規(guī)約:基于客戶價值的RFM的模型[4],我們選出停車記錄表中的"car_num" ,"car_no","duration","amout","start_time","end_time","fees_paid","recover_amount"這八個字段。
2)刪除數(shù)據(jù)集中的重復數(shù)據(jù)。
3)異常數(shù)據(jù)的處理:通過計算和觀察發(fā)現(xiàn)數(shù)據(jù)集中存在部分異常數(shù)據(jù),比如客戶停車時間和結束停車的時間一致,對于這種類似的數(shù)據(jù)意義不大因此本文采取刪除該類型的數(shù)據(jù)。
4)數(shù)據(jù)轉換:最近的消費間隔 =統(tǒng)計截止時間– 每輛車最近一次的消費時間消費金額 =已付金額("fees_paid")+補繳("recover_amount")消費頻率 =每輛車出現(xiàn)次數(shù)的分類匯總。
3 停車用戶行為特征分析
3.1停車數(shù)量時間特性分析
選取某三線城市2020年的開放式收費停車場數(shù)據(jù)。對2020年平均每天的停車數(shù)據(jù)分析,統(tǒng)計得到以一小時為間隔的停車數(shù)量,24小時的停車流量變化情況如圖1所示。
從圖中可以看出,停車場停車數(shù)量最少的時刻集中在24:00-05:00,這是因為大部分人都在休息,停車車輛大多是該停車場場附近居民的車輛,停車數(shù)量總體較少;在06:30-12:00時段停車數(shù)量開始呈現(xiàn)持續(xù)上升的趨勢,由于該停車場位于都市的商業(yè)圈附近,這段時間正是人們選擇去商場購物的時候,所以這段時間內的停車的數(shù)量逐漸增加,說明這群人大部分是來商場工作或者消費的。在12:00-14:00和19:00-20:00這兩個時間段出現(xiàn)了當天的兩個停車高峰,而這兩個時間段正好是一天當中的午餐時間和晚餐時間,人們來商場購物,或者在商場附近就餐;在15:00-17:00這段時間內,人們正處于購物或完成購物準備離開的狀態(tài),停車車輛明顯減少,所以呈現(xiàn)波谷形狀;從20:00-24:00這段時間,停車場停車數(shù)量呈現(xiàn)下降趨勢,22:00-24:00停車數(shù)量急劇減少,說明該時間段人們完成了購物離開了商場準備回家休息。
選取某三線城市2020年的開放式收費停車場數(shù)據(jù),對2020年平均一周的數(shù)據(jù)進行數(shù)據(jù)分析,分析工作日和周末之間的停車數(shù)量差異,統(tǒng)計以天為間隔的停車數(shù)量,如圖2所示。
從圖中可以看出從星期一到星期五的三個指標趨勢大致相同,由于人們的生活方式和通勤時間相對固定,該時段內消費人群規(guī)模較小,所以在工作日這段時間停車數(shù)量較為穩(wěn)定,而在周末這兩天,停車車輛明顯要高于工作日,這說明到了周末人們開始選擇放松,出門逛街或者游玩。
選取某三線城市2020年的開放式收費停車場數(shù)據(jù),對2020年特殊月份的開放式收費停車場數(shù)據(jù)進行用戶行為分析,從而找出停車數(shù)量在節(jié)假日對開放式收費停車場的影響。統(tǒng)計得到以二十四小時為間隔的停車數(shù)量,一個月各個時段的停車數(shù)量變化情況如圖3所示。
從圖中可以看出十月份的停車數(shù)量在十一期間呈現(xiàn)一個高峰,這是因為十一國慶節(jié)人們放假休息,所以去往商場進行消費娛樂活動的人數(shù)較多。到了7日,由于后一天是工作日,人們開始減少出行,停車數(shù)量相對前幾日開始顯著下降。從10月8日到10月31日可以看到停車數(shù)量趨于平穩(wěn),且?guī)в休^為明顯的周期波動,說明人們已經結束了假期回歸有規(guī)律的生活和工作節(jié)奏。
選取某三線城市2020年的開放式收費停車場數(shù)據(jù),對2020年平均月份開放式收費停車場停車數(shù)據(jù)進行用戶分析,統(tǒng)計得到以24小時為間隔的停車數(shù)量,如圖4所示。
從圖中可以看出停車數(shù)量整體呈現(xiàn)有規(guī)律的波動,以五天為間隔在星期六達到高峰,星期天的停車數(shù)量要略低于星期六的停車數(shù)量。由于居民出行具有基本的生活規(guī)律,例如工作人員有固定的上下班時間和休息時間大多數(shù)會選擇去商場或者出去旅游,從而使停車場的停車數(shù)量在時間上呈現(xiàn)一定的規(guī)律。
4 用戶聚類
4.1聚類指標選取
經過數(shù)據(jù)預處理和分析[5],統(tǒng)計得出了客戶的最近一次消費 (Recency)、消費頻率 (Frequency)、消費金額 (Monetary)三個要素。
通過圖5和數(shù)據(jù)的觀察,發(fā)現(xiàn)M和F的值差異較大,但是那些異常值代表著一些重要的客戶,不能消除。于是我們采取對模型打分的方法來消除巨大差異,我們根據(jù)實際情況和人為判斷,采取等頻的原則進行打分,如圖6所示。
4.2聚類結果
聚類效果如表格1所示。
通過上述計算后,得到用戶的分類結果。重要保持用戶有21636名,占所有用戶的23.23%,這類用戶在平臺消費時間間隔相距較小,消費頻率次數(shù)高、消費的金額大,這類用戶能給企業(yè)帶來可觀的利潤收益,重要發(fā)展用戶17353名占所有用戶的18.63%,這類用戶在平臺消費時間相距較小,消費的頻率次數(shù)、消費的金額也低,推測極有可能是新注冊的用戶,是企業(yè)重點關注的對象,重要挽留用戶17049名,占所有用戶的18.31%,這類用戶消費頻率次數(shù)和消費金額高,但消費間隔時間較長,企業(yè)可以采取優(yōu)惠方式和短信提醒,挽回用戶,一般用戶共有17276名,占所有用戶的18.55%,這類用戶消費時間間隔短,消費頻率高,但消費金額少,該類用戶可能覺得企業(yè)的定價頗高,企業(yè)應對這類用戶群體進行調研,發(fā)現(xiàn)其中的問題并解決將其轉為重點用戶以及低價值用戶19818名,占所有用戶的21.29%此類用戶在平臺消費間隔時間長,消費頻率次數(shù)低、消費金額也少,這類用戶給企業(yè)創(chuàng)造的營收微薄,企業(yè)不必投入過多的資源在此類用戶身上。分類結果如圖1所示。
4.3聚類特征分析
聚類結果如圖7所示。
A類用戶:這類用戶的消費金額和消費能力大[6],而且來停車頻率高。這類用戶是高價值客戶,是最理想的客戶類型,但是,近期停車時間間隔大,需要用活動或者優(yōu)惠吸引他們回來。
B類用戶:該類用戶近期間隔小,頻率低,消費也低,可以推斷為新客戶,具有很大潛力,停車場可以與他們多交流和給出額外的優(yōu)惠,來培養(yǎng)這類用戶的忠誠度。
C類用戶:此類客戶停車頻率高,消費金額較少,而且近期停車事件間隔長,可以看出忠誠度在慢慢降低,開放式收費停車場管理平臺在運營過程中要細心發(fā)現(xiàn)這類用戶的特殊情況,分析競爭平臺的營銷方式,采用有效的營銷方式回擊。
D類用戶:此類客戶的消費和停車次數(shù)較低,而且近一段時間間隔較大,創(chuàng)造價值有限。
E類用戶:此類客戶的頻率一般但消費較高,并且近期事件間隔比較小,可以推斷他們是屬于近期頻繁來停車,屬于增長性,他們是停車場未來的主力客戶。開放式收費停車場在運營過程中可以相應加大對這類用戶群體的投入,比如以通知、短信、郵件的方式詢問用戶是否滿意開放式收費停車場管理平臺提供的服務等,并給予相關的優(yōu)惠補貼,提高用戶黏合度。
5 方法評估
本模型采用近期的歷史數(shù)據(jù)進行建模[7],隨著時間的推移,分析數(shù)據(jù)的觀測窗口也在變換,因此對于新增的客戶信息,以及未來業(yè)務的實際情況,該模型建議一個月運行一次,對新增的客戶信息通過聚類中心進行判斷,同時對本次新增客戶的特征進行分析,如果新增的數(shù)據(jù)情況與判斷的結果差異過大,需要引起相關部門的重視,查看變化的原因以及確認模型的穩(wěn)定性,如果模型的穩(wěn)定性變化較大,需要對模型進行調整和重新訓練。
6 總結
某三線城市處于推進智慧停車場發(fā)展的起步時期,在交通信息化的大背景下,如何利用信息化手段提高開放式收費停車場的利用率,減少開放式收費停車場的管理成本成為企業(yè)關注的地方。開放式收費停車場的投入使用和發(fā)展極大地提高了客戶停車體驗,解決了客戶尋找停車位難、停車距離遠、停車不靈活等問題,在此基礎上,利用數(shù)據(jù)分析技術挖掘停車客戶的內在的規(guī)律和特征,進行有效的車位資源管理和分配,幫助用戶獲得更好的停車體驗成為開放式收費停車場發(fā)展方向。
本文首先介紹了某三線城市2020年的開放式收費停車場的原始數(shù)據(jù),為了提高數(shù)據(jù)分析的效率和準確性,對數(shù)據(jù)進行了預處理和數(shù)據(jù)清洗。通過時間維度,對特征數(shù)據(jù)分析,挖掘其中的規(guī)律。采用RFM模型[8]和K-means算法對開放式收費停車場用戶進行分類,通過客戶的近期的消費記錄R(Recency)、購買行為購買頻率F(Frequency)、購買金額M(monetary)三個指標來挖掘客戶的潛在價值。
對比本文的實驗結果和實證結果,可以得到以下兩點結論:第一,針對開放式收費停車場停車用戶的停車特征,能夠得出停車用戶行為和時間維度存在關聯(lián)性[9],與用戶的作息時間、通勤時間和節(jié)假日時間有關系。第二,通過K-means算法和RFM模型將用戶精確分類,分類結果和實證結果較為吻合,為開放式收費停車場提供決策依據(jù)。
當然,本文的研究存在一定的局限性:第一,用戶行為分析指標需要更加多元,影響用戶行為的因素很多需要的用戶數(shù)據(jù)[10]更加精確。第二,由于每一個算法都有自身的局限性,為了更好契合開放式收費停車場用戶群體,實現(xiàn)更加有效的用戶細分,未來可以選擇將密度聚類等方法納入開放式收費停車場用戶分類研究當中。
參考文獻:
[1] 沈佳朋.數(shù)據(jù)挖掘技術在城市路側停車管理中的應用研究[D].杭州:浙江大學,2020.
[2] 陸建.城市交通系統(tǒng)可持續(xù)發(fā)展規(guī)劃理論與方法[D].南京:東南大學,2003.
[3] 孫展.基于時空量化分析的停車泊位共享配置方法研究[D].北京:北京建筑大學,2018.
[4] 楊琳,寇勇剛,白釗,等.基于改進RFM模型對民航客戶的細分研究[J].數(shù)學的實踐與認識,2021,51(1):33-39.
[5] 靖立崢,吳增源.基于改進K-means算法的電子商務客戶細分研究[J].中國計量大學學報,2020,31(4):482-489.
[6] 徐曉敏,谷曉燕.全生命周期客戶價值數(shù)據(jù)分析挖掘方法[J].北京信息科技大學學報(自然科學版),2020,35(2):6-9,20.
[7] 陳東洋,陳德旺,江世雄,等.基于時段客流特征聚類的地鐵運營時段劃分[J].計算機系統(tǒng)應用,2021,30(3):256-261.
[8] 翁小雄,謝志鵬.基于RFMS的高速公路客戶商業(yè)價值挖掘[J].重慶交通大學學報(自然科學版),2021,40(4):62-69.
[9] 武志鵬.路邊停車需求預測與管理對策研究[D].西安:西安電子科技大學,2019.
[10] 肖雪.路外停車需求長短時預測方法研究[D].長春:吉林大學,2020.
【通聯(lián)編輯:唐一東】