杜瑜琦 李新月 李晶晶
摘 要 研究城市乘車人的出行支付特征,就需要從他們的出行數據進行分析。首先,運用K-means聚類算法對數據進行處理,再使用MATLAB等軟件進行時間序列分析,并對支付方式和出行方式進行相關性分析,從不同角度、不同側重點總結乘車人的出行支付特征。
關鍵詞 K-means 聚類算法 時間序列分析 相關性分析
一、引言
隨著移動支付的普及,現金在我們日常生活中的出現頻率大幅降低。在公共交通領域,移動支付卻并沒有完全走進人們的生活。本文意在通過調查與數據分析了解大眾對公交移動支付的態度以及出行支付方式的變化趨勢,了解大眾的移動支付特征。
二、問題分析
要對城市乘車人的出行支付特征進行分析,首先可以運用K-means聚類算法剔除數據中的缺失與錯誤值,而后使用EXCEL等軟件進行時間序列分析,再運用SPSS對支付方式和出行方式進行相關性分析,得出基于不同角度和不同側重點的城市人群出行支付特征。
三、問題的建模與求解
針對乘車人的出行支付特征的問題,可以利用乘車人的支付信息和數據,從時間與支付方式以及出行方式與支付方式兩個方向進行統計分析。首先通過時間序列分析得到支付方式的比例隨時間的變化趨勢,判斷其是否具有周期特征;再利用相關性分析,判斷乘車人的出行方式是否影響支付手段。
(一)支付方式的時間序列分析
隨機選取某一天的數據進行處理,以00:00為起點,以2小時為單位,將一天劃分為12個等距區間,統計每個區間內選擇移動支付的客流量總數。結果如圖1所示。
由圖1可見,乘車人的出行時間密度圖呈左偏態分布。15:00~
17:59是出行數量最高的時間段,凌晨0:00~5:59階段公交地鐵出行量數據對于整體數據來說幾乎等于不存在。
由于原始數據量龐大而處理過后數據較少,因此使用高斯噪聲將原始圖像加噪,結果如圖2所示。
同時隨機選取一年中2、5、8、11月中的每月7天的數據,統計共28天支付方式占總體的比例,運用MATLAB進行曲線擬合和自相關分析,結果如圖3所示。
通過擬合曲線函數圖可看出在總體調查的一年時間內呈遞減趨勢,數據點也隨著時間的變化愈發的貼近擬合曲線;通過自相關圖可以看出數據在1~7天,存在自相關系數大于0.02為非平穩序列;從第8天起為平穩序列。所以,乘車人對移動支付的偏好降低。造成這種現象的原因是:機器未及時進行檢修,導致乘車人刷卡故障。
(二)相關性分析模型
運用SPSS針對出行方式(公交、地鐵)與支付方式進行相關性分析,結果如下表1所示。
由表1看出,支付方式與出行方式相關,但非線性相關,即二者存在其他的非線性關系。通過比較兩種出行方式與支付方式的顯著性,發現地鐵出行與支付方式存在更強烈的相關關系。
四、結語
一是乘車人的出行密度是根據乘車人們日常作息時間進行合理性波動的。乘車人的出行支付特征具有顯著的周期性,以七天為周期波動;峰值往往出現于一個周期的后半期;二是出行方式與支付方式并無線性相關關系,但存在相關性。當乘車人選擇地鐵出行時,他的支付方式受出行方式影響程度更為強烈。
(杜瑜琦、李新月單位為華北理工大學經濟學院;李晶晶單位為華北理工大學管理學院)
參考文獻
[1] 崔喬.基于MATLAB的圖像灰度分析及高斯白噪聲的研究[J].科技創新與應用,2018(27):60-61.