
摘 要:文章首先對ReliefF特征選擇算法相關理論做了解析,分析了影響城市出租車保有量的相關因素;然后利用ReliefF算法對重慶、廣東相關數據進行了處理,提取其中特征權重較大的特征;最后,基于降維后的特征進行多元回歸分析,得到表征重慶、廣東出租車保有量的多元回歸方程。
關鍵詞:出租車保有量;特征選擇;ReliefF算法;多元回歸分析
引言
出租車保有量問題已經成為出租車市場管理的重要依據,對城市出租車保有量的預測也成為了城市交通中的重要研究課題。文獻[1]針對深圳市特區外的出租車保有量問題進行了研究,建立了類比分析模型。文獻[2]通過對北京市出租車保有量問題的研究,提出了基于出行廣義成本預測模型。文獻[3]利用Bruce Schaller需求估計模型,對北京市出租車保有量進行合理預測。
本文提出基于ReliefF特征選擇算法[4]的多元回歸分析方法對出租車保有量問題進行研究。首先,利用ReliefF算法對眾多影響因素進行權重排序,然后,利用多元回歸分析方法對具體城市數據進行預分析。
1 ReliefF特征選擇算法
ReliefF特征選擇算法主要用于解決樣本的多分類問題。算法基本思想:從訓練集中隨機選取一個樣本R,然后從與樣本R同類和不同類的樣本集中均選出k個最近鄰樣本,最后,更新每個特征的權重。
2 出租車保有量問題實例
選取廣東、重慶相關數據進行研究,數據來源于中國統計年鑒[5]。
考查影響出租車保有量的影響因素:X1:地區生產總值(億元);X2:地區總人口(萬人);X3:城鎮居民家庭人均交通、通信消費支出(元);X4:公共交通車輛運營數(輛);X5:公共交通運營線路總長度(公里);X6:公共交通客運總量(萬人次);X7:城鎮居民家庭平均每百戶家用汽車擁有量(輛);Y:現有出租車保有量(輛)。標準化處理后的數據見表1。
3 結束語
文章基于ReliefF算法對影響出租車保有量的因素進行了降維處理,對重慶、廣東2008-2012年相關數據進行多元回歸分析,分別得到二者的多元回歸方程,對后續的研究工作有一定的指導作用。
參考文獻
[1]孫喜梅,李猛,韓彪.基于類比分析的深圳市特區外出租車需求量預測[J].交通信息與安全,2009(5):19-23.
[2]柳麗娜,陳艷艷,張文閣.北京市出租車乘客需求預測模型研究[J].交通標準化, 2010(13):89-92.
[3]范合君,杜博.特大城市出租車合理數量估計及實現路徑-以北京市為例[J].經濟與管理研究,2015,36(8):91-95.
[4]Kononenko I. Estimating Attributes: Analysis and Extentions of RELIEF [C] // Machine Learning: ECML-94.Springer Berlin Heidelberg,1994:171-182.
[5]http://www.stats.gov.cn/tjsj/ndsj/中國統計年鑒.
作者簡介:王巖(1979-),男,吉林省吉林市人,工作單位:吉林化工學院,職務:教師,研究方向:模式識別、機器視覺。