翁劍成 涂 強 林鵬飛 徐 碩
(北京工業大學交通工程北京市重點實驗室1) 北京 100124) (北京市運輸管理技術支持中心2) 北京 100073)
票價調整對公交出行者出行選擇的影響分析*
翁劍成1)涂 強1)林鵬飛1)徐 碩2)
(北京工業大學交通工程北京市重點實驗室1)北京 100124) (北京市運輸管理技術支持中心2)北京 100073)
分析了公共交通調價前后客運量的宏觀時空變化特征,開展面向公交出行者的出行選擇調查.結果表明,公交票價調整對公共交通通勤出行者和非通勤出行者的影響程度和出行方式轉移特征具有顯著差異.以公交出行者刷卡時空特征向量為基礎,提出了基于機器學習的通勤出行者判別方法,并利用北京市每日約1 300萬的多模式公共交通刷卡數據,較精確地實現了通勤出行者和非通勤出行者的類型劃分,分類準確度達到94.24%.利用不同時期的個體出行數據,定量分析了公共交通票制票價調整對通勤和非通勤出行者的出行頻次、公交出行方式選擇的短期和長期影響差異.短期影響看,通勤出行者中地鐵出行和地面公交出行次數明顯下降的人數比例分別為14.90%和25.47%,3.73%的通勤出行者存在軌道交通向地面公交的轉移;而非通勤出行者中,軌道交通和地面公交出行次數明顯下降的人數比例分別為21.32%和26.96%,非通勤出行者軌道出行的下降比例顯著高于通勤出行者.長期影響看,僅有4.15%的軌道交通通勤出行者出行次數依然有明顯下降,而依然有35%左右的出行者地面公交出行次數較調價前顯著下降,表明調價對地面公交出行者的影響更具有持續性.
公共交通;票價調整;通勤出行者;機器學習;出行選擇
國內在公共交通票價調整對居民出行影響方面的研究主要集中于宏觀客流特征的變化分析.周志華等[1]針對2008年底廣州公交票價調整對軌道客流的影響分析較為典型.其主要的方法是根據調價前后的軌道客流統計數據展開對比分析,以探究調價對軌道客流的不同特征的影響.此方法可以從宏觀層面對調價的影響進行整體把握,卻難以體現調價對不同出行類型人群的影響的差異性.賀崇明等[2]則主要通過票價敏感性分析,建立模型對比不同票價調整方案對廣州軌道客運量的影響,并強調了票價對于調節公共交通出行量的作用.
隨著公交IC卡的廣泛應用,研究人員開始著眼于海量公交刷卡數據的特征分析和數據挖掘相關的研究.Agard等[3-4]指出智能公交卡數據分析有助于更好地理解公交出行者的行為.Jang[5]對于乘客公共交通出行時間及換乘特征進行了數據分析并且繪制了行程時間-空間分布圖.該研究利用公交IC卡數據分析了換乘時間、換乘需求等因素的空間分布,對于公共交通線網服務水平的提升有所幫助.Seaborn等[6]基于倫敦市的公共交通智能卡數據對公交與公交、公交與地鐵,以及地鐵與公交這三種換乘關系之間出行階段連接的時間閾值進行了研究,形成了完整的出行鏈連接.基于此,對每日公共交通的出行鏈總數、每人的日均出行鏈數、每條出行鏈所包含的出行階段數、公交與地鐵的混合出行數等進行了詳細的統計分析.
對公共交通出行特征的研究主要聚焦于公交刷卡信息的處理與分析.尹長勇等[7]提出基于聚類分析方法的公交上車站點的客流匹配方法,考慮到乘坐同一車次的乘客的刷卡數據在時間上具有一定的集中性,由此出發設定合理閾值,將公交IC卡數據按照刷卡時間進行聚類,再與公交運營時刻表加以匹配,從而獲得較為準確的上車站點信息.董曉晶等[8]研發出基于GIS的公交IC卡數據處理及分析系統.該系統可以通過連續兩條刷卡紀錄的交易時間判斷其是否在指定范圍內,之后再基于GIS判斷這兩條紀錄所乘交通工具是否為換乘,從而實現基于公共交通IC卡數據判斷不同公共交通工具間的換乘關系.龍瀛等[9]利用連續1周公交IC卡刷卡數據(不含軌道交通AFC刷卡數據及單次刷卡的公交刷卡數據),建立了表示持卡人一次乘車過程的、用于識別通勤出行的出行模型以及表示持卡人在某一地點的開始和持續時間的、用于識別出行者職住地的PTD(position time duration)模型.
總體而言,以往基于海量刷卡信息的研究采用單一模式的公交刷卡數據,研究數據的覆蓋人群和規模偏小,而且樣本選擇中對于通勤和非通勤出行者的特征差異考慮不足,未能細化研究不同類型出行人群的出行規律及影響特征.
文中在對調價前后公共交通客運量變化展開宏觀特征分析的基礎上,結合現場問卷調查結果,基于海量公交刷卡數據,引入機器學習方法實現基于個體刷卡數據特征的公共交通通勤與非通勤出行人群科學劃分.從短期、中期和長期多個視角,分別針對通勤和非通勤出行者的整體出行特征、出行方式選擇行為和出行頻次進行全樣本的數據分析,系統評估公共交通票價調整對公共交通出行者出行特征的影響.
選取調價前、調價1周后、調價3個月后、調價10個月后的四個階段,即2014年11月27日—12月22日,2015年1月8日—2月2日,2015年3月5—30日及2015年10月8日—11月2日的公共交通客運量統計數據對比分析公共交通客運量的宏觀時空變化.為消除月份變化對于公交客運量的影響,利用2013和2014年度2年的公共交通日客運總量計算公交客運量月變系數(年平均日客運量與某一月的月平均日客運量之比).結合變化規律穩定的公交客運量月變系數在一定程度上消除月變因素對客運量的影響.
宏觀的客運量數據分析表明(見表1),北京公交票價調整對居民的出行影響較為明顯,對地面公交出行的影響比軌道更長遠,對軌道交通休息日的出行影響大于工作日.

表1 公共交通客運量變化率(與2014年底調價前的數據相比) %
為了掌握個體出行選擇行為的微觀差異,研究開展了公共交通出行選擇行為的出行調查.為兼顧不同出行距離、出行目的的公共交通出行者,實地調查地點包括北京市居住、商務和混合用地等不同類型區域的站點附近.回收總體有效樣本440份,通勤與非通勤出行者的比例約為1.5∶1.結果顯示,公共交通通勤與非通勤出行者在出行時耗、出行時刻、出行距離等方面差異明顯.Pearson Chi-Square檢驗表明,調價后兩者出行方式變化也具有顯著差異(Sig.<0.05).相對于非通勤出行者,通勤出行者由軌道轉向地面公交出行的比例更大,調價對于通勤出行者軌道出行的影響明顯小于非通勤出行者.
初步分析表明,北京公交調價對居民出行影響較大,且對通勤和非通勤出行者的影響存在明顯差異,需分別探究調價對不同人群出行方式選擇的影響.
公共交通的數據基礎主要可以分為兩大類:一類是動態數據,包含公交IC刷卡數據、地鐵AFC刷卡數據等,全市每天約有1 300萬人次的刷卡數據;另一類為靜態數據,包含公交線路、軌道站點等基礎數據.王月玥[10]在基于多源數據提取個體出行過程的研究中,完成了公共交通多源數據的預處理、公交出行過程的匹配以及公共交通出行鏈的提取,為研究提供了高質量的數據基礎.
原始刷卡數據經過處理整合后的數據見表2.
在表2中,對公共交通多源數據進行了整合,其出行模式中的R代表地鐵出行,B代表地面公交出行.不同刷卡次數出行人數頻率分布見圖1.

表2 公共交通個體出行階段整合表

圖1 不同日均刷卡次數出行人數頻率分布圖
文中定義上下班或上下學主要使用公共交通的出行人為公共交通通勤出行者,反之則為公共交通非通勤出行者,通過調查征集了978位已知公共交通出行類別(通勤或非通勤)的出行人的一卡通卡號,利用一卡通編號字段實現調查數據與刷卡數據的關聯匹配.
以海量公交刷卡數據為基礎,結合問卷調查中采集到的已知出行類別和公交卡號的出行者的出行信息建立SVM分類器,該分類器可針對有限的樣本情況,其目標是得到現有信息下的全局最優解[11-12].由于從問卷調查中獲得的用于進行訓練的樣本數有限,與SVM分類器尤其適用于有限樣本的特點相匹配,因此選用SVM分類器作為進行通勤出行者判別的核心方法.
3.1 特征值的選取
為了將通勤與非通勤出行者的刷卡數據進行鑒別與分類,從刷卡記錄的眾多數據項中選取特征值,用以判斷該用戶是否為通勤出行者.
公共交通的通勤出行主要有以下特點:①通勤出行往返性;②出行時間規律性;③模式選擇固定性;④線路選擇多樣性.前期現場調查的結果顯示,公共交通通勤與非通勤出行人群在出行時間方面差異顯著;且通勤出行者的出行在空間特征方面相對穩定,非通勤出行者的出行起訖點相對變化較大.因此,可以將上、下車刷卡時間、上、下車線路、站點均可作為通勤出行人群鑒別的特征值.
對原始公交刷卡數據進行數據特征提取,將每位出行者一天內可能刷卡的時段定為早上5:00至晚上23:00(該時段內包含絕大部分公交車和地鐵的運營時段).為使不同樣本有統一的格式和元素對應關系,因此將每天公交運營的18 h,以0.5 h為間隔劃分,每個單元分別記錄持卡人的刷卡信息(起始線路、起始站點、終止線路和終止站點),若單元內沒有刷卡記錄,則各向量值全部置為0.
經過數據核對,30 min的最小時間段劃分可滿足出行者的刷卡數據記錄需求,少部分出行者(約3%)在0.5 h內有多次刷卡,此處保證同一條出行鏈的起始和終止站點數據不會丟失,中間數據則可能有部分缺失.此類數據的丟失對數據結構規律的影響較小,基本不影響對于通勤出行者的鑒別判斷.
刷卡時段的劃分可以用于確定刷卡時間,因此將上、下車刷卡時間從6個基本的特征值中剔除,以進一步降低數據維度,提升分類器效率.最終確定的特征值為:上車線路、上車站點、下車線路、下車站點.
3.2 訓練集和測試集的建立
在數據庫中篩選出與已知出行類別的出行者公交卡卡號相匹配的出行人連續5個工作日的所有刷卡信息,經過數據特征提取,建立訓練集和測試集.該集合共包括978位已知是否為公共交通通勤出行者的出行人在連續5個工作日的刷卡信息特征值.其中,正樣本(即通勤者樣本)數量為481;負樣本(非通勤者樣本)數量為497.將所有公交和地鐵線路進行統一編號,全部進行數據值化.則該集合可表示為
T={(x1,y1),…,(x978,y978)},xi∈R720
式中:xi∈R720,是由每位出行者在某一周內5個工作日刷卡所產生的全部特征值;y為該出行者是否為公共交通通勤出行者,1為是,0為否.
3.3 訓練方法及結果
訓練方法包含數據準備,數據標準化和模型選用三個環節.
1) 將全部978個樣本按照7∶3的比例隨機選取分為訓練集和測試集,即訓練集樣本數為683,測試集樣本數為295.其中,訓練集和測試集的正樣本與負樣本的比例約為1∶1.
2) 選取Z-score標準化方法,步驟為:①求出訓練集樣本每個屬性的平均值,然后所有樣本的屬性減去對應屬性的平均值;②求出訓練集樣本每個屬性的標準差,然后所有樣本的屬性除以對應屬性的標準差.最后對樣本刷卡數據進行矩陣化和參數標準化處理.
3) 利用樣本數據對適用性較好的幾種核函數進行了訓練與測試,包括線性核函數、多項式核函數、徑向基核函數、傅里葉核函數和Sigmoid核函數,并參考相關文獻利用libsvm工具箱中的gridregression.py搜索參數C(懲罰因子)的最優值[13].通過多組的樣本數據訓練與測試,線性核函數對于公共交通刷卡數據適用性最好,因此,以線性核函數為核函數,參數C為1.0,優化方法采用SMO,建立了SVM分類模型,分類效果見表3.

表3 不同核函數分類結果
使用線性SVM分類模型對測試集進行分類的正確率(94.24%)最高且穩定.分類結果分布見圖2.
結果表明,分類結果為正樣本分布均勻,并且正負樣本集中區有一定的間隔距離.該分類器對于公共交通通勤及非通勤出行人群的分類具有較高的精度.利用該分類器對所有出行者樣本進行分類表明,在工作日通勤出行者占比約為60%,與以往相關研究結論吻合.
4.1 公共交通不同類型出行者出行特征差異分析
利用分類結果,分析不同出行人群出行特征差異.采用獨立樣本t檢驗對通勤與非通勤出行人群的出行距離、時耗的差異進行顯著性分析.結果表明,通勤與非通勤出行人群在出行距離方面整體差異不明顯(Sig值大于0.05),其中通勤出行距離在10~20 km區間較為集中,均值約為19.1 km.兩者出行距離差異主要體現在局部,非通勤出行人群短程(<5 km)出行人數比例明顯大于通勤出行人群(見圖3).另一方面,兩者的出行時耗整體差異顯著(Sig值小于0.05),均值分別約為39.84 min(通勤)和34.64 min(非通勤),見圖4.在出行距離相近的情況下,可推測其顯著差異主要由于出行效率的差別.

圖3 公共交通通勤、非通勤出行者出行距離分布

圖4 公共交通非通勤、非通勤出行者出行時耗分布
在公交刷卡人數的時間分布方面,研究分析了公共交通通勤出行者及非通勤出行者出行時刻分布特征,見圖5.由圖5可知,對通勤出行人群而言,每日早07:00-09:00、晚17:00-19:00時段為明顯的客流高峰時段,同時,早高峰壓力高于晚高峰.通勤出行人群的高峰時段刷卡人次數占全天所有出行人刷卡人次總數的38.34%.與之相比,非通勤出行人群的出行時刻呈現出巨大的差異性,從早05:00起,非通勤出行人數逐漸增加,至早09:00到達較高水平并保持平穩態勢至晚19:00,之后非通勤出行人次逐漸減少.以上出行時刻的分布特征與出行者問卷調查的結果基本吻合.

圖5 公共交通通勤、非通勤出行者刷卡人次時間分布特征
4.2 公交調價對不同類型出行者整體出行特征影響分析
提取對比2014年12月1—27日(調價前),2015年1月5—31日(調價一周后,評估調價的短期影響特征),2015年12月7日—2016年1月6日(調價一年后,評估調價的長期影響特征)公共交通通勤、非通勤出行者的軌道及公交刷卡次數,每天全市的公共交通刷卡人數約為530萬人,經SVM分類器分類后,通勤與非通勤出行人占比分別約為60%和40%.通過分析不同刷卡次數變化幅度的人數分布,與調價前一個月相比,將調價后一個月內出行人的軌道或公交刷卡次數變化比例大于40%作為判斷其出行方式發生顯著變化的閾值.
1) 通勤出行者 調價的短期影響看,分別有14.90%和25.47%的公共交通通勤出行者,軌道交通和地面公交出行次數顯著下降,調價對通勤出行者的公交出行影響更為明顯.進一步的個體出行數據分析表明,軌道交通出行次數顯著減少的通勤出行者中,約有25.07%的出行人轉移到了公交出行.調價的長期影響看,約有34.87%的通勤出行者的地面公交出行次數出現顯著下降,而僅有4.15%的通勤出行者軌道交通出行次數出現顯著下降,地面公交與軌道的差異性進一步顯著.可見,調價對地面公交出行的影響更長遠,伴隨著軌道交通系統的不斷完善,軌道交通出行受調價的影響隨時間的推移而逐漸減弱.
2) 非通勤出行者 調價的短期影響看,相對于公共交通通勤出行者,非通勤出行者中軌道交通出行減少的人數比例(21.32%)明顯更高,而兩者公交出行顯著減少的人數比例(通勤25.47%,非通勤26.96%)無明顯差別.調價的長期影響看,非通勤出行者中軌道交通出行次數顯著下降的人數比例約為9.57%,有所回升但仍明顯大于通勤出行者(4.15%),可見盡管調價對軌道交通的影響隨時間變化存在減小的趨勢,其對于非通勤出行者的影響仍較為明顯;非通勤出行者中公交出行次數顯著下降人數比例約為37.52%,與通勤出行者的影響基本相當.這一結論與前期調查和客運量的宏觀特征分析的結論基本一致.
4.3 公交調價對不同出行距離人群的影響特征
前期分析表明,不同出行距離的公共交通出行者對票價的敏感程度不同,公交出行變化特征也有明顯差別,圖6為軌道交通不同出行距離刷卡頻次下降人數比例分布.

圖6 軌道交通不同出行距離刷卡頻次下降人數比例分布
調價的短期影響見圖6a),在軌道出行中,兩類人群均在小于10 km的出行中受調價影響較大,但非通勤出行者刷卡次數下降人數比例(大于30%)明顯高于通勤出行者(約20%).同時,出行距離大于40 km時,通勤出行者受調價影響也相對較大;非通勤出行者出行規律性不明顯,其受調價影響隨出行距離變化的波動性較強.長期影響見圖6b),軌道交通出行受調價影響程度明顯下降,通勤出行者刷卡次數下降人數比例約下降至4%,且短距離出行者所受影響程度基本與其他距離范圍出行者持平;非通勤出行者刷卡次數下降人數也大幅降低,但下降人數比例仍明顯高于通勤出行者且短距離出行受調價影響較大.圖7為地面公交不同出行距離刷卡頻次下降人數比例分布.

圖7 地面公交不同出行距離刷卡頻次下降人數比例分布
調價的短期影響見圖7a),出行距離5 km以內的地面公交通勤出行者公交出行次數下降人數占比較高,5 km以上的公交通勤出行者基本保持較為穩定的下降幅度,其下降人數比例與出行距離之間并沒有呈現單調的特征.非通勤出行者的刷卡明顯下降人數比例則隨出行距離的增加而逐漸降低,從5 km以內出行者的近40%下降到40 km以上出行者的近20%,可見出行距離越短,非通勤出行者受調價影響而改變出行選擇的概率越大.出行距離小于20 km時,非通勤出行人群公交出行受調價影響更大;出行距離大于25 km時,結果與之相反.長期影響見圖7b),地面公交出行者刷卡下降人數比例維持在高位,且不同出行距離范圍、不同出行人群的下降比例相近.
1) 工作日內通勤出行者占比約為60%(分類正確率為94.24%),且通勤出行者在短距離出行占比、出行時耗和刷卡人數時間分布特征等方面均存在較大差別.
2) 短期影響看(調價一周后),通勤出行者中,軌道交通出行次數明顯下降的人數比例(14.90%)顯著小于地面公交(25.47%),3.73%的通勤出行者存在由軌道交通轉向地面公交的明顯趨勢;而在非通勤出行者中,軌道交通和地面公交出行次數明顯下降的人數比例差距不大,分別為21.32%和26.96%,且軌道交通的下降比例顯著高于通勤出行者,地面公交的出行次數下降基本持平.調價一年后,其對于地面公交出行的影響明顯大于軌道交通.
3) 結合出行距離進行深入分析發現,針對軌道交通,調價的短期影響對兩類人群均在出行距離小于10 km時更為明顯,且非通勤出行者受影響程度顯著高于通勤出行者;但調價一年后,通勤出行者中的短距離出行所受影響與其他出行距離范圍基本持平,非通勤出行者中的短距離出行受調價影響仍高于其他出行范圍的出行者.
文中進一步明確了公共交通通勤與非通勤出行者受調價影響的差異性,在對現有公共交通線網進行優化時,可通過結合兩類出行人群的空間分布特征,合理應用價格手段提供差別化的公共交通服務,并實現公共交通線網布局和多模式銜接的更加科學的優化設計.
[1]周志華,張艷春.廣州市公交票價調整對軌道客流的影響[J].城市公共交通,2009(5):31-33.
[2]賀崇明,馬小毅.廣州市票務政策對軌道交通客運量的影響[J].城市軌道交通研究,2008(8):5-8.
[3]AGARD B. Mining public transport user behaviour from smart card data[C]. Information Control Problems in Manufacturing,2006(2):399-404.
[4]BAGCHI M, WHITE P R. The potential of public transport smart card data[J]. Transport Policy,2005,12(5):464-474.
[5]JANG W. Travel time and transfer analysis using transit smart card data[J]. Transportation Research Record: Journal of the Transportation Research Board,2010(1):142-149.
[6]SEABORN C, ATTANUCCI J, WILSON N H M. Analyzing multimodal public transport journeys in london with smart card fare payment data[J]. Transportation Research Record Journal of the Transportation Research Board,2009(1):55-62.
[7]尹長勇,陳艷艷,陳紹輝.基于聚類分析方法的公交站點客流匹配方法研究[J].交通信息與安全,2010,28(3):21-24.
[8]董曉晶,余志偉,伏偉偉,等.基于GIS的公交IC卡數據處理及分析系統[J].地理空間信息,2009,10(7):124-126.
[9]龍瀛,張宇,崔承印.利用公交刷卡數據分析北京職住關系和通勤出行[J].地理學報,2012,67(10):1339-1352.
[10]王月玥.基于多源數據的公共交通通勤出行特征提取方法研究[D].北京:北京工業大學,2014.
[11]梁燕.SVM分類器的擴展及其應用研究[D].長沙:湖南大學,2008.
[12]張學工.關于統計學習理論與支持向量機[J].自動化學報,2000(1):36-46.
[13]葉志剛.SVM在文本分類中的應用[D].哈爾濱:哈爾濱工程大學,2006.
Impact Analysis of Public Transport Price Adjustment on Travel Choice for Travelers
WENG Jiancheng1)TU Qiang1)LIN Pengfei1)XU Shuo2)
(Beijing Key Laboratory of Traffic Engineering, Beijing University of Technology, Beijing 100124, China)1)(Beijing Transport Management Technical Support Center, Beijing 100073, China)2)
The macro temporal and spatial variation characteristics of public transport passenger flow before and after the price adjustment are analyzed in the study, and a travel choice questionnaire survey for public transport travelers is conducted. The results show that there is a large difference in the influence level and the characteristics of travel mode transfer between the commuters and non-commuters after the fare adjustment. Based on the temporal and spatial feature vectors of smart card data for public transport travelers, a machine learning based classification method is proposed for commuters. Using massive multi-mode public transit smart card data of about 13 million every day in Beijing, accurate classification of commuters and non-commuters is achieved with an accuracy of 94.24%. Using individual travel data in different periods, both the short-term and long-term effects of public transport price adjustment on the travel frequency, public transport travel mode choice of commuters or non-commuters are quantitatively analyzed. For short-term effect, the travel frequencies of public transport commuters who travel by rail and bus significantly decrease by 14.90% and 25.47%, respectively; while 3.73% of commuters transfer from rail to bus. The travel frequencies of non-commuters who travel by rail and bus significantly decrease by 21.32% and 26.96%, respectively. The decreasing rate of rail travel frequency for non-commuters is found to be larger than that of the commuters, while the decreasing rates of bus travel frequency for both commuters and non-commuters are basically equal. For the long term effect, there are only 4.15% of rail transit travelers whose travel frequency by rail still decreases significantly, and there are about 35% of the ground bus travelers whose travel frequency by bus significantly decreases, indicating that the impact of the price adjustment for bus trip is more persistent.
public transport; price adjustment; commuters; machine learning; travel choice
2017-03-03
*國家自然科學基金面上項目(51578028)、交通運輸部科技計劃項目(2015318221020)資助
U239.5
10.3963/j.issn.2095-3844.2017.03.012
翁劍成(1981—):男,博士,副教授,主要研究領域為智能交通、交通信息