聞 帥,黃正東
(深圳大學智慧城市研究院,廣東 深圳 518060)
優先發展城市公共交通是我國城市發展的重要戰略。而隨著我國城市化進程的不斷發展,各大中城市公共交通所面臨的交通出行壓力與日俱增,城市公共交通出行擁擠的狀況也飽受詬病。而另一方面,城市公共交通運營單位也在持續虧損,必須依靠政府補貼才能維持正常運轉。如何提高公共交通運行效益而又保證較高的服務水平是一個難以取舍的難題。公汽滿載率是反映常規公交出行擁擠程度的指標,又是衡量線路運行效益的指標,對于公交規劃、車輛調度和服務評價也都是重要的參數。然而目前公汽滿載率的應用,如在公交線路規劃、乘客體驗及服務評價,還主要靠人工調查獲取少量線路或站點的滿載率[1-2]。
隨著公交信息采集系統的完善和自動化,公交大數據的獲取越來越方便,應用也越來越廣泛[3]。使用大數據分析和挖掘技術從IC卡刷卡數據、車輛GPS數據等公交大數據獲取準確的公交出行OD(origin-destination),用以研究公共交通問題和其他城市問題是當前的研究熱點。本文提出使用公交大數據推算公汽滿載率的方法,并以深圳市數據為例,推算全市大部分公共汽車的滿載率,最后應用該數據對深圳市公汽101路的擁擠情況進行了試驗,證明該方法的可行性。該方法相比人工調查方法具有獲取范圍廣、獲取時段長、成本低、獲取便捷等優勢,對公交線路規劃、公交調度、公交服務評價等方面的研究有重要的意義。
車輛滿載率是指線路最大斷面的客流量與同一斷面運輸能力的比較,即車廂內實際乘客人數與車型額定載客量之比。公共汽車上標識的額定載客量是按照國家《機動車運行安全技術條件》(GB 7258)的標準,即由每人站立面積不小于0.125 m2的標準計算得來。由于此站立面積設置過小,基于額定載客量得到的滿載率一般不能真實反映乘客的舒適度,因此有學者提出了滿載率更加合理的表示方法。文獻[4]根據人體尺寸和心理安全空間計算得出一個合理的乘客站立面積(0.256 m2),并將其運用到公交調度模型的研究中去。文獻[5]依據單位平方米擁擠度提出了滿載率的分級表示法,以實際案例說明了其在公交線路規劃和服務評價的應用。這些對滿載率的重新定義使得針對不同情況的公交問題研究更加科學合理,具有一定的學術價值和應用意義。
深圳市在2017年底已經實現了公汽的全部電動化,成為全球首個專營公汽全面電動化城市。全市運營的純電動公汽車輛大多為比亞迪K8車型。該車長度為10.5 m,標定載客量87人,座位數31個。文獻[5]根據深圳市2013年較為常見的11 m大巴,車內布局為“36座+5 m2站位”的結構,以76人為載客最大值,根據客舒適度將滿載率劃分為5個級別。其使用的車型大小和載客量與K8車型較相似,因此本文根據其滿載率級別對乘客舒適度的研究,把最大載客量設為較合理的值76。已有研究表明滿載率達到80%或站立達到4~5人將引起人們的不適[6],本文把滿載率大于80%視為高滿載率。與線路流量不同的是,滿載率體現的是以人為核心的表示方法,是乘客真實乘車體驗的指標。過高的滿載率不但導致乘客出現不適,也將影響乘客對于出行線路的選擇[7-8]。準確可靠的滿載率信息對于評價現狀公交服務水平、提升未來公交服務質量具有重要的理論和實踐價值。
獲取每輛車到達每個站點的上下車乘客數是推算公汽滿載率的關鍵。目前比較常用的公汽客流獲取方法即使用IC卡刷卡數據[9-10]。但目前很多IC卡數據的研究對于出行OD推導率不算太高,除了方法本身無法獲取精確的下車站點外,限制還包括數據量、時間范圍、數據完整度等方面[10-13]。
本文提出使用整個城市范圍較長時期的數據,如一個月以上包含地鐵和公汽的IC卡刷卡數據和公汽車輛GPS定位數據,對數據進行細致的預處理,保證數據的完善可靠,再綜合利用多種下車站點推導方法得到下車站點和下車時間,以提高出行OD的推導率。有了出行OD數據再根據到站時刻表統計上下車乘客,可以得到每輛車在每個線路段上的載客量,根據該車的車型核載量計算得到公汽滿載率(如圖1所示)。
1.2.1 到站時刻表提取
到站時刻表是公汽每個車次實際到站的時間記錄,用以根據刷卡時間提取上車站點、根據下車站點獲取下車時間,以及根據出行OD統計車輛到站的上下車乘客數。它是滿載率推算的數據基礎,可以通過公汽GPS數據結合線路和站點數據提取得到。車輛到站時刻表提取步驟如下:
(1) 篩選正確的GPS定位點,篩選方法為在線路100 m緩沖區或者站點300 m緩沖區。
(2) 車次識別。設置起終點站300 m閾值,把最后一個離開起始站的定位點時間作為車次起始時間,第一個進入終點站閾值范圍的定位點時間作為到站時間;根據起終點站識別車次和方向。
(3) 中間站點按照線路方向上的站點順序,依此進行識別。設置到站距離識別閾值為100 m。
(4) 提取完所有站點后,還需要對漏過站點的到站時間進行插值補全,之后即可得到完整的公共汽車到站時刻表。
1.2.2 上車站點提取
得到車輛到站時刻表后,可根據車牌關聯將刷卡時刻與到站時刻進行匹配。在兩個到站時間內的刷卡數據匹配到上一站點。將到站時間前30 s內的刷卡識別為本站點,以減少因定位誤差及刷卡機時鐘偏差導致的誤提取。對于在起始站上車的情況,設置比車次開始時間早5~10 min的時間作為起始站上車識別時間。最終根據到站時刻表提取上車站點后,得到刷卡數據的線路方向、上車站點、上車站點序號、上車時間。
1.2.3 下車站點推導
公汽下車站點推導主要方法有[10,14-15]:①基于連續出行鏈的方法;②基于換乘行為的方法;③基于通勤出行時空特征的方法;④基于歷史出行頻率的方法。本研究主要使用基于連續出行鏈的方法,結合換乘行為,然后依據通勤出行特征和歷史出行推導下車站點,綜合利用以上多種方法,以提高下車站點推導成功率。
本文使用的連續出行鏈方法原理如圖2所示。一個人從家里出發,步行到公汽站點b1,乘坐公汽線路L1到達公汽站點b2,然后步行到地鐵站點s1,進入地鐵網絡N1,之后從地鐵站s2走出,步行到公汽站點s3,搭乘公汽線路L2回到離家較近的另一公汽站點b4,最后步行回到家中。該方法假設乘客僅依靠公交、地鐵和有限的步行完成出行,中途不采用其他交通方式。這樣乘客的下車站點可以通過下次乘車的上車站點進行推斷。
整個下車站點的推導步驟如下:
(1) 基于連續出行鏈原理,假設上次乘車下車站點在下次乘車的上車站點附近,設置公汽站點換乘閾值為800 m,地鐵站點換乘閾值為1000 m,在上次乘車站點之后的方向上搜尋距離下車乘車站點最近的站點,即推斷為下車站點。
(2) 步驟(1)最多只能得到上次出行的下車站點,無法得到最后一次出行的下車站點。而一天的出行一般會返回到當天的起始位置附近。因此假設最后一次出行乘坐公汽的,其下車站點可能在當天上車站點(地鐵和公汽)附近。閾值和下車站點推導同步驟(1)。
(3) 假設當天最后一次出行返回家里。家的位置推測可采用DBSCAN算法[16-17]。首先提取每天第1次出行的起始站點,然后使用DBSCAN算法求得聚類中心,即第1次出行站點最密集的地點,并以此中心作為家的位置。如果當天最后一次公汽出行的線路方向上有在閾值范圍內且離家最近的站點,即可推斷為下車站點。
(4) 根據通勤或歷史出行規律推導下車站點。出行目的通常具有相似性,可以假設每天相同時間段在同一站點乘坐同一條線路的情況,其目的地相同,而在不同時間段乘坐線路反方向的可以假設其上下車站點相反,以歷史出行頻率判斷其最可能的下車站點。
在得到上下車站點之后,可根據到站時刻表得到下車時間。
1.2.4 公汽滿載率推算
由乘客上下車站點和時間,結合車輛到站時刻表,可以獲取每輛車到站時的上下車乘客數,進而計算得到車輛運行時的車廂乘客數量。根據前面制定的滿載量計算方法,最后推算得到基于刷卡數據的公汽車輛滿載率。
本文以深圳市為例,使用2017年9月的深圳通刷卡數據和公汽GPS定位數據,還有從百度地圖抓取的地鐵和公交的線路及站點數據。由于7—12日、24日這7 d的GPS數據有缺失,因此選取剩余23 d作為本文公汽滿載率推算的時間范圍。
深圳通刷卡數據為2017年9月30 d的數據,總卡數為885萬張,總刷卡量為2.58億條,其中地鐵刷卡入站和出站共1.59億條,公汽刷卡接近1億條。深圳通刷卡數據字段有卡號、刷卡時間、刷卡類型(地鐵入站、地鐵出站、巴士)、刷卡價格、優惠后價格、設備編碼、線路名、地鐵站點名、公汽車牌、是否聯程等。
GPS定位數據是公共汽車運營時的位置記錄,采樣間隔最短為10 s,大部分在60 s內。數據字段有車輛車牌、線路名、運營公司、經度、緯度、時間、速度和方向等。
線路和站點數據包含公交線路949條,站點6482個,地鐵線路8條,站點共166個(根據不同線路名、站點名統計)。
根據上下車站點推導步驟得到公汽出行OD數據。最終共獲取了15 888輛公共汽車、覆蓋827條線路的上下車客流數據。車輛刷卡數據OD推導率在80%以上的有10 377輛,占推導后總車輛數的65.31%,推導率在60%以上的有13 925輛,占87.64%。
通過公汽滿載率推算方法,獲取了整個深圳市大部分公共汽車的滿載率。基于此數據可以對出行熱點線路進行分析,發現擁擠的時段和路段,以便采取調整措施,保障乘客的出行體驗,提高公共交通服務水平。
統計2017年9月16—22日各道路路段所承載的高滿載率車次發現,周末(16、17日)的高滿載率路段數量相比工作日非常少,顯示出短時高密度出行需求主要集中在工作日。選擇18—22共5 d工作日的早高峰時段(7:00—9:00),對每一路段上公汽高滿載率的車次數進行統計,結果如圖3所示。可以看到高滿載率路段在整個市區均有分布,并且沿著主要公交廊道延伸,其中主要是“關外”至“關內”的廊道,如從寶安西鄉到南山中心,從石巖、西麗到南山科技園,從龍華到福田CBD,從龍崗、布吉到羅湖商業區。這幾個廊道均是主要的入城通道,直觀地反映了深圳市“關外—關內”往返通勤的擁擠現狀。另外南山至福田、羅湖的3條東西向主干道(濱海大道、深南大道、北環大道)也顯示出了較高的通勤擁擠程度。
深圳市公汽101路由火車站至西麗動物園總站,連接羅湖商業區、福田CBD、華僑城旅游度假區、南山科技園、西麗交通樞紐,是一條較為典型的常規公汽線路。包含運營車輛共49輛,非高峰時段發車間隔在6 min左右,早高峰時段在4 min左右。其東側沿深南大道幾乎與地鐵一號線完全重合,而西側則為地鐵線路尚未覆蓋的南山科技園北部。本文以101路為例,用推算得到的公汽滿載率數據分析其可能出現的擁擠路段和時段。
使用9月16—22日一周的數據,對101路高滿載率車次分析發現,其高滿載率車次主要集中在工作日的7—9點、18—20點及21點附近。具體的,對101路早晚高峰各方向路段所承載的高滿載率車次數進行統計,結果如圖4所示。往火車站的去行方向,早上從九祥嶺②開始到茶光①高滿載率車次是逐漸上升的,達到較高的峰值之后快速下降,又在豪方現代豪園達到另一個小高峰。此方向上豪方現代豪園附近為居民區,因此也有較大量的上車乘客。晚上該方向前半程通往工作區,與下班客流方向相反,而東側與地鐵線路重合,有較多的替代線路,因此除了科技園附近有少量擁擠外,整條線路表現不太擁擠。往西麗動物園總站的回行方向,早上從火車站到白石洲①有少量的高滿載率車次數,而在白石洲①至朗山路西高滿載率車次較高,且逐漸降低。主要原因是作為深圳關內最大的城中村的白石洲,有大量前往南山科技園上班的乘客。晚上從深大北門②至松坪村高滿載率車次數較高,且逐漸上升,之后一直到西麗法庭②逐漸下降,主要是從科技園返回松坪村附近居住區的客流,以及到茶光地鐵站換乘的客流。
通過以上分析發現,101路的擁擠路段主要為西側半程,擁擠時段主要在早晚高峰。為了緩解擁擠狀況,提升乘客舒適度,可以采取的措施是在高峰時段的擁擠路段加開區間線路、縮短發車間隔。此處所分析的高滿載率車次并不涉及總體客流量規模,而是短時間內高密度客流的時空分布,有利于提出針對性的服務質量提升解決方案。總體而言,從火車站至白石洲段還有相當大的客流量,但分布則較為平緩。
公汽滿載率指標是表示公汽車廂擁擠程度最直接的指標,在公交規劃、調度、服務評價等方面有著重要作用。本文利用長時期大范圍的IC卡數據、公共汽車GPS數據等公交大數據推導得到了成功率較高的OD數據,為公汽滿載率的推算提供了基礎,以此可以得到城市級別的公汽滿載率數據。經深圳市案例分析,最終驗證此方法具有可行性,在數據完整的情況下可以獲取全市公交路網的乘客擁擠程度。通過對公汽滿載率的進一步分析,可以對出行擁擠路段和時段進行精準識別。但是研究中對大數據處理的時間較長,未來可對大規模公交數據處理算法進行優化,以提高搜索效率。