羅 敏,熊 文*,張 瑞
(1.云南師范大學 信息學院,云南 昆明 650500;2.深圳北斗應用技術研究院,廣東 深圳 518055)
由于軌道交通具有便捷、高效、準時等特點,已成為城市居民出行的主要方式。借助于信息技術構建的軌道交通系統高速運轉,每天產生千萬級別的地鐵集成電路卡(Integrated Circuit Card,IC卡)拍卡記錄。這些數據記錄了城市居民個體日常的移動軌跡,隱含了城市居民群體流動的時空特征和規(guī)律,為城市居民地鐵出行和職住地研究提供了數據基礎。當前,國內外學者圍繞地鐵IC卡數據做了大量研究。Kusakabe等[1]基于地鐵智能卡數據,分析了乘客出行特征。Ji等[2]利用南寧市工作日地鐵數據,分析了地鐵通勤乘客的時空特征。黃潔等[3]利用北京的地鐵IC數據計算了出行時間和研究了客流時空分布特征。陳艷艷等[4]利用北京市地鐵IC卡數據,提出了一種計算高峰時段乘客等車時間的方法。
本文利用地鐵IC卡刷卡數據,從出行量、出行時長與出行距離、通勤出行空間分布的不同角度分析了深圳地鐵乘客出行的時空特征,為城市軌道交通管理提供了科學依據。
深圳是中國著名的“創(chuàng)新之城”,以高科技產業(yè)聞名于世。改革開放40多年以來,從一個小漁村發(fā)展為比肩北京、上海、廣州的超一線城市。在4個超一線城市中,深圳土地面積最小、人口密度最大,而單位面積創(chuàng)造的GDP最高。深圳是中國改革開放高速發(fā)展的一個縮影,以深圳為研究對象進行城市通勤和職住分析具有廣泛的代表性。
目前,深圳下轄9個行政區(qū)和1個新區(qū),福田區(qū)、南山區(qū)、羅湖區(qū)是深圳中心城區(qū),為原關內區(qū)域。寶安區(qū)、光明區(qū)、龍華區(qū)、龍崗區(qū)、坪山區(qū)、鹽田區(qū)、大鵬新區(qū)組成外圍城區(qū),為原關外區(qū)域。截至2017年底,深圳共建8條地鐵線路和199個地鐵站點,以此為本文的研究區(qū)域(見圖1),軌道交通在2017年的日均客流量達到了450萬人次。

圖1 深圳市地鐵線路分布
本研究使用的數據為深圳市2017年12月連續(xù)一月的地鐵IC卡刷卡記錄,共計約1.5億條,記錄包含了卡號、刷卡時間、刷卡站點、進出站標記等屬性。本文所使用的地鐵IC卡數據所涵蓋的時間范圍無法定節(jié)假日,因此本研究結果不受法定節(jié)假日的影響。
原始數據存在許多數據質量問題,包括:重復記錄、字段缺失、數據異常等。在數據分析之前,本文對數據進行了清洗:重復記錄對分析結果無價值,對其作過濾處理。重要字段缺失數據,可借助歷史刷卡規(guī)律進行填充;非重要字段缺失數據,作刪除處理。數據異常主要是由于設備故障導致數據某些字段不符合約束條件,但因異常數據占比較少,對研究結果無影響,可直接刪除。
地鐵OD(Origin-Destination)匹配是指獲取乘客乘坐地鐵一次出行的起訖點信息,為后續(xù)分析乘客地鐵出行時空特征奠定基礎。乘客進出地鐵站閘機處,均會產生一條拍卡記錄。只需對乘客地鐵IC卡記錄按時間進行排序,即可判斷連續(xù)兩次刷卡記錄的標志是否滿足一進一出。若某一乘客連續(xù)兩條刷卡記錄在時間上滿足先后順序,且刷卡標志滿足先進后出,即可成功匹配該乘客的地鐵OD信息。
一次地鐵出行是指乘客完成從一站向另一站的移動過程,即使期間出現換乘,也認為是同一次地鐵出行過程。根據乘客每一次地鐵出行OD匹配結果,提取對應進出站刷卡記錄中的刷卡時間、刷卡站點。乘客的地鐵出行時間T由進出站刷卡時間差計算,而本文計算地鐵出行距離D是通過進出站點間,所途經站點的相鄰距離累加得到。地鐵出行時間和距離的計算公式分別為:

式中:T為出行時間;Tout為出站時間;Tin為進站時間;D為出行距離;stai為出行過程經過的第i個站點;n為出行經過的所有站點數;distance(stai,stai+1)為相鄰兩個站點的距離。
通過對數據的預處理和過濾后,識別出了141萬名地鐵常乘客。地鐵常乘客是指對地鐵依賴性較強、出行乘坐地鐵頻率較高的乘客。對于地鐵常乘客而言,乘坐地鐵出行具有穩(wěn)定性,以一周為單位的出行量會呈規(guī)律波動。因此,本研究繪制了一周內日均出行量的分布(見圖2)。從圖2可看出,工作日出行量高于雙休日出行量,是由于工作日的通勤、通學乘客出行較多造成的;而在工作日中,周五的出行量達到最高,約為247萬人次。

圖2 周出行量
周出行量呈現的是一周內整體的出行量特征分布,而對于一天中出行量的特征分布需要進一步研究。本文對比研究了雙休日、工作日內深圳地鐵在運營時段(6∶00—23∶30),以小時為間隔的出行量分布情況(見圖3)。從圖3可看出,工作日的出行量有明顯的早晚高峰,早高峰(8∶00—9∶00)出行量約32.1萬人次,小時系數為12.9%;晚高峰(18∶00—19∶00)出行量達33.7萬人次,小時系數為13.6%。就雙休日而言,一整天的出行量分布較均衡,在17∶00—18∶00時段,出行量達到了全天最高,約19.2萬人次,小時系數為8.6%。

圖3 分時出行量
出行時長、出行距離是乘客出行考慮的兩個重要因素,也是反映出行效率的關鍵指標。常乘客在工作日的地鐵出行較穩(wěn)定,因此本文統計了工作日的地鐵出行時長、地鐵出行距離,分布情況如圖4所示。圖4a的地鐵出行時長分布可反映出,約90%的地鐵乘客出行時長在50 min內,剩余10%的地鐵乘客出行時長在80 min內。另外,計算出地鐵出行的平均時長為30 min。在圖4b的地鐵出行距離分布中,從地鐵乘客數量角度可以看出,約90%的地鐵乘客出行距離在20 km內,剩余10%的地鐵乘客出行距離在32 km內;從出行距離長短角度可以看出,5 km以內的短距離出行占比30%,5~15 km的中長距離出行占比50%。

圖4 地鐵出行時長與距離分布
通勤乘客是地鐵出行的主力軍,而通勤乘客的地鐵出行在空間上的分布可以反映出一些特征。本文借助ArcGIS工具,綜合研究每個工作日通勤早高峰(7∶00—9∶00)2個小時內,通勤乘客出入地鐵站點在空間上的分布(見圖5)。圖中的點越大,就代表進出該地鐵站點的人數越多。圖5a顯示出通勤乘客早高峰地鐵進站站點在空間上的分布主要集中在深圳市的外圍區(qū)域,龍華區(qū)、龍崗區(qū)地鐵線路沿線的進站人數尤為突出。圖5b顯示的是通勤乘客早高峰地鐵出站站點在空間上的分布,在深圳市的中心區(qū)域較為密集。

圖5 早高峰進出地鐵站點空間分布
結合圖5a和圖5b可以分析出,早高峰通勤乘客流動主要是從外圍區(qū)域進入中心區(qū)域的過程。而深圳市的外圍區(qū)域是居住處較多的區(qū)域,中心區(qū)域是就業(yè)崗位多的區(qū)域,早高峰進出地鐵站點分析結果也符合了這一點,即早高峰通勤時從居住地到就業(yè)地的過程。通勤上下班出行具有對稱性,晚高峰通勤下班乘坐地鐵出行是早高峰通勤上班出行的逆向出行,因此晚高峰通勤下班進出地鐵站點在空間的分布可以從早高峰通勤上班進出地鐵站點分布推算得到。
本文以深圳市地鐵IC卡刷卡數據為基礎,對地鐵通勤時空特征進行了詳細的分析。實驗結果表明:(1)90%的地鐵乘客出行時長在50 min以內,出行距離在20 km內,還有少量的地鐵乘客出行時長在80 min內,出行距離在32 km內;多數乘客主要是短距離以及中長距離出行。(2)早高峰地鐵通勤出行是從居住地較多的外圍區(qū)域往就業(yè)地較多的中心區(qū)域流動的過程。本文研究結果可為軌道交通系統的發(fā)展和管理提供有利參考。