徐碩 郭丹
(北京市運輸管理技術支持中心,北京10000)
城市交通樞紐是城市對內對外聯系的重要紐帶,更是各類交通方式匯集的一個節點。隨著交通需求的不斷增長,交通樞紐的集散能力顯得尤為重要。交通樞紐對城市內部的主要交通職能為:綜合公共交通、社會交通等多種交通方式,高品質、高效率的集散到離樞紐旅客、迎送人員和工作人員。
目前交通樞紐常見的接續運輸交通方式包括私家車、出租車、網約車、公交車、地鐵等,其中,出租車作為一種方便、靈活的出行方式,在大型交通樞紐接續運輸服務中地位重要。然而,由于出租車運營的市場化行為特征,以及大型樞紐旅客時空分布不均等多重原因,樞紐的出租車供需矛盾問題始終存在,且在特定時期比較突出。因此,如何獲取接續運輸服務的需求特征,評估接續運輸供需差異,抓準矛盾突出點,一直都是樞紐問題研究中一項重要的研究課題。
本研究以大型樞紐出租車接續運輸需求特征為研究對象,基于手機信令數據,建立出租車旅客的識別方法,對場站客流進行細分,深度挖掘出租車旅客的候車人數、候車時間等接續運輸屬性,為出租車接續運輸服務保障工作提供有效決策數據支撐。
近年來,越來越多的研究者將手機信令數據應用于交通問題的研究,如出行特征與需求分析、出行軌跡分析等方面。
國外相關研究的有:Friedrich 等[1]融合手機信令數據與車輛檢測數據,通過模糊算法獲取車輛軌跡,從而判斷車輛出行OD信息,用于交通監測與需求分析;Iqbal[2]基于手機信令數據以及道路交通量,提出了出行OD 計算方法;Rokib[3]則融合手機信令數據與網絡簽到數據,進行出行OD 的計算。
國內相關的研究有:賈會林[4]提出了基于手機信令數據的出行分布分析方法;冉斌[5]梳理并總結了近期手機信令數據在交通方面的應用,認為手機信令數據可以用于通勤出行、出行OD、客流集散方面的研究。
通過國內外研究現狀的梳理來看,手機信令數據已經廣泛的為交通研究所用。然而,針對交通樞紐及其接續運輸能力的分析,手機信令數據的應用還較少。因此,本研究嘗試采用手機信令數據與交通數據相融合的分析方法,對大型交通樞紐出租車接續運輸供需進行研究,以證明其有效性。
本研究提出一種基于手機信令數據的出租車接續運輸需求特征分析研究方法。手機信令數據憑借數據樣本量大、客觀全面、時空連續性強等特點,常用于各類需求分析,本研究則將手機信令數據用于出租車接續運輸需求分析,可以更精準、更長時的分析出租車接續運輸需求狀況。
手機信令數據用于接續運輸需求分析,包含人群識別、出行OD 的識別以及出行方式的識別三個核心算法,能夠精準的得到出租車出行人群的出行時空規律,并基于該出行規律,評價其接續運輸能力。各算法的具體內容如下:
精準識別樞紐旅客(即合理剔除居住和工作人口)是研究樞紐出租車接續運輸能力的重要內容之一。算法思路步驟如下:
3.1.1 空間篩選特定區域交通小區及對應通信基站;
3.1.2 提取觸發該特定區域的用戶所有軌跡;
3.1.3 時間上設定閾值參數,判別特定區域職住人口;
3.1.4 剔除職住人口以及過路用戶,識別特定區域旅客。
其中,時間閾值判定規則可以取為:
場景1:0 點到6 點之間,若用戶在某點的停留時間總和大于3 個小時,則認為該點為用戶的居住地。
場景2:9 點到17 點之間,若用戶在某點的停留時間總和大于3 個小時,且該停留點與用戶居住所在地的距離大于某一閾值,則認為該點為用戶的工作地。
具體算法技術見下圖:

圖1 特定區域不同人群識別流程圖
出行OD 算法的關鍵節點在于計算出行者某一時間段出行的所有起訖點,也就是出行停留點。移動通信數據中,人們會在某些地點停留較長時間,如工作單位、家、購物商場、樞紐、學校等,這些點成為停留點。
本次研究用戶出行停留點采用“時間- 空間”雙層聚類算法進行識別。該算法共分為兩階段,第一階段進行空間聚類方法采用DBSCAN 算法,基于第一階段結果再進行時間層聚類,最終精準識別出用戶停留點,進而得到用戶的出行OD。具體步驟如下:
(1)提取特定區域相關用戶所有軌跡數據;
(2)遍歷各用戶的所有軌跡數據并作為數據輸入;
(3)確定DBSCAN 算法參數,停留點最小點數MinP,停留點判別最小距離MinR;
(4)DBSCAN 模型計算輸出各用戶的停留點;
(5)將停留點按時間序列進行排序,并計算各簇的停留時長;
(6)判定各簇的停留時長是否大于時間閾值;
(7)識別出停留點,輸出停留點集合,并連接出行OD。
具體研究思路見下流程圖:

圖2“時間- 空間”聚類流程圖
本研究基于手機信令大數據挖掘分析,分析北京市樞紐場站旅客的出行方式,并結合出租車抬桿數據相互校驗分析。具體思路如下:
(1)基于用戶移動通信數據識別出行OD;
(2)判別出行OD 及軌跡點在地鐵站內的出行方式為地鐵出行;
(3)提取出行OD 過程中的特征:平均行駛速度、最大行駛速度、85%分位速度、低速占比、高速占比、平均加速度、最大加速度、平均方向改變率、行程時間、行程距離等特征,以及結合地理信息,判別出行OD 點周邊500m 內的公交站點數等;
(4)聚類方法:通過第(3)步中提到的各出行OD 對應的出行特征進行歸一化及主成分分析后,采用K-Means 聚類、層次聚類、BIRCH 聚類等;
(5)聚類結果解釋:對第(4)步中的結果進行解釋,找出各類中心對應的特征值,綜合分析解釋各類對應不同的出行方式(公交/小汽車/非機動車/步行);
(6)結合第(2)步中識別的地鐵出行,將出行方式分為:地鐵/公交/小汽車/非機動車/步行,共五種交通方式;
(7)與出租車抬桿數據分析得到的出租車接續運輸運力進行融合分析。
具體出行方式流程圖如下:

圖3 出行方式識別算法流程圖
基于手機信令數據以及本研究所提出的算法,計算北京西站國慶期間主要時期(9 月30 日、10 月1 日、6 日及7 日)全日各小時到達旅客百分比,并分析客流高峰小時及對應占比。
(1)北京西站到達客流量在國慶期間整體呈上升趨勢,在7日客流量最大,最高客流量為23.11 萬人次;
(2)全天客流到達分布在下午14 點-15 點間達到高峰,高峰小時客流量約占7.98%;
(3)9 月30 日和10 月6 日在晚上21 點-22 點間到達客流較大,約占6.38%。
具體客流分布圖如下所示:

圖4 北京西站國慶期間主要時期客流分布
4.2.1 排隊人數
基于手機信令數據以及本研究提出的算法,計算北京西站出租車等候區國慶期間每天的平均排隊人數、最大排隊人數以及節前后四天(9 月30 日、10 月1 日、6 日和7 日)的排隊人數分布。
國慶期間最大排隊人數總體呈現上升趨勢,其中,10 月1日平均排隊人數和最大排隊人數突高,10 月7 日的最大排隊人數較高,達176 人,全天平均大排隊人數為63 人。

圖5 北京西站出租車等候區國慶期間日排隊人數分布
9 月30 日全天排隊人數較為平穩,高峰值集中在21:00-0:00;10 月1 日高峰值為14:20-15:20,6 日全天多個高峰值,白天主要表現為多個窄峰,早上和晚上主要表現為寬峰。10 月7 日全天出現多個峰值,其中較為突出的是8:20-10:00、12:10-14:00和14:40-16:20,,均為寬峰,且最大排隊人數超過160 人。

圖6 北京西站出租車等候區國慶期間各時刻排隊人數分布
4.2.2 排隊時間
北京西站出租車等候區國慶期間,9 月30 日在22:00-23:30 有一段寬高峰,平均停留時間為22min,1 日在12:00-15:00時段出現兩個高峰值,平均停留時間為24min,6 日早晚各出現一段寬峰,時段分別為5:00-7:00 和21:30-23:30,平均停留時間為25min、29min,7 日平均停留時間有若干高峰,高峰時段為9:00-10:30、12:00-13:00 以及15:00-16:00,平均停留時間在30min 左右。

圖7 國慶期間北京西站出租車等候區旅客排隊時長分布
通過本研究發現,手機信令數據可以很好的應用于樞紐出租車接續運輸需求特征的分析,該方法更加精準,成本更低,也可以用于進行其他交通方式接續運輸需求特征的評估分析。隨著技術的進步,可以進一步實現更加實時化和動態化的樞紐接續運輸供需監測預警,為運輸服務保障調度提供量化數據支撐。
另一方面,根據本研究發現,北京西站在“十一國慶黃金周”這一特殊時期的部分時段,出租車的接續運輸供需矛盾較為明顯,特別是旅客集中達到時段(如每日下午與晚上的客流到發高峰期)以及軌道交通停運時段。相信隨著手機信令數據的應用,可以為進一步優化提升大型樞紐接續運輸服務提供更加有力的技術支撐。