徐藝梅,胡興華,畢宇航,陳曉艷
(1.重慶交通大學交通運輸學院,重慶 400074;2.寧波市民卡運營管理有限公司,浙江 寧波 315199;3.四川省交通運輸發展戰略和規劃科學研究院,四川廣安 638099)
公共交通是解決城市交通問題的重要途徑,其中公交OD(Origin-Destination)可以為公交規劃、公交調度以及車內擁擠度計算提供基礎數據源,國內外對利用IC 卡和手機信令等數據技術推導公交OD矩陣等方面有較多研究[1-5],但由于公交IC 卡數據只有乘客乘坐公交車的上車時間的記錄,沒有下車相關信息的記錄,需要結合其他數據信息來推算下客人數。由于無線通信技術的快速發展,許多研究者也開始將WIFI 探測數據包以及藍牙數據應用到交通領域。部分學者利用WIFI 探針捕獲公交車乘客的WIFI 探測數據包,分析公交車的載客量信息[6-11]。部分學者利用藍牙智能感知技術預測公交車的到站時間和乘客等數據[12-16]。
該文提出一種基于WIFI和藍牙數據的公交客流OD 分析方法,利用WIFI探針和藍牙檢測器采集的相關數據文本來獲取公交車輛的設備數,推算公交車輛的上下客人數,獲得更加準確可靠的OD 數據。
當車輛的GPS 模塊識別到車輛到達公交站臺時,便用裝在每個公交站臺的WIFI 探針和藍牙檢測器連續探測公交車輛上的設備,生成MAC 地址時間位置以及信號強度等相關數據文本,進行數據預處理后上傳給云服務器。其架構設計如圖1所示。

圖1 總體架構設計

圖2 裝置采集前端功能模塊圖
該檢測裝置設計包括三個子模塊,分別為采集模塊(用于采集開啟了WIFI 或藍牙設備的數據信息,并對初始數據進行解析和粗略地過濾,完成數據的預處理)、緩存模塊(用于緩存預處理后的數據信息,對其進行管理)以及發送模塊(負責讀取數據,并發送給服務器)。
WIFI 探針和藍牙檢測器收集到的數據是相互獨立的,因此檢測狀態可以分為四種:同時開啟了WIFI 和藍牙;開啟WIFI 關閉藍牙;開啟藍牙關閉WIFI;同時關閉WIFI 和藍牙。需要進行數據融合處理得到每個站臺總的設備數,以此作為計算公交車輛在每個站點的上下車乘客人數的基礎數據源。
由于收集到的WIFI 探針數據集和藍牙檢測器數據集中存在部分無效數據,主要有以下三類:1)經過站臺附近的非公交乘客;2)在站臺附近的停留人員,長時間停留在公交站臺;3)離站臺較遠的人員,被偶然識別并記錄下來。
因此,為了消除三類無效數據,有必要對數據進行預處理。需要剔除掉30 s內非重復出現的數據,其可能是公交站臺附近經過的車輛以及周邊的行人。并剔除掉數據中連續3 min 內重復出現的MAC 地址,據此可以篩除掉非公交車輛乘客。最后還需要剔除掉信號強度過低的數據,篩除離設備接收端較遠的非公交車輛乘客設備。
當對數據進行預處理后,得到WIFI 探針數據集和藍牙檢測器數據集,需對其進行數據融合才能得到最準確的各個站臺的設備數。由于既開啟了WIFI 也開啟了藍牙的設備數被記錄了兩次,需要將其提取出來,同一個設備的WIFI 和藍牙MAC 地址前六位完全相同,依據此特性進行數據融合:在云服務器中,標記出WIFI 探針和藍牙檢測器所存儲的數據中MAC 地址前六位相同的數據文本,并減少一次藍牙數據記錄,保留被記錄在WIFI 探針儲存的數據。字段及其含義如表1 所示。

表1 字段及其含義
如將公交站臺15 的WIFI 探針和藍牙信號檢測器檢測到的有效MAC 地址上傳入云服務器內,檢查是否有重復的MAC 地址,若有,則提取出來,并刪掉重復的數據。再重新記入云服務器中,經過數據預處理后的數據信息如表2 所示。

表2 初始數據信息
對表2 中數據進行數據融合,創建一個以WIFI1815 命名儲存的數據表,里面儲存了對數據進行預處理后的該時期編號為18 的公交車在15 站臺的有效WIFI探針數據集,并創建一個以bluetooth1815命名的數據表,里面也儲存了藍牙檢測數據集。然后需輸入Python 語句來篩選出表bluetooth1815 字段macAddress的字段值與表WIFI1815字段macAddress的字段值在前六位相同的重復數據,并在表bluetooth 1815 中剔除掉篩選出的重復數據,語句如下:
將表bluetooth1815中的數據合并到表WIFI 1815中。針對表2 中系統能提取到站臺15 的藍牙檢測器儲存的ID 為1 的MAC 地址,與WIFI 探針儲存的ID為3 的MAC 地址在前六位相同,符合為統一設備的特征,因此將其藍牙檢測器中的重復數據信息刪除,并將其合并到WIFI 探針儲存的數據表中,融合后數據信息如表3 所示。

表3 融合后數據信息
假設在進行數據源融合后,檢測到的一臺設備為一個乘客,從公交車第一站開始所有持有設備上車的乘客人數為Szn,當到達第n個站臺,并且出站以后,此時車內持有設備的乘客人數占此時車內總乘客人數的比例為Kn,因此從第一站開始所有上車乘客數為Ozn,其計算公式為:
假設使用公交IC 卡進行刷卡乘車的人數占總乘車人數的比例為KIC,該系數為一個常數,可以利用時間平滑預測法來計算一段時間內該地使用公交IC 卡的人數占總乘車人數的比例,該比例便為KIC,那么從第一站開始到第n站的所有刷卡乘車的乘客數為Izn,則有:
結合式(1)和式(2),可以得出:
公交車離始發站越近,Kn值的誤差就會越大,因此可以設定當Szn小于30 時,Kn便取值為K,其值由在一個月時間內,該公交車持有設備上車的總乘車人數Sz和該公交車的總乘車人數Iz決定,因此Kn的計算公式如下:
假設公交車到達第n站并出站后,車內乘客總人數為Qn,此時檢測到的車內持有設備的乘客數為Sn,此時車內持有設備的乘客人數占此時車內總乘客人數的比例為Kn,所以計算公式為:
結合式(4)和式(5),可以計算出公交車在第n站出站后的車內乘客數Qn,其計算公式為:
上車乘客數:所有上車的乘客都用公交IC 卡進行刷卡乘車,則假設在第n站上車乘客數為On,其值等于In。
下車乘客數:在第n站下車乘客數為Dn,其計算公式為:
為了便于統計,可以將這些詳細數據利用SQL存儲在一個新的數據表中,并通過關系型數據庫查詢統計出某個日期的某段時間內任意兩個公交站點間的OD 數據信息,進而得出基于WIFI 探針和藍牙信號檢測器數據的公交OD 矩陣,如圖3 所示。

圖3 基于WIFI和藍牙數據的公交OD矩陣
最后還需要進行校正,需使得各個公交站點的總上車數之和等于總下車乘客數之和,即:
圖3 中的客流OD 數據只是基于WIFI 和藍牙數據計算的,每個站點上車乘客數為Mn,下車乘客數為Nn,基于此可以計算出結合車載售票信息所推算出的每個站點的上車乘客數為On,下車乘客數Dn,如圖4 所示。

圖4 實際公交OD矩陣
圖4 中各個站點的On 和Dn已知,圖3 中的各個站點的Mn和Nn已知,Qi,j已知,則可以根據相對應的比例因子求出圖4 中的Xi,j,其計算公式如下:
計算出的Xi,j若為小數,則四舍五入,并進行校正,需使得:
計算出各個站點間的到發情況后,便可以得出最終的實際公交客流OD 矩陣。
現有研究大多是基于公交IC 卡和GPS 數據來獲取公交OD 的推算結果,會出現由于乘客刷卡信息錯誤而影響數據準確性的問題,以及對各站點的下客人數推算精度不高,難免會產生一定的誤差,該文提出一種基于WIFI 和藍牙數據來進行公交客流OD 方法的分析,利用WIFI 探針和藍牙檢測器來識別每個站臺的設備數,結合車載售票信息如IC 卡數據來計算出公交車輛在各站點的上下客流數,與基于WIFI和藍牙數據的OD 矩陣進行校正,計算出最終的實際公交客流OD 矩陣,得到的公交OD 信息也更加準確可靠。隨著智能手機的普及率越來越高,利用WIFI和藍牙數據來分析公交OD 方法的準確率也將越來越高,其有望成為一種重要的公交客流OD 信息獲取的有效手段,為城市的公交規劃、公交調度和車內的擁擠度計算提供基礎數據源。在碳達峰碳中和目標框架下,對于城市客運碳排放量核算的要求更加精準,利用該設備為計算公交客運周轉量的能耗強度和碳排放強度提供了技術基礎。
該文研究基于公交站點的公交客流OD,為城市公共交通管理者提供較為全面的居民出行信息,是城市公交站點布局的合理性和公交線路可達性的評價依據,但與以交通小區為基本單元的傳統交通規劃的統計方法有較大區別,因此在下一步研究中,將站點歸類于小區,以獲得交通小區之間的公交出行OD 矩陣。