王 振,張志敏,李同飛,高 歌,禚保玲
(1.青島市城市規劃設計研究院,青島 266071; 2.北京工業大學 交通工程北京市重點實驗室,北京 100124; 3.山東科技大學 交通學院,青島 266590)
在城市規劃領域,居民通勤及職住特征的獲取需要借助大規模的抽樣入戶問卷調查,在操作簡單易行的同時也存在入戶難度大,調查成本高的弊端。隨著互聯網的興起,依托網頁、終端的調查發展迅速,通過問卷星,調查派等應用進行居民出行調查,如青島市2015年第三次居民出行調查中采用網絡調查問卷調查居民的出行和通勤情況。網絡調查雖然能夠降低調查成本,但仍然需要被調查者主動填寫,是信息主動采集的過程,存在主觀臆斷的可能。目前,手機信令數據、APP定位數據等互聯網大數據,在信息被動采集的基礎上,借助大數據處理技術和人工智能算法能夠進行居民出行特征的分析。蘇躍江等[1]系統分析了包括手機信令數據在內的大數據在交通調查中的應用,從挖掘特殊調查指標、實現多源數據互補與校核兩個層面進行了深入剖析;付雷[2]闡述了手機信令數據在居民出行調查中關鍵技術,并以石家莊市為例從人口、出行以及通勤等方面進行分析。同時互聯網大數據,在保護用戶隱私的前提下,能夠最大程度地還原用戶出行軌跡,且具有樣本覆蓋廣的特點,例如傳統的居民出行調查抽樣率在3%左右,手機信令數據的樣本覆蓋率根據不同的運營商市場份額確定,但一般都在30%左右。
目前,我國的人口普查每10年一次,經濟普查每5年一次,但人口普查數據不涉及就業地,經濟普查數據不涉及居住地,因此難以根據官方統計數據進行通勤特征的研究。傳統職住空間的研究,尤其是通勤特征的分析往往需要借助手機信令數據、位置定位數據等多源數據。丁亮等[3]基于手機信令數據,根據居民的夜間駐留地和日間駐留地的密度分布識別出上海中心城區通勤圈;郭亮等[4]依托手機定位服務(location based service,LBS)數據識別武漢市中心城區主要通勤圈的空間分布;鐘煒菁等[5]以上海市為例,構建“人口-時間-行為”關系的手機信令數據分析框架,研究職住關系和通勤出行特征;張天然[6]對比驗證了手機信令和居民出行調查的職住空間和距離較為吻合,并提出了職住通道平衡的概念;鈕心毅等[7]在運用手機信令數據識別職住分布時,比較分析了不同規則和參數取值的可靠性;李祖芬等[8]基于交通小區進行OD矩陣、出行期望線等居民出行時空特征提取,并與北京市第四次交通綜合調查結果進行比較,得出兩者偏差較小的結論;蔣寅等[9]基于手機信令數據,提出獲取職住分布的方法和路線,并以天津市為例,探究軌道交通與通勤廊道之間的耦合關系;鄒戴曉等[10]提出基于手機信令數據的職住識別方法,并通過交通模型對城市職住空間進行了分析;鄧社軍等[11]通過手機信令數據構建城市間旅游出行網絡,并通過構建指標評價體系分析了客流空間分布特征;于泉等[12]從用戶行為特征的角度運用手機信令數據對高速公路服務區客流進行可視化研究以及科學分析。

圖1 技術路線
張逸姬等[13]采用土地利用數據、公交地鐵刷卡以及微信定位數據等多源數據構建職住空間分析框架,并對影響職住空間分布的因素進行了分析;申犁帆等[14]利用騰訊宜出行等多源數據分析軌道站點周邊人口分布,并通過高斯混合模型進行站點職住功能劃分;吳子嘯[15]通過構建時空貪婪算法識別個體出行鏈,能夠最大程度降低信令數據定位的空間不確定性。
既有研究成果,無論是手機信令數據還是多源混合數據都對城市通勤進行了深入研究,但大多停留在通勤出行OD的獲取上,并未進行個體出行路徑的推演。本研究在傳統通勤OD識別算法的基礎上,充分利用手機信令數據自身特點,反推出行的中間點(基站定位),從而構造包含起訖點和中間點在內的近似的出行路線進行通勤廊道分析;并實例分析利用手機信令數據進行通勤時耗分析有天然的局限性,技術路線如圖1所示。

圖2 青島市基站核密度分布
研究中手機信令數據的時間范圍為2018年8月1日—10月14日共76 d超過198.48億條數據,日均出行個體約653.49萬人,約占常住人口的69%(青島市2018年常住人口939.48萬人)。傳統的分析方法中,數據初始化時對基站進行柵格化處理,并以網格質心作為網格內所有基站的位置,在簡化計算的同時也降低了數據的精度,因此本研究采用基站自身作為分析單元。青島市有效基站共有約34 225個,其分布如圖2所示。
常住人口的識別主要基于人口活動規律進行判斷,通過用戶長期信令數據,分析在不同時段不同空間的時間累積判斷常住人口。研究采用青島市連續76 d數據中,同一用戶在夜間時段(22:00—6:00)連接同一基站的逗留時間超過閾值,則計作為有效天數,累積有效天數超過分析數據時間的一半(38 d),即認定該基站對應的區域為該用戶的住址,該用戶即為常住人口,個體編號為MSID。

表1 出行鏈樣本
首先,針對原始手機信令數據通過出行鏈分析模型(時空貪婪算法[1])能夠最大限度地降低乒乓效應和數據漂移的影響,進而得到全樣本的居民出行鏈數據,見表1,然后通過時間邊界閾值判斷出行(OD)。
如圖3所示,出行鏈中當手機用戶在某一位置A駐留時間超過閾值(取15 min),則認為該位置A為出行駐留點。當兩個出行駐留點A,B的間隔時間Δ3-2超過閾值(取10 min)且兩個駐留點間的直線距離超過閾值(取500 m),則認為相鄰兩個駐留點之間為一次出行。
Δ2-1=T2-T1,Δ3-2=T3-T2。

圖3 手機用戶出行(OD)定義
其次,根據青島市人均出行次數、統計年鑒人口總數等指標進行出行擴樣,得到青島市全方式OD出行。
最后,進行通勤出行的判斷。統計青島市工作日出行量數據,如圖4所示,6:00—10:00間的出行量在早高峰期間相對集中,約占全天出行的23%,考慮到此時間段內多為上班出行,故作通勤分析樣本數據。在所有的出行OD中,通過常住人口(MSID)和時間邊界(早高峰6:00—10:00)兩個條件篩選出通勤出行。

圖4 全天出行時間分布
基于分析得到的通勤出行,將個體編號(MSID)、時間從原始數據庫中提取出對應的個體原始信令數據。如圖5所示,通過匯總個體原始信令數據,基站連接數據在20個以內的占比高達76%,通勤出行連接基站平均數為11.26個,大于通勤出行的起終點2個基站。
區域通勤廊道通過人流量疊加法,將所有個體的出行軌跡點,分別以交通小區和500 m網格兩種尺度,按照個體(MSID)、基站位置去重后進行空間匯總,并進行密度分析,即得到對應尺度的通勤廊道。
為了表示手機數據的時間密度,吳子嘯[15]將1 d劃分為以0.5 h 為單位的時段,在一個時段內有一個或多個信令數據即表示該時段出現信令數據,而以出現信令數據的時段數表示時間密度,并據此計算信令數據出現的時間間隔?;谇鄭u市手機信令數據進行時間密度分析,如圖6所示,在分析時段內(7:00—22:00)信令數據出現頻次相對穩定,平均時段數量為11.85個,平均間隔為75.9 min,而根據青島市第三次居民出行調查(2016年)居民的平均出行時耗為35.9 min,故運用手機數據進行時耗分析并不可靠。故本研究只做通勤距離的特征研究。

圖5 通勤出行連接基站分布情況

圖6 手機數據的時間密度分析
青島市各行政區通勤人口平均出行距離呈現外圍區市高于中心城區的態勢,如圖7所示,即墨區最高,平均出行距離7.14 km (2015年居民出行調查為6.4 km);其次為平度市,平均出行距離6.86 km (2015年居民出行調查6.4 km);城陽區平均出行距離最低,僅5.32 km。
對比青島市各行政區的平均通勤距離,如圖8所示,外圍的平度市、萊西市、即墨區、膠州市、西海岸新區其外出(圖8(a))和外來(圖8(b))的通勤出行均位于同一層級,表明其崗位吸引范圍和人口活躍范圍基本一致;市南區、嶗山區、城陽區外來通勤距離要大于外出,表明其崗位吸引的范圍更大,進一步佐證其崗位密集的特點;受“南工北宿”城市格局的影響,市北區、李滄區居住區密集,外出通勤距離大于外來。

圖7 青島市各區市通勤出行距離

圖8 青島市各區市外出及外來通勤距離(單位:km)
進一步分析鎮街尺度的通勤出行網絡發現,如圖9所示,中心城區的街道通勤距離集中在6 km以內;城陽區的紅島街道、上馬街道、棘洪灘街道、流亭街道以及河套街道外來通勤距離要大于外出,表明其就業吸引范圍相對更大;西海岸新區的海青鎮、膠河管區距離中心城區較遠,其外出和外來的通勤距離均在10 km以上。

圖9 青島市各街道外出及外來通勤距離(單位:km)

圖10 青島市通勤客流途經人流密度
區域通勤廊道通過識別區域內人流軌跡的主要路徑來模擬,即區域廊道通過人流量疊加法。如圖10所示,青島市東岸城區中的市南區、市北區、李滄區、嶗山區、城陽區、即墨區整體處于通勤連綿范圍內;外圍的膠州市、平度市、萊西市相對獨立,與東岸城區的通勤聯系較弱;西海岸新區呈現為兩個通勤組團,分別為開發區和原膠南組團,且兩者之間通道單一。
疊加城市路網后,由圖11可見,青島市東岸城區中東西向廊道主要集中在膠寧高架-寧夏路、香港東路兩個方向上,南北向廊道則以山東路-黑龍江路為主,并延伸至城陽區;城陽區、即墨區與市內四區通勤廊道單一,內部道路相對獨立。
同理,以500 m網格為空間單元,按照個體(MSID)、基站位置對個體進行去重后,匯總統計進行人流密度分析得到網格尺度區域通勤廊道。如圖12所示,青島市內四區通勤客流呈現廊道一體化特征,并沿主要道路帶狀布局,山東路-哈爾濱路-黑龍江路與地鐵3號線復合廊道貫通南北;平度市呈現東西向矩形通勤廊道,接近40%的出行分布在9 km × 6 km范圍內;萊西市呈現南北向矩形通勤廊道,約50%的出行分布在9 km × 5 km的范圍內;即墨區、膠州市一半以上的出行集中在5 km以內,通勤廊道圍繞中心放射延伸;西海岸新區通勤廊道呈現開發區和原膠南雙矩形通勤廊道結構,接近140 km2范圍內集中了全區約65%的早高峰出行。

圖11 基于交通小區的早高峰通勤廊道

圖12 基于500 m網格的早高峰通勤廊道
本文運用手機信令數據對青島市通勤距離、通勤時間等通勤特征進行分析,并通過回溯原始數據推算通勤個體出行軌跡,匯總后得到全市通勤廊道。以青島市為例,全市通勤距離處于合理范圍之內,但各行政區通勤出行距離呈現外圍區市高于中心城區的態勢,同時受“南工北宿”城市格局的影響,市北區、李滄區居住區密集,外出通勤距離大于外來。因此即墨區、萊西市等外圍區市應通過優化引導職住空間匹配,合理控制通勤出行距離。市南區、市北區、李滄區、嶗山區等市內四區通勤客流呈現廊道一體化特征,即墨區、平度市、萊西市等外圍區市通勤聯系呈現組團獨立發展態勢,因此,在城市一體化發展過程中應通過預留有限通道資源,優先發展大容量公共交通工具實現市區與遠郊的便捷聯系。