蔣 寅,鄭海星,于士元,唐 曉
(1.天津市市政工程設計研究總院,天津300201;2.天津市城市規劃設計研究院,天津300201;3.天津市公安交通管理局,天津300201;4.天津市住建委世行貸款項目辦公室,天津300201)
截至2017年末,天津市常住人口1 556.87萬人,軌道交通運營里程約166 km,客運量約97萬人次·d-1,線路客運強度0.6萬人次·d-1·km-1,與人口規模接近的廣州、重慶等城市相比,軌道交通網絡客運量及客運強度偏低[1]。軌道交通網絡與城市空間結構是否耦合是影響軌道交通客流的重要因素,也是衡量城市交通與用地是否良性發展的關鍵指標。相關文獻研究認為,軌道交通對都市圈空間具有重構及再生作用,而都市圈的空間規模和結構決定著軌道交通網絡規模和形態[2]。因此,天津市城市空間結構與軌道交通網絡耦合關系的研究是當前軌道交通大規模建設背景下極其重要的課題。
隨著大數據在城市交通中的不斷應用與推廣,利用手機信令數據研究職住分布關系及城市空間結構已取得豐富的研究成果。文獻[3]探討不同手機數據的采樣方式對職住地識別結果及通勤特征分析的影響及其可靠性。文獻[4]利用手機信令數據對北京市用戶職住分布情況進行分析。文獻[5]對重慶市主城區職住狀況與交通系統之間的關聯進行研究。文獻[6-7]利用手機信令數據研究上海市通勤區與職住空間分布關系。文獻[8]基于手機信令數據分析珠三角城市群空間特征。文獻[9]基于手機信令數據估算得出美國舊金山城市交通大區OD分布。
在借鑒國內外手機信令數據分析算法的基礎上,通過分析天津市手機信令數據獲取職住分布關系,進一步提出從通勤圈、CBD、通勤出行聯系強度三個維度分析城市空間結構的思路,并在天津市進行應用,探究現狀已建與近期建設的軌道交通網絡與城市空間結構的耦合關系,為軌道交通線網優化及城市空間結構調整提供參考。
1)基于居住地和工作地識別的用戶職住與通勤分析。
手機信令數據具有采樣率高、覆蓋面廣、置信度高等優點,為關注個人的時空行為提供了重要的契機和數據基礎。近年來,基于手機信令數據建立城市居民居住與就業地識別模型,研究居住和就業的空間分布特征,成為城市與交通規劃領域的熱點,并得到了廣泛應用。
2)基于停留點識別的出行OD分析。
城市居民出行OD及其特征是交通規劃與管理中最重要的基礎資料之一,也是交通領域中一直研究和探討的重點。手機信令數據積累了大量的用戶實時定位數據,能夠為研究居民出行規律、實時交通狀態監控及估計出行需求提供豐富的數據資源。近年來,基于手機數據的出行OD分析研究在不斷推進,然而,受限于手機基站定位精度的影響,在短距離出行OD及其相關出行特征分析等方面的應用有限。
城市空間結構分析主要利用基于手機信令數據得到的職住分布關系。
基于手機信令數據的職住地識別算法主要分為3類:時間閾值法、相對停留時間法和信息熵法。
1)時間閾值法。每天夜間(例如0:00—6:00)停留時間超過某一閾值且1個月內出現次數大于某一閾值次數的停留點,作為識別的居住地點;每天白天(例如9:00—17:00)停留時間超過某一閾值且1個月內出現次數大于某一閾值次數的停留點,作為識別的工作地點。
2)相對停留時間法。計算夜間觀測時段內(例如0:00—6:00)在各網格停留的時間占比P,當P取最大值時對應停留點作為識別的居住地點;計算白天觀測時段內(例如9:00—17:00)在各網格停留的時間占比P,當P取最大值時對應停留點作為識別的工作地點。
3)信息熵法。為進一步區分夜間休息與白天休息用戶,文獻[10]引入信息熵的概念,分析研究時段內用戶的活躍度,進而有效識別用戶的集中休息時段,有效解決了無法區分白天工作用戶和夜間工作用戶的問題。
時間閾值法和相對停留時間法較簡單,是各運營商、研究機構等普遍采用的方法。信息熵法相對復雜,應用案例較少,但很好地解決了由于用戶作息時間不規律或夜間工作等情況而將工作地誤判為居住地的問題。
在借鑒國內外手機信令數據職住地識別算法的基礎上,結合天津市聯通、移動、電信三家運營商手機信令數據實際情況,綜合考慮時間閾值、相對停留時間以及信息熵等方法的使用,利用時間-空間雙層聚類分析,形成一套有效的天津市職住地識別算法。時間上的聚類指對位于同一網格(300 m×300 m)的連續記錄進行合并處理;空間上的聚類指考慮到手機信令數據的“乒乓”現象,對潛在居住地(工作地)停留時間進行統計時,將附近一定范圍內網格的停留時間也統計在內。具體如下:
1)數據概況。
獲取天津市聯通、移動、電信三家運營商連續1個月的手機信令數據,包括用戶編號、網格ID、網格中心經度、網格中心緯度、開始時間、結束時間等信息。網格尺寸約為300 m×300 m。
2)數據預處理。
首先,對純上網手機號、當月工作日內大都未出現過信令數據(概率>0.5)的用戶進行過濾,該部分用戶不進行工作地與居住地的識別。
其次,新增首記錄和完善末記錄。新增首記錄的網格編號設為昨日該用戶出現的最后一個網格編號,開始時間設為00:00:00,結束時間設為當日第一條記錄開始時間;末記錄的網格編號、開始時間不變,結束時間設為23:59:59。
3)用戶集中休息時段識別與工作分析時段選取。
信息熵值大小反映了用戶在研究時段內的活躍程度。信息熵值越大,活躍度越高。當用戶處于完全靜止狀態時,信息熵值為0。
將工作日劃分為0:00—6:00,6:00—12:00,12:00—18:00,18:00—24:00四個時段,各含6 h。分別統計不同時段內各用戶在各網格的停留時間,計算各用戶在各時段內的信息熵值

圖1 各時段信息熵值分布Fig.1 Information entropy distribution by time

式中:Pij為用戶Xi在在停留點j的停留時間占比,Pij=Tij/T,其中,Tij為研究時段內用戶Xi在停留點j的總停留時間/h,T為研究時段總時間(6h)。
選取全天四個時段內信息熵值最小時段作為用戶的集中休息時段。如果出現一個用戶含有多個信息熵最小值,優先考慮時段00:00—06:00;否則,隨機選取即可。
綜合考慮三班倒、兩班倒、正常通勤等各類用戶的集中休息與工作時段特征,當用戶集中休息時段為0:00—6:00時,選取10:00—20:00作為工作分析時段;當用戶集中休息時段為其他時段時,則選取1:00—7:00作為工作分析時段。
為更好地反映用戶活動特征與信息熵值的關系,以0.5 h為統計時間間隔,對用戶1和用戶2在連續一周內的信息熵值分別進行分析。如圖1所示,橫坐標代表一周內不同日,縱坐標代表一日內不同統計時間間隔,數值代表對應日對應時段該用戶活動的信息熵值,顏色越紅,代表信息熵值越大;信息熵為0時,代表用戶未活動。可以看出,用戶1的活動主要集中在白天,集中休息時段為00:00—06:00;用戶2的活動主要集中在夜間,集中休息時段為12:00—18:00,因此,計算信息熵值可有效避免由于統一規定用戶集中休息時段而將工作地誤判為居住地。
4)用戶居住地(工作地)推算。
首先,計算用戶i在工作日j集中休息時段(或工作時段)內在各網格k的停留時間Ti,j,k。
其次,識別用戶潛在居住地(工作地)。以停留時間最大時對應的網格為中心,對該用戶當天集中休息時段(工作時段)內出現的其他網格進行空間聚類??紤]到基站服務范圍約為0.4~1.5 km,居住地推算時聚類半徑取1.5 km,工作地推算時聚類半徑取0.6 km。統計各聚類的總停留時間,并選取總停留時間≥ΔT的用戶作為目標用戶。居住地推算時ΔT取4 h,工作地推算時ΔT取2 h。針對各目標用戶,選取停留時間排名前三的網格作為當天識別的潛在居住地(或工作地)。
如圖2所示,用戶i在第j個工作日的休息時段(6 h)內,共出現在網格1,2和3三個位置,且Ti,j,1≥Ti,j,2≥Ti,j,3??紤]到用戶在集中休息時段內的位置穩定性特征,以網格1為中心,統計附近1.5 km范圍內出現的所有網格位置的總停留時間如果Ti,j≥4 h,則判斷該用戶在該工作日的潛在居住地依次為網格1、網格2、網格3。
最后,綜合各用戶在該月出現的所有潛在居住地(工作地)網格,按累計出現天數、累計停留時間等條件依次降序排列,如果第一潛在居住地(工作地)所在網格在該月工作日出現的概率大于0.5,則判定該網格為該用戶的居住地(工作地)網格。
另外,對于工作地和居住地位于同一網格的用戶,識別為特殊用戶,如寄宿學生、居家老人等。
通過分析聯通、移動、電信三家運營商1個月連續的手機信令數據,對天津市常住人口的工作地與居住地進行識別,并對其職住空間分布進行分析。

圖2 潛在居住地識別Fig.2 Recognition of potential residence place

圖3 雙城人口和就業崗位密度分布Fig.3 Population density and employment density in twin cities of Tianjin
1)職住識別總體概況。
天津市常住人口居住地識別規模約為865萬人,相當于天津市常住人口55%的抽樣率。常住人口的工作地識別規模約為697萬人,過濾特殊用戶(如寄宿學生、小區底商、居家老人等)后約為289萬人,其中識別夜間上班用戶約占10%(見表1)。

表1 天津市常住人口職住地識別概況Tab.1 Overview of work and housing locations of Tianjin residents 萬人
2)雙城人口與就業崗位密度分布。
如圖3所示,天津市中心城區的人口主要分布在快速環線以內;崗位高度集中在南京路沿線區域;濱海新區核心區的人口主要分布在塘沽老城,就業崗位主要分布在開發區、外灘等地區,與實際情況基本相符。
城市空間結構是以一定的組織方式,將城市內部的各要素(如經濟活動、土地利用、建筑、社會群體等)、城市形態以及城市間的相互作用關系連接起來,最終形成一個完整的系統[11]。利用手機信令數據分析城市空間結構,主要反映人的活動規律,從而間接反映城市空間形態,因此更偏向地理學角度對城市空間結構的分析。
基于手機信令數據得到的職住分布特征對城市空間結構分析主要關注三個方面(見圖4):城市空間拓展的范圍;城市CBD的規模結構與輻射范圍;各區域之間聯系強度。

圖4 基于職住分布分析城市空間結構的技術路線Fig.4 Techniques of urban spatial structure based on job-housing distribution
1)城市空間拓展的范圍,即大都市區范圍,通勤率是國外大都市區劃分的核心指標,因此可以通過手機信令數據得到中心城區與外圍組團的通勤率,研究通勤圈范圍,從而界定城市空間拓展的主要范圍。
2)城市形態主要針對城市CBD進行分析,通過手機信令數據得到人口密度和就業崗位密度,界定CBD的規模與范圍,并進一步分析CBD工作與居住人員的分布規律,研究CBD的輻射范圍。
3)各區域之間空間聯系主要針對通勤出行聯系強度進行分析,通過手機信令數據得到職住分布關系,從而獲取各區域間通勤出行聯系強度。
通勤圈也稱作都市圈,一般以外圍地區前往中心城區的通勤率作為主要指標來表達都市圈的空間層次結構。通勤率指外圍地區的就業人口前往中心城區通勤的比例,或在中心城區居住但在外圍地區就業的人口占該地區就業人口的比例。美國1990年提出的大都市區界定標準為,至少15%非農業勞動力向中心縣以內范圍通勤或雙向通勤率達到20%以上;日本以5%或10%的通勤率為標準界定大都市圈范圍[12]。
天津市呈現以中心城區和濱海新區核心區為雙核的空間結構模式,因此以中心城區和濱海新區核心區為對象,分別進行通勤圈分析。將雙城外圍地區按照組團進行劃分計算與雙城的通勤率,分別按照5%,10%,15%,20%的通勤率計算通勤圈覆蓋工作人口居住地和居住人口工作地的比例,最終選取10%的標準作為通勤圈劃分的閾值(見圖5,表2和表3),以實現通勤圈覆蓋居住人口工作地的比例達到96%以上。

圖5 雙城通勤圈Fig.5 Commuting loops in twin cities of Tianjin

表2 中心城區通勤圈分析Tab.2 Commuting loops in urban central area

表3 濱海新區核心區通勤圈分析Tab.3 Commuting loop in core area of Tianjin Binhai NewArea
分析表明:1)從通勤圈的面積來看,中心城區遠大于濱海新區核心區,表明雙核結構中中心城區是主核,濱海新區核心區是副核;2)從通勤半徑看,中心城區平均通勤半徑約27 km,濱海新區核心區通勤半徑約20 km,通勤半徑均較??;3)從通勤方向看,不管是通勤范圍還是通勤量,雙核由內至外出行均大于由外至內出行,中心城區進出比為1:1.87,濱海新區核心區為1:1.08(見表4),表明現階段天津市作為工業城市,至外圍二產崗位的通勤量大于至雙城三產崗位的通勤量。

表4 雙城通勤方向分析Tab.4 Commuting directions in twin cities of Tianjin
根據天津市軌道交通近期建設規劃[13],天津市中心城區在已建的軌道交通1號、2號、3號、9號線及即將通車的軌道交通5號、6號線基礎上,將建設軌道交通4號、7號、8號、11號線,濱海新區將建設軌道交通B1線、市域軌道交通Z2及Z4線。
從通勤圈與軌道交通網絡的耦合關系看(見圖6),軌道交通覆蓋了外圍與雙城區之間通勤聯系較強的主要組團(通勤率>30%),但也存在不足。1)對部分強通勤聯系的組團覆蓋不足,如中心城區西側組團。2)市域軌道交通線路的建設時機與功能定位有待進一步研究,例如,南北向Z4線北側漢沽與濱海新區核心區通勤功能較弱,該段軌道交通線路建設時機有待商榷;東西向Z2線從雙城北側外圍通過,主要服務雙城間產業區的通勤,與雙城需要換乘才能進入城市中心區,不是一般市域軌道交通線路主要服務中心城區通勤的功能,其功能定位有待進一步研究。

圖6 雙城通勤圈與近期建設軌道交通網絡耦合關系Fig.6 Relationship between commuting loop and recently-constructed rail transit network in twin cities of Tianjin
從就業崗位密度分布可以清晰地看到雙城的CBD范圍。由于現階段濱海新區核心區CBD的能級較小,因此主要分析中心城區的CBD,其范圍見圖7。該CBD區域面積約10.4 km2,占通勤圈面積的0.5%;居住人口約34.5萬人,占通勤圈居住人口的4.0%,其中通勤居住人口約18萬人;就業崗位約46.5萬個,占通勤圈就業崗位的8.9%??傮w來看,CBD能級偏小,其聚集效應必須進一步強化,因此從發揮CBD效應的角度看現階段仍然需要集聚而不是分散。

圖7 中心城區就業崗位密度與CBD范圍Fig.7 Employment density and scope of CBD in urban central area
從CBD職住分布看,CBD居住人員主要在CBD及周圍緊鄰區域工作(見圖8a),這一比例約為61.2%;CBD就業人員主要在外環線以內居住(見圖8b),CBD的輻射范圍較小,其吸引外部就業人員約占CBD就業崗位的82.4%。

圖8 中心城區CBD職住分布關系Fig.8 Job-housing distribution in CBD
從CBD就業人口居住地分布與近期放射性的軌道交通線路的耦合關系看,軌道交通網絡對CBD的支撐作用有待加強。主要表現在兩方面:1)部分主要通勤走廊缺少軌道交通覆蓋,或沒有覆蓋到主要方向(見圖9a中紅色箭頭示意走廊);2)部分軌道交通線路站間距偏大,導致CBD軌道交通車站500 m覆蓋范圍不足,僅為70%左右(見圖9b)。

圖9 中心城區CBD與近期放射性軌道交通線網耦合關系Fig.9 Relationship between CBD and radial rail transit network
空間聯系分為人流和物流的空間聯系。人流的空間聯系可以分為通勤出行聯系和非通勤出行聯系。通過手機信令數據得到工作地與居住地分布,可以分析人流的通勤出行聯系強度。
從圖10可以看出:1)通勤出行總體圍繞雙核展開,雙核間通勤聯系總體不大;2)相鄰區域間通勤聯系較強;3)中心城區CBD對外輻射出行特征明顯。

圖10 通勤出行聯系強度Fig.10 Degree of commuting travel connecting
從中心城區軌道交通5號線與6號線的組合環線與通勤出行耦合關系看(見圖11),軌道交通環線與CBD外圍的通勤出行環較吻合,環線位置的選擇基本合理,但組合環的布局模式值得商榷。組合環占據了4條放射線位置,而這4條放射線走廊有3條與CBD有較強的聯系(分別為M6北、M6南、M5南),因此,通過這3條走廊前往CBD的軌道交通乘客至少需要換乘1次。由于重要的放射性走廊是非常寶貴的通道資源,站在乘客出行的角度分析,天津市中心城區軌道交通組合環線的布設模式值得商榷,采用完整環線模式相對更合理。

圖11 中心城區軌道交通環線與通勤出行耦合關系Fig.11 Relationship between loop lines of rail transit in urban central area and commuting travel
天津市現狀及近期建設軌道交通網絡與城市現狀空間結構耦合度一般,有較大改善空間。1)通勤圈層面,軌道交通網絡對部分強通勤聯系的外圍組團覆蓋不足,濱海新區部分市域軌道交通線路的建設時機與功能定位有待進一步研究;2)CBD層面,部分主要通勤走廊缺少軌道交通覆蓋,或沒有覆蓋到主要方向,CBD軌道交通車站500 m覆蓋范圍僅70%左右,覆蓋不足;3)通勤出行聯系強度層面,中心城區組合環線的布設模式值得商榷。
上述結論主要依據現有的職住分布特征及城市空間結構與軌道交通網絡的耦合關系,但軌道交通建設對城市用地和空間布局有很強的引導作用,隨著軌道交通網絡的完善,城市空間結構也將相應改變。因此,建議定期開展基于手機信令數據的城市空間結構與軌道交通網絡耦合關系的評估工作,為軌道交通線網建設及城市空間結構調整及時提供科學依據。