陳艷艷 張野 王子帆 錢漢強 宋程程



摘要:針對大城市職住分離日益嚴重的問題,以北京市為例,基于大數據分析城市重點功能區的出行和職住平衡特征。首先,利用手機信令數據提取用戶出行起訖點(OD),將獲取的出行信息集計到各交通小區,從時間、距離和時耗方面分析各功能區的出行特征,并通過職住地識別算法獲取用戶居住/工作地,引入居住/工作獨立性指數來衡量職住分離程度,結果顯示各功能區的職住分離度均大于50%。其次,結合興趣點(POI)數據對城市功能區基礎配套設施的密度與出行特征進行橫向對比,數據顯示回龍觀地區的交通配套設施較少,通勤出行距離和時間均最大。最后,針對以上問題提出具體改善建議,為調整城市空間結構、優化設施配置以更好滿足通勤出行需求及減少城市碳排放量提供參考。
關鍵詞:城市功能區;職住平衡;出行特征;手機信令
文章編號 1673-8985(2023)06-0025-08 中圖分類號 TU984 文獻標志碼 A
DOI 10.11982/j.supr.20230603
隨著經濟不斷發展,城市常住人口逐年增長。截至2019年底,北京市常住居民數達到2 154萬人[1],城市因此不斷向外擴張,從而加劇了城市居民的職住分離情況。長時間的通勤不僅降低居民生活的舒適度,更不利于城市的交通狀況。早晚通勤高峰的交通擁堵,既降低了出行效率,也導致交通碳排放量增加,加劇了城市環境污染。因此,挖掘城市內居民的出行規律、分析城市的職住平衡問題并合理調整城市職住地的空間布局逐漸成為學者研究的熱點問題。職住平衡有助于提高城市發展的可持續性,減少能源消耗和碳排放,提升居民的生活質量,減少交通事故和通勤壓力。
當前各大城市逐步轉向精細化城市功能分區發展,城市通常存在典型的商業、工業、居住和混合功能區[2]。這些功能區聚集了城市中大部分人口,維持城市運轉。將研究聚焦在功能區有助于提供更精確的分析,了解各區域的職住平衡情況和出行模式,從而幫助規劃和管理者更好地掌握每個區域的需求,以制定具有針對性的政策和規劃,更好地滿足各個區域的職住與出行需求,解決其職住平衡問題。
國內外許多學者對城市居民出行特征和職住平衡開展大量研究,且所利用的數據源也越來越豐富。傳統的數據源通常來自居民出行調查問卷。針對城市職住平衡問題,Cervero[3]492,[4]針對舊金山地區展開研究,首先提出職住平衡的城市發展模式能減少交通出行。對于國內城市的職住平衡研究,Zhao等[5]利用問卷調查數據分析了北京市在轉型時期的職住平衡對城市通勤模式的影響,結果表明在控制其他因素的前提下,職住平衡與人們的通勤時間有著顯著的統計相關性。晉澤倩等[6]以出行問卷調查所獲得的位置數據為基礎,識別居民的出行停留點,從而挖掘北京市經濟技術開發區企事業員工通勤出行的特征及規律。
隨著信息技術的發展以及位置服務數據的多樣化,越來越多的研究開始嘗試利用多源數據分析城市的職住平衡與通勤出行之間的關系。張小佳等[7]提出最小覆蓋圓時空聚類算法用于識別GPS軌跡的停駐點,為研究職住與出行模式奠定了基礎。李淑慶等[8]基于公交IC卡與GPS數據,從公交乘客的視角出發,提取并分析重慶市居民的通勤特征參數。張天然等[9]通過居民出行調查、人口普查、百度大數據等多源數據,對上海市新城等居民工作就業地分布及通勤特征進行研究。Long等[10]20利用公交IC卡數據識別北京的職住分布和通勤模式,并以北京出行調查數據對研究結果進行驗證。Li等[11]利用公交刷卡和互聯網定位數據分析城市地鐵站點周邊的職住與通勤出行關系;趙桐等[12]結合微博大數據與POI數據識別流動人口的職住分布,并利用Getis-Ord Gi*的空間分析手段挖掘其空間聚集模式。
隨著移動通信技術的進步以及智能手機的普及,手機信令數據以其樣本量大、覆蓋范圍廣、成本低、時效性強、連續性好等優點[13-15],成為熱門的研究數據來源,出現將手機信令數據與其他多源數據相結合分析的方法。鄒偉等[16]基于手機信令數據對張江科學城的職住進行識別并探討其問題因素與應對策略。程小云等[17]基于手機信令數據、軌道交通刷卡數據、軌道線網等多源數據,以空間交互視角開展西安市中心城區職住分布與軌道交通網絡的影響關系及耦合效應分析。Wang等[18]以手機信令數據識別職住人口并結合人口普查與統計數據,提出基于重力模型的通勤連接強度指數,探究區域間的實際通勤關系。周新剛等[19]基于手機信令數據,針對職住關系測度及職住平衡能否緩解通勤交通壓力,以深圳、上海兩個城市為例,研究得出尺度效應對上述兩個問題均會產生影響;甘田等[20]利用手機信令數據提取重慶市的職住信息,以各個交通小區和小區之間的通勤流量構建網絡,分析城市職住空間分布和通勤出行特征。楊郎等[21]利用手機信令數據,分別從職住獨立性、職住密度、通勤比例和距離4個方面研究廣州市的職住空間特征。
綜上所述,當前關于職住平衡與出行模式的研究主要以城市整體或公共交通樞紐為單位展開,但是以當前各城市逐步形成的功能分區為單位的研究還較為欠缺,且對于北京這樣的千萬級人口城市,職住空間的形成往往受到勞動力市場、房地產市場及政策引導等多種因素影響[22],難以實現整體的職住平衡。因此本文在分析北京市整體職住分布的基礎上,選取北京市重點功能區,基于手機信令數據采用出行和居民職住地識別算法提取功能區內居民和工作者的出行職住信息,從出行OD、距離、時間和時耗的角度分析功能區的通勤出行特征,采用職住獨立性來衡量功能區的職住平衡,并輔以城市POI數據來對比出行與職住特征和城市配套設施分布之間的關系。為調整城市空間結構和設施配置以實現區域職住平衡、更好地滿足通勤出行需求提供參考。
1 研究數據
本文將以手機信令數據為基礎,并結合POI數據進行后續通勤出行及職住平衡特征研究。
1.1 手機信令數據
本文所使用數據為北京市域范圍內中國移動通信集團有限公司的手機信令數據,數據采集時間為2019年11月21日—2019年12月21日,總數據記錄數約10億條,覆蓋約2 700萬名手機用戶,其中北京市用戶約1 540萬人,占北京市常住人口的71.5%。數據包含的主要字段內容和含義如表1所示。
通信運營商采集此種手機數據時采用的是CELL-ID定位法,即數據中的經緯度是用戶使用手機進行通信業務或者連接互聯網操作時所連基站的經緯度。以基站的位置代替手機用戶的位置會存在一定的誤差,當城市內部基站布設密度較高時,誤差可減少至100—200 m,對城市區縣級別的分析研究造成的影響較小。北京市各區內的基站數量、密度和空間核密度如圖1、圖2所示。可以看出,中心城6區的基站密度較高,其中西城區基站密度最大,達到71個/km?。郊區因面積大且人口密度較低,所以基站密度低,但對分析跨區出行的影響較小。
1.2 POI數據
POI數據包括購物場所、辦公場所等地理實體的名稱、類別和空間位置信息,具有定位精度高、信息量大、數據來源與覆蓋面廣等優勢。以POI數據為基礎,通過空間數據分析對城市重點功能區布局進行研究,對研究城市各區域間出行及職住平衡具有重大意義。本文采用北京市2019年的POI數據對城市功能區的配套設施展開分析。數據包括餐飲、住宅、生活服務、交通服務在內的13類POI數據,總計93.2萬余條,各類數據數量及占比如表2所示。
2 研究方法
在對手機信令數據進行預處理基礎上,提出居民出行OD以及職住識別算法,并基于識別結果,提出職住平衡度計算模型。
2.1 數據預處理
由于無線信號在強度、傳輸等方面存在不穩定性,通信系統中產生的手機信令數據存在無效數據、重復數據、乒乓數據等噪聲數據。具體描述如下:
(1)無效數據:數據中某一個或幾個字段為空。這類數據無法準確記錄研究所需的信息(如時空信息或用戶信息)。
(2)重復數據:數據庫中存在各個字段均相同的完全重復數據。除此之外,某些信令事件會在短時間(數秒)內產生多條除Timestamp外其他字段均相同的數據。
(3)乒乓數據:由乒乓切換產生的數據。切換是指手機在通信過程中為了保證通信的穩定性與連續性而將鏈路從信號較弱的基站轉移至信號較強的基站的過程,乒乓切換是指手機在短時間內頻繁在鄰近的基站間來回切換的現象。
(4)漂移數據:GSM通信系統中存在信號漂移現象,即手機的通信鏈路會從鄰近的基站切換至位置較遠的基站,并在短時間后重新切換至鄰近的基站。由這種信號漂移現象產生的數據即為漂移數據。
上述噪聲數據不僅會影響研究結果的精度與準確性,而且會增加數據處理的工作量與復雜度,因此需要通過預處理的方法過濾噪聲數據。對重復數據通過LAC與TIMESTAMP字段進行篩選,保留其中一條數據;對于乒乓數據與漂移數據,則需根據數據的時間與位置信息,對時間閾值 與距離閾值 進行判別,對不符合相應判別準則的數據進行剔除。
2.2 OD提取算法
居民的出行由移動過程和兩端的停留點組成[10]26-27,利用手機數據的定位點在二維平面上抽象表示一次完整的出行過程(見圖3)。出行OD算法的關鍵在于計算居民某一時間段出行的所有起訖點,也就是出行停留點。移動通信數據顯示,人們會在某些地點停留較長時間,如工作單位、家、購物商場、樞紐、學校等,這些點成為停留點。通過確定手機用戶的出行停留點,并將停留點匹配至具體的交通小區,便可得到用戶的出行OD和出行特征。
本文采用“時間—空間”雙層聚類算法識別用戶出行停留點。該算法分為兩個階段:第一階段采用空間聚類方法,使用DBSCAN算法;第二階段在第一階段結果的基礎上,進行時間層聚類,最終精準識別出用戶停留點,進而得到用戶的出行OD。具體步驟如下(見圖4):(1)提取特定區域相關用戶所有軌跡數據;(2)遍歷各用戶的所有軌跡數據并作為數據輸入;(3)確定DBSCAN算法參數,停留點最小點數MinP,停留點判別最小距離MinR;(4)DBSCAN模型計算輸出各用戶的停留點;(5)將停留點按時間序列進行排序,并計算各簇的停留時長;(6)判定各簇的停留時長是否大于時間閾值;(7)識別出停留點,輸出停留點集合,并連接出行OD。
在本算法中,需要對DBSCAN算法中的最小點數MinP和最小距離MinR,以及時間聚類中時間閾值進行調參并校驗。參照北京市綜合交通調查中的出行特征[23],確定本文中MinP為2,MinR為500 m,時間閾值為30 min。
2.3 職住識別算法
本文所討論的工作范疇為有較固定的地點且工作時間為白天的工作,因當前這類工作占主要部分,且這類工作者每天的上下班構成城市中大部分的通勤出行。在工作日白天,工作者去往工作地點,且在工作時間內基本停留在一處;在工作日夜間,工作者基本居家休息。基于以上特點,時間閾值法在此類研究中較為常用,將居民每天白天(夜間)停留時間超過閾值時間且一個月內出現次數大于閾值次數的停留點作為居民的工作(居住)地,具體識別規則如下:
(1)白天時段規定為8:00—20:00,夜間時段規定為20:00—次日8:00,各為12 h。
(2)在白天時段內,用戶在停留點A停留時間超過x1個小時,一個月的周期內,停留點符合此規則的天數超過y1天即識別A點為用戶的工作地。
(3)在夜間時段內,用戶在停留點B停留時間超過x2個小時,一個月的周期內,停留點符合此規則的天數超過y2天即識別B點為用戶的居住地。
本文在對不同停留天數及停留時長的累計頻率進行分析后,確定x1,x2分別為6.8 h和7.7 h,y1,y2均為12 d。
2.4 職住平衡度模型
傳統研究中大多利用職住比來測度職住平衡,即區域內的工作人口與居住人口的比值,通常比值在0.8—1.2則表明該區域的職住人口較平衡[3]494。但此方法更多的是從數量上來衡量區域的職住平衡,具有一定局限性。即便某區域的職住人口大致相同,并不一定表示區內的居住人口在該區域就業,即可能存在大部分的跨區上班人口,所以該指標不能實質性地反映職住平衡狀況。本文采用自足度指標來衡量區域的職住分布情況。
自足度通常用“獨立指數”來測量,即某區域內居住人口本地就業或就業者中本地居住者的占比,本文分為居住獨立指數和就業獨立指數,如公式(1)所示,二者比值越高,則表明該區域的自足性越高。獨立指數更適合進行深入的職住關系研究,尤其是在區域層面,該方法可以較好地反映某區域的職住一體化水平。
3 實例分析
基于手機信令數據分析北京市居住人口和工作人口,并與北京市統計年報數據常住人口數進行標定擴樣得到,北京市居住人口約2 150萬人,工作人口約1 240萬人,北京市居住人口密度、工作人口密度及職住比分布如圖5所示。
可以發現,部分區域存在職住人口數量兩極分化、職住比嚴重失衡的情況。為保證研究準確性和代表性,筆者結合區域用地規劃及相關研究[24-26],最終選取8個重點區域,分別為回龍觀、國貿、中關村、三里屯、天通苑、金融街、上地、望京。表3中顯示8個重點區域的職住比,結合區域功能定位與區域獨立職住情況,筆者將其分為典型居住區、商務就業區、高新就業區、混合區4種類型。
3.1 功能區基本情況
首先,基于各功能區的實際地理位置,確定其所包含的交通小區及研究范圍,各個功能區的區位如圖6所示。其次,根據區域類型、位置、職住情況結合后續獨立指數分析,從中選取4個區域作為本文的典型案例。在典型居住區中,筆者選取職住比與獨立指數更低且人口規模更大的回龍觀區域;在商務就業區中,國貿區域相比金融街區域職住比更低,但二者獨立指數相當,且國貿區域的人口規模更大,因此選取國貿區域;在高新就業區中,筆者選取人口規模更大且獨立指數更低的中關村區域;在混合區中,望京區域相比三里屯區域更接近職住平衡,為發現研究問題故選取三里屯區域。
各功能區的基本信息如表4所示。可以看出,回龍觀區域覆蓋面積最大,位于北京市五環外,單位面積居住人口和工作崗位相差較大,為典型的居住區;國貿、中關村和三里屯位于北京市中央城區,其中國貿和中觀村區域覆蓋面積較小,但擁有較多的工作崗位,為典型的工作區。三里屯區域為北京的娛樂商業區域,因此工作崗位數較居住區相比較多,居住人口較少。
3.2 出行特征
3.2.1 出行OD
通過出行OD識別算法,得到各功能區的出行OD分布(見圖7)。對比4個功能區可以看出,國貿地區出行輻射范圍最大,主要在六環以內,并且沿東西方向有著明顯的出行通道,正好與北京軌交6號線的走向契合。中關村區域的出行輻射范圍最小,主要在周邊區域,其中強度較大的出行方向為東北方向的互聯網公司科技園區,多為上班族的通勤出行。回龍觀地區與海淀區中關村科技園區出行聯系強度較高,反映出中關村附近的高新產業就業者部分居住在回龍觀居住區。
3.2.2 出行時間
根據識別得到的用戶出行信息,得出各功能區通勤出行時間在全天的分布情況(見圖8)。可以看出,回龍觀區域屬于典型的居住區,早上出發集中在6:00—7:00和9:00—10:00,晚上到達集中在18:00—20:00和21:00—22:00;國貿區域屬于典型的工作區,早上到達高度集中在9:00—10:00,晚上離開集中在17:00—19:00間;中關村區域屬于典型的工作區,早上到達高度集中在9:00—10:00,晚上離開集中在18:00—19:00間;三里屯區域功能較混合,早上到達集中在9:00—10:00,大部分為三里屯區域的就業者,同時,因該區域夜間休閑娛樂出行較多,造成晚間的出發和到達較為分散。
3.2.3 出行時耗
根據識別得到的用戶出行信息,得出各個功能區通勤出行時耗的分布情況(見圖9)。回龍觀區域平均出行時耗為50.46 min;國貿區域平均出行時耗為46.06 min;中關村區域平均出行時耗為46.26 min;三里屯區域平均出行時耗為44.33 min。
3.2.4 出行距離
根據識別得到的用戶出行信息,得出各功能區通勤出行距離的分布情況(見圖10)。考慮到根據定位點計算的距離為歐式距離,實際道路距離應大于直線距離,參考《城市道路交通規劃設計規范GB50220-955》中棋盤式路網形態的綜合非直線數取值,本文取北京市的道路非直線系數為1.3。回龍觀區域平均出行距離為12.14 km;國貿區域平均出行距離為11.54 km;中關村區域平均出行距離為11.21 km;三里屯區域平均出行距離為10.04 km。
3.3 職住平衡特征
根據職住地識別算法,得到手機用戶的居住和工作所屬地,集合所有用戶信息,計算各功能區的工作/居住獨立指數(見圖11)。國貿地區的工作獨立指數最高,而居住獨立指數極低,說明該區域的工作人員大部分住在區外,職住平衡度較低,印證了該地區為典型的工作區,區內居住人口大部分為白領或高端商務人士,區內工作占比較高;中關村地區也存在同樣的問題,工作人口職住分離問題嚴重。回龍觀地區的居住獨立指數較高,為典型的居住區,但仍然存在較為嚴重的職住分離情況;三里屯為混合功能區,工作和居住獨立指數較其他區域為中等水平。
結合北京市POI數據,進一步得到各功能區中各類城市配套設施的密度和平均通勤時間、距離(見圖12)。將主要功能區的職住出行與各類基礎設施配置情況進行橫向對比分析,可以發現位于北京市中心的區域交通類與生活類設施都相對完善;回龍觀區域作為典型居住區,除配有藥店、學校等居民需求較大的生活類設施外,其余各類公共設施密度較低,區域通勤距離和時間相對較長;國貿區域作為北京的商務中心區,交通類設施最為完善,便于就業人群的通勤出行;中關村區域作為高新區域,占地面積雖小,但區域內各類設施密度都相對較高;三里屯區域作為混合區,生活類設施完善,其中餐飲密度最高,區域通勤距離和時間相對較短。
4 結語
本文基于手機信令數據挖掘北京市重點功能區的職住分布及出行特征,并結合POI數據探究重點功能區的配套設施與職住關系的匹配情況,得到以下結論。
(1)通過對比各重點功能區職住出行特征的指標數據可發現,北京市各功能區職住分離情況較為嚴重。在空間布局上,核心區和中心地區承擔了北京市重要的就業職能,以國貿區域為代表的典型工作區的工作人口遠大于居住人口,且其工作人口的居住地分散廣泛,大部分遠離區域中心,使得居住—就業空間錯位現象越發明顯;而城市邊緣區域則承擔了北京市主要的居住功能,以回龍觀區域為代表的典型居住區的居住人口遠大于工作人口,且其居住人口的工作地遠離區域中心,對居住者和就業者的通勤時間影響顯著。
(2)各重點功能區內部工作/居住獨立指數不高,理想中功能區內部的職住平衡基本很難達到,應通過政策引導加強不同功能區域間的相互聯系,構建區域間通勤走廊,緩解北京市向心通勤帶來的交通擁堵,同時優化出行環境,降低碳排放量。
(3)重點改善區域交通基礎設施,提高區域內公共交通覆蓋率,提升區域內公共交通的服務能力與服務水平,將有助于提高通勤效率、優化出行結構,從而促進綠色出行。
由于本文尚未充分討論北京市不同重點功能區之間的相互聯系,以及區域配套設施與職住平衡和出行模式之間的關系,這些內容還需要在今后研究中進一步加以探討。