杜 洋,柴 彥 威,楊 家 文,梁 軍 輝,藍 建 航
(1.北京大學城市規劃與設計學院,北京 100871;2.北京大學城市與環境學院,北京 100871;3.北京師范大學地理學與遙感科學學院,北京 100875)
隨著交通規劃由注重設施建設向注重居民出行需求管理轉變[1],居民活動時空間特征受到學者的廣泛關注。現階段,居民自主選擇能力與移動性增加,個體能夠到達空間范圍在擴大[2,3],個體行為的日間差異[4]和彈性[5]越來越強;但是,個體行為所受到時空固定性制約從未減弱[6,7],Long等利用公交卡數據對于居民職住空間和通勤路徑的提取和分析支持了這一觀點[8];劉瑜等通過研究提出城市尺度的個體行為具有隨機部分(unforeseeable movements)和慣常部分(predetermined movements),并受到地理空間的影響[9]。一些學者提出,個體行為的規律性可由可預測性的概念進行定量測度,即居民未來行為可以被預測的可能性。可預測性越強說明居民行為越具有規律性,反之,則說明個體行為越具有物理學意義上的布朗運動特征[10]。這一概念的提出對于行為規律性的研究和行為研究在規劃中的應用起到了重要作用。
隨著定位技術、信息與通信技術 (ICT)的發展與廣泛應用,基于GPS、GSM等定位技術獲取的個體行為時空數據為基于個體的居民活動可預測性分析提供了新的契機。Song等基于美國手機信號塔數據(5 000樣本,30 d)進行個體活動可預測性分析,發現個體活動的可預測性普遍在93%以上[11,12];Lu等基于科特迪瓦手機信號塔數據(50 000樣本,120 d)研究得出理論上最大的個體活動的可預測性達到88%[13,14]。國內現階段開展了一些匯總層面上針對交通流量可預測性的研究[15,16],但是基于個體的居民活動可預測性研究尚缺乏相對完整的實證研究[17]。總結來看,國內外現階段的研究首先普遍存在數據精度不足的問題。不論是 Wi-fi數據還是手機信號塔數據,由于服務范圍較大的原因,空間精度相對較低;同時由于是被動收受數據,時間精度也不能得到保證。從研究視角看,國內現在尚處于匯總層面的可預測性研究,基于個體活動的非匯總層面的研究仍然空缺。
本研究關注個體活動的時空間可預測性,基于GPS手段收集居民一周真實時空路徑數據,利用信息熵算法分析北京城市居民日常活動的可預測性的大小。在此基礎上,結合居民的活動范圍,探究活動半徑是否會對可預測性產生影響;同時結合居民的活動規律,分析不同時間點居民活動可預測性的差異。
本研究以北京為案例城市,于2012年9-12月對北京市上地和清河兩個街道進行抽樣調查,采用位置感知設備、互動式調查網站及電話訪談相結合的辦法,通過居委會對兩個街道選取樣本,每個樣本調查時間為一周,調查內容包括居民、居民社會經濟屬性、一周活動日志及GPS軌跡(樣本活動的時空間坐標點是以3 min為間隔均勻獲取),最終獲得有效樣本709個。調查樣本中女性略多于男性,平均年齡34.6歲,85%以上居民具有高中以上學歷,就業比例為89.5%。從空間屬性看(圖1、表1),由于調查區范圍的限制,樣本居住地和市中心距離分布偏離標準正態分布。就業地和市中心距離分布符合標準正態分布,職住距離和活動半徑分布均符合泊松分布。
隨機選取單個樣本,對其一周出行軌跡進行可視化顯示(圖2),樣本周一、周二、周五、周六沿同一條路徑前往相同目的地,而周三、周四、周日又沿另一條相同路徑前往另一個相同的目的地。為了更好地理解樣本活動規律性的特征,將活動區域劃分為1 km*1 km的網格,運用網格計數法抽象樣本的活動過程(圖3)。結果顯示,樣本坐標點集中程度非常高,樣本趨向于在幾個特定的網格范圍內花費其大部分的時間。直觀看出,樣本活動具有顯著的規律性。
信息熵是為了解決對信息的量化度量問題,表征的是樣本在條件約束下,新增加一個坐標點所能提供給的信息量。如果樣本只在一個網格范圍內活動,那么這個樣本的活動位置是確定的,新增加一個坐標點提供的信息量是0 bit,熵值為0;相反,如果樣本在多網格范圍內活動,如26個網格,那么新增加一個坐標點,提供的信息量就是6 bits,熵值為6。熵值越大表示活動位置越混亂,不確定性也越大,可預測性也越低。本文定義3個熵值:
(1)隨機熵SrandI。SrandI表征不考慮樣本i在每個網格范圍內出現的時刻和出現的頻率(即樣本i在每個網格中出現的概率相同)的條件下,樣本i活動地點可預測性的大小。計算公式如下:
式中:Ni表示出現樣本i的軌跡點的網格個數。
式中:Ni表示出現樣本i的軌跡點的網格的個數,Pk表示軌跡點落入網格k中的概率。
(3)真實熵Sreali。Sreali表征同時考慮樣本i在每個網格中出現的時刻和出現的頻率(即樣本i坐標點真實的時空間序列,包括空間規律性和時間規律性)的條件下,樣本i活動地點可預測性的大小。為了實現這樣的考量,本文將樣本每天的軌跡以1 h為單位分段,假設Tj={X1,X2,…,Xm},代表樣本在j時段內的m個活動位置坐標點,則Sreali的計算公式如下:
式中:P(T′)表示樣本i在T′時段內軌跡點落入網格的概率分布。
信息熵是度量可預測性大小的一種方式,但是并不夠直觀。本文引入費諾不等式,對熵值進行處理。費諾不等式中,不確定性(即熵值Si)由兩部分組成:一部分指接收到坐標集后,是否產生錯誤的不確定性H(PFano),一部分指錯誤發生后,到底是哪個坐標造成錯誤的最大不確定性log2(Li-1)*(1-PFano),而其概率值P則表征不出現錯誤的最小可能性。假設,一個樣本i有Li個可供選擇的活動地點,對應熵值為Si,費諾不等式能夠幫助計算得出樣本可預測性的極限。其計算公式如下:
將代表樣本熵值引入費諾不等式所得計算結果可知:當不考慮樣本的時間規律性和空間規律性,而只考慮樣本活動的空間范圍(22 km2),那么樣本的可預測性只有5.3%;當考慮了樣本活動的空間規律性(每個網格中活動的頻率),則樣本的可預測性提升至78.64%;當既考慮了樣本的空間規律性,又考慮了樣本的時間規律性(活動點落入某個網格所處的時段),則樣本的可預測性高達94.68%。可以看出,時間規律性和空間規律性是個體活動模式的重要組成部分,二者引起個體活動可預測性的大幅提升。
基于以上對于3個熵值的定義,計算每個樣本在3種條件下的熵值,匯總得到全體樣本熵值概率密度分布圖(圖4),Srand分布較為分散,主要集中在3~5,比例為59.5%,峰值為4;Sunci分布比較分散,主要集中在1~3,比例為74.3%,峰值為2;Sreal的分布非常集中,分布在0~1的比例為91%,峰值為0.5。結果顯示,北京市居民一周的活動空間大小為16 km2左右,居民一小時內平均活動空間大小為1.41 km2。3個熵值的分布集中度遞進增強,熵值逐步縮小,說明隨著條件限制的增強,居民可預測性差異逐步縮小,同時可預測性大幅提升。
計算每個樣本在三種條件下對應的可預測性值,匯總得到全體樣本可預測性概率密度分布圖(圖5),Pmax分布非常集中,普遍大于0.8,88.2%的樣本取值大于0.9,11.5%的樣本取值處于0.8~0.9之間;Punc的分布最為分散,樣本取值相對均勻地分布在0.3~0.9之間;Prand則集中分布在取值較低的區間,93%的樣本取值分布在0~0.3之間。上述結果反映出,居民的日常活動存在顯著的空間規律性和時間規律性,如果忽視規律性的存在而僅僅考慮居民的活動范圍,則居民的活動空間是均質的,無法確定居民更有可能在哪個網格范圍內活動,可預測性非常低;當考慮了居民活動的空間規律性,也因此掌握了居民的空間偏好,可預測性大幅提升;當進一步考慮居民活動的時間規律性,可預測性就不再是基于居民整日的活動空間進行探討,而是基于某一時段內(1 h)居民的可達范圍進行探討,居民活動可預測性非常高。
為了研究可預測性與活動半徑之間的關系,這里用回轉半徑概念定義個體的活動半徑。回轉半徑定義活動半徑的優勢在于其具有較強的穩定性和有界性[18]。公式如下:

式中:rcm表示該個體在統計時段內所有軌跡點質心的所在位置;ri為各個軌跡點;nc(t)為在t時刻的軌跡點數量,上標a表示對個體a進行統計。
分析結果表明,樣本的活動半徑服從泊松分布,95%的樣本活動半徑分布在0~10 km以內。對活動半徑和可預測性二者進行顯著性檢驗,結果顯示兩者之間相關系數為0.95,在0.01水平上顯著相關。圖6是活動半徑與可預測性兩者之間的散點圖,可以看出,活動半徑小于10 km的樣本,可預測性與活動半徑之間相關性較強,可預測性普遍大于92%;活動半徑大于10 km的樣本,可預測性與活動半徑之間相關性較弱。
居民活動的可預測性在一日之內具有比較明顯的變化規律。本文以小時為單元,進行時間分段,計算每個時間段居民活動的可預測性,得到可預測性的日變化規律圖(圖7)。從圖7中可以看出,居民活動一日之內的可預測性呈現雙谷分布,兩個低谷分別出現在7:00-10:00和17:00-20:00,最低值(74%)出現在8:00-9:00,說明在這兩個時段內,居民受到的制約性較小,活動彈性較大,活動的規律性較低。兩個相對平穩的時段為10:00-17:00和23:00-6:00,可預測性分別維持在85%和接近100%的水平,居民日常活動中的工作和睡眠往往發生在這兩個時段內,因此可預測性相對較高也較為穩定。
本研究對709個樣本進行可預測性計算,并探討其規律性。結果顯示,居民活動行為具有很強的可預測性,活動半徑在10 km以內的居民移動行為可預測性普遍在92%以上;進一步分析發現,居民活動行為的可預測性與活動半徑存在顯著的相關關系;居民一日之內的活動行為可預測性具有明顯的時間節律,呈現雙波谷的變化特征。
從方法論看,本文基于時空間行為研究范疇內的個體活動慣常性與制約性,在非匯總層面對個體的活動特征進行討論。這一研究提供了一個更人本化、精細化的城市交通預測研究視角。研究結果表明:盡管居民的時空間活動是自發的和多變的,但事實上因為制約性和慣常性的存在,活動行為具有非常強的規律性和可預測性。基于這樣的認識,當本文涉及災害分析、城市規劃、交通管理、市政管理等領域的實踐時,精確地對居民時空間活動進行預測便具有科學的依據。
本研究仍存在一定的不足。方法上,將樣本的每一個坐標點當做一個孤立點看待,沒有考慮樣本活動時序特征對于可預測性的影響,即未將居民活動的時序規律性納入研究框架,下一步有待完善;研究內容上,本文只探討了居民活動可預測性的度量方式和現象規律,對于行為主體屬性以及導致這一現象背后的原因分析不足。下一階段,要結合居民的社會經濟屬性,探討不同類型人群所呈現的可預測性的規律性及背后的成因,為個性化的居民出行引導以及智慧化的城市規劃管理服務。
[1] JONES P,CLARKE M.The significance and measurement of variability in travel behavior[J].Transportation,1988,15:65-87.
[2] 郭文伯,張艷,柴彥威,等.基于GPS數據的城市郊區居民日常活動時空特征——以北京天通苑、亦莊為例[J].地域研究與開發,2013(6):159-164.
[3] 申悅,柴彥威.基于GPS數據的北京市郊區巨型社區居民日常活動空間[J].地理學報,2013(4):506-516.
[4] 申悅,柴彥威,郭文伯.北京郊區居民一周時空間行為的日間差異[J].地理研究,2013(4):701-710.
[5] 申悅,柴彥威.基于GPS數據的城市居民通勤彈性研究——以北京市郊區巨型社區為例[J].地理學報,2012(6):733-744.
[6] KWAN M-P.Interactive geovisualization of activity-travel patterns using three-dimensional geographical information sys-tems:A methodological exploration with a large data set[A].Transportation Research Part C[C].2000.185-203.
[7] SCHWANEN T,KWAN M-P,REN F.How fixed is fixed?Gendered rigidity of space-time constraints and geographies of everyday activities[A].Geoforum,2008.2109-2121.
[8] LONG Y,LIU X J,ZHOU J P,et al.Early birds,night owls,and tireless/recurring itinerants:An exploratory analysis of extreme transit behaviors in Beijing,China[J].Physics and Society,CoRR abs/1502.02056(2015).
[9] 柴彥威.時空間行為研究前沿[M].南京:東南大學出版社,2015.
[10] SONG C,QU Z,BLUMM N,et al.Limits of predictability in human mobility[J].Science,2010,327(5968):1018-1021.
[11] SONG C,KOREN T,WANG P,et al.Modelling the scaling properties of human mobility[J].Nature Physics,2010,6(10):818-823.
[12] LU X,WETTER E,BHARTI N,et al.Approaching the limit of predictability in human mobility[R].Scientific Reports,2013.3.
[13] LU X,BENGTSSON L,HOLME P.Predictability of population displacement after the 2010 Haiti earthquake[J].Proceedings of the National Academy of Sciences,2012,109(29):11576-11581.
[14] 王進,史其信.神經網絡模型在短期交通流預測領域應用綜述[J].河南科技大學學報(自然科學版),2005(2):22-26.
[15] 姜桂艷,常安德,牛世峰,等.基于BP神經網絡的交通數據序列動態可預測性分析方法[J].北京工業大學學報,2011(7):1019-1026.
[16] 姜桂艷,常安德,李琦,等.基于出租車GPS數據的路段平均速度估計模型[J].西南交通大學學報,2011(4):638-644.
[17] 劉瑜,肖昱,高松,等.基于位置感知設備的人類移動研究綜述[J].地理與地理信息科學,2011,27(4):8-13.
[18] 周濤,韓筱璞,閆小勇,等.人類行為時空特性的統計力學[J].電子科技大學學報,2013(4):481-540.