李明,楊小寶,環梅,董苓
(北京交通大學交通運輸學院,北京 100044)
城市購物出發時間的非參數生存分析
李明,楊小寶,環梅,董苓
(北京交通大學交通運輸學院,北京 100044)
根據濟南市2011年的出行數據,研究了該市城市購物出發時間的分布特性。采用生存分析方法,建立城市購物出發時間的持續時間模型。運用非參數方法,對購物出發的持續時間進行估計,討論了城市購物出行的時間分布和家庭社會經濟屬性變量對購物出發時間的影響。結果表明,總體樣本的5.4%在7:00之前出發購物,69.7%在7:00~10:00出發購物,在10:00之后出發購物的少于24.9%。性別、年齡和家庭中兒童的數量對購物出發時間的選擇有著顯著的影響。女性比男性購物出發早,老年人更易在非高峰期進行購物出行,沒有兒童的家庭購物出行在時間上更加靈活。本研究為購物出行的定量研究提供了準確、有效的分析工具,也對通過動態價格機制控制交通擁堵有重要意義。
城市購物出發時間;連續時間模型;非參數生存分析
在城市發展過程中,交通系統和城市發展相互影響,相互制約。而個人的出行選擇對城市交通有非常重要的影響,對個體出行行為的研究,是進行城市交通規劃、建設和管理的一項不可缺少的基礎工作[1]。研究個人出行的目的是為了改善個人出行計劃和提出有效的交通管理措施。根據基于活動的出行理論,出行可以看作為到達活動空間的必要方式,這意味著出行時間的重要性[2]。因此,在構造與出行有關的模型時,活動的出發時間是一個重要的因素。
現有對出行的研究主要集中在對通勤者的研究方面,通勤者的出發時間一般是在一天中的高峰擁堵時段。通勤出行是城市居民最基本和最重要的出行,影響到城市生活的方方面面,特別是早、晚高峰通勤時段的交通擁堵,已成為城市交通最為突出的問題之一,并制約著城市社會和經濟的進一步發展。然而,目前對非通勤者出行研究較少,由于非通勤出行在城市出行中所占比重越來越大,且非通勤出行比通勤出行時間上更加靈活,這意味著社會人口學變量的變化和交通控制措施對非通勤出行時間的影響要多于不太靈活的通勤出行,所以有必要對非通勤者出行進行深入研究。以前的研究多采用logit離散模型,將時間分成若干時段[3-6],這樣的方法雖具有一定的科學性,但是將出發時間作為離散的變量,而不是連續的變量。另外,當劃分時間的方法不同時,就會出現不同的結果,很難對交通狀況做出正確的評價。
在眾多非通勤出行活動中,購物出行是一個重要的出行目的。本文主要對非通勤出行人群中的購物人群的出發時間進行研究。基于濟南市2011年工作日一天中居民出行的調查數據,主要探討了購物出發時間的整體分布特征,利用生存分析方法,構造了購物出發時間的選擇模型,并從變量的顯著性檢驗方面,討論并分析了對購物出發時間有顯著影響的社會經濟屬性變量。本研究將為制定擁擠收費、錯時上班等交通需求管理措施,提供重要的參考依據。
1.1 生存分析風險模型
生存分析(survival analysis)是一種根據實驗或調查數據,將事件的結果(終點事件)和出現這一結果所經歷的時間結合起來分析的一種統計分析方法,也稱之為風險模型或持續模型(hazard model/duration model)[7]。目前生存分析已廣泛應用于生物工程、社會科學等多個領域,近年來也逐步被運用到城市交通研究中,部分學者運用生存分析方法研究了交通事故的清理時間[8]、基于活動的出行行為[9]以及機非混行的通行時間[10]等問題。
廣義的生存時間指生物體存活的時間,或所關心的某種現象的持續時間。城市購物出發時間指從凌晨開始,一直到出發去購物為止的持續時間[11],屬于廣義生存時間范疇,可運用生存分析方法來對其進行研究。設T是非負的隨機變量,表示的是從凌晨到出發去購物的持續時間。令f(t)表示T的概率密度函數,則T的分布函數為

生存函數S(t),也叫累積生存率,表示生存時間大于t的概率。表達式為

本研究中,由于沒有刪失觀測值,生存函數可用在時刻t之前仍沒有出去購物的人數占總樣本的比例來估計,即

生存分析中,T的風險函數也叫危險率函數,指事件在持續到t時刻時沒有結束,但在接下來的一段很小的時間Δt內結束的概率。用公式表示如下

在本文中,風險函數指在時刻t之前沒有出去購物,但在接下來的一段很小的時間Δt內出去購物的概率,可用下式來估計

其中N[t,t+Δt]表示在區間[t,t+Δt]內出發購物的人數;Nbefor[t]表示在t時刻前未出發購物的人數。
風險函數與密度函數和生存函數之間有如下關系

持續時間模型用風險函數和生存函數來描述事件的持續發展過程。從式(6)可知,風險函數是生存函數變化率的相反數,反映了事件持續過程的時間變化規律。
1.2 估計生存函數的非參數方法
生存分析通常采用生存函數、風險函數來描述,估計生存函數的方法有參數方法和非參數方法。當生存時間所服從的理論分布已知時用參數方法。當生存時間所服從的理論分布的類型未知時,非參數方法比參數方法有較高的效率,對數據的分布沒有特殊的要求。參數模型的一個缺點是當參數形式不正確的時候,估計的風險函數也不正確。非參數模型的一個優點是不論資料是什么樣的分布形式,只需要根據樣本提供的順序統計量對生存率進行估計。本研究中,我們采用非參數法,即Kaplan-Meier乘積限方法,來估計購物出發時間的生存函數。以城市購物出行行為為研究對象,假定共有n個出發時間樣本,這些樣本的出發時間共有k(k≤n)個不同的取值,由于沒有刪失數據,直接將它們從小到大排序t1<t2<…<tk。令dj為tj-1到tj時段內出發去購物的樣本數,nj為各時刻初未去購物的樣本數。生存函數S(t)的乘積限估計可用下式表示


2.1 數據的提取和變量的定義
本研究以濟南市2011年居民出行調查數據庫為數據來源,調查的是一個工作日,一天中(0:00~20:00)的活動,調查包括家庭中所有成員的出行日志。出行日志包括出行的目的、出行的方式、出發的時刻、出發地、到達地、出行方式、所居住小區的性質等。另外,調查還包括個人和家庭的社會經濟屬性變量,如年齡、性別、月交通支出、月收入和職業類型等。
文章重點分析城市購物出行的出發時間,樣本來自1 246個外出購物者。表1提供的是購物出發相關變量及其定義。

表1 變量的定義及取值Table 1 Definition and value of the variables
2.2 購物出發時間的總體分布
運用1中介紹的生存函數非參數估計方法,可求出購物出發時間的生存函數及其風險函數。樣本的最早出發時間為2:00。表2給出了樣本的出發時間生存函數和風險函數的估計值,圖1則給出了生存函數和風險函數隨著購物出發時間的變化規律。

表2 購物出發時間的分析Table 2 Analysis of shopping departure time
由圖1a生存函數曲線可知,在7:00之前,生存率變化較平穩,占到總體樣本的5.4%,表明在此時段出去購物的人很少。在7:00~10:00之間生存率急劇下降,樣本占到總體的69.7%,說明購物人群中有近70%的比例選擇在這一時段內出發。在10:00之后變化較平穩,占到總體樣本的24.9%。由圖1b風險率函數可知,該函數不是單調的,在8:00~10:00之間出現購物高峰,加入購物的概率比較大。在10:00~16:00風險率較平穩,說明10:00沒有出去購物的人在這一時段內出去購物的可能性不大。在16:00之后,隨著時間的延長,風險率函數趨勢是上升的,說明在16:00前仍未去購物的人群,在這之后出去購物的可能性越來越大。

圖1 購物出發時間的生存函數和風險率函數曲線Fig.1 Survival and dangerous functions curves of shopping departure time
表3給出了樣本出行時間分布情況,T(min)表示0:00到出發去購物的持續時間。由表3可知,75%分位點為600 min(10:00),表明很大比例的購物人群是在10:00之前出去的。

表3 購物出發時間統計Table 3 Statistics of shopping departure time
2.3 變量的影響
除了購物出發時間的整體分布規律之外,各屬性變量對購物出發時間分布也有一定影響。本文運用生存分析的KM方法來分析各變量對購物出發時間的影響,通過生存分析中的非參數方法對各變量在不同取值下的生存率和風險率函數進行比較,可以得出各變量對出發時間選擇的影響。由于7:00~10:00的樣本占到總體的將近70%,本文將重點針對這一時間段內購物人群的出發時間及其影響因素進行分析,見圖2~4。

圖2 性別對購物出發時間的生存函數和風險函數的影響Fig.2 Impact of gender on survival and dangerous functions of shopping departure time

圖3 年齡對購物出發時間的生存函數和風險函數的影響Fig.3 Impact of age on survival and dangerous functions of shopping departure time

圖4 家庭中兒童數量對購物出發時間的生存函數和風險函數的影響Fig.4 Impact of children amount on survival and dangerous functions of shopping departure time
由圖2~4可以看出,性別、年齡和家中有無兒童對購物出發時間有顯著影響。從不同性別的生存函數曲線(圖2)可以看出,男性外出購物的生存函數一般比女性的低,這說明女性的購物出行活動總體比男性更多。另外,從風險函數曲線可以看出,男性外出購物的風險率變化較為平緩,說明男性在7:00~10:00之間購物出行的時間分布上比較均勻;而女性外出購物的風險函數的變化較為明顯,在8:50前后有個明顯的高峰值,對應的生存函數曲線上這一時段內生存率有急劇的下降趨勢(由50%迅速下降到20%),表明樣本中有近30%的女性選擇在8:50前后出發去購物。
從不同年齡段的生存曲線(圖3)可以看出,8:40之前,老年人外出購物的生存率曲線一般低于中青年,表明在這一時段內老年人出外購物的比例比中青年高,這可能與更多老年人有逛早市的習慣有關。此外,在7:40~8:50之間老年人外出購物的生存率曲線下降得很慢,表明在這一時段內老年人出外購物的比例非常低。從風險率曲線可以看出,中青年外出購物的曲線變化較為平緩,說明他們購物的出發時間分布更為均勻,而老年人外出購物的風險率函數中有幾個明顯的峰值,對應在生存率曲線上,老年人外出購物在7:40和8:50前后都有急劇的下降趨勢,表明老年人的購物活動大多會選擇在上班高峰期(7:40~8:50)之前或之后出行,以此避開上班高峰期。
家庭中兒童的數量也是影響購物出發時間的另一個重要因素。由圖4可以看出,有兒童的家庭要比沒有兒童的外出購物生存率要平穩,沒有兒童的家庭外出購物在7:40和8:50出現生存率急劇下降,表明沒有兒童的家庭在這兩個時點前后出外購物的比例較高,以此避開上班高峰期,他們在購物出行時間選擇上比有兒童的家庭更加靈活。家庭中有兒童的會在8:30左右出現第一個購物高峰,可能是由于這段時間內老人或家庭婦女帶領兒童出來購物的比較多。
本文通過非參數生存分析的方法分析了城市購物出發的時間分布,討論了購物出發時間隨出行者社會經濟屬性的連續分布規律,建立的出發時間的持續時間模型可以更好地分析購物出行的有效數據,為出行時間的定量研究提供了更準確有效的分析工具,對于準確把握居民購物出行行為有重要意義。利用模型得到的影響購物出發時間的顯著因素主要是個人和家庭屬性,而未考慮實時的道路狀況[12],今后應該對這方面做出更廣泛的估計,包括更廣泛的社會資源和爭議性的變量。
[1]雋志才,鮮于建川.基于持續時間模型的日出行時間分析[J].交通運輸系統工程與信息,2010,10(4):62-65.
[2]陳團生.通勤者出行行為特征與分析方法研究[D].北京:北京交通大學,2007.
[3]ARENTZE,TA,TIMMERMANS,H JP.A Learning based transportation oriented simulation system.[J].Transportation research part B:Methodological,2004,38(7):613-633.
[4]ETTEMA D,BASTIN F,POLAK J,et al.Modelling the joint choice of activity timing and duration[J].Transportation Research Part A,2007,41(9):827-841.
[5]ETTEMA D,ASHIRU O,POLAK JW.Modeling tim ing and duration of activities and trips in response to road-pricing policies[J].Transportation Research Record:Journal of the Transportation Research Board,2004,1894:1-10.
[6]LEE E T,WANG J.Statisticalmethods for survival data analysis[M].New York:John Wiley&Sons,Inc,2003.
[7]CHUNG Y.Development of an accident duration prediction model on the Korean Freeway Systems[J].Accident Analysis and Prevention,2010,42(1):282-289.
[8]van den BERG P,ARENTZE T,TIMMERMANSH.A latent class accelerated hazard model of social activity duration[J]. Transportation Research Part A:Policy and Practice,2012,46(1):12-21
[9]GUO H W,GAO Z Y,YANG X B,et al.Modeling travel time underthe influence of on-street parking[J].Journal of Transportation Engineering,2012,138(2):229-235.
[10]YANG X B,HUAN M,GUO H W,et al.Car travel time estimation near a bus stop with non-motorized vehicles[J]. International Journal of Computational Intelligence Systems,2011,4(6):1350-1357.
[11]BHATC R,STEED J L.A continuous-timemodel of departure time choice for urban shopping trips[J].Transportation research part B:Methodological,2002,36(3):207-224.
[12]GADDA S,KOCKELMAN KM,DAMIEN P,etal.Contimuous departure timemodels[J].Transportation Research Record:Journal of the Transportation Research Board,2009,2132:13-24.
Nonparametric survival analysis of departure time of urban shopping trips
LI Ming,YANG Xiao-bao,HUAN Mei,DONG Ling
(School of Transportation and Traffic,Beijing Jiaotong University,Beijing 100044,China)
We addressed distribution characteristic of departure time of urban shopping trips based on the travel data of Jinan in 2011.We established its duration model with survival analysis method.We also estimated the duration time of shopping trips with a nonparametric method.We further discussed the impacts of departure time distribution of shopping trips and individual social-demographic properties on departure time of urban shopping trips.Results show that 5.4% of the total samples depart for shopping before 7:00,69.7% between 7:00 and 10:00,and less than 24.9% after 10:00.Gender,age and children amount of a family have significant impacts on departure time:females are early than males in departure time;elders are easier to go shopping at non-peak hours;departure time is more flexible for a no-child family.Our results can provide an accurate and effec tive analysis tool for quantitative investigation of departure time of shopping trips and have guiding significance for the controlof traffic congestion through dynamic pricing mechanism.
departure time of urban shopping trips;continuous time model;nonparametric survival analysis
U491
A
1002-4026(2014)04-0085-07
10.3976/j.issn.1002-4026.2014.04.015
2013-11-01
國家重點基礎研究發展計劃(973計劃)(2012CB725400);國家自然科學基金(70901005;71071016;71131001)
李明(1990-),女,碩士,研究方向為智能交通工程。Email:12120965@bjtu.edu.cn