李 信,楊橋東,曾大堃
(西南交通大學 交通運輸與物流學院,四川成都 610031)
基于D-optimal試驗設計的公共交通出行logit模型
李 信,楊橋東,曾大堃
(西南交通大學 交通運輸與物流學院,四川成都 610031)
以成都到龍泉片區的交通通道為研究對象,假設通道開通地鐵的情況下,采用D-optimal試驗設計意愿調查問卷,選擇費用、時間等變量以及個人屬性作為效用變量,建立公共交通出行的多項logit模型,結合意愿調查數據對模型進行求解,分析通道中公共交通出行選擇行為,并預測成都到龍泉片區主要交通方式的客流分擔率。分析表明,地鐵將承擔通道中大部分的客流。
公共交通出行;D-optimal試驗設計;意愿調查;多項logit模型
離散選擇模型是描述人們選擇行為的模型,廣泛應用于具有選擇行為的社會各個方面,在交通工程界的應用主要有需求量預測、政策評價、交通服務效益評價等。離散選擇模型是基于效用函數最大化的假說,以Logit模型應用最為廣泛,假設效用函數的概率項服從二重指數分布。Logit模型中需要的數據主要采用意愿調查(Stated Preference,SP)得到,意愿調查獲取假設情景下出行者的偏好或者選擇結果[1-2]。意愿調查的問卷設計方法有多種,應用比較多的是正交設計法,但本文采用一種新的試驗設計方法——D-optimal試驗設計法進行問卷設計,該方法的本質是使模型的漸進協方差矩陣的行列式最小,本質是使模型參數的標準誤差最小,從而得到更可靠的參數估計結果,進而能夠更精確的分析出行者的出行偏好。
1.1 D-optimal試驗設計原理
D-optimal試驗設計的目的是使模型漸進協方差矩陣的行列式Derror最小,則模型參數估計的標準差也就越小,參數估計的精度就越高,確保所選屬性水平的組合方案能夠最大程度體現受調查者出行選擇時的偏好信息最大化[3]。
多項Logit(MNL)模型的對數似然函數L為
(1)
式中yni為列矩陣,選擇枝i在選擇情景中被回答者n選擇時,yni值為1,反之為0;Pni為選擇模型中選擇枝i被出行者n選擇的概率;I為選擇枝總數;N為出行者總數。
定義的選擇模型考慮一個特殊的選擇數據集,使式(1)最大化,得到參數的最大似然估計量。
漸進協方差矩陣Ω可以計算為Logit模型的對數似然函數L的海賽矩陣逆矩陣的負數[4-6]。海賽矩陣H中的元素計算式為

式中Xikn為選擇枝i中屬性k的值,該值不隨出行者n改變;βik為選擇枝i中屬性k的系數;K為試驗設計中需要標定的一般參數的總數量。
1.2 D-optimal試驗設計
1)定義選擇枝集合、選擇枝屬性以及屬性水平
假設成都地鐵2#線東沿線開通,成都到龍泉片區交通出行的選擇枝集合為:大巴、公交車、出租車、私家車、地鐵。利用SP調查問卷采集出行者從成都到龍泉片區的選擇偏好的數據。選擇枝屬性定義時,應選能夠有效反應選擇枝特性且不具有相關性的屬性。在定義選擇枝屬性水平時,每個屬性的水平個數不需要相等,屬性水平定義越多,在效用空間中能夠得到的信息量越大,但屬性水平的個數會影響試驗組合個數,因此,應適當選擇[7]。選擇枝屬性水平的選取應結合實際情況,適當增加和減少相應的比例,結合從成都到龍泉片區各種交通方式的實際出行時間,根據兩地距離和地鐵的運行速度計算出車內時間,最后確定選擇枝的屬性及屬性水平定義如表1所示。

表1 選擇枝屬性及屬性水平定義
注:到站時間,指從出發點到乘車站點的時間。

表2 選擇枝屬性預先值
2)計算參數的預先值
D-optimal試驗設計法需要先計算參數的預先值。調查問卷采用正交設計,采集192組觀測結果,利用采集的數據對MNL模型進行參數估計,參數估計結果為屬性參數的預先值,從而得到5個選擇枝中屬性參數的預先值,如表2所示。
3)設計試驗組合
根據表1定義的選擇枝屬性以及屬性水平,利用全因子設計法可以有648個試驗組合,把這648個試驗組合作為候選試驗組合。本文使 D-optimal試驗設計的試驗組合數為32個。根據D-optimal試驗設計的步驟,利用Matlab軟件編程,從具有648個組合的候選矩陣中任意挑選32個試驗組合,計算Derror,重復迭代,得出使Derror最小的32個試驗組合,該Derror為0.065。
同樣,為了減少被調查者的調查情景數,得到更可靠的調查數據,把32個組合隨機分成8塊,由8個被調查者來完成,每個被調查者完成4個組合情景,再加上個人屬性等問題的選擇,構成完整的問卷。試驗組合示例如表3所示。

表3 D-optimal試驗設計組合示例
2.1模型建立
Logit模型是基于隨機效用最大化理論的假設。根據效用最大化理論,出行者總是選擇具有最大出行效用的出行方式,出行者n選擇第i種出行方式的概率Pn(i)為
Pn(i)=P(Uni≥Unj),?j∈Cn,j≠i,
式中Uni為出行方式i對于出行者n的效用;Unj為出行方式j對于出行者n的效用;Cn為選擇枝集合。
效用Uni、Unj與出行方式的屬性和出行者本身屬性相關。隨機效用理論認為效用是一個隨機變量,并將效用函數U分為可以觀測的影響因素所構成的固定項(V)和不可觀測的影響因素所構成的隨機項(ε)兩大部分,并假設它們呈線性關系。因此交通方式i對出行者n的效用函數可以表示為
Uni=Vni+εni,
Vni=α+β1Xi1n+β2Xi2n+…+βkXikn+λ1Si1n+λ2Si2n+…+λmSimn,
(2)
式中α為選擇枝i的常數項;βk為每個選擇枝的效用中屬性k的權重,即選擇枝屬性的參數值;λm為每個選擇枝的效用中出行者屬性m的權重,即出行者屬性的參數值;Sinm為出行者n屬性m的值。
當εni服從相互獨立的Gumbel分布時,可以得出Multinomial logit(MNL)模型的一般式,logit模型中出行者n選擇第i種出行方式的概率[8]為

(3)
2.2數據分析
基于D-optimal試驗設計法的一份問卷包括32個選擇情景,每個被調查者完成4個選擇情景。在實際調查中不僅采集被調查者的年齡、收入、性別等個人信息,而且被調查者必須回答在不同的費用與出行時間組合情況下首選的交通方式。每份問卷包含多個完全獨立的情景,被調查者需要對其中調查內容做出回答。此次,調查對象為1 344人,男性占50.2%。樣本中擁有私家車的出行者占41%,樣本平均年齡為32.8歲,年齡的分布如圖1如示,其中男性和女性的平均年齡差距比較小,總體平均年齡分別是33.4歲和32.2歲。樣本總體月平均收入為3 788元,與成都市居民的月平均收入相差不大,樣本的收入分布比例如圖2所示。

圖1 總體樣本年齡分布圖

圖2 總體樣本收入分布圖
MNL模型效用參數的標定通過軟件NLOGIT 3.0實現。NLOGIT軟件可以實現多項式選擇數據的估測、模擬和分析,已經成為估計和模擬多項離散選擇模型的首要軟件。把調查的數據樣本數量1 344輸入標定軟件,NLOGIT軟件利用最大似然估計法得到模型參數的標定結果,如表4所示。由表4可得,似然函數值為1 004.118,擬含優度為0.37。

表4 MNL模型標定結果
注:性別、年齡、月收入分別為對應車型駕駛員的性別、年齡、月收入。
一般離散選擇模型的擬合優度為0.2~0.4時,代表模型的擬合度較好,所建模型的擬合優度為0.37,模型擬合度較好,說明所建模型正確。由表4可知,廣義變量“費用”、“到站時間”、“候車時間”、“車內時間”以及“下車到目的地時間”的參數值均為負值,表示費用越高,選擇該種交通方式的概率越小,出行時間越長,選擇該種交通方式的概率越小,與實際相符。
通過t檢驗值的絕對值判斷該參數值所對應的屬性是否能夠顯著影響出行者的選擇行為。通常,在5%置信度區間下,如果t檢驗的絕對值>1.96,則認為該屬性能夠顯著影響出行者的選擇行為,反之則認為該屬性對出行者的選擇行為不會造成顯著影響。根據模型結果,變量“費用”、“到站時間”、“車內時間”t檢驗的絕對值均>1.96,表明這3個屬性對出行者的選擇行為具有顯著影響。
精神衛生既是全球性的重大公共衛生問題,也是較為嚴重的社會問題。由于精神障礙患者病情波動的不可預見性,在預防控制精神障礙患者突發肇事肇禍事件上存在著相當困難,因此嚴重精神障礙應急處置就顯得異常重要。應急處置主要是通過有效的應急救援行動,盡可能地降低事故的后果,包括人員傷亡、財產損失和環境破壞等。在應急處置過程中,需要包括綜治、公安、衛生、街道、居委會、家屬等多部門的參與,各部門要分工明確,職責分明,流程順暢,應對及時;應急處置后還有可能需要民政、司法、殘聯等相關部門的后續支持,因此掌握嚴重精神障礙患者應急處置流程,明確各部門職責就顯得異常重要。
出行者的個人屬性也作為解釋變量進入模型,由表4可知,選擇枝大巴、公交車和地鐵對應變量“收入”的參數值均為負數,說明收入越高,選擇這幾種交通方式的概率越小。出租車對應變量“收入”的參數值為正數,表明收入越高,選擇出租車的概率就會越大?!笆欠駬碛兴郊臆嚒睂λ郊臆嚨氖褂糜兄@著地影響,擁有私家車的出行者在出行上非常依賴于私家車。
將表4的模型標定參數值代入式(2)可以得出5種出行方式對出行者的效用。
如:一年齡28歲的男性出行者,月收入5 600元,無私家車,針對表3中的第4種組合的出行方式,分別計算選擇5種出行方式的概率。
當出行者性別為男時,屬性值為1;性別為女時,屬性值為0;擁有私家車時,屬性值為1,否則為0;年齡為25~30歲時,屬性值為3;收入為4 000~6 000元時,屬性值為3。將表4中相應的數據代入式(2),計算大巴對該出行者的效用為
V1=3.328-0.028 9×10-0.108 9×20-0.020 9×15-0.034 2×40-0.031 7×15+0.351 6×1+0.036 9×3-0.292 6×3=-1.713 0.
同理計算出公交車、出租車、私家車、地鐵對該出行者的效用分別為:-1.249 8、-2.396 5、-1.946 1、1.628 9。

同理可計算出該出行者選擇公交車、出租車、私家車、地鐵的概率分別為:0.49,0.16,0.25,0.879。這樣,計算出每個選擇情景中出行者對每種交通方式的選擇概率,再計算每種交通方式選擇概率的平均值,得到通道中大巴、公交車、出租車、私家車、地鐵5種交通方式的客流分擔率分別為2.5%、22.6%、1.2%、25.6%、48.1%??梢姷罔F對旅客具有強大的吸引力,將承擔通道內大部分的客流。
基于D-optimal 試驗設計的公共交通logit模型的擬合優度為0.37,擬合優度較好,說明所建模型的正確性。模型求解結果表明:
1)費用、到站時間以及車內時間顯著影響出行者的出行行為,通過提高公交車的站點覆蓋率、縮短公交線路的非直線系數等手段來縮短出行者的到站時間和車內時間,可以提高公交車的選擇概率。
2)擁有私家車的出行者對私家車依賴度非常高,因此可以采用一些交通需求管理政策控制小汽車的出行量,以達到緩解交通擁擠的目的。
3)成都到龍泉片區地鐵建成后,成都到龍泉片區大巴、公交車、出租車、私家車、地鐵5種交通方式的客流分擔率分別為2.5%、22.6%、1.2%、25.6%、48.1%,地鐵將承擔成都到龍泉片區的大部分客流。
[1]趙鵬,藤原章正.SP調查方法在交通預測中的應用[J].北京交通大學學報,2000,24(6):29-32.
[2]焦朋朋,陸化普.基于意向調查數據的非集計模型研究[J].公路交通科技,2005,22(6):114-116.
[3]Michiel C J Bliemer, John M Rose. Experimental Design Influences on Stated Choice Outputs: An Empirical Study in Air Travel Choice[J].Transportation Research: Part A , 2011,45:63-79.
[4]John M Rose, Michiel C J Bliemer, David A Hensher, et al.Designing E Cient Stated Choice Experiments in the Presence of Reference Alternatives[J].Transportation Research: Part B,2008,42(4):395-406.
[5]Rose J M, Bliemer M C J, Hensher D A ,er al. Handbook of Transport Modelling[K].Oxford:Oxford University Press,2008:151-180.
[6]Kenneth Train, Wesley W Wilson. Estimation on Stated-Preference Experiments Constructed from Revealed-Preference Choices[J].Transportation Research: Part B, 2008,42(3): 191-203.
[7]David Alan Hensher, William Greene. Applied Choice Analysis [M].England:Cambridge University Press,2005.
[8]關宏志.非集計模型——交通行為分析的工具[M].北京:人民交通出版社,2004.
(責任編輯:楊秀紅)
ApplicationofD-OptimalDesignMethodforLogitModelConstructionofPublicTransportTravelBehavior
LIXin,YANGQiao-dong,ZENGDa-kun
(CollegeofTransportationandLogistics,SouthwestJiaotongUniversity,Chengdu610031,China)
A traffic corridor between Chengdu and Longquan district is selected to analyze the public transport travel behavior. Assuming that the subway is opened in the traffic corridor, the D-optimal design is adopted in the stated preference questionnaires. Then, such utility variables as time, cost, sex, age and income are selected to construct the multinomial Logit (MNL) model and the stated preference data are used to calibrate the Logit model to analyze peoples′ public transport behavior. Finally, the sharing rate of main traffic modes is forecast. As a result, the analysis shows that the subway will undertake the main part of passenger flow in the traffic corridor.
public transport travel behavior; D-optimal design;stated preference; multinomial logit model
2013-03-03
李 信(1990—),女,云南彌勒人,西南交通大學碩士研究生,主要研究方向為交通運輸規劃與管理、交通規劃與交通行為理論與實證.
10.3969/j.issn.1672-0032.2014.01.008
U491
A
1672-0032(2014)01-0033-06