陳先龍
出行者交通方式選擇行為特征是制定城市客運交通政策的先決條件之一。離散選擇模型是研究出行者交通方式選擇行為的基本方法,使用離散選擇模型對出行選擇的行為影響因素進行研究,研判城市客運出行方式結構,是城市交通規劃決策的有效手段和重要基礎。
運輸市場中出行者會選擇最適合自己的交通方式,同樣的,交通工具也會“選擇”最有能力的出行者。因此,出行者選擇交通方式的過程中除了會受到交通工具屬性的影響外,也會受到消費者本身的經濟能力、偏好等內在因素(個人屬性)的影響。由于交通方式選擇行為描述、預測精度會受到各種不同變量的影響,因而選擇一個恰當且解釋能力強的離散選擇模型是十分關鍵的問題。
國內外雖然有很多學者對離散選擇模型進行了不同層次的研究[1-14],但面對離散選擇理論體系眾多模型,如何從中選擇合適的模型以有效解決交通方式選擇行為預測問題仍然是困難的。有鑒于此,本研究針對交通方式選擇行為建模預測問題,對五種典型的離散選擇模型進行比較,研討選擇最佳離散選擇模型的依據,并提出選擇策略。
離散選擇理論起源于心理學與經濟學,1980年代以來它已成為選擇行為模型研究的基本手段,其核心為各選擇枝的效用函數。常見的效用函數的數學模型表達式如下:

式中,njU 為方案j帶給決策者n的效用;njV為可衡量效用;njε為誤差項(不可衡量效用),nγ′為決策者n的參數向量,njZ 為觀察到的變量;njx為決策者 n所具有的個體特性向量,njy為替選方案j所具有的特性向量。nN∈,N為決策者個體總量,jJ∈,J為可以選擇的方案數量。
個體選擇模型建模過程中假設消費者為理性的選擇者,則個人n選擇方案i的概率為:

式(2)中假定誤差項njε滿足獨立一致同分布假設(Independent and identically distributed, I.I.D)并服從如下第I型極值分布:

式中,ηnj為位置參數;λ為離散參數。
此分布的方差為 π2/6λ2。令λ=l、ηnj=0,則得MNL(Multinomial Logit Model)的選擇概率模型,這也是最簡單的離散選擇模型:

關于可衡量效用,一般多指定為參數的線性關系,亦即 Vni= βnxni+ α yni。 因此,個人 n選擇方案 i的概率可表示如下:

將式(5)經過簡單推導,可以得到式(6)。該數學式即為多項Logit模型的不相關替選方案獨立(Independence from Irrelevant Alternatives, I.I.A)特性:

(6)式的意義為,在全部方案集合中,決策者對于任意兩個替選方案選擇概率比值,僅與該兩替選方案效用有關,與其他替選方案之效用無關。
另一方面,如果假設個人n面對第i個方案作決策時不受其自身特性nix的影響,則上述多項 Logit模型(5)可以改寫成下式:

式(7)即條件 Logit模型,此模型的特點在于其所有的決策只取決于選擇方案所具有的特性(jy),而與決策者特性(nX)無關。估計時等于假設每一組選擇對于個人效用的影響都是相同的,所以不論有多少組選擇方案,需估計的參數值只有一組。若研究中方案較多,則適合利用條件Logit模型來建模,同時也方便其他模型與之比較。
MNL模型在實際應用中需滿足不相關替選方案獨立(I.I.A)特性。I.I.A特性意味著方案之間彼此獨立沒有關連,且二替選方案選擇概率的比值,僅與該兩替選方案效用有關,與其他替選方案效用無關。I.I.A特性來自于誤差項的I.I.D假設(誤差項概率分布滿足獨立、相同的第I型極值分布)。若存在著異質性與相似性問題,則 I.I.D條件不能保證,進而導致錯誤統計推斷。
除了I.I.A特性限制外,MNL模型應用時另外兩個較大缺陷是:不能處理隨機偏好差異;不能運用面板資料來從事未被觀察到的有序列相關因素的研究。MNL模型的優點為:型式封閉;參數估計便利。
部分學者認為就模型理論而言,此特性是完全合理的。如 McFadden(1975)[15]就認為 I.I.A的限制雖然使得某些應用 MNL的研究失去價值,但是I.I.A所造成的偏誤是來自研究對象而非理論本身。他認為在同質群體中,I.I.A 特性是成立的。Ben-Akiva(1985)[2]進一步指出,I.I.A雖然不適用于整個群體,但是I.I.A特性的確存在于同質群體,因此 I.I.A 特性的可信程度取決于模型考慮的群體異質性是否顯著。若群體異質性不顯著,則MNL 模型是最佳建模選擇。但也有部分學者認為I.I.A 假設不適當且不適用于一般情況。基于以上分歧,眾多學者在尋找其他更好的模型。
異質性與相似性問題與模型誤差項假設有直接關系。影響誤差項的因素有兩個方面:觀察樣本與替選方案。因此可以從樣本、替選方案兩個角度來考察異質性與相似性問題。從樣本的觀點來看異質性,其代表著決策者的方式選擇行為中對特定的交通方式有不同的看法,即個體間的品味有差異,或稱為“個體異質性”。個體異質性主要來自偏好異質與回應異質,前者包含個體社會經濟特性對于運輸方式選擇的可觀察及不可觀察的影響效果,后者則是個體對于運輸方式服務水平的評價差異,同樣存在可觀察及不可觀察的影響。
而所謂相似性,系指樣本間調查獲取過程中可能會因為空間或時間上的自相關(例如重復訪問同一受訪者或者抽樣對象間的樣本因區位相鄰之因素可能造成數據間自相關等)而造成其存在相似性的問題(Bhat,1998)[16]。這兩類難以完全避免的特性容易造成參數估計偏誤甚至高估特定因素影響。
至于從替選方案的觀點來考察異質性與相似性特性,則只需考核替選方案間是否滿足 I.I.A之特性即可。若方案間不獨立或不同質,則選擇方案之間會有相似與異質的問題產生,亦即所謂的“方案相似性”與“方案異質性”。
近三十年來,為克服異質性與相似性問題,眾多學者逐步發展出 NL(Nested logit model)模型、HEV(Heteroscedastic extreme value model)模型、MMNL(Mixed multinomial logit model)模型和MNP(Multinominal probit model)模型。
NL模型引入巢層的概念,將具有相似性的替選方案放在同一巢層中。其假設同巢層內的替選方案的誤差項為獨立且相同的第I型極值分布,而屬于不同巢層內的替選方案誤差項則不相同。這里以兩層巢式架構為例,假設模型中共M個巢,第m巢層中有Jm個方案且方案i為m巢層中方案之一,則方案i被決策者選中的概率為:

NL模型將具有相關性的替選方案置于同一獨立巢層中,并利用包容值代表這些方案的共同效用,再與其他獨立之替選方案構建模型,以達到各方案間相互獨立的效果。故此NL模型優點在于適合于解決部分替選方案存在相似性的情況。其不足也很明顯:一是須指定固定的巢層結構;二是無法處理所有隨機誤差項之間同時存在相關性的情況;三是需假定決策程序滿足連續性條件;四是須限定每個替選方案只能出現在一個巢中。
HEV模型由 Bhat(2001)[17]提出。該模型允許替選方案njε滿足獨立不一致第I型極值分布,即各替選方案擁有各自的方差,可能相同也可能不同,而不同方案間的協方差則為零。個人n選擇方案i的概率為

式中,Ψ (·)與 ψ (·)為第I型極值分布的累積分布函數與概率密度函數。C為選擇集合,
w=εniθi,θi為替選方案的異質性參數,反應出不確定性因素的程度,也就是不確定性因素的權重,不同的替選方案對整體效用會有不同程度的影響。θi越大則可觀測效用對選擇概率的單位變動量將趨緩。
HEV模型通過各替選方案誤差項的方差表達式中引入尺度因子而允許替選方案誤差項的方差不同(各自的方差可相同也可能不同),且不同方案間的協方差為零。HEV模型僅能處理方案間存在異質性的問題,若方案間同時存在相似性問題,則使用該模型將會造成大偏差。
Daganzo(1979)[18]提出若式(2)中,假設隨機誤差項服從正態分布,則可推導得到MNP模型。MNP模型允許隨機誤差項間彼此可以不完全獨立且不相同,能充分表現出決策者的實際選擇行為,為最一般化模型。MNP模型的數學表達式為:

式中, I (·)為指標函數, I(·)=1則表示決策者選擇了其中效用最大者,否則為0;φ(εn)為多元正態分布,,期望E ( εn) = 0,Ω為協方差矩陣。
模型(10)帶有復雜的積分項,當選擇集合超過四個方案時,參數求解較困難。
MNP模型則不會受到上述 MNL模型的三種限制,其可以處理異方差問題,可設定任何型式的誤差結構,亦可運用面板數據處理時間序列相關的誤差項。MNP模式唯一的限制是必須假設效用函數所有的誤差項均為正態分布。大部分的情況下,假設隨機項為正態分布是適當的,但某些情況下,假設為正態分布并不適合,且會導致違反常理的預測結果,最著名的例子就是價格變量的系數,應采用密度分布只出現在大于 0的一側的分布,如對數正態分布較為合理,但此種分布無法納入MNP模型中。除了此項限制之外,MNP模型參數求解較復雜。
MMNL 模型假定決策者的偏好應該不同,因此假設邊際效用服從某種分布,使得須對MNL模型的參數積分得到 MMNL的概率。決策者n選擇方案 i的概率表示如下:

式中,Lni(γ)是在特定參數向量下的多項Logit選擇概率:

而 g (γ)=g(γ θ)是概率密度函數,θ是深層參數向量,包括均值、方差或協方差等; Vni(γ)是可衡量效用。
如果將效用指定為線性組合,亦即 Vni( γ) = γ'Zni,則MMNL的選擇概率可表示如下:

MMNL模型的選擇概率取決于γ的分布形態。常見的分布形態是均勻分布、三角分布、正態分布、對數正態分布。在實證研究中 g (γ)究竟為何種分布,須由研究者探索之后認定。現有多數研究,如Hensher和 Greene(2002)[19]等均設定 g (γ)服從正態分布或對數正態分布。
MMNL模型的效用函數中除了可觀測部分的非隨機項以及誤差項外,還包括不可觀測部分的隨機項。而透過此隨機項可考慮方案間的相關性、異質性以及個體偏好異質性。MMNL可同時處理異質性與相似性問題,因此理論上MMNL模型假設最接近真實情況,其對于偏好行為解釋效果最佳。
若MMNL模型中效用設定為線性組合,則MNL為MMNL模型的特例。MMNL模型的優點在于:允許個體之間存在偏好差異性;可用來刻劃同一消費者不同出行間的相關性;可逼近任何其他隨機效用模型的估計結果。MMNL模型的缺點是計算過程繁雜,需要高速計算機估計參數;參數的分布未知需要特別制定,可能產生問題。
有必要說明的是,MNL、NL、HEV、MMNL、MNP模型參數估計方法不完全相同。MNL、NL、HEV模型參數一般采用極大似然法辨識得到。MMNL、MNP模型未知參數估計則必須采用極大模擬似然法。
以誤差項假設獨立與一致的二維觀點解析離散選擇模型,可將本文介紹的五種模型作如下分類,見表1。

表1 離散選擇模型的分類Tab.1 Discrete choice models’ classification
由上述分析可知,每種模型均有優缺點,若將其很好組合應用則在實踐中可能得到滿意結果。
這里使用悉尼與墨爾本之間的通勤出行者問卷調查數據[20]來對五種離散選擇模型進行研究。原數據源于對 210個通勤出行者從悉尼到墨爾本面對小汽車、火車、長途公共汽車、飛機四種交通方式的選擇行為調查,主要變量如下:①T——站點等待時間,小汽車交通方式為0(min);②S——車內時間(min);③G——廣義成本,等于車輛成本+車內時間×時間價值;④H——家庭收入。
待估計的效用函數表達式為:

對于任意j,εij服從相同的獨立分布,即Ⅰ型極值分布, Fε(εij) = e xp(? e xp(? εij)),其標準偏差為 π2/6。di,m是選擇交通方式i時交通方式m的二元變量。αm是交通方式m二元選擇變量的參數。 di,f是選擇交通方式i時航空交通方式的二元變量。
首先以小汽車出行方式為參照方案,建立 MNL模型,采用極大似然法估計參數可得全集合、受限制集合情況下的參數值(見表2)。(受限制集合是指剔除航空方式的集合)。
表 2數據是采用小汽車作為標準參照組計算得到的。由結算結果可知,因豪斯曼檢驗值HM=33.3363大于 χ02.05=9.488,說明模型 I.I.A 假設未通過檢驗,即意味著存在異質性與相似性的問題,需要建立其他模型研究選擇行為。

表2 MNL模型校估結果Tab.2 Result of MNL calibration
計算表明火車、公共汽車和小汽車均可作為標準參照組,但航空不能作為標準參照組,因它會導致參數不可辨識。
這里采用圖 1的樹狀 NL模型作為例子估計參數。

圖1 NL模型結構Fig.1 Nested logit model structure
檢驗NL模型估計結果可得到10.945>20.05χ=5.99,即拒絕I.I.A假設。從計算結果可知NL模型較之MNL模型能提高選擇行為的解釋能力。
方案之間可能存在異質性,這里嘗試將一尺度因子加入各替選方案的誤差項中,使得各替選方案的誤差項不再均等,而存有方案異質性的問題。在HEV模型中,需要至少固定一方案的尺度因子才可以估計其他參數的尺度因子,為了便于模型比較,此處假設小汽車為基礎方案,且其尺度參數值為1。其他參數的尺度因子估計值為:航空=0.2485,火車=0.2595,公共汽車=0.6065。Bhat的實證研究發現,HEV模式的解釋能力比NL模型及MNL模型好。本例計算結果表明(見表 3)HEV模型對選擇行為的解釋能力強于MNL模型但劣于NL模型。
MNP模型參數估計中固定小汽車參數值為0,得出的一組結果見表3。MNP模型對選擇行為的解釋能力并未增強,可能與假設有關,即某些效用函數的誤差項并不是正態分布。

表3 NL模型、HEV模型與MNP模型校估結果Tab.3 Model calibration results of NL,HEV and MNP
以前述全集合狀態下的MNL模型為基本型建立 MMNL模型。采用極大似然模擬估計方法得到參數見表4,分為獨立隨機參數與相關隨機參數兩種情況。研究采用 Halton序列并將抽樣數設定為125。

表4 MMNL模型校估結果Tab.4 Model calibration result of MMNL
總體而言,在本文所有模型中MMNL 模型解釋能力最好。
本文對常見離散選擇模型進行了比較研究,重點介紹它們各自的理論基礎并比較了它們的差異。通過算例研究得出一些具有價值的結論:
(1)與其他模型相比,MMNL模型可以大幅度提升模型解釋度,但應用中依然有參數分布不可隨意設定的缺陷。若能正確選擇參數的分布,該模型應是最優選擇。
(2)MNP模型必須設定效用函數所有的誤差項為正態分布的原生缺陷,導致實踐中MNP模型解釋能力可能不強。
(3)NL模型應用上需先確定決策者的行為架構,若決策程序無法確知,將使得選擇結構建立十分困難,而決策結構建立若有重大錯誤,對于模型結果影響甚大。此外,決策者的決策程序為連續性假設有時可能與事實不符。
[1] Train K. Discrete choice methods with simulation(2nd ed)[M]. Cambridge∶ Cambridge University Press, 2009∶ 388.
[2] Ben-Akiva M. E., Lerman S. R.. Discrete choice analysis ∶ theory and application to travel demand[M].Cambridge Mass.∶ MIT Press, 1985∶ 390.
[3] Lerman S. R. Discrete choice analysistheory and application to travel demand[M]. Cambridge Mass∶MIT Press, 1985∶ 390.
[4] Hensher D. A., Swait J. D., Louviere J. J. Stated choice methods ∶ analysis and applications[M].Cambridge UK∶ Cambridge University Press, 2000∶402.
[5] Greene W.H., Hensher D A. A latent class model for discrete choice analysis∶ contrasts with mixed logit[J].Transportation Research Part B∶ Methodological.2003, 37(8)∶ 681-698.
[6] Antoniou C., Matsoukis E., Roussi P. A Methodology for the Estimation of Value-of-Time Using State-of-the-Art Econometric Models[J]. Journal of Public Transportation, 2007, 10(3).
[7] Bhat C. R., Sidharthan R. A new approach to specify and estimate non-normally mixed multinomial probit models[J]. Transportation Research Part B∶Methodological, 2012, 46(7)∶ 817-833.
[8] Fosgerau M., Bierlaire M. A practical test for the choice of mixing distribution in discrete choice models[J]. Transportation Research Part B∶Methodological, 2007, 41(7)∶ 784-794.
[9] Bhat C. R., Castelar S. A unified mixed logit framework for modeling revealed and stated preferences∶ formulation and application to congestion pricing analysis in the San Francisco Bay area[J]. Transportation Research Part B∶Methodological, 2002, 36(7)∶ 593-616.
[10] Munger D., Ecuyer P. L., Bastin F, et al. Estimation of the mixed logit likelihood function by randomized quasi-Monte Carlo[J]. Transportation Research Part B∶Methodological, 2012, 46(2)∶ 305-320.
[11] Hess S., Bierlaire M. Polak J.. Estimation of value of travel-time savings using Mixed Logit models[J].Transportation Research Part A∶ Policy and Practice,2005, 39(3)∶ 221-236.
[12] Walker J., Ben-Akiva M. Generalized random utility model[J]. Mathematical Social Sciences, 2002, 43(3)∶303-343.
[13] 吳至中. 檢視住宅選擇行為中的異質性與相似性[D]. 臺南∶ 國立成功大學, 2005.
[14] 鮮于建川. 通勤者活動—— 出行選擇行為研究[D].上海∶ 上海交通大學, 2009.
[15] Mcfadden D., Domencich T. A. Urban travel demand ∶a behavioral analysis ∶ a Charles River Associates research study[M]. Amsterdam∶ North-Holland Pub.. Co., 1975∶ 215.
[16] Bhat C. R. Accommodating flexible substitution patterns in multi-dimensional choice modeling∶formulation and application to travel mode and departure time choice[J]. Transportation Research Part B∶ Methodological, 1998, 32(7)∶ 455-466.
[17] Bhat C. R.. Quasi-random maximum simulated likelihood estimation of the mixed multinomial logit model[J]. Transportation Research Part B∶Methodological, 2001, 35(7)∶ 677-693.
[18] Daganzo C. F. Multinomial Probit∶ The Theory and Its Application to Demand Forecasting[M]. New York∶Academic Press, 1979∶ 216.
[19] Hensher D. A, Greene W H. The Mixed Logit Model∶The State of Practice [R]. Sydney, 2002.
[20] Greene W. H. NLOGIT Version 5 Reference Guide[M]. New York∶ 2012∶ 650.