陳 林,黃奕慧
(1.蜀道投資集團有限責任公司,四川 成都 610000;2.西南交通大學交通與物流學院,四川 成都 610000)
研究意愿調查問卷的目的就是希望通過科學的實驗設計方法設計精細的選擇情景,獲取出行者意愿偏好數據,進而預測出行者的交通選擇行為。常用的實驗設計方法包括隨機部分因子設計法、正交設計法(Orthogonal Design,OD)以及D-efficient(D-e)設計法。隨機部分因子設計法是從全因子組合中隨機挑選部分實驗組合作為調查問卷內容,該方法能夠有效減少實驗組合數量,但是該方法無法避免選擇枝屬性之間存在相關性,一旦相關性達到一定程度將會導致模型參數估計誤差[1]。正交設計法以選擇枝屬性相互正交為準則挑選實驗組合,從而避免由于屬性間的相關性造成模型參數估計誤差。正交設計法由于受到正交性的約束,一旦選擇枝屬性與屬性水平設置過多,采用正交設計法得到的實驗組合數量也非常大,這樣造成調查工作量與投入非常大[1]。D-efficient設計法以Logit模型漸進協方差矩陣行列式值最小為目標反推實驗組合,該方法能夠降低模型參數估計的標準差,提高模型參數估計結果的顯著度[2-5]。這些實驗設計方法具有不同的理論基礎且各具優勢與不足,在實證研究中有著豐富的應用[6-9]。
理論上無論采用何種實驗設計方法,都能得到無偏的模型參數估計結果。事實上,基于不同實驗設計方法得到的模型參數結果存在一定程度的差異,尤其是在小樣本量情況下。一些學者推測造成此結果的原因是調查問卷存在含有主導項的選擇情景[10-13]。主導項是指選擇情景中存在某個選擇枝的屬性水平都優于其他選擇枝[5]。一旦選擇情景中存在明顯的主導項,主導項被選擇的概率將遠大于情景內的其他選擇枝,該情景將無法有效捕捉出行者決策過程中的意愿偏好信息,從而導致模型參數估計結果產生偏差[11-12]。采用效用均衡法檢測調查問卷中是否存在包含主導項的選擇情景,標定Nested Logit Trick(NLT)模型,對比分析不同效用均衡值的兩種實驗設計法對效用函數誤差項方差、尺度參數與參數估計結果的影響,進而證明是否由于主導項的存在引起誤差項方差變化,從而導致模型參數估計結果產生偏差。
效用均衡主要應用于經濟學領域,它要求調查問卷的選擇情景中每個選擇枝具備相似的效用或者選擇概率[14]。若選擇情景中存在主導項,則主導項被選擇的概率將遠大于情景內的其他選擇枝,那么該選擇情景的效用均衡值將較小。效用均衡值通常采用百分比作為衡量標準,某一選擇情景的效用均衡值的計算方式,如公式(1)所示[14]
(1)
式中:BS為選擇情景S的效用均衡值;J為選擇枝數量;PjS為選擇情景S中選擇枝j被選擇的概率。
若調查問卷中存在多個選擇情景,則全部選擇情景的效用均衡值如公式(2)所示。
(2)
式中:BS為選擇情景S的效用均衡值;s為選擇情景數量。
根據隨機效用理論,效用函數U分為可以觀測的固定項V和不可觀測的誤差項ε,并假設它們呈線性關系[1]。因此,交通方式i對出行者n的效用函數可以表示為
Uni=Vni+εni
(3)
Logit模型中,εni獨立同Gamble分布時,其概率分布函數和概率密度函數分別為
F(y)=exp[-exp(-λy)]
f(y)=λF(y)exp(-by)]
(4)
式中:λ>0為尺度參數,尺度參數λ的平方與誤差項方差D(ε)呈反比的關系,如公式(5)所示:
(5)
根據隨機效用理論,出行者n選擇交通方式i的選擇概率為
(6)
式中:Cn為選擇枝集合;Xnjk為選擇枝j中的屬性k;θk為未知參數;λ為尺度參數。
實證研究中,用極大似然函數法得到未知參數λθk的值,將λ標準化為1(即誤差項方差D(ε)=π2/6),從而得到θk的值。根據公式(5),尺度參數的平方與效用函數誤差項方差呈現倒數關系。如果誤差項方差發生變化,則尺度參數的大小也會發生變化,最終模型參數估計值λθk與真實值θk將存在顯著差異。
應用NLT模型,分析不同實驗設計法對誤差項方差、尺度參數與參數估計結果影響[1]。NLT模型與NL模型(Nested Logit,NL)模型的區別在于層次結構樹的劃分原理。NL模型將具有相關性的選擇枝劃分到同一個樹枝結構內,而NLT模型則可以按照研究者需要來劃分層次樹枝結構[1],本文將按照實驗設計方法的不同來劃分層次樹枝結構。
以成都市主城區與衛星城龍泉驛區之間的新增地鐵為研究背景,開展意愿調查獲取出行者在新增地鐵方式情況下交通方式選擇行為偏好。通道內的選擇枝集合包含地鐵、地面公交、出租車、私家車以及客運大巴;選擇枝屬性包括到站時間、候車時間、費用、車內時間以及下車到目的地時間。選擇枝屬性水平是在現狀水平的基礎上相應地增加或者減少相同比例得到[1],如表1所示。

表1 選擇枝屬性水平定義
按照表1所示的選擇枝屬性及屬性水平,得到全因子組合648個。采用正交設計法挑選屬性水平相互正交的組合,最終得到32個組合。正交實驗設計法受到正交性條件的限制,不能夠按照研究需要確定實驗組合數量。所以,將32個組合全部納入到意愿調查問卷中。為了減輕被調查者的工作量,采用分塊實驗設計法(Blocking Experiment)在保證正交性的前提下,將32個組合劃分為8組,一個被調查者隨機完成其中1組。最后,輔助以調查說明、填寫說明、選擇枝組合相關問題以及被調查者個人屬性,形成完整的正交意愿調查問卷。一式完整的調查問卷中包含了8份問卷。
D-efficient實驗設計法是以模型漸進協方差矩陣行列式值最小為目標,降低模型參數估計的標準差,獲得更加顯著的模型參數估計結果[5,10,11]。通常,模型漸進協方差矩陣行列式值采用D-error來表示,D-efficient設計法的數學推導式如下
D-error=det(Ω)1/K
(8)
式中:Ω為離散選擇模型的漸進協方差矩陣;K為模型參數估計個數。
漸進協方差矩陣等于費歇爾信息矩陣的逆矩陣,如公式(9)
Ω=I-1
(9)
式中:I為費歇爾信息矩陣。
費歇爾信息矩陣的計算方法,如下公式(10)所示
(10)
式中:L(x,β)為離散選擇模型的極大似然函數;Xnjk代表選擇枝j的第k個屬性;βjk代表選擇枝j的第k個屬性在效用函數中未知參數。
離散選擇模型的極大似然函數,如公式(11)所示
(11)
式中:yni表示決策者n的選擇結果;Pni表示決策者n的選擇選擇枝i的概率。
首先實施預調查采集數據,標定MNL模型,將參數標定結果作為D-efficient實驗設計法的參數預先值,如表2所示。得到預先值后,根據上述原理完成實驗組合設計。為了同正交設計法進行對比,將實驗組合數量設置為32個,最終得到D-error值最小情況下的32個組合方案。同樣,為了減輕被調查者的工作量,也采用分塊實驗設計法(Blocking Experiment)將32個組合劃分到8組,一個被調查者隨機完成其中1組。最后,將這些組合分別輔助以調查說明、填寫說明以及被調查者個人屬性問題,形成完整的D-efficient意愿調查問卷,一式完整的調查問卷中包含了8份問卷。

表2 選擇枝屬性參數預先值
所有的問卷調查都采用面對面訪問式的調查方式。調查獲取出行者在不同選擇情景下的偏好數據,同時被調查者還需要提供年齡、收入、性別等個人信息,最終分別得到1 272組有效數據。調查問卷通過設置了4個年齡區間來衡量調查樣本的年齡情況,同樣設置了5個收入區間來呈現被調查者的收入分布情況,每種問卷對應調查樣本的總體屬性統計情況如表3所示。根據表3可以看出,兩組調查樣本的總體特征基本符合該城市人口的總體特征,兩組調查樣本的總體特征之間不存在顯著差異,說明調查樣本的總體特征不會對模型參數估計結果存在顯著的影響。

表3 調查樣本總體特征表
NLT模型與MNL模型的參數標定結果如表4所示。模型參數結果符號正確且顯著,模型擬合度較好。對比兩組MNL模型結果發現,兩者存在明顯的差異,尤其是費用與到站時間等變量,表明不同實驗設計方法會導致參數估計偏差。

表4 不同實驗設計法的模型結果
NLT模型中按照實驗設計法的不同劃為兩個結構樹,如圖1所示。不同樹枝結構間選擇枝效用函數誤差項相互獨立,并且每個樹枝結構都有對應的IV參數(IV1,IV2)。IV參數與尺度參數的關系,如公式(12)所示
(12)

圖1 NLT模型的層次結構劃分
式中:λOD表示樹枝結構OD內Level1層的尺度參數;λi表示樹枝結構OD內Level2層的尺度參數。
為了驗證基于不同實驗設計法得到的模型結果中,效用函數誤差項方差是否存在顯著差異。將Level1層中的尺度參數標準化為1,即λOD=λD-e=1。如表4所示,NLT模型結果中IV值顯著(|T|=33.7>1.96),表明基于兩種實驗設計法的尺度參數存在顯著差異。
根據公式(12)計算得到Level2中尺度參數(λi,λj)的值分別為1與1.14。同時,利用公式(1)、(2)以及(5)計算得到兩組調查問卷的效用均衡值以及誤差項方差,如表5所示。計算結果表明正交設計法與D-efficient設計法都沒有保持良好的效用均衡,即調查問卷中存在一些包含主導項的選擇情景。

表5 誤差項方差與尺度參數值
根據表5所示,相比于正交設計法,D-efficient設計法的效用均衡值(9.1%)更小,誤差項方差更小,尺度參數值更大。表明D-efficient調查問卷中含有主導項的選擇情景數量更多,導致其效用均衡值較小。由于主導項的存在,選擇情景無法有效獲取被調查者決策過程中的意愿偏好信息,造成誤差項方差變小,尺度參數值變大,則模型參數估計值(λθk)與真實值(θk)之間的偏差更為顯著。
進一步對比了設計D-efficient調查問卷時采用的預先值與MNL模型結果,發現兩者間存在明顯的差異,表明D-efficient設計法的設計效能有所損失。認為造成D-efficient設計法參數估計偏差大于正交設計法的原因就在于較差的預先值,較差的預先值無法有效的避免選擇情景中出現主導項。
分別使用正交設計方法和D-efficient設計法設計了兩組出行意愿調查問卷,獲取出行者在通道內新增地鐵情況下的交通方式選擇偏好數據。利用效用均衡法分別計算兩組調查問卷的效用均衡值,定量化評估了調查問卷中是否含有主導項的選擇情景。根據NLT模型與MNL模型標定結果,對比分析了不同實驗設計法對誤差項方差、尺度參數以及模型參數估計結果的影響。
(1)通過效用均衡分析發現D-efficient調查問卷的效用均衡值(9.1%)小于正交設計法(11.9%),表明D-efficient調查問卷中存在主導項的選擇情景多于正交設計法。NLT模型結果則證實基于D-efficient設計法的效用函數誤差項方差比正交設計法小,尺度參數值則更大,模型參數估計值與真實值之間的偏差則更顯著。表明由于問卷中存在包含主導項的選擇情景,導致效用函數誤差項的方差較小,尺度參數值變大,模型參數估計值與真實值之間的偏差更為顯著。
(2)D-efficient調查問卷中存在較多包含主導項的選擇情景的原因在于較差的預先值,較差的預先值降低了D-efficient設計法的設計效能,無法有效避免選擇情景中主導項的存在。
(3)效用均衡在意愿調查問卷實驗設計過程將是非常重要的一個過程,它能夠有效降低參數估計結果的偏差。