潘義勇,蔣冠宇,高 翔 PAN Yiyong,JIANG Guanyu,GAO Xiang
(南京林業大學 汽車與交通工程學院,江蘇 南京 210037)
出行方式選擇行為研究對于交通需求預測、政策編制和綜合運輸體系規劃具有重要作用。大學生寒暑假返程出行需求規模大且時空分布不均勻,現有出行方式選擇行為研究鮮有考慮潛變量對大學生返程出行影響的相關研究。因此深入研究大學生返程出行選擇行為,對于緩解大學生返程出行路網壓力和相關交通需求管理政策制定意義重大。
國內外相關學者對于出行方式選擇行為進行了大量研究。McFadden微觀經濟學中提出的離散選擇模型(Discrete Choice Model,DCM),DCM是基于效用最大化理論(Random Utility Maximization,RUM)基礎的非集計模型,該模型奠定了離散選擇行為研究的基礎。研究初期,學者多采用以Logit模型為代表的非集計模型對出行行為進行刻畫。Hennsher對傳統Logit模型進行了改進,并提出了巢式Logit(Nested Logit,NL)模型,巢式模型在處理影響因素具有較多相似特征時,具有更好的分類效果,隨后,Ben等人提出了目前國內外研究者普遍認可的基于隨機效用理論假設的多項式Logit模型,其中心思想是利用效用大小來表征不同出行方式對出行者選擇的吸引力,出行者會考慮采用最大效用最具吸引力的出行方式。在Logit模型的基礎上還發展了不同類型的Logit模型,如條件Logit、交叉巢式Logit(CNL)、混合Logit模型等。由于數據中普遍存在不可觀測的異質性,然而傳統多項Logit模型參數固定難以描述出行者異質性特征。欒鑫等人采用混合Logit模型對南京這類特大城市居民出行選擇機理進行分析。現有研究多針對居民的出行選擇進行建模,但對于大學生這一特殊群體,研究相對較少。且現有研究多采用傳統模型進行構建,多考慮可直接觀測的出行者外在特征及交通方式屬性來研究,較少考慮心理潛變量對出行方式選擇行為的影響。
針對以上問題,首先,采用陳述性偏好調查法(Stated Preference,SP)調查大學生個人屬性和出行方式屬性,使用顯示性偏好調查法(Revealed Preference,RP)調查大學生潛變量屬性;其次,對比分析二項Logit模型、不考慮個人因素的混合Logit模型、混合Logit模型;第三,對模型計算的參數和邊際效應進行分析;最后,總結本文研究成果以及進一步研究方向。
本文旨在使用混合Logit模型分析大學生出行者屬性、出行方式屬性、心理潛變量屬性對出行方式選擇的影響。傳統MNL模型認為出行者偏好是一致的,難以解析出行者之間的異質性。混合Logit模型(Mixed Logit,ML),也稱為隨機參數Logit模型(Random Parameter Logit,RPL),可以解決IIA假設對個體差異性在多項式Logit模型中的限制,混合Logit模型通過設定自變量系數的隨機參數分布形式,從而刻畫出決策者在進行選擇時具有的偏好差異性,隨機偏好差異在混合Logit模型中的效用方程如式(1):

式中:x為解釋變量;β則為偏好差異;(β|θ)是某種分布的概率密度函數,其值取決于總體參數θ。
隨機參數常見的分布有正態分布、均勻分布、對數正態分布等。若不存在偏好差異,那么模型就回歸到標準的Logit模型,其決策者的條件選擇概率為:

在存在偏好差異的情況下,β是一個隨機變化的參數,在原有的基礎上還需要乘上一個分布函數,故決策者的選擇概率則變為:

通過分析出行者出行行為影響因素相關文獻發現,大量國內外研究表明潛變量指標相較于傳統個人屬性和出行方式屬性,能更好地解釋交通參與者的出行方式選擇行為。因此本研究考慮大學生個人屬性、出行方式屬性和潛變量屬性對大學生返程出行方式選擇行為的影響,選用陳述性偏好調查法(Stated Preference,SP)調查大學生個人屬性和出行方式屬性,個人屬性和出行方式屬性的調查內容如表1所示。使用顯示性偏好調查法(Revealed Preference,RP)調查大學生潛變量屬性,結合本文研究目的,本研究僅針對大巴和高鐵兩種出行方式展開研究,潛變量屬性包含對出行方式可靠性評價和舒適性評價兩項。由于潛變量屬性無法直接觀測得到,需要用指標變量來表征,不同潛變量的指標變量均采用李克特五級量表法(Likert scale)進行表征,通常情況下,李克特量表比同樣長度量表具有更高的量表信度水平,常用于社會和心理變量等領域的測量,其中,1表示很不滿意,2表示不滿意,3表示一般,4表示滿意,5表示很滿意,具體見表2所示。

表1 大學生個人屬性與出行方式屬性

表2 表征潛變量的指標變量
采用正交設計法,從乘車時間(Time Dur)和車票價格(Price)三個方面設置了出行場景,上述兩個要素屬性進行了交叉組合,共設置了24個假設情景。為了避免受訪者填寫多種場景產生厭煩心理,且為滿足研究需要,每個調查者只針對4種假設情景進行選擇,將24個假設情景分別設置于6套問卷中,表3為假定場景示例。

表3 假設場景示例
調查采用線上與線下相結合的調查方法,共得到914份問卷。其中線下調研問卷共有347份,線上問卷共有567份。對問卷數據進行篩查剔除填寫時間過短和缺失數據的問卷樣本,得到有效問卷數為858份,有效率為93.9%,調查樣本量較大,可以用于模型構建。
根據調查發現,大學生訪者性別的分布較為均衡,在年齡方面,23~25歲大學生占問卷的主體;在年級方面,受訪人群主要集中于碩士研究生群體,占比達56.47%;在專業方面理學專業的比例最高;在每月生活費方面,75.61%的人群在3 000元之內;在購票費用方面,報銷的占比為39.22%;在家與學校距離方面,20%的受訪者在100km以內,24.31%在100~200km之間,35.29%在200~500km之間,距離在100km以內的人群較少,大部分出行距離處于100~500km以內的中長途出行。
本文利用SPSS Statistics25.0對各潛變量指標變量數據進行信度和效度檢驗。使用克朗巴哈系數進行信度檢驗,采用因子分析運用最大方差旋轉的主成分法提取因子進行效度檢驗,表4表示了數據信效度檢驗結果,克朗巴哈系數信度指標均大于0.7,且因子荷載和KMO效度指標均大于0.7,表明量表具有較好的可靠性和收斂效度。

表4 高鐵潛變量效度檢驗結果
由于后續需要采用驗證性因子分析對潛變量進行標定,數據需服從多元正態分布假定,因此,采用偏度和峰度指標對數據進行正態性檢驗,檢驗結果見表5所示。偏度系數絕對值<1,峰度系數絕對值<10時,可以認為數據符合正態分布。調查數據偏度系數絕對值<0.8,峰度系數絕對值<1.1,潛變量對應指標變量符合正態性分布假定。

表5 潛變量數據正態性檢驗結果
針對表2中設置的各潛變量的指標變量數據,選用驗證性因子分析(Confirmatory Factor Analysis,CFA)對心理潛變量指標進行標定,驗證性因子分析的擬合優度指標如表6所示,潛變量指標的擬合優度指標主要有(/、、、和),模型擬合優度指標均處于可接受范圍內,模型適配度良好,可以用于后續模型構建。

表6 模型適配指標結果
潛變量與對應指標變量的對應關系如表7所示,列出系數均為標準化后系數結果,系數均大于0.7,且系數顯著性位于1%顯著度水平,表明各指標變量可以用于表征潛變量[13]。

表7 模型求解結果
考慮混合Logit模型的概率函數存在非閉合性,即每個待估計參數均可選擇不同形式的概率密度分布,不能通過傳統的計算積分的方式進行求解,因此需要借助計算機模擬仿真求出近似解,本文選用Halton序列抽樣對混合Logit模型進行求解,設置Halton抽樣次數為1 000次,設置隨出行方式變化的出行方式屬性為隨機參數,假定參數服從正態分布,當不考慮個人屬性影響下,求解得到結果如表8所示。

表8 不考慮個人屬性影響的混合Logit模型回歸系數
表8結果表明對出行方式舒適性評價可以設置為隨機參數,為了減少個人屬性對隨機參數的影響,先將數據帶入二項Log-it模型進行標定,標定結果見表9所示。

表9 二項Logit模型參數估計結果
CHOICE表示隨出行方案變化的出行方式屬性的影響,BUS表示該模型是以大巴出行作為參照方案進行估計。從二項Logit模型的標定結果可知性別、專業和乘坐大巴頻率位于5%顯著度水平,故將性別、專業和乘坐大巴頻率帶入模型進行回歸,設置Halton抽樣次數為1 000次,得到最終混合Logit模型的回歸結果如表10所示。

表10 混合Logit模型回歸系數
混合Logit模型的對數似然值為-1 496,預測準確率為78.5%;傳統的二項Logit模型的對數似然值為-1 559,預測準確率為63.4%,混合Logit模型擬合優度指標高于傳統二項Logit模型。
由于混合Logit模型是離散選擇模型,屬于非線性模型,其模型系數估計值含義不同于反映解釋變量變動一個單位時因變量變化率的線性模型,因此其模型估計值不具備回歸意義上的變化含義。為了找出與傳統線性回歸模型系數估計值含義等價的指標,引入邊際效應分析,對模型參數進行解釋。邊際效應(Marginal Effect)表示某種方式每單位變量變化對其被選擇概率的影響,邊際效應分析結果如表11所示。

表11 模型邊際效應分析
根據表10回歸結果和表11邊際效應結果可知:
(1)出行方式舒適性評價的服從均值為0.089,標準差為0.343的正態分布,參數為正,即隨著對出行方式舒適性評價的提升,大學生出行者選擇某種方式出行的概率提升。通過計算得到(出行方式舒適性評價<0)的概率為39.74%,即隨著對出行方式舒適性評價的提升,39.74%的大學生返程出行者選擇某出行方式的概率越低,60.26%的大學生出行者選擇某出行方式的概率提高。
(2)乘車時間和車票價格的參數值為負,即隨著乘車時間、車票價格的提升,大學生返程出行者效用降低。對出行方式可靠性評價的參數值為正,意味隨著對出行方式可靠性評價的提升,大學生出行者出行效用得以提升。個人屬性方面,個人屬性中的性別參數為正,表明女性選擇高鐵出行的概率大于男性。專業參數為正,達到了5%顯著性水平,表明專業類別為理學、人文社科和工學專業相較于其他專業選擇高鐵出行的概率更高。乘坐大巴頻率參數為負,表示大巴出行頻率越高,選擇高鐵出行的概率越低,個人屬性部分與傳統二項Logit模型的回歸結果一致。
(3)乘車時間每增加1小時,選擇高鐵的概率降低10.02%,選擇大巴出行的概率提升19.17%。車票價格每增加一元,選擇高鐵的概率降低9.17%,選擇大巴出行的概率增加4.03%。對出行方式舒適性評價每增加一個單位,選擇高鐵出行的概率增加91.85%,選擇大巴出行的概率減少91.23%。對出行方式可靠性評價每增加一個單位,選擇高鐵的概率增加16.61%,選擇大巴出行的概率降低15.84%。
本文針對大學生返程作為研究場景,研究舒適性和可靠性評價對大學生返程出行選擇行為的影響,通過混合Logit模型的回歸結果,可以得出以下結論:
(1)加入潛變量指標能夠增強模型的解釋能力和預測精度,說明考慮心理潛變量指標的模型對于描述大學生返程出行方式選擇行為上更加合理,因此,交通運輸管理部門應當在考慮大學生個人屬性特征和對出行舒適性需求和可靠性需求等心理潛變量特征的基礎上,或從考慮行為學、心理學和大數據方法來對出行數據進行挖掘,分析大學生出行特質,進而制定更符合實際的大學生返程出行引導策略。
(2)當大學生返程出行者對于交通工具可靠性需求提升時,選擇高鐵出行的概率提升16.61%,大巴的出行概率降低15.85%。隨著大學生返程出行者對交通工具舒適性需求的提升,高鐵的出行概率提升,大巴的出行概率降低。說明大學生對于高鐵出行的可靠性和舒適性需求較為認同,需要進一步提升大巴可靠性和舒適性水平,形成大巴與高鐵協同分擔返程出行運力和共同競爭的運行環境。
(3)高鐵和大巴作為兩種相互競爭的出行方式,客流會相互替代轉移,目前大學生返程出行過程中女性出行者及理工科和人文社科學生更偏向于選擇高鐵出行,可以利用大巴的時間和價格優勢轉移一部分高鐵出行需求,大巴可以利用價格干預措施使得部分大學生出行者轉移回大巴出行,以引導大學生特別是出行高峰時段的出行壓力,以均衡交通出行需求的時空分布。