張 兵,黃娜娜,徐偉碩,折 欣,薛運強
(1.華東交通大學 交通運輸與物流學院,江西 南昌 330013 2. 同濟大學 道路與交通工程教育部重點實驗室,上海 201804;3.中國安全生產科學研究院,北京 100012)
昌吉贛客運通道為江西省南北向的重要運輸通道,連接省會南昌市、吉安市和贛州市。目前南昌至贛州的高速鐵路正在如火如荼地建設中,設計速度達350 km/h,預計于2020年建成通車。高鐵的開通將會對客運通道內其余客運方式客流分擔率有顯著的影響,尤其對公路客運班線帶來較大的沖擊。
目前國內外關于高速鐵路與其他運輸方式客流分擔率的研究比較成熟,其中以概率論為基礎的Logit模型應用最為廣泛,Park、陸化普、鄧衛、張戎等學者[1-4]以RP/SP組合調查方法設計調查問卷方案,選用不同指標建立Logit模型,預測高鐵或城鐵開通后客運體系中各客運方式分擔率的變化;王煒、王慈光、朱鴻國、朱順應等學者[5-8]探討了用不同方法與傳統Logit模型進行組合預測交通方式結構及旅客出行方式選擇行為;徐亞、王爽、陳喜春、欒琨等學者[9-12]對Logit模型中效用函數參數的標定方法做了較為詳細的研究。還有很多學者[13-17]對運輸通道尤其是客運通道進行了理論研究,目前的研究更側重于客運通道內各客運方式的協調發展。
通過對上述研究成果進行分析,一些文獻在進行效用函數中特性變量的選取時,未考慮這特性變量與實際問題的吻合情況,也較少考慮廣義費用中隨機項的標定。本研究以昌吉贛通道為例,根據旅客出行SP/RP調查數據分析該通道內的旅客出行行為和出行特征,采用MNL模型(Multinominal Logit Model)作為基礎模型,分析了各影響因素作為模型特性變量的適用性,選取了效用函數中固定項的線性函數形式和對數函數形式來進行模型效用函數的標定,最終通過模型檢驗確定一種最優的分擔率預測模型,該模型能夠充分地解釋和擬合調查樣本數據。
在昌吉贛高鐵建成之后,該客運通道內旅客的主要出行方式有高速鐵路、普速鐵路、公路班線以及航空班線,水運承擔的客運量很小,本研究將不再討論。昌吉贛通道全公共客運方式分類如圖1所示。

圖1 昌吉贛客運通道客運全出行方式Fig.1 Travel modes in Nanchang-Ji’an-Ganzhou passenger transport corridor
由于昌吉贛高鐵尚未開通,因此采用旅客出行行為SP/RP調查,在昌吉贛客運通道沿線對旅客出行選擇行為進行問卷調查以收集數據。調查地點包括沿線火車站、長途汽車站和昌北機場。共發放調查問卷450份,回收到調查問卷408份,回收率達到90.7%,并進行問卷整理,篩除掉漏填、錯填等無效問卷,最終確認有效問卷366份,有效率為81.3%。調查問卷的特性變量及其取值如表1所示。

表1 問卷調查設計表Tab.1 Questionnaire design table
根據問卷調查數據,得到的旅客意向出行方式與特性變量類別交叉統計結果,如表2所示。
(1)旅客年齡分布
選擇普速鐵路和公路客運的旅客年齡分布與總體旅客的年齡分布相似,26歲~40歲的旅客占比較大,40歲~50歲的旅客占比其次。
(2)旅客性別分布
在所有出行的旅客中,男性乘客數量較女性乘客多15%左右。
(3)旅客職業分布
選擇高速鐵路、普速鐵路和公路客運出行的旅客與總體旅客的職業分布具有明顯的一致性,所占比例最大的4類旅客依次是學生、個體從業人員、企業管理人員和工人。
(4)旅客收入分布
總體上,旅客的收入主要集中在4 000元/月~7 000 元/月區間,選擇普速鐵路和公路客運出行的旅客其收入分布與總體旅客收入分布較為一致,而選擇高鐵出行的旅客中中高收入的比例較低。通過分析調查數據可知,由于調查時正處于寒假期間,旅客中學生和返鄉工人占到了大多數,排除這一影響因素后,選擇高鐵出行旅客主要是中高收入人群,而且該人群所占比例遠大于總體旅客和選擇其他方式旅客所占比例。
(5)私家車數量分布
總體上,家庭私家車數量為1輛,2輛和3輛及以上的旅客分別占比41%,23%和10%,而家庭無私家車的旅客占比也達到27%。

表2 旅客意向出行方式與特性變量類別交叉統計表Tab.2 Cross statistics of passenger intended travel mode and characteristic variable categories
(6)費用來源
選擇不同出行方式的旅客費用來源情況大致相同,都是自費占較大比例,總體上自費的旅客大約占比84%,其中選擇公路客運的旅客自費占比最大,達到96%,而選擇航空客運出行的旅客自費占比最小,為67%。
MNL模型,是非集計模型中較為常用的模型,其具體表達形式如下:
(1)
式中,Pi為旅客選擇第i種出行方式的概率;Ui為第i種出行方式的效用值;n為運輸通道內可供旅客選擇的出行方式種類。
旅客選擇某種出行方式的效用因旅客自身特性、旅客出行特性以及該出行方式特性等因素決定,因此,效用值又由固定項和隨機項組成。
Ui=Vi+εi,
(2)
式中,Ui為第i種出行方式的效用值;Vi為由可觀測到的特性變量的固定項;εi為不能觀測到的其他因素影響及已有變量的偏差引起的隨機項。
MNL模型的固定項有以下幾種表示形式:
(1)線性函數形式
(3)
(2)對數函數形式
(4)
(3)CES(Constant Elasticity of Substitution)函數形式
(5)
考慮到CES函數對參數的計算十分復雜,本研究只選取了固定項的線性函數形式和對數函數形式來進行模型效用函數的標定,最終通過模型檢驗確定一種最優的分擔率預測模型,該模型能夠充分地解釋和擬合調查樣本數據。
特性變量的選擇直接影響到模型對實際問題的擬合精度以及分析實際問題的有效程度。因此,選出具有代表性的出行方式選擇影響因素作為變量對模型具有重大意義。下面結合旅客出行特征以及其他學者[18]選取的各種運輸方式的安全性、快速性、經濟性、舒適性、方便性等指標對相關影響因素的模型適用性進行分析。
(1)旅客年齡分布
選擇普速鐵路和公路客運的旅客年齡分布與總體旅客的年齡分布相似,26歲~40歲的旅客占比較大,40歲~50歲的旅客占比其次。因此,旅客的年齡分布應作為特性變量出現在效用函數中。
(2)旅客性別分布
在所有出行的旅客中,男性乘客數量較女性乘客多15%左右,旅客性別分布情況對其出行方式選擇的影響較小。
(3)旅客職業分布
根據調查結果,選擇高速鐵路、普速鐵路和公路客運出行的旅客與總體旅客的職業分布具有較為明顯的一致性,該指標對旅客出行方式選擇的影響較小。
(4)旅客收入
根據調查結果,旅客收入作為衡量旅客自身特性的重要指標,選擇普速鐵路和公路客運出行的旅客其收入分布與總體旅客收入分布較為一致,而選擇高鐵出行的旅客中中高收入的比例較大,其與旅客的出行方式選擇高度相關,因此,旅客收入應作為特性變量出現在效用函數中。
(5)私家車數量
根據調查結果,旅客家庭私家車數量的多少對于旅客城際間出行方式選擇的影響較小。
(6)費用來源
根據調查結果,旅客出行費用的來源很大程度上決定了旅客出行方式的選擇情況。費用來源應作為特性變量出現在效用函數中。
(7)安全性
安全性指標表征的是不同客運方式發生安全事故的概率情況,人們在出行時首先希望自己的人身及財產安全可以得到充分的保障。但是安全性指標一般由客運方式的事故率[19]來表征,其標定值只與這種客運方式有關,不隨起訖點而變化,因此安全性指標不宜出現在特性變量中。
(8)快速性
快速性指標以旅客選擇出行方式出行的總時間來衡量,主要包括旅途耗時和市內交通周轉耗時兩部分。本研究將不同運輸方式的快速性(出行時間)指標標定在效用函數中。
(6)
式中,Ti為旅途耗時;T′i為市內交通周轉耗時;Li為一種出行方式的旅行距離;Vi為一種出行方式的運行速度。
(9)經濟性
經濟性指標表征的是旅客選擇一種出行方式需要支付的費用,本研究采用票價來描述各出行方式的服務費用。本研究將不同運輸方式的經濟性(票價)指標標定在效用函數中。
Ei=pi×Li,
(7)
式中,pi為一種出行方式的單位運費;Li為一種出行方式的旅行里程。
(10)舒適性
舒適性指標是旅客在選擇出行方式并在交通工具中對車內環境、擁擠程度及客運服務等因素的綜合性概念,故舒適性指標的衡量尺度較難確定。文獻[9]采用旅客旅途后恢復疲勞所需時間來度量舒適性,其標定值不隨起訖點的變化而變化,因此,舒適性指標不宜作為特性變量出現在效用函數中。
(11)方便性
旅客的方便性感受很大程度上依賴于旅客等候時間及中轉效率,而其大多都依賴于運輸方式發車間隔的長短,因此本研究將不同運輸方式的發車間隔時間標定在效用函數中。
各特性變量的參數在一定程度上代表了旅客在選擇各種出行方式的時候給予它們的權重,這些參數須在大量的社會調查基礎上結合數學方法加以確定,常見的數學方法有層次分析法、回歸分析法、極大似然估計法等,本研究運用極大似然法估計特性變量的參數,具體步驟如下所示。
(1)設昌吉贛通道間旅客人數為N,則他們選擇出行方式的行為可視為進行N次獨立的貝努力試驗。N個出行者選擇第n種交通方式的人數分別為N1,N2,…,Nn,其概率可表示為:
(8)

(2)對似然函數Λ取對數,以便得到最大似然估計值,并對表達式進行化簡,化簡后的具體表達式為:
lnΛ=∑NilnPi。
(9)
(3)對lnΛ分別求α1,α2,…,α4的偏導數,并令偏導數為0,解方程組(10)可確定各參數。
(10)
模型估計的檢驗值由軟件估計所得的效用函數參數的t檢驗值和優度比來表征。
(1)當t檢驗值的絕對值大于1.96時,有95%的把握認為相應的變量是對選擇概率造成影響的因素,否則,應當將變量從影響因素中排除后再進行參數估計。
(2)優度比指標McFadden決定系數ρ2,其值位于0~1之間,越接近1表明模型的精度越高,一般情況下ρ2達到0.2~0.4之間就可以認為模型精度比較高了。
考慮到旅客出行時間指標與票價指標均與出行距離有關,這兩個指標可能會高度相關,因此,本研究在選擇上述特性變量的基礎上采取費用時間比(票價與出行時間的比值)來替代費用和出行時間這兩個指標。模型特性變量的標定與取值如表3所示。

表3 模型特性變量標定與編碼Tab.3 Model characteristic variable calibration and coding
根據以上旅客出行特征以及效用函數的線性和對數形式,確定了4種特性變量選取方案,最終通過模型檢驗確定一種最優的分擔率預測模型。
(1)選取年齡、收入、票價、費用來源、出行時間、發車間隔作為線性形式效用函數的特性變量,隨即項與固定項的變量取值結果如表4所示。

表4 第1種特征變量選取方案下的變量參數的標定與t檢驗Tab.4 Calibration and t test of variable parameters for 1st feature variable selection scheme
各變量的估計值均與理論情況相符合;固定項的t檢驗值絕對值均大于1.96,可以認為各檢驗指標均滿足精度要求;另外模型的整體優越程度指標McFadden決定系數ρ2的值為0.234 2,介于0.2與0.4之間,表明模型的精度可以接受。因此,可以選用上述變量作為線性形式效用函數的特性變量。
(2)選取年齡、收入、票價、費用來源、出行時間、發車間隔作為對數形式效用函數的特性變量,隨即項與固定項的變量取值結果如表5所示。

表5 第2種特征變量選取方案下的變量參數的標定與t檢驗Tab.5 Calibration and t test of variable parameters for 2nd feature variable selection scheme
特性變量的參數估計值中,票價的參數估計值大于0,表示票價與出行方式的效用值呈正相關關系,這與理論情況相違背,因此,不可選用上述變量作為對數形式效用函數的特性變量。
(3)選取年齡、收入、費用來源、費用時間比、發車間隔作為線性形式效用函數的特性變量,隨即項與固定項的變量取值結果如表6所示。
各變量的估計值均與理論情況相符合;固定項t的檢驗值絕對值均大于1.96,可以認為各檢驗指標均滿足精度要求;另外模型的McFadden決定系數ρ2的值為0.284 7,介于0.2與0.4之間,表明模型的精度可以接受。因此,可以選用上述變量作為線性形式效用函數的特性變量。
(4)選取年齡、收入、費用來源、費用時間比、發車間隔作為對數形式效用函數的特性變量,隨即項與固定項的變量取值結果如表7所示。

表6 第3種特征變量選取方案下的變量參數的標定與t檢驗Tab.6 Calibration and t test of variable parameters for 3rd feature varible selection scheme

表7 第4種特征變量選取方案下的變量參數的標定與t檢驗Tab.7 Calibration and t test of variable parameters for 4th feature varible selection scheme
各變量的估計值均與理論情況相符合;固定項的t檢驗值中,發車間隔的t檢驗值絕對值小于1.96,認為該檢驗指標不滿足精度要求。因此,不可選用上述變量作為對數形式效用函數的特性變量。
綜上所述,各特性變量選取方案的對比如表8所示。

表8 各方案對比Tab.8 Comparison of different schemes
可以看出,在可行的方案1和方案3中,方案1的極大似然函數估計值為-524.382 7,其值小于方案3的極大似然函數估計值-510.603 9,因此方案3較方案1更優。
本模型選取年齡、收入、費用來源、費用時間比、發車間隔作為線性形式效用函數的特性變量,因此,模型中效用函數表示為如下形式:
(11)

(12)
(13)
(14)

運用上述模型,以昌吉贛客運通道為例,對4種客運方式的客流分擔率進行預測,首先應明確各特性變量的取值。
對通過問卷調查得到的旅客年齡、收入和費用來源數據計算加權平均值,得到昌-贛區間的旅客年齡指標中,4種出行方式取值分別為-0.34,-0.78,-0.57和-1.00;旅客收入指標中,4種出行方式取值分別為0.72,0.29,0.20和3.00;費用來源指標中,4種出行方式取值分別為0.54,0.76,0.91和0.33。
費用時間比指標由運輸方式費用和出行時間的比值表示,其中高鐵、普鐵和公路班線客運的運價率分別取0.45元/km,0.16元/km和0.30元/km,南昌至贛州航空班線平均票價為200元;高鐵的運行速度可達250 km/h,市內交通耗時為0.70 h,普鐵平均運行速度為120 km/h,市內交通耗時為0.50 h,高速公路上客運班線的平均運行速度為80 km/h,市內交通耗時0.50 h,南昌至贛州航空班線的運行時間為1.00 h,市內交通耗時為1.00 h。
發車間隔指標可通過互聯網數據統計得到,公路班線客運的平均發車間隔取值如下:地級市之間為1.00 h,地級市到縣城為2.25 h,縣城之間為3.00 h;高鐵的平均發車間隔參考滬昆高鐵江西段情況取值如下:地級市之間為0.25 h,地級市到縣城為0.83 h,縣城之間為2.25 h;普速鐵路的平均發車間隔取值如下:地級市之間為0.50 h,地級市到縣城為2.50 h,縣城之間為4.00 h;另外航空客運班線的平均發班間隔取12.00 h。
下面以昌吉贛通道中南昌至吉安、吉安至贛州和南昌至贛州區間為例,對4種運輸方式的客流分擔率進行計算,結果如表9和圖2所示。

表9 客流分擔率計算表Tab.9 Passenger flow sharing rate calculation table

圖2 高鐵開通后客運通道內各出行方式分擔率Fig.2 Share rate of each travel mode after opening of high-speed railway
據此計算結果,在昌吉贛高鐵建成之后,該客運通道間將會有大量的旅客采用高速鐵路作為主要運輸方式,其中南昌至吉安、吉安至贛州和南昌至贛州區間內高速鐵路分擔率分別為73.74%,73.69%和73.78%,而公路班線客運的分擔率分別為7.65%,7.66%和7.34%。
本研究主要根據固定項特性變量的參數估計結果和分擔率的計算結果,分析變量參數的變化對分擔率可能造成的影響,并結合不同客運方式的服務范圍和自身運營特點,提出不同客運方式尤其是公路班線客運的運營改進策略。
(1)固定項特性變量的取值中,公路客運的運行時間、發車間隔的均值明顯高于高速鐵路和普速鐵路,僅票價指標略低于其他客運方式,表明高速鐵路在快速性、方便性等方面均具有較強的競爭力和優勢,且公路班線客運在票價方面也沒有十分明顯的比較優勢。
(2)費用時間比的變量參數α2=0.002 9,表明旅客更加青睞旅途時間更短的客運方式。狹義上的旅客總出行時間又包括市內交通耗時及選擇的客運方式運行時間。因此,若要提高旅客選擇某種客運方式的概率,就需要在縮短客運方式運行時間的基礎上,不斷提高旅客在市內交通的換乘效率,這也就需要不斷完善客運場站與市內常規公交、軌道交通、出租車等交通方式之間的接駁設施。同時,公路客運企業需完善票價制度,合理調整票價結構,建議采用浮動票價體系,特別是針對學生、老年人等低收入群體制定差異化票價,并通過推行月票、年票等優惠票卡,以提高自身吸引力和競爭力。
(3)發車間隔的變量參數α4=-0.359 3,表明一種客運方式的發車間隔越小,旅客越有可能選擇這種客運方式出行,且發車間隔每減少1 h,旅客選擇該客運方式的概率將會增加35.93%。因此,公路客運企業需根據高鐵的到站時刻表,動態調整公路班線客運的發班時刻和發班班次,減少旅客換乘等待時間以提高公路班線客運的方便性。
(4)考慮到各種客運方式的合作與競爭關系,高鐵和普鐵應繼續發揮運輸速度快、運力大的優勢,在通道內的客運體系中發揮運輸骨干的作用;而公路班線客運受自身運輸速度慢、運力小等特點的影響,要適當放棄通道內與高鐵競爭處于劣勢的班線,而應將運力資源調配至高鐵尚未覆蓋的區域,諸如通道外圍縣城、鄉鎮及旅游景區,適時加開這些區域與新建高鐵站之間的線路,并推動公路班線客運與其他交通方式間的接駁換乘,發揮公路班線客運機動靈活的特點和優勢。
本研究基于旅客SP/RP調查數據分析昌吉贛通道內的旅客出行行為和出行特征,采用多項Logit模型作為基礎模型,對比分析了在不同特性變量的選取方案和不同效用函數的選取形式下運用模型和模型擬合昌吉贛通道旅客出行特征調查數據的能力,最終通過模型檢驗確定一種最優的分擔率預測模型,該模型能夠充分地解釋和擬合調查樣本數據。
根據模型計算結果,高速鐵路極大地緩解了昌吉贛通道中既有普速鐵路和公路客運班線的客運壓力,但也勢必會對公路客運企業帶來較大沖擊,因此相關公路客運企業在制定經營策略時應著重考慮在保持公路客運班線經濟性優勢的基礎上如何提高其快速性和舒適性等服務特性,建議在完善票價結構、合理安排班次以及調整線網布局等方面予以考慮。