程邦錄,干宏程 (上海理工大學 管理學院,上海 200093)
隨著城市規模的不斷擴大和車輛數量的不斷增加,人們面臨著日益增長的交通壓力,如何解決道路擁擠問題是城市規劃設計者面臨的重要問題。在眾多解決方案中,快速路網由于其可以解決長距離交通問題的特點被廣泛應用在城市交通建設中。在城市快速路網的建設過程中,也在不斷加入科技元素,利用智能交通系統(Intelligent Traffic System,ITS)中先進的技術輔助快速路網的管理,是未來交通的發展方向。先進交通信息系統(Advanced Traffic Information System,ATIS)是ITS中重要的子系統之一,可變信息板(Variable Message Sign,VMS)是主要用來優化路網的ATIS設備之一。但是,由于交通路網的復雜性,VMS在實際運用的過程中,還有很多問題需要進一步完善和解決。
目前,國外的學者們都從不同的角度對VMS在信息誘導方面做了大量研究,其中不乏通過建?;蛩惴ǚ抡鎸MS影響駕駛員行為方面進行討論。Markos Papageorgiou(1990)對快速路網上的動態交通進行建模,進行了有關道路引導方面的研究[1];Said Mammar(1996)分析了丹麥奧爾堡市VMS的設計與實施,評價了快速路網的運行效益,同時提出了改進建議[2];Jiajun Wang(2013)從有效性和總成本最小的角度,利用多目標優化模型,對VMS信息效用的最大化進行研究[3]。
近些年來,國內很多城市積極建設快速路網,大力發展智能交通,大量的信息技術被運用在交通領域。在這一背景下,越來越多的國內研究者關注到這一領域,進行調研分析,為交通路網的建設提供建議。石小法、王煒、李文權(2001)利用隨機均衡模型論證了提供交通信息是一種提高交通網絡效率的有效方法[4];曾松等(2002)通過駕駛員調查和計算機仿真對駕駛員的路線選擇行為進行研究,利用多元Logit模型分析了駕駛員在行程時間信息的影響下對不同路線的選擇,討論了改變到非常規路線的可能性[5];熊秩、黃海軍、李志純(2003)將出行者分為懷疑保守型和信任樂觀型兩類,建立了一個等價的隨時間演進的隨機用戶均衡模型[6];干宏程、孫立軍、陳建陽(2006)針對上海市快速路交通誘導系統,研究了VMS對駕駛員出行途中改道的問題,利用離散選擇方法分析數據,建立了多元Logit模型[7];尚華艷、黃海軍、高自友(2008)采用元胞傳輸模型,針對重復性擁擠和非重復性擁擠兩種交通狀態下,對VMS對交通流的影響進行了分析[8];干宏程(2010)運用意向調查方法采集了行程時間和其波動性對駕駛員路徑選擇行為影響的數據,采用離散選擇建模方法估計了二元Probit模型用來描述路徑選擇概率[9]。
綜合來看,現有的研究存在著兩點值得改進的地方。第一,針對駕駛員的路線選擇調查數據一般是分類數據,通常不滿足正態分布,因此在利用經典線性模型進行回歸估計時會產生偏差。第二,調查數據的樣本并不是相互獨立的,同一位駕駛員在面對不同交通情景時作出的判斷具有關聯性,這當中涉及到了個體的固定效應和隨機效應,在數據處理的過程中應當格外關注。
現階段,廣義線性混合模型是解決上述問題的首要選擇。該模型由經典線性模型發展而來,通過引入鏈接函數解決了變量為非正態分布的問題,而且通過引入隨機效應來分析數據間的相關性問題。因此,本文采用廣義線性混合模型來進行駕駛員路徑選擇問題的實證分析,期望可以得到影響駕駛員路徑選擇的更為準確的結論[10]。
本文的問卷調查采用了行為調查(Revealed Preference,RP),以及意向調查 (Stated Preference,SP)結合的方式。RP調查是針對實際的情況而進行的一種調查,反映被調查者的具體屬性及其在現實的生活中真實情況的選擇,SP調查則是針對被調查者的意愿或者是態度,反映被調查者在虛擬的情境中對不同的情況做出的偏好程度及其選擇情況。
RP調查的內容主要包括:(1)使用高架快速路的頻率(幾乎每天,每周3~4天,每周1~2天,幾乎不用);(2) 是否了解VMS(非常了解,比較了解,不太了解,完全不了解);(3) 對VMS的關注度(時刻關注,經常關注,很少關注,不關注)。SP調查的主要內容是假設當VMS給出不同的信息(顏色和文字)時,駕駛員是否會改變原定的駕駛路線。本文模擬的情景是駕駛員駕車前往龍華路,原計劃從龍華西路下匝道,離開高架道路,到達目的地。當關注到VMS給出的前方道路信息后,是否會提前從漕溪路匝道離開高架走地面道路到達目的地。調查問卷提供了6種VMS假設,為3種路徑顏色組合(黃、紅、黃+紅)與2種擁堵原因描述(事故擁堵、非事故擁堵)的搭配組合,調查中使用的圖像如圖1所示:
對應說明如表1所示:

圖1 SP調查中使用的圖像

表1 SP調查中使用的圖像描述
基礎問卷部分包括受訪者的性別、年齡、駕齡、汽車類型等問題,針對年齡、駕齡等連續進行離散化處理,被調查者根據實際情況進行單項選擇。調查方式為現場發放問卷和網絡問卷結合的方式,實地調查地點為上海市浦東新區杜鵑路一家司機快餐店和附近洗車場。共獲得問卷109份,其中有效問卷96份,經過處理后得到576條(96×6)有效記錄,這就是本文建立模型所用到的數據。
通過對問卷調查結果的整理分析,得出駕駛員對VMS了解程度以及是否改變出行路徑的交叉分析統計結果,如圖2??梢钥闯?,對VMS越了解的駕駛者越傾向根據VMS提供的信息改變原定駕駛路線。
如圖3,問卷調查的結果顯示,對VMS越關注的駕駛者越傾向根據VMS提供的信息改變原定駕駛路線。
廣義線性模型,就是經典線性回歸模型的普遍化。經典線性回歸模型假設因變量為一組自變量的線性方程,同時因變量為連續且正態分布的,可以寫成:


圖2 不同VMS了解程度下的路徑改變的意向

圖3 不同VMS關注程度下的路徑改變的意向
其中,y是連續因變量,xj是自變量,ε為假設正態分布的誤差。因變量由兩部分組成:系統性成分β0+βjxj,以及誤差成分ε。參數β0被稱為截距,即當所有自變量都為0時因變量的期望值。
這種線性回歸模型發展自19世紀,隨著人們需求的不斷提升,線性回歸的局限性也愈發凸顯出來。比如,它假設因變量是連續的或者至少是準連續的,同時該連續變量需要滿足正態分布。在1972年,Nelder和Wedderburn提出了廣義線性模型(Generalized Linear Model,GLM),后來發展為應用于非正態因變量的回歸模型。通過選擇適當的連接函數,就可以使用廣義線性模型對多種數據進行處理分析。
標準廣義線性模型假設樣本是相互獨立的,但是在很多情況下受訪者數據間是存在關聯性的,不滿足這種要求。因此,廣義線性模型進一步被拓展為廣義線性混合模型(Generalized Linear Mixed Model,GLMM),即通過引入混合效應,在反應不同對象間的異質性,以及同一對象不同觀測值間的相關性。
混合效應分為兩種:固定效應和隨機效應。對于固定效應,參數的含義是,自變量每變化一個單位,對應變量平均變化多少。對于隨機效應,參數是服從正態分布的一個隨機變量,也就是說對于兩個不同的自變量的值,對應變量的影響不一定是相同的。廣義線性混合模型可以表示如下:

其中,βj代表固定效應參數,zj是具有隨機效應的協變量,vj代表隨機效應參數。
在本次問卷調查中,我們關注的是駕駛者接收到VMS信息后是否改變路徑的概率,因此采用logistic回歸。logistic回歸的標準連結函數為logit,即,其中π表示二元因變量的平均數或事件發生的概率。那么,利用logistic回歸的廣義線性混合模型就可以寫成:

其中,Z代表具有隨機效應協變量的設計矩陣,向量U代表隨機效應。
對問卷進行分析,初步將駕駛者的性別、年齡、駕齡、車輛類型、VMS顯示顏色、文字等確定為影響因素。性別、年齡、駕齡、車輛類型、快速路使用頻率為啞變量,其中性別女性、最高年齡、最高駕齡、幾乎不使用快速路以及使用其他類型的車輛為用于對比的變量。模型變量及含義如表2所示:

表2 模型變量及含義
建立廣義線性混合模型,如下所示:

利用SAS軟件中的GLIMMIX過程進行參數求解,模型協方差參數估計如表3所示:

表3 模型協方差結果
在固定效應方面,本文選擇概率為0.2作為篩選變量的標準,當p值小于0.2時,表明變量對結果的影響顯著。本文之所以選擇0.2作為篩選標準,是為了避免遺漏某些重要的自變量。模型參數結果如表4所示:

表4 模型參數結果
(1)性別。性別Gender的系數為正,表明相比于女性,男性更傾向于改道。根據以往的出行行為研究來看,男性對于道路擁堵帶來的延誤更加敏感,因此會更傾向于改道。
(2)駕齡。駕齡DrvExp的系數均為正,而且系數有增大的趨勢,表明隨著駕齡的增長,改道的可能性變大。可能的原因是駕駛經驗越豐富,對地面替換道路的情況越熟悉。在接收到道路擁堵延誤信息后,能夠通過改道減少對自己的影響。
(3)車輛類型。VclType1(私家車)與VclType2(單位用車)的系數為正,說明與單位用車相比,私家車的駕駛員更傾向于改道,可能是由于單位用車的油耗可以報銷,從而對延誤不敏感。VclType3(出租車)的系數為負,表明出租車的駕駛員傾向于不改道,可能是由于乘客付費且改道易引起乘客不滿。
(4)高架使用頻率。ExwUse的系數均為負,說明快速路使用頻率越高,越傾向于不改道,而很少使用快速路的駕駛員更容易受到VMS的影響。
(5)圖形板顏色。Color的系數為正,說明顏色是影響駕駛員路徑選擇的重要因素,紅色所占比例越大,代表延誤時間越長,駕駛員更加傾向改道。
(6)延誤原因的文字描述在本調查中對并未對駕駛員產生重要影響,可能的原因是駕駛員在駕駛過程中并沒有足夠時間來閱讀信息板的文字。
為了驗證廣義線性混合模型在處理此類數據上的優勢,本文將引入隨機效應和不引入隨機效應的兩種模型運行的結果進行對比,如表5所示:

表5GLM和GLMM擬合統計量對比
其中,AIC、AICC、BIC、CAIC、HQIC均是非均衡重復測量指標,用來判斷模型擬合程度,均是數值越小代表擬合結果越好。可以看到,GLMM下的指標均小于GLM,這表明在處理非均衡的調查數據時,廣義線性混合模型比廣義線性模型更具優勢。GLMM的Pearson卡方/自由度小于1,也說明不存在過離散,擬合效果較好。
本文利用廣義線性混合模型對駕駛員路徑選擇行為進行分析,并且通過與廣義線性模型對比,可以看到加入混合效應會對模型擬合產生積極的影響,是分析此類數據更好的選擇。
就政策建議而言,在建立VMS信息版的時候,應多考慮視覺因素,如顏色、圖形等。同時各單位應完善車輛使用制度,避免帶來不必要的油耗浪費。出租車公司應該積極引導駕駛員與乘客的進行有效溝通,提高乘客的體驗感受。
[1]Papageorgiou M.Dynamic modeling,assignment,and route guidance in traffic networks[J].Transportation Research Part B Methodological,1990,24(6):471-495.
[2]Said Mammar,Albert Messmer,Peder Jensen,et al.Automatic control of Variable Message Signs in Aalborg[J].Transportation Research Part C,1996,4(3):131-150.
[3]Jianjun Wang,Qiong Wu.Study on Multi-Objective Optimization Model for VMS Layout on Expressways[J].Applied Mechanics and Materials,2013(361):2012-2015.
[4]石小法,王煒,李文權.交通信息對交通網絡的影響研究[J].系統工程學報,2001,16(3):167-171.
[5]曾松,史春華,楊曉光.基于實驗分析的駕駛員路線選擇模式研究[J].公路交通科技,2002,19(4):85-88.
[6]熊軼,黃海軍,李志純.交通信息系統作用下的隨機用戶均衡模型與演進[J].交通運輸系統工程與信息,2003,3(3):44-48.
[7]干宏程,孫立軍,陳建陽,等.提供交通信息條件下的途中改道行為研究[J].同濟大學學報(自然科學版),2006,34(11):1484-1488.
[8]尚華艷,黃海軍,高自友,等.基于元胞傳輸模型的實時交通信息設計[J].北京航空航天大學學報,2008,34(2):234-238.
[9]干宏程,葉昕.行程時間波動性對路徑選擇影響的離散選擇分析[J].交通運輸系統工程與信息,2010,10(1):140-144.
[10]朱冬輝,王珂英.廣義線性混合模型在顧客滿意度研究中的應用——基于某地區銀行理財產品顧客滿意度的分析[J].統計與信息論壇,2014,29(1):94-99.
[11](美)喬治·H.鄧特曼,(加)何滿鎬.廣義線性模型導論[M].林毓玲,譯.上海:格致出版社,2012.
[12]詹姆斯·杰卡德.Logistic回歸中的交互效應[M].上海:格致出版社,2014.
[13]弗雷德·C,潘佩爾.Logistic回歸入門[M].上海:格致出版社,2015.
[14]瓦尼·布魯雅.logit與probit:次序模型和多類別模型[M].上海:格致出版社,2012.
[15]費宇,陳飛,喻達雷,等.線性和廣義線性混合模型及其統計診斷[M].北京:科學出版社,2016.