王 玲 王艷麗 戚新洲 馬萬經
(同濟大學道路與交通工程教育部重點實驗室 上海 201804)
在當前積極推進公交優先發展的背景下,如何提升城市公交服務品質提高公交吸引力是當前公交發展的主要任務.而品質和吸引力的提高則需要公交服務可靠性的保障.常規公交仍然是我國大多城市公交系統的主體,相較于蓬勃發展的軌道交通,除了運營速度較慢,關鍵在于其行程時間的可靠性相對較差.特別是在交通網絡較為復雜的大城市,交通擁擠等問題日益嚴峻,增加了公交車的在途時間,從而影響了公交線路的行程時間可靠性.所以對于常規公交線路的行程時間可靠性進行分析以提高服務可靠性對于提升公交服務品質與吸引力極為重要.
目前,對于常規公交可靠性已經有較多研究,包括路網連通可靠性、服務可靠性以及運行可靠性[1].其中,對于公交運行可靠性的研究,主要集中于可靠性的評價包括評價指標和評價方法、可靠性的影響因素分析以及可靠性的預測模型三個方面.在評價方面,提出了不同的評價指標,如準點率[2]、到達可靠性[3]、行程時間可靠性[4-5]、行車間隔可靠性[6]、候車時間可靠性[7]等,其中,行程時間可靠性是目前公交系統可靠性評價中應用最多,可以綜合體現準時、穩定、延誤等.對于行程時間可靠性的影響因素,結合不同的案例進行了影響因素分析[8-9],發現線路長度[10]、道路交通狀態[11]、站點數量[12]、站點區間長度[13]等是顯著影響因素,而行程時間與影響因素的分析仍以兩者的相關分析為主,或者是進行多元線性回歸分析.對于行程時間的預測方法上,目前多是針對具體線路構建模型如多元回歸模型[14]、神經網絡[15]、向量機模型、貝葉斯網絡預測、指數平滑技術與基于卡爾曼濾波(KF)的遞歸方法結合的混合模型等對公交到站時間進行預測.目前綜合分析因素對行程時間可靠性的影響較少.總的來說,對于行程時間可靠性的評價指標和計算,大多是針對某一條或者幾條線路的評價,影響因素的分析也多是選定一條或幾條公交線路,分析的結果也許并不能反映整體狀況,有必要研究城市范圍內的常規公交線路,給出一般性結論.同時,以往研究多將行程時間可靠性作為連續變量處理,但出行者對公交可靠性的感知,多為分類變量,如可靠與不可靠,故有必要對可靠性進行分類處理,從而得到影響因素與公交線路是否可靠之間的關系.
文中從城市公交線網整體出發,提出評價公交線路行程時間可靠性的指標,并以上海市為例,基于所有的公交線路運行GPS數據,分析影響公交線路行程時間可靠性的顯著因素,以及影響規律,并構建邏輯回歸模型定量分析影響因素與公交線路可靠性間的關聯.
對于乘客而言,其認知的基準時間通常是白天平峰的公交的行程時間.因為白天平峰時的交通狀況是1 d中相對最為順暢的時段,其行程時間的差異較少(見圖1),而且白天出行(06:00—18:00)的人數,約占總出行人次的79.9%,故大多出行者對公交行程時間的基準值應多是白天平峰時公交平均行程時間.
圖1 工作日與非工作日各時段行程時間差異系數
為了評定公交線路與白天平峰時的相近性,提出行程時間可靠指數的概念,即一條線路在某個時間段內從首站到末站(即運行一趟)所耗費時間相對于白天平峰時的相近程度,即
(1)
(2)
(3)
由于出行者對行程時間可靠指數S的具體數值感知并不精確,其對行程時間可靠性的判斷通常為可靠或不可靠,所以引入二分變量可靠度R來評定.在用S來表征出行者對某條線路的行程時間與基準值相近性的基礎上,將S轉換成為二分變量,當S大于等于某個值時,線路運行可靠(R=1);當S小于某個值時,線路運行不可靠(R=0).
分界閾值的確定取決于城市整體公交線路運行狀況,圖2為公交行程時間可靠指數分布圖.根據上海市的公交運行情況,可靠指數處于70~80范圍內時,頻次最高;同時,累計頻率曲線在70~80區間范圍內曲線的切線斜率最大,也就是說,在這個范圍內可靠指數變化最顯著,因此建議取80作為分界點.
圖2 公交行程時間可靠指數分布圖
選取全上海市的常規公交作為研究對象,獲取每輛公交在2017年4月1—10日的全部GPS數據.GPS數據的采樣間隔為10 s,記錄了公交在某時刻(精確到s)的經緯度,同時也記錄了車輛的行駛速度,公交在首末公交站點的時間也從GPS數據中獲得.共有1 388條線路、826 279條數據樣本量.
從線路設置自身初步考慮的變量包括,公交線路的長度、公交線路的站點數量、公交站點的平均間距、公交線路跨越的區域數量、以及公交線路跨越的主要區域類型.其中區域的分類,參照《上海公交線網優化導則》,分為一類區域、二類區域、三類區域.當公交線路跨越幾類區域時,頻率最高的區域類型作為該線路的主要區域類型;當幾種區域類型頻率相同時,選擇等級更高的區域類型(等級:一類區域>二類區域>三類區域)作為跨越的主要區域類型.
從線路的運行,影響行程時間可靠性造成行程時間波動的因素,主要是受交通狀態的影響.交通狀態的直接反映指標是速度,所以選取線路平均行程速度作為自變量.
鑒于路網交通流有明顯的潮汐性,公交在運行過程中與其他車輛相互影響,所以公交行程時間可靠性也應該分時段分析公交線路行程時間可靠性.根據上海市第五次交通大調查,將一天分為5個研究時段:凌晨0:00—6:00,早高峰6:00—10:00,平峰10:00—15:00,晚高峰15:00—20:00和晚上20:00—24:00.
同時,除了1 d內的交通潮汐情況,工作日與非工作日的交通特性也不盡相同,所以工作日與非工作日也納入影響因素分析.
對影響因素數據作為變量進行統計,結果見表1.
表1 變量描述性分析
若影響因素為分類變量則采用卡方檢驗,否則用T檢驗,檢驗結果見表2.
表2 影響因素與公交可靠度R的顯著性檢驗
由表2可知:所有的影響因素變量都與可靠度變量R顯著相關.研究進一步分析了影響因素變量間的顯著性關系,來排除自變量高度相關,模型變量共線性的問題.結果表明:自變量間的相關性不強.
部分影響因素與可靠度R間存在非單調性關系,比如當公交運行的行程時間很短時,公交運行可靠度高,因為被其他車輛或者紅綠燈影響公交運行的機會少;當車輛運行的行程時間很長時,公交運行可靠度高,因為行程時間長的公交線路極有可能經過很多長路段,在這些長路段上,公交車可以提高運行速度來彌補在擁堵或交叉口產生的延誤.除了公交行程時間,公交站點數量或許也存在類似情況.
為了定量分析這種非單調性關系,以公交行程時間為例,將所有線路的公交行程時間按照數值從小到大依次排列,選取九個等分點,將行程時間數值劃分為10個區間,得到在每一個區間的線路可靠度概率(p=可靠度為1的線路數/總線路數),并計算其發生比的自然對數值,也就是Logit(p),結果見圖3.
圖3 不同行程時間組的Logit(p)
圖3表明當公交的行程時間的區間為第6區間時,Logit(p)最低,也就是說行程可靠度最低;而當行程時間離第6區間越遠,Logit(p)越高,證明行程時間可靠度越好,第六組的平均值為3 886 s.
公交站點數量也存在和行程時間類似的情況:當公交站點數量處于中間狀態(21站)時,行程時間可靠度最好,當公交站點數量與中間狀態差距越大,公交的可靠度越差.
若將這兩個變量直接放入模型中,這些重要的信息難以得到體現,故需對這兩個變量做轉換:分別取行程時間與其平均值(3 886 s)和站點數量與其中間狀態(21站)差額的絕對值.
構建貝葉斯邏輯回歸模型來定量分析顯著影響因素與公交行程時間可靠度R之間的關系.傳統的邏輯回歸模型認為模型中自變量的系數是一個確定值,但是貝葉斯模型認為自變量的系數服從一個預定的分布,并且貝葉斯模型能以上一次模型的結果作為參考,更新模型,用多次穩定的回歸結果來得到自變量系數的分布情況.
行程時間可靠度,可靠與不可靠,發生的比例分別為p(R=1)和1-p(R=0).貝葉斯邏輯回歸模型為
(4)
式中:β0距;xj為第j個自變量;βj為第j個自變量的系數.因為沒有類似研究能為βj參考,所以采用無信息先驗分布,認為β0服從以下分布:
β0~N(0,106)
βj~N(0,106)
行程時間可靠度的貝葉斯邏輯回歸模型通過R語言調用Winbugs得到.一共有10 000次模型迭代,其中前5 000次模型迭代沒有用于模型結果中,因為初始迭代的結果存在很大的波動性且受初始值影響大,故不能反映真實的自變量系數情況.本研究將后5 000次模型迭代的結果用于得到變量的系數,同時也檢查了這5 000次迭代的系數值,結果顯示自變量系數的數值穩定,故采用后5 000此迭代的結果是合理的.
研究隨機抽取70%的樣本作為模型標定的樣本,剩余30%作為模型檢驗的樣本.對于標定樣本,最先將表2中除了站點數目以及行程時間外的所有變量,以及轉換過后的站點數目與行程時間放入貝葉斯邏輯回歸模型中,然后將那些在95%貝葉斯區間不顯著的變量一一剔除,最終的模型結果見表3.
表3 模型結果
當行程時間與3 886 s相差越大,公交的行程可靠性增加,差距每增加1 000 s,行程時間可靠的發生比增加117%.行程時間很短時,因為被其他車輛或者紅綠燈影響公交運行的時間長度短,所以公交運行可靠度高;當車輛運行的行程時間很長時,公交可以在此長時間段,調整速度,以彌補因擁堵或其他突發事件而產生的延誤.
相對于平峰而言,凌晨、晚上、早晚高峰的行程時間可靠度較差.工作日相對于非工作日而言,行程時間可靠度較差,這是因為工作日與非工作日相比,出行車輛更多,公交受其他車輛的影響更大.
相對于第三類區域而言,第一類與第二類區域的行程時間可靠度較差.第一類區域為內環內,第二類區域為內外環之間或郊區新城及重點開發,第三類區域為外環外的其他地區,故相對于第三類區域而言,第一類與第二類區域的交通更為擁堵,所以行程可靠度更低.
文中提出了可靠度指數和運行可靠度作為整條線路的行程時間可靠性的評價指標,運用上海市公交線路的運行數據進行分析,發現線路平均行程速度、公交線路跨越的區域數量、公交線路的長度、公交線路的站點數量、公交站點的平均間距、公交線路跨越的主要區域類型、以及運行時段、工作日與非工作日都會影響其可靠性,并建立了貝葉斯邏輯回歸模型來反映其定量關系.但研究由于數據限制,只分析了的線路的起點到終點的行程時間可靠性,后續可以細化研究站點到站點間的行程時間可靠度.同時,鑒于天氣對公交運行也有影響,后需將融合交通氣象數據,將天氣納入對公交行程時間可靠度的影響分析中.