史博,宋鋒,李軼群,劉猛,趙東鋒,趙建東*
(1.河南交通投資集團有限公司,鄭州 450000; 2.河南中原高速公路股份有限公司航空港分公司,鄭州 450000;3.北京交通大學交通運輸學院,北京 100044)
隨著后ETC(electronic toll collection)時代的來臨,中國高速公路收費站的收費模式發生了巨大的改變。首先,ETC用戶規模的大幅增加導致了人工收費MTC(manual toll collection)的主體地位被電子不停車收費取代。其次,車輛的繳費方式隨著各種支付手段的出現而呈現出了多元化特點。然而,現有的車道開閉配置方法無法應對高速公路時變的交通需求和多元收費模式,導致交通擁堵和車道閑置兩極化現象日益嚴重。因此,如何針對這種新的收費模式和時變的交通需求制定合理的車道開閉配置方案是一個亟待解決的問題。
在短時交通流預測方面,基于機器學習的預測模型近年來應用廣泛,主要包括K均值聚類、系統聚類、主成分分析法等無監督學習方式和支持向量機、決策樹、人工神經網絡等有監督學習方式[1]。其中人工神經網絡在短時交通流預測中體現出了很好的適用性和有效性。宋瑞蓉等[2]為了提高交通流預測精度,將小波神經網絡與果蠅優化算法相結合,解決了小波神經網絡對初始參數敏感的問題。Wang等[3]基于長短時記憶神經網絡(long short term memory,LSTM)和循環神經網絡提出了一種基于數據驅動方法的城市道路網短期交通流預測框架,并證實其具有更高的精度和魯棒性。Zhao等[4]針對傳統機器學習在非復發性擁堵場景下的預測精度較低問題,采用LSTM進行速度預測,經評估后證明該方法具有較好的魯棒性。
在收費車道開閉配置研究方面,方法分為兩種:一種是通過構建微觀仿真模型來模擬收費站在不同車道配置方案下的運營過程,再經過平均延誤時間或平均排隊長度等指標的評價對比后選取最終方案;另一種是利用排隊論知識對收費站進行建模,確定目標函數和約束條件,選取合適算法求解得到車道配置方案。李蓉[5]針對收費站收費方式多元化,統籌考慮各方利益建立了一種收費系統資源優化配置模型,并利用遺傳算法尋優求解。姬楊蓓蓓等[6]從建設成本和延誤成本考慮,利用排隊論知識構建了以總成本最小為目標函數的優化模型,并進行實例分析,探討了成本與交通狀態和車道配置的關系。林弼胄等[7]采用VISSIM軟件構建了混合收費站仿真模型,并將仿真結果與實際觀測數據進行了對比,提出了收費車道的具體配置方案。
綜上所述,人工神經網絡經過持續發展已經足以承擔收費站的交通需求預測任務,但許多模型仍存在訓練緩慢、工作量過大的問題;而現有的車道開閉配置方法主要針對的是人工收費車道,在當前的多元收費模式下亟需得到拓展。因此,現基于收費站收費數據,提出一種基于貝葉斯優化算法和LSTM的組合預測模型,用于實現收費站的交通需求預測,以及一種基于綜合成本最優的車道開閉配置模型,用于確定車道開閉配置方案。
所用數據采集于河北新元高速機場收費站,其中交通量數據由收費系統的通行記錄獲取,時間范圍為2020年10月1日—12月31日;服務時間數據采用攝像法和人工統計獲取,時長為2 h,為避免異常數據對研究過程的影響,對不同類型的異常數據進行預處理,其中交通量數據存在缺失值和重復值,對這部分數據直接剔除,服務時間數據存在偏大值,采用三西格瑪法則進行過濾。數據經清洗后,每條交通量數據包含7個主要字段,分別為流水號、收費站名稱、車道編號、時間、車型、車種和通行介質,服務時間數據包含5個主要字段,分別為車型、支付方式、實際服務時間、離去時間和服務時間。
多元收費方式是指車輛通過收費車道繳費時支付方式種類的多樣化。調研中發現,目前主要的支付方式有ETC支付、現金支付、移動支付和刷卡支付4種,其中ETC支付應用于ETC專用車道,其余3種應用于MTC車道。按不同的收費方式進行交通量統計,結果顯示選擇ETC車道通行的用戶占比已達70%,在余下選擇MTC車道的30%用戶中,現金支付、移動支付和刷卡支付的使用率分別為35.74%、56.38%和7.89%。
由于服務時間隨著收費方式的不同存在明顯差異性,其值大小與收費方式和車型密切相關,故按照車型大小和不同收費方式計算對應的服務時間均值和標準差,以ETC車型為例,結果如表1所示。

表1 ETC車型服務時間統計表
高速公路收費站是一個典型的排隊系統,常采用排隊論展開理論研究。排隊論也被稱為隨機服務系統理論[8],是研究排隊現象的一種經典理論,其核心可分為輸入過程、排隊規則和服務過程三部分[9]。針對高速公路收費站,輸入過程即車輛的到達過程,決定了收費站的交通需求,收費車道即提供服務的機構,所提供服務能力的大小主要由車道開啟數目決定,同時也和收費方式和工作人員的操作水平有關,排隊規則屬于等待制,服務規則為FCFS??紤]到ETC車輛和MTC車輛分車道行駛,假設兩類車輛在進入收費系統時互不干擾,對ETC收費系統和MTC收費系統分別構建排隊論模型。
根據相關研究,收費站車輛到達服從泊松分布,而服務時間通常服從正態分布或負指數分布[10-11],根據本次調研得到的服務時間,采用SPSS軟件分別對其進行正態性檢驗。經檢驗,各收費方式對應的服務時間基本服從正態分布,因此選擇M/G/K排隊模型展開研究。在M/G/K模型中,能夠反映系統運營效果的重要指標分別為平均排隊長度Lq、平均等待時間Wq、平均逗留時間Ws和單個服務臺的服務強度ρ。
對于ETC收費系統來說,車輛在經過收費車道時不需要停車繳費,也不存在收費方式的差異,因此服務時間的均值與方差只與所統計時間段內的車型比例有關,則模型中服務時間的均值和方差計算公式為

(1)

(2)

(3)

(4)
式中:EE為ETC服務時間均值,s;DE為ETC服務時間方差,s;E1為ETC小型車服務時間調研均值,s;D1為ETC小型車服務時間調研方差,s;β′j為各車型服務時間均值換算系數;β″j為各車型服務時間方差換算系數;θj為各車型比例;m為車型種類數;t′j為各車型的服務時間調研均值,s;t″j為各車型的服務時間調研方差,s。
對于MTC收費系統,由于其支付方式多元化,導致服務時間的均值和方差不僅與所統計時間段內的車型比例相關,同時也與收費方式的使用比例相關,則模型中服務時間的均值和方差計算方法為

(5)

(6)
式中:

(7)

(8)
式中:EM為MTC服務時間均值,s;DM為MTC服務時間方差,s;Ei1為第i種收費方式小型車服務時間調研均值,s;Di1為第i種收費方式小型車服務時間調研方差,s;β′ij為第i種收費方式第j種車型的服務時間均值換算系數;β″ij為第i種收費方式第j種車型的服務時間方差換算系數;αij為第i種收費方式第j種車型的比例;li為收費方式占比;m為車輛類型數;n為收費方式種類數;t′ij為第i種收費方式第j種車型的服務時間調研均值,s;t″ij為第i種收費方式第j種車型的服務時間調研方差,s。
服務能力的大小可以通過排隊論模型中的服務時間來衡量。因此利用服務時間進行通行能力估計。即用平均服務率μ來計算單位時間內收費車道的通行能力大小。
對于ETC收費系統,收費車道通行能力僅與所統計時間段內的車型比例有關,計算公式為

(9)
式(9)中:μE為單條ETC車道的平均服務率。
對于MTC收費系統,收費車道的通行能力除了與所統計時間段內的車型比例相關外,也與收費方式的使用比例相關,計算公式為

(10)
式(10)中:μM為單條MTC車道的平均服務率。
收費車道通行能力的大小反映了收費站的交通供給能力,而要實現車道配置合理化,還需要考慮收費站的交通需求。一般情況下,車道配置方案依據實際的交通量來制定,但由于交通量只能在車輛通行完畢后才能統計,此時再進行車道配置會存在嚴重的滯后性。為此,本文研究首先展開交通流預測。
貝葉斯優化算法[12]是一種全局優化算法,其在獲得近似最優解的過程中只需要對目標函數進行較少次評估[13],從而大幅度提高模型訓練的調參效率。BOA主要由概率代理模型和采集函數兩部分組成[14]。概率代理模型負責計算未知目標函數概率,采集函數則用來尋找下一個變量組合。
針對交通量的時變性特點和LSTM模型的超參數調整工作量過大問題,在LSTM模型中引入BOA組合成BOA-LSTM模型實現收費站交通流預測,由上文構建的收費站M/G/K模型可知,影響收費站服務效率的關鍵因素是交通量、車型比例和收費方式占比,由于收費方式占比數據需結合交通調查獲取,本文研究采用調研值。因此,模型預測的交通流信息中主要包括交通量和3種車型比例。模型結構如圖1所示。

圖1 BOA-LSTM預測模型結構圖
為評價模型的預測效果,選取工作日(12月9日、12月10日和12月11日)和休息日(12月19日、12月20日和12月26日)各3 d展開預測效果驗證?;赑ython中的pytorch框架構建LSTM模型,并選取Adam作為梯度下降算法進行模型訓練,循環迭代次數epoch設置為100,時間窗大小為20,隱藏層節點數為100;Adam優化算法中學習率為0.01。利用Hyperopt庫實現貝葉斯算法優化超參數,選用樹狀結構Parzen估計(tree-structured parzen estimator,TPE)作為概率代理模型,預期改善函數(expected improvement,EI)為采集函數。以均方誤差(mean square error,MSE)作為目標函數,對超參數中的學習率η和隱藏層神經元個數hs進行尋優。以均方根誤差(root mean square error,RMSE)和平均絕對百分比誤差(mean absolute percentage error,MAPE)作為預測效果的評價指標。結果如表2所示。

表2 BOA-LSTM模型預測效果
由于所選收費站的地理位置特殊,導致數據集中的小型車占比極大,幾乎占據了總交通量的90%,而中型車和大型車占比很少,并且體現不出變化規律,因此預測過程中擬合優度出現了負數,說明效果很差,針對此類情況,將中型車和大型車的預測值采用均值替代。
4.1.1 運營成本
收費站運營成本Cop是收費站建成投入運營后維持正常運轉需要的費用,包含工作人員工資、水電費、設備維修費等[6]。計算公式為

(11)
式(11)中:Cop為收費站整體運營成本,元/h;aE為一條ETC車道的運營成本,元/h;aM為一條MTC車道的運營成本,元/h;NE為收費站ETC車道的開啟數;NM為收費站MTC車道的開啟數;b為平均每條MTC車道安排的工作人員數;Csa為工作人員的平均月工資,元;d為每個月的工作天數,d;t為平均每天的工作時長,h。
4.1.2 用戶延誤時間成本
延誤時間成本Cde指車輛在收費站繳費過程中,由于減速、停車和排隊所造成的成本,用延誤時間和時間價值來衡量。延誤時間依據多元收費方式M/G/K排隊模型計算得到,其中ETC車道和MTC車道的平均逗留時間分別用WsE和WsM表示。人均時間價值按式(12) 所示的收入法計算[15]。

(12)
式(12)中:A為人均時間價值,元/h;I為當地人均月收入,元。
單位時間內用戶延誤時間成本為
Cde=HA(λEWsE+λMWsM)
(13)
式(13)中:Cde為單位時間內的用戶延誤時間成本,元/h;H為車輛的平均載人數。
為綜合考慮收費站管理者和出行者的利益,以運營成本和用戶延誤時間成本之和作為綜合成本C,以綜合成本最小為目標,建立目標函數為
minC=Cop+Cde
(14)
在求解最小成本的同時,所得方案必須要符合客觀規律,要保證車輛的順利通行,必須要滿足以下約束條件。
(1)收費站提供的服務能力必須滿足到達的交通流。為保證不會出現嚴重的交通阻塞,收費站必須具備足夠的通行能力,即ETC車道和MTC車道的服務強度都不能超過1,且服務強度不能為負數,公式為
(15)

(16)

(17)
式中:ρE為ETC車道的服務強度;ρM為MTC車道的服務強度。
(2)各類型車道至少有1條在全時段開啟。收費站當前可切換使用ETC和MTC兩種功能的車道,且需保證兩種類型的車道分別有一條以上處于全時段開啟狀態以防止個別車輛到來時無通道可走,即車道設置應當滿足

(18)
(3)ETC和MTC車道數之和不能超過已建成的車道總數。由于混合車道兼具有ETC車道和MTC車道的功能,可以保證在收費站運營過程中實現兩種類型車道功能的轉換,所以兩種類型的車道數不必單獨設置上限,但其總和不能超過已建成的車道數,即需要滿足
NE+NM≤N
(19)
式(19)中:N為已建成的車道總數。
(4)車道數均為正整數。車道開閉配置模型采用粒子群算法(particle swarm optimization,PSO)求解,整體結構如圖2所示,首先將BOA-LSTM模型預測得到的收費站交通量和車型比例輸入到多元收費方式M/G/K排隊模型中,即依據預測得到的ETC和MTC交通量及相應的車型比例計算ETC和MTC收費車道的到達率、通行能力和車輛的平均逗留時間、服務時間均值和方差等指標,然后根據這些指標計算值和調研得到的參數確定車道開閉配置模型的各個參數,求解可得未來某一時段的車道開閉配置方案。
以河北新元高速機場收費站為例,獲取其在2020年12月9日、12月10日以及12月11日(工作日)和12月19日、12月20日以及12月26日(休息日)的相關數據,以工作日和休息日兩個場景展開實證分析,根據上述調研得到的基本信息設置模型參數,采用PSO算法求解后得到車道開閉配置方案,其中07:00—21:00的配置方案如表3所示。

表3 車道開閉配置模型求解結果
服務水平指出行者在道路上行駛時能夠感受到的交通設施所提供的服務質量,用來衡量交通狀態和相應的出行者感受。為衡量本文方案的實際應用效果,分別計算ETC和MTC車道的服務水平。針對MTC收費車道,采用平均排隊長度Lq來劃分服務水平等級,當平均排隊長度在0~1 pcu時,服務水平為一級,對應交通狀態為順暢;當平均排隊長度在1~4 pcu時,服務水平為二級,對應交通狀態為基本順暢;當平均排隊長度在4~8 pcu時,服務水平為三級,對應交通狀態為擁堵;當平均排隊長度大于8 pcu時,服務水平為四級,對應交通狀態為嚴重擁堵。針對ETC收費車道,采用服務強度ρE來衡量服務水平,當服務強度在0~0.6時,服務水平為一級,對應交通狀態為順暢;當服務強度≥0.6~0.8時,服務水平為二級,對應交通狀態為基本順暢;當服務強度在0.8~1時,服務水平為三級,對應交通狀態為擁堵;當服務強度≥1時,服務水平為四級,對應交通狀態為嚴重擁堵。根據本文模型求解方案分別計算相應的ETC車道服務強度和MTC車道的平均排隊長度,工作日和休息日的結果分別如圖3(a)、圖3(b)和圖4(a)、圖4(b)所示。

圖3 工作日收費車道服務水平

圖4 休息日收費車道服務水平
按照上述服務水平劃分標準依次確定其服務水平,結果表明,在工作日ETC車道處于二級以上服務水平的時間達到了90.28%,MTC車道處于二級以上服務水平的時間達到了100%;在休息日ETC車道處于二級以上服務水平的時間達到了69.44%,MTC車道處于二級以上服務水平的時間達到了94.44%。上述結果說明本文所提車道開閉配置方法能夠保障車輛在收費站順暢通行。
為進一步評價上述模型得到的車道開閉配置方案,將其與現行的車道開閉配置方案進行對比分析,圖5(a)和圖5(b)所示分別為工作日和休息日的綜合成本對比圖。

圖5 工作日與休息日綜合成本對比
將現行方案的各項成本與本文所提方法得到的成本求差值,并計算其優化的百分比。結果表明,本文所提方法能夠在一定程度上降低收費站的各項成本,相比于現狀方案,工作日平均每小時的綜合成本能夠減少7.33元,降低了2.30%,其中,運營成本降低了1.98元,延誤時間成本降低了5.36元,分別優化了2.97%和1.77%;休息日平均每小時的綜合成本能夠減少25.23元,降低了5.14%。其中,運營成本降低了1.24元,延誤時間成本降低了23.99元,分別優化了1.89%和5.62%。
按此趨勢估計,工作日每天可節約的綜合成本約為175.92元,其中運營成本和時間延誤成本分別為47.52元和128.4元;休息日每天可節約的綜合成本約為605.52元,運營成本和時間延誤成本分別為29.76元和575.76元。折算成一年來看,按照250個工作日和115個休息日計算,綜合成本大約可節約113 614.8元,其中運營成本為15 302.4元,延誤時間成本為98 312.4元。
以高速公路收費站收費數據為基礎,針對收費站交通需求的時變性和收費方式的多元化特點,基于深度學習方法和數學建模方法構建了BOA-LSTM組合預測模型和車道開閉配置模型,并開展了實例驗證。結果表明,本文所提車道開閉配置方法能夠有效解決收費站車道資源分配不均問題,具有較大的科研價值和工程意義,得出如下結論。
(1)針對ETC和MTC兩種不同類型收費車道共存的現象,在M/G/K模型應用于收費站方面,提出了一種基于多元收費方式M/G/K排隊模型,分別確定了ETC收費車道和MTC收費車道的服務時間均值和方差計算方法。提出了使用多元收費方式下的平均服務率計算收費車道通行能力的方法。
(2)在交通流預測方面,采用BOA對LSTM模型的學習率和隱藏層節點數進行尋優,構建了BOA-LSTM組合模型。實例驗證結果顯示,BOA-LSTM組合模型能夠取得良好的預測效果,其中交通量和車型比例的RMSE分別為16.24和0.03,MAPE分別為13.32%和1.77%。
(3)在車道開閉配置方面,構建了以綜合成本最小為目標的車道開閉配置模型,并結合高速收費站的調研情況展開了實例驗證。結果表明,相比于現狀方案,本文所提模型能夠在保證一定服務水平的前提下,具備更高的時效性和更低的綜合成本,其中工作日平均每天的綜合成本能夠減少175.92元,降低了2.30%,休息日平均每天的綜合成本能夠減少605.52元,降低了5.14%。