


摘要:高速公路交通流量的復(fù)雜性和波動性對通行效率與安全性提出了更高的要求。為精確預(yù)測高速公路通行時間分布,文章結(jié)合貴陽至黃果樹高速公路段連續(xù)門架系統(tǒng)采集的交通流數(shù)據(jù),提出了一種基于注意力機(jī)制的長短期記憶網(wǎng)絡(luò)(Long ShortTerm MemoryAttention,LSTMAttention)組合模型。該模型通過LSTM捕捉時間序列中的長期與短期依賴關(guān)系,利用注意力機(jī)制動態(tài)聚焦于關(guān)鍵時間步,顯著提升了通行時間分布的預(yù)測精度。研究結(jié)果表明,LSTMAttention模型在節(jié)假日與非節(jié)假日2種場景下均表現(xiàn)出較高的預(yù)測精度,能夠有效捕捉交通流量的時變特性和波動模式,尤其在節(jié)假日期間復(fù)雜交通場景下表現(xiàn)出顯著優(yōu)勢。相比傳統(tǒng)模型,LSTMAttention模型在平均絕對誤差(Mean Absolute Error,MAE)和均方誤差(Mean Squared Error, MSE)上均實(shí)現(xiàn)了顯著優(yōu)化,為動態(tài)路徑規(guī)劃、交通管理優(yōu)化和應(yīng)急響應(yīng)提供了重要的技術(shù)支持。文章研究成果不僅驗(yàn)證了深度學(xué)習(xí)技術(shù)在交通預(yù)測中的有效性,也為復(fù)雜交通場景的通行時間分布預(yù)測提供了新的研究思路。
關(guān)鍵詞:高速公路通行時間;深度學(xué)習(xí);注意力機(jī)制;LSTM;交通流量預(yù)測
中圖分類號:U4911文獻(xiàn)標(biāo)志碼:A
0引言
隨著城市化的推進(jìn)與機(jī)動車數(shù)量的持續(xù)增長,高速公路面臨前所未有的交通壓力:車輛增多造成擁堵頻發(fā)、事故風(fēng)險(xiǎn)上升,而節(jié)假日與高峰期的流量波動則使交通預(yù)測難度進(jìn)一步加劇。在此背景下,高速公路通行時間分布預(yù)測的價(jià)值日益凸顯。與單一的期望通行時間相比,通行時間分布預(yù)測通過分析歷史數(shù)據(jù),為路徑規(guī)劃和交通管理提供更精細(xì)的決策支持[1]。
從研究趨勢看,通行時間分布預(yù)測方法經(jīng)歷了從參數(shù)模型到無參數(shù)模型、再到組合模型的逐步演變。參數(shù)模型多依賴于統(tǒng)計(jì)和物理過程,如卡爾曼濾波器和自回歸移動平均模型,這些方法在面對復(fù)雜的交通環(huán)境和非線性交通流量特征時,表現(xiàn)出一定的局限性。朱征宇等[2]提出了一種基于卡爾曼濾波器和支持向量機(jī)的混合短期交通流預(yù)測方法。該研究通過結(jié)合卡爾曼濾波器的狀態(tài)估計(jì)能力和支持向量機(jī)的強(qiáng)大非線性映射能力,提高了交通流預(yù)測的準(zhǔn)確性。隨著數(shù)據(jù)驅(qū)動方法的興起,無參數(shù)模型逐漸成為通行時間分布預(yù)測領(lǐng)域的主流。Vlahogianni[3] 研究了優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)在短期交通流預(yù)測中的應(yīng)用,展示了無參數(shù)模型在捕捉復(fù)雜交通流模式中的優(yōu)勢。然而,單一的無參數(shù)模型在面對交通流的多變性和不確定性時仍存在一定的局限。近年來,組合模型逐漸成為研究熱點(diǎn)。Wu等[4] 提出了一種混合深度學(xué)習(xí)框架,融合了時空相關(guān)性,用于短期交通流量預(yù)測。該研究探討了深度學(xué)習(xí)與傳統(tǒng)預(yù)測方法的組合在交通預(yù)測中的前沿應(yīng)用。
通行時間分布預(yù)測盡管已取得了長足進(jìn)展,但仍面臨關(guān)鍵挑戰(zhàn),對節(jié)假日等異常流量缺乏有效捕捉機(jī)制、預(yù)測模型的實(shí)時性不足以及神經(jīng)網(wǎng)絡(luò)超參數(shù)調(diào)整煩瑣等問題依然存在。為應(yīng)對上述挑戰(zhàn),本文基于高速公路門架系統(tǒng)采集的數(shù)據(jù),提出了一種融合注意力機(jī)制的LSTMAttention模型并與傳統(tǒng)LSTM模型進(jìn)行對比,驗(yàn)證其在節(jié)假日與非節(jié)假日場景下對核心輸入特征具有更精準(zhǔn)的動態(tài)聚焦能力。
1數(shù)據(jù)來源與預(yù)處理
11數(shù)據(jù)來源
本研究的數(shù)據(jù)來自貴陽至黃果樹高速公路的某段連續(xù)門架系統(tǒng),采集時間范圍為2024年5月1日至5月14日,共計(jì)14天的所有車輛通行數(shù)據(jù)。數(shù)據(jù)總量約為1000 MB,涵蓋節(jié)假日和普通工作日的交通情況。
12數(shù)據(jù)預(yù)處理
在對原始數(shù)據(jù)進(jìn)行分析和建模之前,須對數(shù)據(jù)進(jìn)行預(yù)處理,以確保數(shù)據(jù)的質(zhì)量和模型的有效性。數(shù)據(jù)預(yù)處理步驟主要包括數(shù)據(jù)清洗、特征選擇、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)分割等。首先,對原始數(shù)據(jù)進(jìn)行完整性和一致性檢查。(1)缺失值處理:檢測各字段是否存在缺失值。對于少量缺失的數(shù)據(jù)記錄,予以刪除;對于關(guān)鍵字段缺失的數(shù)據(jù),考慮利用線性插值方法或其他統(tǒng)計(jì)方法進(jìn)行填補(bǔ)。(2)異常值處理:針對通行時間、累計(jì)里程等數(shù)值型字段,采用箱線圖(Box Plot)方法檢測異常值。對于明顯異常的數(shù)據(jù),分析其產(chǎn)生原因并根據(jù)需要進(jìn)行修正或剔除。(3)重復(fù)數(shù)據(jù)檢測:檢查是否存在重復(fù)的通行記錄,避免同一車輛通行被多次記錄的情況。如有重復(fù)記錄,保留時間最早或最完整的一條數(shù)據(jù)。
其次,通過對原始數(shù)據(jù)的處理,繪制每天上行和下行不同道路的車流通行時間分布,為后續(xù)模型的構(gòu)建提供了數(shù)據(jù)支持。如圖1所示,研究特別關(guān)注了數(shù)據(jù)集中假期與日常車流量的顯著差異,假期的車流量幾乎在全天各時段均明顯高于日常水平且在高峰時段車流量的增長尤為顯著,遠(yuǎn)遠(yuǎn)超出了日常的車流量水平。假期的交通流量模式不僅具有更高的流量峰值,還呈現(xiàn)了更復(fù)雜的波動特性。
2模型設(shè)計(jì)
21長短期記憶網(wǎng)絡(luò)(Long ShortTerm Memory,LSTM)
在處理時間序列數(shù)據(jù)時,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)因其能夠利用序列數(shù)據(jù)的時間依賴性,成為常用的模型。然而,傳統(tǒng)的RNN在處理長序列時,容易出現(xiàn)梯度消失和梯度爆炸問題,導(dǎo)致模型難以捕捉長期依賴關(guān)系。為解決這一問題,Hochreiter等[5]提出了LSTM,通過引入門控機(jī)制,有效地緩解了梯度消失問題。
LSTM的核心是引入了細(xì)胞狀態(tài)和3個門控機(jī)制:輸入門、遺忘門和輸出門。這些門控機(jī)制通過控制信息的流動,選擇性地記憶或遺忘信息,從而捕捉長期依賴關(guān)系。
22注意力機(jī)制
LSTM在捕捉長期依賴方面有所改進(jìn),但在處理長序列時仍易出現(xiàn)信息壓縮、遠(yuǎn)端信息可能被忽視。注意力機(jī)制最初在機(jī)器翻譯領(lǐng)域提出[6],通過為輸入序列的不同部分分配不同的權(quán)重,從而更精準(zhǔn)地聚焦于當(dāng)前任務(wù)相關(guān)的信息。注意力機(jī)制的核心思想是,根據(jù)當(dāng)前的解碼狀態(tài),對編碼器輸出的隱含狀態(tài)進(jìn)行加權(quán)求和,得到上下文向量Ct,然后用于生成輸出。通用的注意力計(jì)算過程如下:
(1)計(jì)算注意力權(quán)重。
(3)計(jì)算上下文向量。
上下文向量ct表示模型在時刻t對輸入序列的加權(quán)關(guān)注。通過引入注意力機(jī)制,模型能夠動態(tài)地選擇重要的輸入信息,緩解長序列信息壓縮的問題,提高模型性能。
23LSTMAttention 模型在通行時間分布預(yù)測中的應(yīng)用
本文提出的LSTMAttention模型結(jié)合LSTM對時間序列的建模優(yōu)勢與注意力機(jī)制的動態(tài)加權(quán)特性,能更有效地捕捉交通流量的時變模式與關(guān)鍵特征。模型架構(gòu)如下:
(1)輸入層。輸入特征包括經(jīng)過預(yù)處理的時間特征、空間特征和車輛特征,組成時間序列輸入X={x1,x2,…,xT},其中,xT為時刻t的輸入特征向量,T為時間序列長度。
(2)LSTM編碼層。將輸入序列X輸入LSTM層,得到每個時刻的隱藏狀態(tài)序列H={h1,h2,…,hT},其中,hT包含了從時間1到t的歷史信息。
(3)注意力層。引入注意力機(jī)制,對LSTM的隱藏狀態(tài)序列H進(jìn)行加權(quán)求和,得到上下文向量c,用于捕捉與當(dāng)前預(yù)測任務(wù)最相關(guān)的時間步的信息。注意力權(quán)重的計(jì)算公式如下:
3實(shí)驗(yàn)設(shè)置與結(jié)果分析
31模型設(shè)置
實(shí)驗(yàn)設(shè)置模型由2部分組成:第一部分是LSTM層,用于處理輸入的時間序列數(shù)據(jù)。LSTM能夠通過其門控機(jī)制捕捉長期和短期的時間依賴性。第二部分是注意力機(jī)制層,能夠?yàn)長STM輸出的隱藏狀態(tài)分配不同的權(quán)重,進(jìn)而重點(diǎn)關(guān)注與當(dāng)前預(yù)測最相關(guān)的時間步。模型通過全連接層輸出預(yù)測的通行時間分布。
32結(jié)果分析
預(yù)測結(jié)果可以看出,LSTMAttention模型能夠有效捕捉節(jié)假日期間復(fù)雜的交通流特性,對交通高峰時段的通行時間分布預(yù)測尤為精準(zhǔn)。特別是在早晨和下午的高峰時段,模型的預(yù)測值緊密貼合真實(shí)值,表明引入注意力機(jī)制后,模型能夠動態(tài)聚焦于關(guān)鍵時間點(diǎn),提高對高峰期交通波動的響應(yīng)能力。同時,從整體趨勢來看,模型成功反映了節(jié)假日期間通行時間的波動模式,較好地避免了傳統(tǒng)LSTM模型可能出現(xiàn)的高峰時段誤差偏大或低谷時段預(yù)測不足的問題。
非節(jié)假日期間交通流量相對穩(wěn)定,通行時間的分布也更加平緩。在這種情況下,LSTMAttention模型同樣能夠準(zhǔn)確預(yù)測通行時間的變化趨勢且在低流量時段預(yù)測誤差較小。與節(jié)假日期間的預(yù)測相比,非節(jié)假日期間模型的預(yù)測值與真實(shí)值之間的差異進(jìn)一步減小,表明LSTMAttention模型在應(yīng)對穩(wěn)定交通模式時具有較強(qiáng)的泛化能力。
通過對比LSTMAttention和LSTM模型在相同數(shù)據(jù)集上的表現(xiàn),可以看出,LSTMAttention模型在節(jié)假日和非節(jié)假日的交通流量預(yù)測中都表現(xiàn)出更優(yōu)越的性能,尤其是在節(jié)假日的復(fù)雜交通流量下,其預(yù)測誤差顯著低于其他模型。實(shí)驗(yàn)結(jié)果如表1所示。
從表1中可以看出,LSTMAttention 模型在節(jié)假日和非節(jié)假日的場景下均表現(xiàn)出最優(yōu)的預(yù)測性能。節(jié)假日期間交通流量波動顯著,LSTMAttention模型的MAE和MSE分別為 645和978,顯著優(yōu)于LSTM(MAE=934,MSE=1456)。這表明注意力機(jī)制能夠有效捕捉節(jié)假日期間復(fù)雜的交通流量波動并動態(tài)聚焦關(guān)鍵時間步,提升預(yù)測精度。非節(jié)假日期間交通流量相對平穩(wěn),LSTMAttention模型的MAE和MSE分別為512和689,在對比模型中表現(xiàn)最佳。盡管非節(jié)假日交通流量的波動性較低,注意力機(jī)制仍然能夠通過動態(tài)加權(quán)的方式捕捉細(xì)微的時間序列特征,減少預(yù)測誤差。
4結(jié)語
通過引入注意力機(jī)制,LSTMAttention模型能夠動態(tài)聚焦關(guān)鍵時間段的交通流變化[7],尤其在節(jié)假日和高峰期表現(xiàn)出更高的預(yù)測精度。結(jié)合實(shí)驗(yàn)結(jié)果,注意力機(jī)制的引入顯著提升了模型對關(guān)鍵時間步的關(guān)注能力,尤其是在交通流量波動較大的時段(如節(jié)假日高峰期),能夠動態(tài)調(diào)整對歷史數(shù)據(jù)的權(quán)重分配,避免重要信息的丟失。消融實(shí)驗(yàn)進(jìn)一步驗(yàn)證了注意力機(jī)制的重要性,其單獨(dú)移除會導(dǎo)致模型性能大幅下降,表明注意力機(jī)制是提升預(yù)測精度的關(guān)鍵因素。
結(jié)合實(shí)驗(yàn)結(jié)果與實(shí)際應(yīng)用需求,未來研究可從以下幾個方面進(jìn)一步拓展:(1)引入其他高速公路或區(qū)域的多源交通數(shù)據(jù),構(gòu)建更大范圍、更全面的通行時間分布預(yù)測模型,以驗(yàn)證模型的通用性和適用性。(2)結(jié)合擴(kuò)展長短期記憶(Extended Long ShortTerm Memory,xLSTM)或時空混合密度網(wǎng)絡(luò)(SpatialTemporal Mixture Density Network,STMDN),進(jìn)一步捕捉交通流的空間依賴性,從而提升預(yù)測精度[8]。(3)深度學(xué)習(xí)模型通常需要較高的計(jì)算成本,尤其是在大規(guī)模數(shù)據(jù)集上進(jìn)行預(yù)測時。未來研究可嘗試引入輕量化模型(如 TinyML)或模型壓縮技術(shù),在保證預(yù)測精度的同時顯著降低計(jì)算開銷,提升模型的實(shí)用性。
參考文獻(xiàn)
[1]WANG Q,XU C,ZHANG W,et al.GraphTTE:travel time estimation based on attentionspatiotemporal graphs[J].IEEE Signal Processing Letters,2021(1):1.
[2]朱征宇,劉琳,崔明.一種結(jié)合SVM與卡爾曼濾波的短時交通流預(yù)測模型[J].計(jì)算機(jī)科學(xué),2013(10):248-251,278.
[3]VLAHOGIANNI E I,KARLAFTIS M G,GOLIAS J C.Optimized and metaoptimized neural networks for shortterm traffic flow prediction:a genetic approach[J].Transportation Research Part C:Emerging Technologies,2005(3):211-234.
[4]WU Y,TAN H.Shortterm traffic flow forecasting with spatialtemporal correlation in a hybrid deep learning framework[J].Neurocomputing,2016,205:22-32.
[5]HOCHREITER S,SCHMIDHUBER J.Long ShortTerm Memory[J].Neural Computation,1997(8):1735-1780.
[6]BAHDANAU D,CHO K,BENGIO Y.Neural machine translation by jointly learning to align and translate[J].CoRR,2014,abs/14090473.
[7]LI Y G,YU R,SHAHABI C,et al.Diffusion convolutional recurrent neural network:datadriven traffic forecasting[EB/OL].(2018-02-22)[2025-01-20].https://arxiv.org/abs/170701926.
[8]杜漸,段洪琳,王振華,等.面向高速公路通行時間分布預(yù)測的時空混合密度神經(jīng)網(wǎng)絡(luò)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2023(4):308-316.
(編輯王雪芬)