中圖分類號:TP183 文獻標志碼:A DOI:10.13705/j. issn.1671-6841. 2024025
文章編號:1671-6841(2025)06-0058-07
Abstract: Highway freight always occupy a large share in the freight system. Compared with other traffc sources,data colected from gantry were more accurate. But the data were difficult to obtain,so the existing forecasting models rarely used gantry data to predict highway freight traffic.To address this issue,a short-term prediction model for highway freight traffic based on gantry data was proposed. Initially,the highway freight data were preprocessed. Then,an integration of atention mechanisms with AGCN was employed to excavate spatial correlations within the data,while ResNet and LSTM were utilized to uncover temporal dependencies.Finally,feature fusion was applied to derive the predicted highway freight traffic results.By comparative experiments,it was demonstrated that the proposed model exhibited higher accuracy in short-term highway freight traffic forecasting compared to baseline models such as LSTM and STNN.
Key words: short-time flow prediction; gantry data;deep learning; residual neural network ; long shortterm memory network
0 引言
隨著我國經濟的不斷發展,貨物運輸需求不斷增加,其中公路貨運在貨運體系中持續占據重要地位。據國家統計局統計,2022年公路貨運量達到371.2×108 t,占當年總貨物運輸量的 72.04%[1] 。由此可見,公路貨運在綜合交通系統中持續占據重要地位,迫切需要合理且先進的貨運管理與規劃來提升公路貨運效率。相較于當前廣泛使用的GPS軌跡數據,門架信息具有數據準確不會產生定位漂移、門架分布廣泛、數據量大等優點。因此,分析基于門架數據的高速公路貨車流量數據并準確地預測貨運流量對于提升高速公路貨運效率具有重要意義。
在短時流量預測方面,國內外學者提出了大量預測方案。傳統的短時交通流量預測方法有ARI-MA模型[2]、卡爾曼濾波模型[3]等參數模型, K 最近鄰模型[4]、高斯過程模型[5]等非參數模型及TVF-EMD-ARIMA等混合預測模型。然而由于難以滿足實時性要求以及精度不高的問題,現在的短時交通流量預測工作中已經很少用到傳統的預測模型。
隨著深度學習的發展,許多學者將深度學習技術用于短時流量預測任務,例如支持向量機模型、隨機森林模型等。深度學習技術在短時流量預測方面表現突出,例如長短期記憶(LSTM)網絡、門控循環單元(GRU)時間卷積網絡(TCN)等模型常用于短時交通流量預測任務。Ma等基于LSTM和Bi-LSTM模型提出了改進的LSTM_BILSTM方法,其準確率和穩定性均優于LSTM和Bi-LSTM模型。Shu等[8]采用一種改進的雙向正負反饋GRU預測模型Bi-GRU完成短期交通流預測任務。葉景等用CNN進行特征提取并提出一種經果蠅算法優化參數的XGBoost模型用于交通流量預測。Zheng等[10]提出了一種結合基于注意力機制的Conv-LSTM和Bi-LSTM的預測模型。Guo等[]提出基于注意力的時空圖卷積網絡(ASTGCN)模型來解決交通流預測問題。
但現有的研究還存在著以下問題:
1)由于交通流數據收集成本較高且大多數數據不公開,訓練數據難以獲取。以往的訓練真實數據較少,導致模型在真實場景下預測能力較差。現有的流量預測模型大多針對客車進行研究,所提出的模型對貨車適用度不高。
2)交通系統中位置之間的相關性是高度動態的,它們受出行模式和意外事件的影響而隨時間變化,但現有方法主要以靜態方式(預定義或自學習)建模空間相關性,這限制了學習動態交通模式的能力。
3)現有的基于GCN的流量預測模型,需預定義鄰接矩陣來進行圖卷積運算,得出的預定義圖不能包含有關空間依賴性的完整信息,與預測任務也沒有直接關聯,可能會導致較大的偏差。若缺少相關領域知識,這些方法便無法遷移至其他領域,泛化能力不強。
針對以上問題,本文采用真實門架數據信息,提出了基于注意力機制的時空殘差長短期記憶(AS-TResLSTM)的貨車流量短時預測模型,采用AGCN提取門架數據中的空間動態相關性,避免了權重參數過大無法優化和過擬合的問題,實現對高速公路貨車流量的多步預測,從而提升模型的預測準確度。
1模型方法
本文提出的ASTResLSTM網絡模型結合了Res-Net、AGCN和Attention-LSTM。其中,AGCN用于提取高速公路貨車數據中的空間相關性,Attention-LSTM用于提取高速公路貨車數據的時間相關性。ResNet用來解決深層神經網絡中的梯度消失和模型退化問題。
1.1 殘差神經網絡
由于一些神經網絡的深度較深,在訓練過程中可能會出現梯度消失或梯度爆炸等問題,He等[12]提出殘差神經網絡,解決了模型退化問題,極大提高了有效訓練的網絡深度,
xl+1=xl+F(xl,Wl),
式中: xι 和 xl+1 分別為第 l 個單元的輸入和輸出; F
為殘差函數。具體網絡結構見圖1。
1. 2 自適應圖卷積循環網絡
Bai等[13]提出了兩個自適應模塊,用于增強GCN的新功能:
1)節點自適應參數學習(NAPL)模塊,用于捕獲特定于節點的模式;2)數據自適應圖生成(DAGG)模塊,自動推斷不同流量系列之間的相互依賴關系。1.2.1節點自適應參數學習模塊由于時間序列數據的動態特性以及影響交通的節點因素的多樣性,不同交通序列之間的模式可能不同甚至相反。因此,僅捕獲所有節點間的共享模式不足以進行準確的流量預測,有必要為每個節點維護唯一的參數空間以學習每個節點的特定模式。
圖1改進的殘差塊結構
Figure1 Improved residual block structure

然而,對于一個包含 N 個相關單變量時間序列的大流量序列 X X∈RN×C 和 Z∈RN×F 為GCN層的輸入與輸出,每個節點維護參數空間會導致要學習的權重參數 θ∈RN×C×F 過大而無法優化,并且會導致過擬合問題。為解決此問題,本文使用了NA-PL模塊增強傳統的
。
NAPL通過學習兩個較小的參數矩陣來解決過擬合問題,即節點嵌入矩陣和權重池 WG∈Rd×C×F 。因此NAPL增強型GCN可表述為

式中:
為對稱歸一化矩陣; Ec 為節點嵌人矩陣; WG 為權重池; X 為特征矩陣, z 為學習的圖表示。
1.2.2數據自適應圖生成模塊現有的基于GCN的流量預測模型,需要預定義鄰接矩陣 A 來進行圖卷積運算。目前的研究中主要利用距離函數或相似度函數等直觀方法來預先計算圖,得出的預定義圖可能會導致較大的偏差。
使用DAGG模塊自動從數據中推斷出隱藏的相互依賴關系。DAGG模塊首先為所有節點隨機初始化一個可學習的節點嵌入字典
,其中:EA 的每一行表示節點的嵌入; d 表示節點嵌入的維度。與通過節點相似度定義圖類似,通過 EA 和 EAT 相乘來推斷每對節點之間的空間依賴關系,即

式中:softmax用于對自適應矩陣進行歸一化。在訓練過程中, EA 會自動更新,以學習不同流量序列之間隱藏的依賴關系,并獲得圖卷積的自適應矩陣。DAGG增強型GCN可以表述為
Z=(IN+softmax(ReLU(EA?EAT)))Xθ°
1.3注意力長短期記憶網絡
為了捕獲之前網絡層提取特征的不同權重,本文在模型中引入了注意力長短期記憶網絡。傳統的注意力長短期記憶網絡模型往往根據時間步長的遠近分配權重參數,為相距較近的時間步長分配的權重參數較重,為相距較遠的時間步長分配的權重參數較輕。但交通流量會受到網絡拓撲結構、車輛進出流量等多種因素的共同影響,預測模型比較復雜,分配權重參數僅僅基于距離難以滿足預測需求。基于 Wu 等[14]設計全連接神經網絡來學習權重的方法,用全連接網絡根據LSTM的輸出進行評分并獲得權重,


式中: Out∈Rm×n 為長短期記憶網絡模型的輸出,?m 表示時間步長, n 表示每個時間步長的特征數量;A 是與 ?Out 形狀相同的權重矩陣;·表示Hadamard積; f 表示全連接層; W 是 f 的權重矩陣。
2 貨車短時流量預測
本文提出的ASTResLSTM模型,結構如圖2所示。該模型由三部分組成
1)數據預處理。對輸入的門架數據進行清洗,去除原始數據中的異常值并篩選出貨車數據,按照近鄰周期、日周期進行數據切片,最后進行數據歸一化。
2)時空特征提取。通過ResNet和基于注意力機制的LSTM提取貨車流量數據的時間特征,通過AGCN提取高速公路貨車數據中的空間特征。
3)特征融合輸出。對提取出的時空特征進行融合,得到最終的貨車流量預測結果
2.1 數據預處理
2.1.1數據清洗數據質量是影響模型預測效果的關鍵因素,結合門架數據的特點,對輸入的數據進行操作。
1)異常數據清洗。門架數據中存在同一輛貨車在很短時間內連續通過同一個門架的錯誤記錄,通過對門架數據進行分析,設置 15min 的閾值,刪除 15min 內同一輛車連續通過同一門架的錯誤數據。
圖2ASTResLSTM模型 Figure 2The ASTResLSTM model

2)冗余數據清洗。針對同一貨車在同一時間內有多條重復的門架記錄,可通過刪除重復數據來清除冗余數據。
3)篩選貨車數據。門架數據中除了貨車數據,還有客車數據,根據門架表中的車型代碼字段篩選出貨車數據。
2.1.2數據切片由于門架數據具有時間周期性,為有效提取其周期性特征,將數據沿時間軸截取一定長度,得到近鄰序列 Ic 和日序列 Id 。對于特征矩陣 Xt∈Rn×m,n 為高速門架數, m 為節點的特征數量。
預測窗口的近鄰周期序列 Ic 、日周期序列 Id 計算為式(7)(8),時間序列圖見圖3,
Ic=(Xt0-c×o+1,…,Xt0-o+o),
Id=(Xι0-d×q+1,…,Xι0-q+p)
其中: t0 是預測點對應的編號; σo 為一小時中的數據點個數; q 為一天中的數據點個數( q=24×O 】。
圖3 時間序列圖
Figure3Time sequence diagram

2.1.3數據歸一化為消除數據間的量綱影響,在模型訓練前對數據進行歸一化處理。本文采用反正切函數歸一化,歸一化后的數據區間為[0,1]。

式中: x 為待歸一化的數據; x* 為歸一化后的數據。
2.2 時空特征提取
在時間序列中,路網中的信息一直在動態變化,所以在不同的時間點,路網的各個節點的關注權重也不同,可能會逐漸丟失節點信息。因此使用注意力機制從不同時間點的路網信息中自適應地衡量各個節點的重要程度,用分配概率方法取代原來的隨機分配,通過結合多種結構有效挖掘數據間的內在規律,增強節點的關鍵信息。節點注意力單元的計算為


Ot=Ot′+αt?Ot′,
式中: oι,i′ 表示 χt 時刻路網上第 i 個節點的隱含狀態;et 表示 χt 時刻所有節點的信息聚合; W,Wo,We,Us bs,bu 為可訓練的參數; αι 為所有節點的注意力分數。
通過使用注意力機制將時刻所有節點信息進行匯總,再通過全連接層,從而得到各個節點相對于全部節點的注意力權重,增強了關鍵節點的信息,更好提取門架數據中的時間特征。
對于門架數據的空間特征提取,采用AGCN實現。首先為每個樣本構建和學習獨特的殘差拉普拉斯矩陣,將學得的殘差圖拉普拉斯算子添加到初始圖中;然后學習共享的最優距離度量參數,圖的拓撲結構隨著網絡的訓練而更新;最后通過全連接層,提取門架數據的空間特征。
2.3 特征融合輸出
特征融合是指將不同來源或不同層次的特征信息合并在一起,以提高模型的表達能力和預測精度。
本文采用矩陣融合和注意力融合方式獲得融合后的特征數據。矩陣融合是將不同來源或不同層次的特征向量通過矩陣乘法進行融合,融合方法如式(13)所示。注意力融合是根據注意力權重對不同來源或不同層次的特征進行加權融合。綜合利用矩陣融合和注意力融合方法可以獲得更充分融合的交通網絡特征數據。

式中: ? 為Hadamard乘積; Wc,Wd,WG 分別為近鄰周期、日周期和拓撲結構分支的權重參數;權向量W 中的值在訓練前隨機初始化,并隨著反向傳播過程更新。
3實驗部分
3.1 實驗設置
本文所用數據源于河南省高速公路門架數據,門架數據時間為2023年3月6日—12日,數據規模約5.2億條,門架數據結構如表1所示,門架分布情況如圖4所示。
表1門架數據表
Table1Gantrytrafficdatasheet

圖4門架數據分布圖

觀察分布圖可得,從整體來看門架數據分布廣泛且較為均勻,從局部來看道路交叉節點門架較為密集,有利于精準識別車輛去向,減少流量預測誤差。
本次實驗采用Python3.7編程語言實現,并在Windows10操作系統下運行。在訓練模型的過程中,采用Adam梯度優化算法,學習率為0.001。模型最小預測時長為 1h ,最大預測時長為 3h 。為對比實驗結果,采用平均絕對誤差( MAE )、均方根誤差(RMSE)作為誤差分析指標,即


式中: yi 表示第 i 個門架數據樣本的實際貨車流量;
表示第 i 個門架數據樣本的預測貨車流量; n 為樣
本數。
本次實驗采用LSTM、時空神經網絡(STNN)兩種模型作為對比模型
1)LSTM:適合處理和預測時間序列中間隔和延遲非常長的重要事件,用來解決一般的循環神經網絡(RNN)存在的長期依賴問題。
2)STNN[15]:主要通過一個隱藏動態組件,使用觀測數據進行預測,學習整個序列的從屬關系。相比RNN,STNN觀測序列的動態行為完全由隱狀態決定,沒有受到任何外部輸入的影響,從而提高交通預測的準確性。
3.2 數據分析
首先對門架數據進行分析,通過代碼統計每個門架一周內通過的貨車流量,并繪制出熱力圖,熱力圖顏色的深淺表示該門架貨車的流量大小,部分門架貨車流量熱力圖如圖5所示。
圖5門架貨車流量熱力圖
Figure 5Thermal diagram of gantry traffic flow

觀察熱力圖可以發現,門架通行流量分布呈點狀集中,在圖5中所示區域通行流量由西北到東南遞增,并存在三個流量集中區域,流量分布呈現出較強的空間相關性。
3.3 實驗結果
為了測試ASTResLSTM模型的效果,本文采用不同的時間尺度進行預測,包括
和 3h 。通過在這些不同的時間間隔上進行預測,驗證模型在不同尺度下的性能表現,預測結果使用MAE和RMSE與LSTM、STNN模型進行對比。對比實驗結果如表2所示。
表2對比實驗結果
Table 2 Comparison experimental results

觀察表2可知,當預測時長為 1h 時,ASTResLSTM的MAE較LSTM下降了 36.99% ,較STNN下降了15.32% 。可以發現,LSTM能夠有效學習時間維度的趨勢規律,卻無法提取空間維度的趨勢。相比LSTM,STNN觀測序列的動態行為完全由隱狀態決定,沒有受到任何外部輸入的影響,從而提高交通預測的準確性。相比之下,ASTResLSTM不僅采用時間和空間兩個維度學習特征后融合的方式,還采用自適應圖卷積來提高泛化能力。因此,隨著預測時長的增加,三種模型的誤差均呈上升趨勢,而 AS-TResLSTM模型在各個預測時長和評價指標上預測結果均優于其他模型,誤差結果對比見6。
圖6預測誤差對比圖
Figure 6 Comparison chart of prediction error

從圖6中可知,隨著預測時間增長,ASTResL-STM相較于LSTM和STNN模型誤差增長幅度更小。實驗結果表明,所提出的模型在短時高速公路貨車流量預測任務上的準確度得到了穩定的提升。
為進一步展示ASTResLSTM模型的預測結果,對STNN以及ASTResLSTM模型進行了三步預測,并通過可視化方式呈現預測結果。選擇其中一個門架的節點進行貨車流量短時預測分析,圖7表示模型在 1h.2h 和 3h 三個時間尺度下的預測圖像。可以明顯看出,ASTResLSTM模型由于使用了自適應圖卷積,可以同時捕捉多個節點之間的關系,對于這種具有空間依賴性的客流數據更為適用,流量預測結果比較準確,擬合效果較好,明顯優于STNN模型預測結果。
圖7 預測結果圖
Figure7Graphofpredictionresult

4結語
本文基于真實門架數據信息,提出了一種結合ResNet、AGCN和Attention-LSTM的貨車流量短時預測模型,通過與LSTM、STNN等基線模型作對比,發現ASTResLSTM模型預測的準確率更高。
由于本文中的AGCN模型引入了節點自適應參數學習模塊和數據自適應圖生成模塊,因此我們的模型避免了權重參數過大無法優化和過擬合的問題,并且具有較強的泛化能力。
除本文考慮的因素外,還有交通事故、貨運需求、快遞中轉站地理分布等因素與貨車流量相關,后續工作中將對高速公路貨車流量預測問題進行更全面的考慮,進一步提升模型性能
參考文獻:
[1] 國家統計局.國家數據貨運量[EB/OL].(2022-02- 23)[2023-11-13]. https://data.stats. gov.cn/easyquery. htm? cn=C01 National Bureau of Statistics.Nationaldata freight volume [EB/OL]. (2022-02-23)[2023-11-13]. https:// data. stats. gov. cn/easyquery. htm? cn=C01 :
[2] AHMED M S,COOK A R. Analysis of freeway traffic time-series data by using box-jenkins techniques[M]. Washington:Transportation Research Board,1979.
[3] 楊高飛,徐睿,秦鳴,等.基于ARMA和卡爾曼濾波 的短時交通預測[J].大學學報(工學版),2017, 38(2):36-40. YANGGF,XUR,QIN M,et al. Short-term traffic volumeforecastingbased on ARMA and Kalman filter[J]. Journal of Zhengzhou university (engineering science), 2017,38(2) :36-40.
[4] ZHANGL,LIUQC,YANGWC,etal.Animproved (20號 K -nearest neighbor model for short-term traffic flow prediction[J]. Procedia-social and behavioral sciences, 2013,96:653-662.
[5] XIE Y C, ZHAO K G, SUN Y,et al. Gaussian processes for short-term trafic volume forecasting[J]. Transportation research record,2010(2165):69-78.
[6] 陳萱,康杰,張文軒,等.基于TVF-EMD 和ARIMA 模型 的短時交通量預測研究[J].交通技術,2023,12(3): 188. CHENX,KANGJ,ZHANGWX,etal.Researchon short-term traffic flow forecasting based on TVF-EMD and ARIMA model[J].Open journal of transportation technologies,2023,12(3):188.
[7]MA CX,DAIG W,ZHOUJB.Short-term traffic flow prediction for urban road sections based on time series analysis and LSTM_BILSTM method[J]. IEEE transactions on intelligent transportation systems,2022,23(6) : 5615-5624.
[8]SHU W N,CAI K,XIONG N N. A short-term traffic flow prediction model based on an improved gate recurrent unit neural network[J]. IEEE transactions on intelligent transportation systems,2022,23(9):16654-16665.
[9] 葉景,李麗娟,唐臻旭.基于CNN-XGBoost 的短時交 通流預測[J].計算機工程與設計,2020,41(4): 1080-1086. YE J,LI L J, TANG Z X. Short-term traffic flow forecasting based on CNN-XGBoost[J]. Computer engineering and design,2020,41(4):1080-1086.
[10] ZHENG HF,LIN F,FENG X X,et al. A hybrid deep learning model with attention-based Conv-LSTM networks for short-term traffic flow prediction[J]. IEEE transactionson intelligent transportation systems,2021, 22 (11):6910-6920.
[11]GUO S N,LIN Y F,FENG N,et al. Attention based spatial-temporal graph convolutional networks for traffic flow forecasting[ C]//Proceedings of the AAAI Conference onArtificial Intelligence.Palo Alto:AAAI Press,2019: 922-929.
[12]HE K,ZHANG X,REN S,et al. Identity mappings in deep residual networks[C]//European Conferenceof Computer Vision. Cham:Springer International Publishing,2016:630-645.
[13]BAI L,YAO L N,LI C,et al. Adaptive graph convolutional recurrent network for traffic forecasting[C]//Proceedings of the 34th International Conference on Neural Information Processing Systems. New York: ACM Press, 2020: 17804-17815.
[14]WU YK,TAN HC,QIN L Q,et al. A hybrid deep learning based trafic flow prediction method and its understanding[J]. Transportation research part C: emerging technologies,2018,90:166-180.
[15] ZIAT A,DELASALLES E,DENOYER L,et al. Spatiotemporal neural networks for space-time series forecasting and relations discovery[C]//IEEE International Conference on Data Mining. Piscataway:IEEE press,2017: 705-714.