黃紫竹



摘要 為了解決高速公路道路擁塞問題,建立相應的高速交通流預測模型是較好的解決途徑。文章綜合分析當前常見的交通流預測模型特點,提出了一種CNN-LSTM神經網絡預測模型,該模型能夠有效結合CNN神經網絡和LSTM長短時神經網絡的優點。通過采用該模型對西寶高速交通流進行預測后發現CNN-LSTM模型具有準確的預測性能,其可為高速公路交通管理運營提供數據支持,提高對突發事件的適應性。
關鍵詞 高速公路;交通流;預測模型;CNN神經網絡;LSTM
中圖分類號 U491.112 文獻標識碼 A 文章編號 2096-8949(2022)10-0013-03
0 引言
近年來隨著我國經濟的快速發展,人們對于交通運輸行業的發展也提出了更高的要求。當前我國高速公路的交通量與日俱增,常常出現高速堵車以及嚴重的交通事故。不僅影響了高速公路的正常運行,也給高速公路的通行安全帶來極大的隱患。因此,準確地對高速公路交通流進行預測能夠合理地規避上述問題,從本質上提升高速公路的服務質量。基于此,該文提出了一個基于CNN和LSTM的高速公路交通流預測模型,通過與其他模型對比分析后發現該模型在預測高速公路交通流方面具有更高的精確度。采用交通流預測模型能夠為高速公路的管理和運營提供有力的技術支撐。
1 交通流預測模型
1.1 模型分類
國內外學者對于交通流預測模型展開深入研究,提出了近300余種預測模型,總體可歸納為統計方法模型、神經網絡模型、非線性理論模型以及動態交通分配模型[1-3]。其中,統計方法模型是通過對歷史數據進行統計分析,得出未來交通流的預測結果。此類模型簡單,所需檢測設備簡單,一般適用于特定路段的預測。由于模型預測精度較差且不具備實時性,因此,目前已較少應用此類模型來預測高速公路的交通流。作為一種新興的數學方法,神經網絡的黑箱型的學習模式使其在交通流預測方面具有顯著優勢。在不需要任何經驗預測公式的基礎上,僅需對數據樣本進行學習便能得到準確的數學模型。也正基于此優點,神經網絡模型在預測時必須具有大量的數據樣本,一旦數據樣本較少,容易造成模型預測結果偏差很大。由于此類模型僅適用于預測數據所處的高速公路,對其他路段的交通流預測不具有普適性。非線性預測模型常以混沌理論、耗散理論等非線性系統為基礎,采用相關的非線性概念建立交通流預測模型。此類模型最大的特點是僅適用于交通流的短期預測,而不能用于長期預測。動態交通分配模型是用獲取的數據進行模擬,從而得到交通流的預測數據,由于采用靜態交通分配假設來進行動態交通流的預測,因此具備良好的理論基礎,但有些模型盡管解釋性好但可能存在無法求解或求解復雜等問題。此類模型一般不適用于大規模路網交通流的預測。表1中簡要給出了當前用于高速公路交通流預測的模型特征。
1.2 模型網絡結構
圖1為該文設計的高速公路交通流神經網絡模型結構。預測模型由輸入層、隱藏層和輸出層組成[4-5]。輸入層主要是對高速公路交通流照片進行采樣,操作流程是輸入交通流照片。隱藏層包含CNN卷積神經網絡和LSTM長短期神經網絡,其主要工作是將輸入層的圖片特征進行分析并最終輸出到LSTM中對交通流進行最后預測。基于CNN-LSTM神經網絡預測模型主要采用卷積層、池化層、全連接層以及LSTM,其中卷積層與池化層相對應,在池化層后將池化層的節點全部展開成特征向量形式,并最終輸入到LSTM長短期神經網絡中進行預測分析。
考慮到高速公路的交通流具有空間和時間效應,因此,在進行建模預測時必須將空間和時間作為整體。由于CNN卷積神經網絡能較好捕捉交通流的空間特征,因此,在后續的信息數據處理過程中必須考慮時間對交通流的影響。由于LSTM能夠反映輸入數據前后間的相互影響,因此,以其作為對交通流預測的時間響應模型。LSTM作為一種特殊的循環神經網絡,通常由輸入門、遺忘門以及輸出門組成,分別起著控制當前網絡狀態所需存儲的信息量、確定需要丟棄的狀態信息以及決定最后輸出的信息量的作用。單個時間步下的LSTM的網絡結構可表示為圖2。CNN-LSTM神經網絡的卷積層的核心是提取交通流圖片上的特征信息并進行分析。假定圖片大小為M\timesN,采用卷積核對圖像區域進行點乘從而得到卷積后圖像的像素值。按照上述方法,對圖像進行多次采用后,將所得數據存儲為一列即可實現全連接層的搭建。
1.3 模型構建
交通流預測模型的構建主要由卷積層、池化層、全連接層以及輸出層四部分組成。假定在當前時刻高速公路的交通流為一組特征向量,為準確預測一定時間內的高速公路交通流,因此,在上述特征向量的基礎上考慮時間的影響,從而將其轉化為了矩陣向量。卷積核和圖像的像素分別表示為M×N和m×n,卷積層通過采用Relu激勵函數對卷積面中的所有元素按下式進行計算:
式中,y為節點i與j的交通流情況,w為計算權重函數,m和n分別為交通流數據。
池化層采用下采樣法進行計算,將特征映射進行區域劃分后計算該區域的特征值。針對全連接層而言,作為前饋網絡通常采用同卷積層相同的Relu激活網絡進行計算,并得到交通流的特征信息。全連接層的輸出作為LSTM層的輸入,該層的輸出被送入Softmax分類器中進行分類,計算出現車輛特征的最大概率。
2 試驗結果分析
2.1 數據來源及數據預處理
該文的實驗數據來自西安市交通管理部門,路段為西寶高速路段,選取這條道路上的三個具有“上下游”關系的監測點的交通流量進行研究。結合道路1和道路2的交通量,對道路2的交通量進行預測。交通流量每10分鐘統計一次,共1個月數據(2019.12.1—2019.12.30),獲得數據4 350條。其中,以2019.12.1—2019.12.24時間段的車流量數據為訓練樣本,以2019.12.25—2019.12.30時間段的車流量為測試樣本。作為模型輸入的訓練樣本3 350個,測試樣本1 000個。
2.2 評價標準
為了準確地預測該路段未來的交通流的趨勢,所建立的交通流預測模型往往需要一個合適的評價指標。為了更加精確地反映該文所建立模型的精度,采用了均方根誤差(RMSE)、平均絕對誤差(MAE)和擬合優度(R)3個評價指標來驗證該文所提出的交通流預測模型的性能。這些評價指標的表達式可表示為:
2.3 模型參數分析
由于模型構建中CNN神經中卷積核的尺寸和模型的迭代次數對試驗結果的精度有一定影響,因此,在開展模型訓練及預測之前須開展交通流預測模型的自身參數研究。為了更為合理地確定卷積核尺寸大小和迭代次數,實驗過程中對不同卷積尺寸和迭代次數下模型預測的均方根誤差RMSE進行了統計,結果如圖3所示。結果表明,卷積核尺寸為3×3時,模型的預測誤差最小;當卷積核尺寸2×2和7×7時,模型的預測誤差較大,且最為復雜。雖然卷積核尺寸在3×3至6×6時均具有較小的RMSE,但考慮到卷積核尺寸越小,對模型預測速度影響較大。因此,模型中的卷積核尺寸最終確定為3×3。類似的,迭代次數與模型預測精度也表現為非線性關系,單一提高模型的迭代次數并非會得到更為準確的預測結果,根據對實驗結果的分析,模型的迭代次數確定為120次。
2.4 模型訓練
在建立好高速公路交通流的CNN-LSTM預測模型后,將預先準備好的訓練數據集和測試數據集輸入到該模型中并進行后續的訓練和測試工作。通過對模型參數調整,得到了交通流的預測結果。同時為了體現該文所建立模型的精度和優越性,對比分析了基于CNN神經網絡建立的交通流預測模型所預測的試驗結果,如圖4所示。從圖中可以看出,相較于基本的CNN神經網絡預測模型,該文所建立的CNN-LSTM模型與實際交通流更為接近,且精度更高,因此,采用本模型來模擬高速公路交通流時具有更好的效果。除此之外,為了更直觀地反映這兩個模型在模擬交通流時的精度,表2給出了各自模型的誤差評價指標。根據表及評價指標可知,CNN-LSTM預測模型的誤差指標均顯著低于基本的CNN神經網絡預測模型。綜上所述,CNN-LSTM模型在預測高速公路交通流方面更具優越性。
3 結論
作為高速公路運行規劃的前提條件,交通流預測是制約高速公路安全運營的主要因素。該研究以深度神經網絡為研究手段,通過結合CNN在數據提取方面和LSTM在前后交通流數據處理方面的優點,提出了CNN-LSTM交通流預測模型。以西寶高速為例,在經過調整模型參數后開展該模型的訓練和預測工作。通過對比預測交通流與實際交通流發現,該文所建立的CNN-LSTM交通流預測模型在高速公路交通流預測方面具有極高的精度,為交通管理和控制提供有效的依據。
參考文獻
[1]高小婷. 基于時空相關性的短時交通流預測模型[J]. 電腦知識與技術, 2020(18): 12-14.
[2]唐凡. 基于神經網絡的城市交通流預測研究[J]. 四川水泥, 2019(4): 335.
[3]蔣亞平, 郭俊亮, 趙軍偉. 基于組合模型的短時交通流預測[J]. 現代計算機, 2013(7): 26-29.
[4]胡伍生, 呂楚男, 夏曉明. 基于神經網絡的短期交通流預測模型[J]. 現代測繪, 2020(5): 10-13.
[5]蒲悅逸, 王文涵, 朱強, 等. 基于CNN-ResNet-LSTM模型的城市短時交通流量預測算法[J]. 北京郵電大學學報, 2020(5): 9-14.