王志成,張玉一,巴天星,常燕燕
(沈陽市規劃設計研究院有限公司,遼寧沈陽 110004)
良好的交通狀況以及有效的交通管理方案,對城市功能的多樣化與良性協同發展具有重要意義。隨著理論技術的不斷發展,智慧交通系統可以識別出擁堵路段并指揮城市交通。優異的交通指揮系統可以協助城市交通部門對道路進行管控,避免擁堵,從而提升出行效率[1-4]。
實時性是交通流最典型的特征,通常可以使用預測手段對道路進行指揮和疏導。目前最常用的方法就是利用安裝在路口的攝像頭采集圖像數據,或在地面安裝壓力傳感器獲取交通流量、機動車輛駕駛速度以及道路占用率等信息,再通過計算推導對交通流量進行準確預測[5-6]。同時,部分地區的交通數據還會被做成API 接口開放至第三方地圖軟件,以引導人們的出行。雖然現階段智能交通指揮系統的普及率較高,但由于交通流具有非線性、隨機性與實時性等特點,傳統的交通指揮系統大多僅能對少量指標進行分析,因此實時預測的準確性偏低。該文通過對多源數據進行異構與融合,做出準確預測,從而緩解城市交通的運行壓力。
長短時記憶時間循環神經(Long Short-Term Memory,LSTM)網絡[7-9]是一種由循環神經網絡(Recurrent Neural Network,RNN)演化而來的網絡模型。該模型具備處理時間特征數據的能力,可以實現對帶有時序特征數據的分析。RNN 模型依據時間展開的結構如圖1 所示。

圖1 RNN模型結構
在圖1 中,RNN[10-12]可以展開為不同時間節點的輸入。隱藏層函數的表達式如下:
輸出層函數為:
其中,b和c為相應的偏置,f(·)為核函數。
由于RNN 網絡在處理大規模數據序列時,會存在梯度消失的問題。因此LSTM 在結構層面對原模型進行了改進,即在RNN 的神經網絡中增加了三個門單元。該文所采用的LSTM 結構如圖2 所示。

圖2 LSTM的網絡結構
LSTM 的隱藏層由遺忘門、輸入門及輸出門組成。遺忘門能對內部神經元的狀態信息進行傳遞,其輸入為t-1 時刻的節點狀態輸出與當前時刻的數據,輸出為:
其中,Wf和Uf為遺忘門輸入權重值,bf為激活函數的偏置值,σ為Sigmoid 函數。
輸入門則主要用來控制輸入信息的數量,其由Sigmoid 函數和tanh 函數兩部分組合而成。輸入門的函數表達式為:
而tanh 函數的表達式為:
單元狀態由遺忘門的輸出與輸入門的輸入組成,其可表征為:
其中,⊙為同或邏輯運算。輸出門用來傳輸控制信息,其與輸入門具有相同的函數組成形式,如下所示:
因此在t時刻該文所采用LSTM 模型的輸出為:
在單向的LSTM 網絡中,模型數據僅應用了正向的數據流,但并未考慮逆向數據流。然而在對實際的交通流數據進行預測時,通常需要使用整個時間序列數據。正向與逆向的LSTM 網絡分別可以訓練t時刻前后的數據,因此將二者的網絡相結合,進而得到雙向LSTM(Bi-LSTM)網絡,其結構如圖3 所示。

圖3 Bi-LSTM網絡結構
由于該文使用的CIM 系統可以采集到實時的交通圖像,而LSTM 算法為循環神經網絡,其處理圖像的能力較差。因此,使用深度卷積神經網絡(Deep Convolutional Neural Networks,DCNN)對初始圖像進行預訓練,從而提取圖像的全局特征。
深度卷積神經網絡[13-15]在圖像識別與特征提取領域具有較大優勢,而DCNN 通過自主學習,能夠對圖像特征進行深層次的挖掘,網絡的主要架構如圖4所示。

圖4 深度卷積神經網絡的架構
圖4 所示的深度卷積神經網絡主要由輸入層、卷積層、池化層、全連接層以及輸出層組成。其中,輸入層為CIM 系統實時采集到的圖像數據,該層可以對原始圖像進行預處理,從而保障輸入圖像的歸一化。卷積層是深度卷積神經網絡的核心計算單元,其包含有多種維度的卷積核,能夠對圖像特征進行深層次的提取。池化層通過壓縮卷積層的輸出數據,進而去除特征數據的重疊信息,因此被保留下來的部分即可以代表圖像的本質特征,并提升算法的計算性能。而全連接層則將已完成的工作進行了整合,并將最終的特征數據映射至樣本空間。
單層DCNN 的結構較為簡單,對數據特征的提取并不準確,通常需要對DCNN 的卷積層進行合理的設置與安排。因此,文中使用多尺度的深度卷積神經網絡完成圖像的特征提取。多尺度的深度卷積神經網絡由大尺寸及小尺寸的卷積核組成,大尺寸卷積核可以獲得更佳的全局視野,而小尺寸卷積核則能得到更好的局部特征。
由上文可知,多尺度DCNN 獲取圖像特征需要多層合理的設置,但網絡層數過多可能會導致計算資源消耗的急劇上升,網絡性能也會發生不同程度的退化。因此,該文在多尺度DCNN 結構中加入了殘差網絡(Residual Network,ResNet)[16],將淺層及深層的卷積層相連接,進而優化網絡的整體性能。殘差網絡的結構如圖5 所示。

圖5 殘差網絡的結構
可以看到,通過殘差模塊的作用,輸出數據能夠綜合淺層的輸入與深層的輸出。同時,與二維卷積層的互相融合還可以對時間維度特征進行更好的把握。因此,該文所采用殘差模塊可以定義為:
其中,xl-1是第l-1 層殘差網絡的輸出,xl是第l層殘差單元的輸出,θl是第l層殘差單元參數集合,F為殘差函數的映射關系。傳統ResNet 網絡共有3 層,其結構如圖6 所示。

圖6 傳統的ResNet網絡
該文利用多尺度深度卷積神經網絡對ResNet 進行改進,在原網絡的基礎上,在每層殘差單元中加入了更多級的殘差結構。改進后的ResNet 結構如圖7所示。在經過第一層卷積后,經過第二子層時會有三個3×3 的卷積核,而這三個卷積核則可以感受到數據的所有特征信息,這樣每個殘差網絡都能夠得到不同尺度的數據特征。

圖7 改進后的ResNet網絡
綜上所述,該文最終設計得到的殘差卷積神經網絡結構如圖8 所示。

圖8 殘差卷積神經網絡結構
該文設計的算法總體模型如圖9 所示。模型數據為多源數據,其中,多尺度DCNN 模型為圖像特征的提取結構,模型的主要輸入部分則為CIM 交通系統提供的城市實時交通流三維模型。而Bi-LSTM 結構為多源數據訓練模型,多源數據包括時間、天氣與路況信息等。使用全連接層對訓練后的數據集進行分類,得到最終的數據標簽,進而對城市交通情況進行綜合分析,為后續管理措施的制定提供數據支撐。

圖9 算法總體模型
為充分驗證文中所提算法的有效性,實驗使用某地區2015—2020 年的交通數據作為訓練集,并將2021 年的數據作為驗證集。多尺度DCNN 模型的輸入數據為CIM 三維圖像模型集,其可實時反映交通流的狀態,并為LSTM 提供其他種類的多源數據。數據集的相關信息如表1 所示。實驗使用Python3.6 對算法進行編寫,相關軟硬件的配置環境如表2 所示。

表1 數據集相關信息

表2 軟硬件配置參數
為了驗證該文算法的可行性,根據編寫的程序對其分類性能進行測試。實驗測試指標選擇了均方根誤差(RMSE)和平均絕對值誤差(MAE)進行無單位的數值計算,而對比算法選擇了RNN、LSTM、CNN、SVM 和RF 算法。通過對訓練集進行模型訓練,并使用驗證集對結果加以驗證,實驗結果如表3所示。
由表3 可知,該文算法的RMSE 和MAE 誤差指標值分別為7.896 及4.259,與LSTM 原始算法相比誤差降低了0.878 和0.955。同時也可以看到,CNN 處理及挖掘時間序列特征的能力較差,RMSE 和MAE的值較高;而傳統算法例如RF 算法,在處理時間序列數據時則容易忽略時間特征。
除了使用LSTM 進行多源數據分析外,還使用多尺度DCNN 算法對CIM 三維圖像進行處理。多尺度DCNN 可以從三維圖像中獲得車流的詳細特征,因此還需要對該文所提出的多尺度DCNN 模型進行評價。評價指標為準確率、召回率以及F1 值,對比算法則為CNN、DCNN、ResNet、AlexNet 和ZFNet 算法。狀態識別結果如表4 所示。

表4 交通狀態識別結果
從表4 可以看出,該文算法對交通狀態的識別準確率能夠達到87%,證明其可以實現對交通三維圖像的精準識別及處理。此外,相較于其他對比算法,該文算法的評價指標均為最優。
良好的交通指揮系統,對提升城市的出行效率,減少交通擁堵有著重要的意義。該文基于CIM 系統與多源數據提出了一種動態交通信息分析算法。該算法由多尺度DCNN 模型和Bi-LSTM 模型組成,通過對CIM 三維數據進行訓練,進而獲取實時的交通情況并獲得相應的時序特征。實驗測試證明,所提方法的圖像識別性能與多源數據分類性能較為理想,具備可供工程應用的實時交通狀態識別能力。