金杰靈,史晨軍,鄧院昌
(1.中南大學 交通運輸工程學院,湖南 長沙 410075;2.肇慶市交通運輸局,廣東 肇慶 526060;3.中山大學 智能工程學院,廣東 廣州 510006)
道路交通事故造成的人員傷亡和財產損失是人類社會的主要威脅之一。據世界衛生組織2021年統計,道路交通事故每年大約造成130萬人死亡,約2 000萬~5 000萬人受傷,財產損失約占大部分國家國內生產總值的3%[1]。因此,對道路交通事故進行分析有利于緩解交通安全形勢。
交通事故風險預測是交通安全分析的重要分支,也是智能交通系統的重要模塊,對降低交通事故發生頻率起關鍵作用。在智能交通管理系統中,一旦知曉某地區在某一時間段事故發生風險較高,可通過信息發布系統提醒駕駛員或自動駕駛車輛繞行,降低事故發生的可能性。在相關文獻中,通常采用交通事故發生頻率表示特定空間和時間狀態下交通事故風險[2]。
交通事故具有典型的時空分布特征[3-4]。交通事故由駕駛員、天氣、環境和偶然事件等多種因素造成,事故時空分布數據存在大量噪聲,可能掩蓋其時空分布特征,所以通過挖掘事故時空分布特征,預測特定時間和空間的事故風險,具有一定挑戰性。
國內外學者對交通事故風險預測的研究分為傳統統計學類方法和機器學習類方法2類。常用統計學方法包括整合移動平均自回歸(ARMIR)模型和向量自回歸(VAR)模型。Rabbani等[5]使用單方程自回歸方法ARMIR預測中國季度單位時間序列的道路交通死亡人數;Michalaki等[6]建立VAR模型,探討高速公路碰撞與道路基礎設施、社會人口、交通和天氣特征之間的動態關系。統計學方法比較適用于分析低維時間序列數據,針對高維交通事故數據處理有一定困難。
部分學者通過機器學習模型,在高維事故數據中學習事故相關因素與事故之間的關系,對事故進行預測。Dong等[7]提出使用支持向量機(SVM)模型解決道路事故預測中高維時空數據處理比較困難的問題。文獻[8-9]基于具有時空特征及其他相關特征的事故數據,運用人工神經網絡(ANN)和BP神經網絡(BPNN)模型預測交通事故。為提高預測模型的準確性,將深度學習模型應用于交通事故預測中:Ren等[2]利用基于長短期記憶神經網絡(LSTM)的交通事故風險預測方法,對北京2016年交通事故頻率進行預測;Yu等[3]開發深度時空圖卷積網絡模型(GCN),捕捉交通事故預測時空模式;Yuan等[4]基于LSTM在挖掘時間特征方面的優勢和GCN在挖掘空間特征方面的優勢,開發新的卷積長短期記憶神經網絡(ConvLSTM)模型。機器和深度學習方法可用于處理高維時空事故數據,但該類方法依賴參數調整,并消耗大量計算資源。因此,開發1種既能高效處理高維數據,又能準確捕獲數據中時空相關性的方法十分必要。
動態模態分解(DMD)通過完全數據驅動的無方程策略,可從高維數據中捕捉時空關聯性,適合交通事故風險預測系統等缺乏物理特征信息的動態系統。具備無需依賴參數調整、完全數據驅動等優點,被廣泛用于流體系統、流行病學系統和金融系統等研究領域[10-12]。
鑒于此,本文基于美國丹佛市2021年7個月的交通事故記錄數據,以天為時間單位,以街區為空間單位進行整理,在整理后的數據集上,采用總最小二乘法去除數據噪聲,建立結合Hankel矩陣的動態模態分解(Hankel-DMD)模型,進行交通事故風險時空預測,并將預測結果與傳統統計分析模型、機器學習模型和傳統DMD模型進行對比,驗證Hankel-DMD模型的可行性及有效性。
DMD是基于動態系統的分析方法。假設城市交通事故風險波動是1個離散的動態系統,由測量值xt+1和測量值xt組成[13],如式(1)所示:
xt+1=Axt
(1)
式中:xt是系統在t時的狀態,xt∈RN;A是線性算子,A∈RN×N,N是空間維度。構建2個數據矩陣如式(2)~(3)所示:
X=[x1,x2,…,xM-1]
(2)
Y=[x2,x3,…,xM]
(3)
式中:X,Y∈RN×(M-1),表示動態系統在(1-(M-1))和(2-M)時刻的狀態集合,M為時間維度。 DMD最初是針對M?N的情況進行開發,空間維度可以囊括所有的時空主導模式。結合式(1)~(3),X,Y之間的關系如式(4)所示:
Y=AX
(4)
找到使X,Y之間的二階范數規范最小化的最佳線性算子A,即找到A的解,如式(5)所示:
(5)
方程的解可由X的奇異值分解得到,如式(6)所示:
A=YX?=YVΣ-1UT
(6)
式中:?為偽逆運算。
(7)
(8)
(9)
式中:W包含特征向量;Λ是特征值。
包含動態特性的動態模態Φ由式(10)給出:
(10)
Hankel-DMD(Dynamic Mode Decomposition with Hankel matrix,Hankel-DMD)為具有Hankel塊矩陣的DMD模型。在部分交通事故預測場景中,時間維度總數遠遠大于空間維度,既N?M。由于空間維度間存在一定依賴關系,使采用空間模式主導的DMD方法無法囊括所有時空模式,原始DMD公式不足以捕捉系統的全部主要時空特征。為此,將觀測值重新排列在Hankel矩陣中,通過將s個時間維度的觀測值附加到數據矩陣,以豐富觀測值[14]。Hankel矩陣如式(11)~(12)所示:
(11)
(12)
(13)
(14)
(15)
(16)
總最小二乘法(TLS)是線性最小二乘問題的降噪方法[15]。假設數據D是由理想無噪聲數據Dp和噪聲E組成,如式(17)所示:
D=Dp+E
(17)
降噪是為了從D中獲得Dp的適當估計,總最小二乘法假設無噪聲數據Dp與噪聲E正交,0為零向量,E為獨立同分布,則D的奇異值分解如式(18)所示:
(18)
(19)
本文實驗整理了丹佛2021年1月至2021年7月的交通事故記錄數據,將數據中的時間和空間信息整合為1個時空矩陣,分別以街區為空間單位,以天為時間單位,整合得到1個交通事故數量分布的時空矩陣,矩陣大小為78×212。
原始數據分布如圖1(a)所示,交通事故數據時空分布較離散,為更有效地提取事故時空分布特征,采用總最小二乘法對數據進行降噪,降噪后數據分布如圖1(b)所示,噪聲明顯減少。
圖1 去噪前后實驗數據集分布Fig.1 Distribution of experiment data sets before and after denoising
本次實驗使用交通事故頻率表示某一空間和時間狀態下的交通事故風險[2]。為討論Hankel-DMD交通事故時空風險預測模型性能,將其與統計學方法、機器學習方法和傳統的DMD方法預測效果進行比較。
ARMIA是最常用的一類時間序列預測模型,由差分、建模和預測3個步驟組成。ARMIA可以捕捉時間序列數據中變量的演化特征,將演化特征推算到未來,得到預測結果。
支持向量回歸機(SVRM)是支持向量機在回歸領域的發展,利用非線性映射函數,將輸入空間映射到高維特征空間,在特征空間中尋求最優線性函數,以獲得原始空間的非線性回歸效果。
BPNN是由誤差反向傳播算法訓練的多層前饋網絡,通過學習數據中相關因素間的關系進行預測,是使用最廣泛的神經網絡之一,也是機器學習中最常用的預測方法之一。
LSTM是特殊的遞歸神經網絡,能夠學習數據中的長期依賴關系,該模型的遞歸模塊由多個層相互作用地組合,常用于時間序列預測。
ConvLSTM是有卷積結構的遞歸神經網絡,將能夠抽取空間特征的卷積操作增加至能抽時序特征的LSTM網絡中,常用于時空預測。
在數據集中,選取前160個時刻數據作為訓練數據,后52個時刻數據作為測試數據。同時,分別評估模型的單步預測和多步預測準確性,單步預測為預測1 d,最大預測長度為7 d,使用平均絕對誤差(MAE)和均方根誤差(RMSE)對預測結果進行評估。MAE代表數據集中實際值和預測值之間絕對差異的平均值,衡量數據集中殘差的平均值,反映預測誤差的實際情況。定義Pt和Ot分別表示預測值和觀測值[16],MAE計算如式(20)所示:
(20)
RMSE用來衡量殘差的標準偏差,評估數據的變化程度[16],RMSE計算如式(21)所示:
(21)
1)模型結果比較分析
Hankel-DMD模型和其他模型的交通事故預測性能對比見表1,當MAE,RMSE越小,表示預測模型準確性越好。由表1可知,Hankel-DMD模型在本文實驗中整體預測效果相對最佳,DMD模型表現僅次于Hankel-DMD模型;隨預測步數增加,所有模型MAE,RMSE逐漸增加,但DMD和Hankel-DMD的增長趨勢相對較小,這說明DMD系列模型除單步預測精度較高外,多步預測的誤差增長率低于其他方法。上述結果驗證DMD系列模型在交通事故風險的時空預測方面的有效性和高準確性。
表1 不同模型方法對不同預測步長任務性能的比較Table 1 Comparison of performance for tasks with different prediction steps by different model methods
2) Hankel-DMD結果分析
測試集數據及DMD重構數據分布如圖2所示,DMD重構數據捕獲事故頻發的關鍵街區(如第1,9街區)和關鍵時間(如第42,47 d)。
圖2 測試數據和DMD重構數據的時空分布比較Fig.2 Comparison of spatio-temporal distribution of test data and DMD reconstructed data
圖3 Hankel-DMD提取的動態模態和特征值Fig.3 Dynamic modes and eigenvalues extracted by Hankel-DMD
Hankel-DMD模型提取的10個特征值如圖3(b)所示。特征值表示動態模態的時間演化特性:如果特征值虛部為0,那么相應動態模態存在振蕩特性;如果特征值在單位圓內,動態模態存在衰減特性;如果特征值在單位圓外,動態模態有增長特性[18]。由3(b)可知,特征值點在單位圓內或單位圓上,其中,有9個特征值在單位圓內,1個特征值在單位圓上,其虛部為0。由此可知,交通事故風險預測Hankel-DMD模型主要動態模態的時間演化特性分為振蕩和衰減2種。這說明特征值捕捉到丹佛交通事故動態系統的主要時間演化特征為一定周期性和逐漸下降的特點。
綜上,Hankel-DMD中的動態模態和特征值可捕捉城市交通事故風險發生的時空關聯性,同時,可以利用低秩解從高維交通事故數據中探索時空相關性,在交通事故風險時空預測任務中表現較好。因此,Hankel-DMD模型比較適用于城市交通事故的時空數據分析任務。
1)提出使用總最小二乘法去除事故數據噪聲,并建立結合Hankel矩陣的動態模態分解模型(Hankel-DMD),用于交通事故風險的時空預測;Hankel-DMD模型可基于具有一定數據噪聲的高維交通事故數據,捕捉事故的時空一致性關系,并預測交通事故風險。
2)應用統計學、機器學習、深度學習及傳統動態模態分解方法,與Hankel-DMD模型進行比較,結果顯示Hankel-DMD模型在MAE,RMSE方面的表現較優。
3)Hankel-DMD預測過程中產生的動態模態,可解釋城市交通事故風險預測動態系統的空間特性,進而解釋系統的時間特性。Hankel-DMD模型的結果具有一定的可解釋性,適用于城市交通事故風險時空預測。