教欣萍,王江鋒*,陳磊,高志軍,董佳寬,黃海濤,葉勁松
(1.北京交通大學 交通運輸學院 綜合交通運輸大數據應用技術交通運輸行業重點實驗室,北京 100044;2.交通運輸部科學研究院,北京 100029)
智能交通協同誘導技術為有效改善高速公路出行服務水平提供了有力支撐,作為其中關鍵技術的短時交通流預測,可實現交通流態勢實時預估,為出行者提供更可靠的出行路徑參考方案。但是,交通流蘊含的不同時間維度信息對其短時預測結果具有顯著影響[1-2]。
目前,短時預測方法多考慮交通流低維信息,易使其信息丟失導致無法滿足預測精準度的要求。國內外學者陸續將卡爾曼濾波理論、K近鄰法、ARIMA模型等用于短時交通流預測[3-5]。文獻[6-9]基于卡爾曼濾波方法、K近鄰法提出一些改進算法用于優化預測性能;文獻[10-14]基于小波分析、高斯回歸過程、分形理論、突變理論、混沌理論等方法進行了短時交通流預測;神經網絡具有高度非線性的動力學系統,有強大的非線性擬合能力,文獻[15-18]將神經網絡方法應用于短時交通流預測,其中BP神經網絡應用最為廣泛;隨著組合模型的廣泛運用,文獻[19-21]將多種模型組合應用于短時交通流預測。傳統短時交通流預測算法大多將交通流數據視為一維時間序列,這種線性或平面數據表征方法忽略了交通流數據在多時間維度的信息挖掘,難以有效利用交通流數據的內部結構性和規律性。
近年來,張量作為一種高階數據空間的多重線性映射模型,可以深層挖掘數據內部結構與規律,已經成為大數據處理領域的研究熱點[22],國內外學者在張量理論研究方面積累了良好的研究基礎[23-25]。由于交通流數據在不同時間維度上具有很強的規律性,為張量理論應用于短時交通流預測提供了理論基礎。本文基于實際交通流速度數據,挖掘其在不同時間維度的規律特征,建立基于高精度低秩張量填充(high accuracy low-rank tensor completion,HALRTC)理論的短時交通流預測算法,提升短時交通流預測的預測效果與精度。
為了充分挖掘交通流數據在不同時間維度上的規律性,實現滾動式數據輸入預測未來時間段交通狀態,將短時交通流預測問題轉化為動態張量填充問題。以京港澳高速公路杜家坎路段2017年4月至6月共10周的速度數據為例,構建了周維度×天維度×時段維度的三維動態張量矩陣模型,如圖1所示。實際交通流數據從每日零點開始采集,每5 min為一時段,一天共采集288個時段數據。

圖1 動態張量模型示意圖
結合圖1構建的動態張量矩陣模型,設計基于HALRTC理論的短時交通流預測算法。該算法按照運算邏輯,包括算法函數確定、增廣拉格朗日函數轉換和迭代求解3個步驟,即可獲得短時交通流的預測結果。
設A為由交通流速度數據構成的三維動態張量,大小為I1×I2×I3。同樣設置大小為I1×I2×I3的非負權重張量W,權重張量中元素賦值如下:
(1)
引入3個相同大小的三維張量M1、M2及M3,則算法函數可定義為張量核范數最小化問題:

(2)
式中,M1(1)為M1按模式I1×(I2I3)展開所得數值矩陣,同理M2(2)、M3(3)為M2、M3按模式I2×(I1I3)、(I1I2)×I3展開所得數值矩陣。參數α1、α2及α3滿足α1+α2+α3=1,實際運算中3個參數常取相等數值。
對算法函數進行推導,可得其增廣拉格朗日函數如下:
(3)
式中,Y1、Y2、Y3為額外變量,參數ρ隨迭代次數而逐漸增加,通常設ρ0=ρ,有ρk+1=tρk,t∈[1.15,1.25]。
借助交替方向乘子法思路,可對式(3)進行迭代:

(4)

(5)

(6)
交替方向乘子法可確保增廣拉格朗日函數中迭代過程的收斂性,加快參數迭代計算過程。
對于M1、M2及M3,每次更新有如下優化問題:

(7)
通過奇異值收縮算子計算可得式(7)的閉形式解為:

(8)


(9)
由一階最優性條件可得其解為:

(10)
則N階張量X∈RI1×I2×…×IN的HALRTC算法函數與增廣拉格朗日函數可描述為:

(11)
s.t.X=Mi,i=1,…,n,

(12)


圖2 HALRTC預測算法邏輯流程圖
利用京港澳高速公路杜家坎路段2017年4月至6月速度數據對所提出HALRTC算法進行實證分析,分別進行天維度、周維度預測精度分析,以及缺失數據下該算法與其他經典算法的精度對比分析。
針對天維度,分析算法在周維度與時段維度預測精度的變化規律,選擇平均絕對誤差(mean absolute error,MAE)為評價指標。圖3為不同周維度、時段維度下第10周周一交通流速度預測精度結果。從時段維度上看,預測精度隨著時段維度的增大而增大,在時段維度為18或20時預測精度呈現平面狀態,MAE指標穩定在2.8%左右;從周維度上看,MAE在周維度大于6后表現出略微增長趨勢,說明所提出預測算法能夠基于較少歷史數據較快達到良好的預測效果。

圖3 天維度預測精度變化趨勢
針對周維度,分析算法在同周不同日的預測精度。表1為不同周維度、時段維度下第11周共計7 d的速度數據預測精度結果,MAE指標平均值約為3.6%。其中非工作日預測精度較低,說明當速度數據波動加大時,所提出算法需要更多歷史數據才能獲得良好預測效果。

表1 算法第11周速度預測精度結果
為深入分析速度數據波動較大時所提出預測算法的預測性能,分別選取第11周周四與周日作為分析對象,算法的預測精度結果如圖4所示。結果表明,當出現明顯速度波動時,所提出算法依然能夠有效預測速度波動,即使在速度波動頻繁的周日,算法也能取得良好的預測效果,成功實現對兩個速度高峰時期的曲線跟蹤。

圖4 算法針對速度波動的預測結果
針對不同比例缺失數據,分析所提出短時交通流預測算法的精度變化情況。表2給出了不同比例缺失數據情況下所提出算法的預測精度結果,預測精度隨缺失數據比例增大而呈現下降趨勢,說明所提出算法對數據缺失較為敏感,在短時交通流預測時也會對數據完整性有一定要求。對缺失數據進行預處理后,所提出算法的預測精度得到大幅提升。

表2 缺失數據下所提出算法預測精度結果
選擇ARIMA、BPNN和KNN作為比較算法,進一步分析不同比例數據缺失情況下所提出算法的預測性能。為保證算法預測結果的有效性,利用不同比例缺失數據分別進行4種算法預測性能測試,重復進行10次,測試結果的MAE指標平均值如圖5所示。隨著數據缺失比例增大,4種算法的預測精度均有所下降。相比較而言,本算法的預測效果較好,明顯低于其他3種經典算法的預測誤差,算法表現出更好的預測精度。

圖5 缺失數據下4種算法預測精度結果
針對交通流所蘊含的不同時間維度信息特征,本文從周維度×天維度×時段維度構建了動態張量模型,提出一種基于HALRTC理論的短時交通流預測算法。所提出算法可實現針對工作日與非工作日的交通流有效預測,MAE指標平均值約為3.6%,并能及時跟蹤交通流波動性。在缺失數據情況下,所提出算法預測精度隨數據缺失比例增大而降低,但相較于3種經典預測算法可表現出更好的預測精度。本文的算法效率有待提高,同時選取的路況比城市道路簡單,未來可以將HALRTC理論應用于城市道路并改進算法的效率。