李松江,弓晉霞,丁 巖,王 鵬
(長春理工大學 計算機科學技術(shù)學院,吉林 長春 130022)
目前,短時交通量預測模型主要分為時間序列模型[1]、卡爾曼濾波模型[2]、歷史平均模型[3]、人工神經(jīng)網(wǎng)絡(luò)模型[4]、支持向量機模型[5]和組合預測模型[6,7]等。同時,國內(nèi)外專家學者對天氣條件、時空因素以及交通狀態(tài)等因素對交通量的影響,進行了定性和定量的研究,將其應(yīng)用于交通量預測中并取得了一定的成果。Koesdwiady A等[8]利用決策層數(shù)據(jù)融合技術(shù)將天氣數(shù)據(jù)與交通量數(shù)據(jù)融合,提高了交通量預測精度;Li等[9-12]結(jié)合上下游特性和時間序列性,提出了時空特性交通量預測模型;楊春霞等[13]對不同時間尺度的周期相似性進行分析,提出了基于相似性的短時交通量預測模型。然而,大多數(shù)研究只是在分析上下游關(guān)系和時間序列性的基礎(chǔ)上進行交通量預測,沒有同時考慮時間周期性對交通量預測的影響;且僅對輸入特征進行討論,尚未對預測結(jié)果進行優(yōu)化。針對上述兩方面的不足,本文綜合考慮了高速公路交通量的時間序列性、周期相似性以及空間序列性,對不同特性的狀態(tài)向量進行定義。以BP神經(jīng)網(wǎng)絡(luò)預測模型為基礎(chǔ),結(jié)合自適應(yīng)加權(quán)數(shù)據(jù)融合算法構(gòu)建了基于數(shù)據(jù)融合的高速公路短時交通量預測模型。利用相關(guān)性計算方法對時空特性進行分析,研究不同維度的輸入數(shù)據(jù)對模型預測精度的影響。
在高速公路路網(wǎng)中,歷史時刻交通量、人們出行選擇的總體規(guī)律性以及上下游實時交通狀態(tài)變化均對路段交通量產(chǎn)生一定的影響,使得交通量呈現(xiàn)3個明顯的時空特性:時間序列性、周期相似性和空間序列性。高速公路路段上的交通量,會隨著時間的變化而變化,當前時段的交通量與前幾個時段的交通量之間存在著必然的聯(lián)系,即時間序列性。
定義1 設(shè)m個時間段的交通量數(shù)據(jù)構(gòu)成一個時間序列列向量,前n個時刻的交通量時間序列列向量構(gòu)成時間序列矩陣Xtime。Xtime表示為
(1)
由于高速公路交通量產(chǎn)生于人們的出行,人們的生活作息出行整體上呈現(xiàn)相似程度不同的周期規(guī)律性,這將直接影響著交通量的數(shù)據(jù)特征,導致高速公路交通量存在著以日、星期、月、季度等為單位的周期規(guī)律性,即周期相似性。
定義2 設(shè)m個時間段的交通量數(shù)據(jù)構(gòu)成一個周期列向量,p個周期的交通量數(shù)據(jù)列向量構(gòu)成周期相似矩陣Xperiod。Xperiod表示為
(2)
高速公路路段之間相互連通,上下游相鄰路段的交通狀態(tài)相互影響,當本路段的上游路段或下游路段交通量發(fā)生變化時,必然會對當前路段的交通量產(chǎn)生一定的影響,即空間序列性。
定義3 設(shè)m個時間段的交通量數(shù)據(jù)構(gòu)成目標路段空間序列列向量,l個相鄰路段的交通量數(shù)據(jù)構(gòu)成空間序列矩陣Xsection。Xsection表示為
(3)
高速公路交通量受到人文地域、自然環(huán)境、天氣條件、實時路況等多種因素的影響,又具有不確定性、復雜性、非線性的特點。故本文選取應(yīng)用最廣泛、適用于非線性且難以用數(shù)學模型表示的復雜系統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)[14]作為基礎(chǔ)模型,對時空特性交通量進行預測。在短時交通量預測中,時間特性預測與空間序列預測在性質(zhì)上存在著不可忽視的差別。為了充分考慮時空因素對交通量預測的影響,以總均方誤差最小為原則,結(jié)合自適應(yīng)加權(quán)數(shù)據(jù)融合算法,對時間特性預測值和空間序列預測值進行融合,使融合后的預測值更接近于真實值,構(gòu)建如圖1所示的基于時空數(shù)據(jù)融合的高速公路交通量預測模型。

圖1 時空數(shù)據(jù)融合的高速公路交通量預測模型
該預測模型主要分為3部分:一是時間特性交通量預測;二是空間序列交通量預測;三是利用時空數(shù)據(jù)融合算法對時間特性預測值和空間序列預測值進行融合。具體步驟如下所示:
(1)確定目標路段、預測日期和以15 min為時間間隔的時間段數(shù)m。
(2)時間序列交通量預測
選取預測日期目標時刻前n個時刻的時間序列交通量數(shù)據(jù)組成的時間序列矩陣Xtime,作為神經(jīng)網(wǎng)絡(luò)預測模型的輸入;建立BP神經(jīng)網(wǎng)絡(luò)時間序列交通量預測模型,設(shè)置隱含層層數(shù)、隱含層神經(jīng)元數(shù)、激活函數(shù)和各層傳遞函數(shù),選取網(wǎng)絡(luò)優(yōu)化函數(shù);對模型參數(shù)進行初始化,利用選取的樣本數(shù)據(jù)集進行訓練;利用訓練好的神經(jīng)網(wǎng)絡(luò)預測模型進行預測,輸出時間序列交通量預測值,記為ut。
(3)周期相似性交通量預測
選取預測日期同一時刻的前p個周期的交通量數(shù)據(jù)組成的周期相似性矩陣Xperiod,作為神經(jīng)網(wǎng)絡(luò)預測模型的輸入;建立BP神經(jīng)網(wǎng)絡(luò)周期相似性交通量預測模型,設(shè)置隱含層層數(shù)、隱含層神經(jīng)元數(shù)、激活函數(shù)和各層傳遞函數(shù),選取網(wǎng)絡(luò)優(yōu)化函數(shù);對模型參數(shù)進行初始化,利用選取的樣本數(shù)據(jù)集進行訓練;利用訓練好的神經(jīng)網(wǎng)絡(luò)預測模型進行預測,輸出周期相似性交通量預測值,記為up。
(4)時間特性交通量預測
采用步驟(2)和步驟(3)得出的預測值ut和up,作為時間特性神經(jīng)網(wǎng)絡(luò)預測模型的輸入;建立BP神經(jīng)網(wǎng)絡(luò)時間特性交通量預測模型,設(shè)置隱含層層數(shù)、隱含層神經(jīng)元數(shù)、激活函數(shù)和各層傳遞函數(shù),選取網(wǎng)絡(luò)優(yōu)化函數(shù);對模型參數(shù)進行初始化,利用選取的樣本數(shù)據(jù)集進行訓練;利用訓練好的神經(jīng)網(wǎng)絡(luò)預測模型進行預測,輸出時間特性交通量預測值,記為u1。
(5)空間序列交通量預測
選取預測日期目標路段相鄰l個上下游路段的交通量數(shù)據(jù)組成的空間序列矩陣Xsection,作為空間序列預測模型的輸入;建立BP神經(jīng)網(wǎng)絡(luò)空間序列交通量預測模型,設(shè)置隱含層層數(shù)、隱含層神經(jīng)元數(shù)、激活函數(shù)和各層傳遞函數(shù),選取網(wǎng)絡(luò)優(yōu)化函數(shù);對模型參數(shù)進行初始化,利用選取的樣本數(shù)據(jù)集進行訓練;利用訓練好的神經(jīng)網(wǎng)絡(luò)預測模型進行預測,輸出空間序列預測值,記為u2。
(6)基于時空數(shù)據(jù)融合的交通量預測
采用步驟(4)和步驟(5)得出的時間特性預測值u1和空間序列預測值u2,構(gòu)造自適應(yīng)加權(quán)數(shù)據(jù)融合算法的輸入特征X
(4)
利用自適應(yīng)加權(quán)數(shù)據(jù)融合算法,在總均方誤差最小的條件下,自適應(yīng)調(diào)整時間特性預測值和空間序列預測值加權(quán)因子,對其進行融合,得出高速公路短時交通量的最終預測值,記為u。其表達式為
(5)
式中:w1+w2=1,w1為時間特性預測值的權(quán)值,w2為空間序列預測值的權(quán)值。
根據(jù)多元函數(shù)求極值理論,加權(quán)因子w1與w2由式(6)計算可得
(6)
(7)
其中,upre(t)為交通量預測值,ureal(t)為交通量實際值,t為總的時間段。此時,總均方誤差σ2最小為
(8)
本文研究的高速公路短時交通量預測模型,需要充分考慮上下游路段交通量、歷史時段交通量以及同周期相同時段的交通量對本路段的影響,故實驗數(shù)據(jù)選用東北某省2015年5月11日到8月9日去除端午節(jié)所在星期外的十二個星期的高速公路部分路網(wǎng)的收費數(shù)據(jù)。如圖2所示,選取距離為34.11 km、平均行程時間為28 min 9 s的路段作為研究路段,記為“0”路段。通過分析收費站之間點到點的OD交通量數(shù)據(jù)、出入口的收費數(shù)據(jù),以及對相鄰路段、樞紐之間的連接關(guān)系進行研究,以15 min為時間間隔計算出了該路段與相鄰6個路段的交通量數(shù)據(jù)。

圖2 路段
高速公路交通量預測性能的提高,不僅依賴于預測模型的優(yōu)化,且輸入特征的選取也會影響模型的預測準確度。本文對目標時刻交通量數(shù)據(jù)與歷史時刻交通量數(shù)據(jù)之間的相關(guān)性進行分析,上、下游路段交通量數(shù)據(jù)之間的相關(guān)性進行討論,不同時間尺度的周期相似性進行研究,選取較優(yōu)時空特性樣本數(shù)據(jù)作為時空數(shù)據(jù)融合交通量預測模型的輸入。
(1)交通量時間序列分析
交通量時間序列的連續(xù)性,表現(xiàn)在歷史時刻的交通量數(shù)據(jù)會隨著時間的延續(xù)對目標時刻交通量數(shù)據(jù)產(chǎn)生影響。本文推測研究路段目標時刻的交通量數(shù)據(jù)與前10個時刻的交通量數(shù)據(jù)具有較強的關(guān)聯(lián)性,并利用皮爾森相關(guān)性計算方法對目標時刻交通量時間序列列向量與前10個時刻組成的10組交通量數(shù)據(jù)時間序列列向量進行相關(guān)性分析。如圖3所示,為第十二周星期一到星期日目標時刻時間序列交通量數(shù)據(jù)與前10個時刻時間序列交通量數(shù)據(jù)相關(guān)性趨勢。從圖中可以看出前10個時刻的交通量數(shù)據(jù)與目標時刻交通量數(shù)據(jù)的相關(guān)性都大于0.65,說明相鄰時間間隔的交通量數(shù)據(jù)都具有一定的相關(guān)性。但是觀察曲線趨勢可知,隨著時間的推移相關(guān)性逐漸下降,故不再對與目標時刻時間距離更遠的交通量數(shù)據(jù)進行研究。圖中顯示,t-3時刻時相關(guān)性急劇下降,在t-4時刻部分時間序列的相關(guān)性低于0.9。利用BP神經(jīng)網(wǎng)絡(luò)預測模型進行預測分析,隨著時間距離的增加逐漸增加輸入樣本數(shù)據(jù)。實驗結(jié)果顯示逐漸增加t-1、t-2、t-3時刻的交通量數(shù)據(jù),模型預測性能逐漸提升、誤差逐漸減小。繼續(xù)增加樣本輸入,模型預測性能誤差呈現(xiàn)波動性增加,但都大于前3個時刻作為模型輸入時的預測效果。同時參考文獻[15],本文選取前3個時刻的時間序列交通量數(shù)據(jù)作為模型時間序列預測部分的輸入進行預測。

圖3 時間序列相關(guān)性趨勢
(2)交通量周期相似性分析
時間尺度不同,可能會導致周期相似性與交通量預測效果的不同。本文利用皮爾森相關(guān)性計算方法,分別對兩兩周期之間的相關(guān)性進行計算,然后計算它們之間相關(guān)性的平均數(shù)作為周期相似性的衡量標準。分別對以“天”為時間尺度和以“星期”為時間尺度的交通量數(shù)據(jù)周期相似性進行計算。表1所示為,第九周到第十二周交通量數(shù)據(jù)的周期相似系數(shù),可知每周特定日期同星期“幾”的相似系數(shù)都大于0.94,而連續(xù)“幾天”的工作日相似系數(shù)在0.9129~0.9446之間波動,連續(xù)兩天休息日的相似系數(shù)在0.9036~0.9361之間波動。綜上得出,以“星期”為時間尺度的同星期“幾”的交通量周期相似性高于以“天”為時間尺度的交通量周期相似性。利用BP神經(jīng)網(wǎng)絡(luò)預測模型分別對兩組交通量數(shù)據(jù)進行預測,對比可知以“星期”為時間尺度作為模型的輸入,預測精度優(yōu)于以“天”為時間尺度的交通量預測。故本文選取以“星期”為時間尺度前3個星期同星期“幾”的交通量數(shù)據(jù)作為模型周期相似性預測部分的輸入。

表1 四周交通量數(shù)據(jù)的周期相似系數(shù)
(3)交通量空間序列性分析
高速公路上下游路段相互連通,交通量數(shù)據(jù)具有相似的變化趨勢,而交通路況實時變化,導致目標路段交通量數(shù)據(jù)具有不確定性。利用皮爾森相關(guān)性計算方法,分別對圖2所示路段“1、2、3、4、5、6”的交通數(shù)據(jù)與目標路段“0”同一時刻交通量數(shù)據(jù)的相關(guān)性進行計算,見表2。結(jié)合圖2和表2可知,路段“1”相比于其它上游路段與目標路段相關(guān)性最高,路段“4”相比于其它下游路段與目標路段相關(guān)性最高,隨著相鄰路段與目標路段距離的增加,相關(guān)性在不斷下降。利用BP神經(jīng)網(wǎng)絡(luò)預測模型進行預測分析,考慮上下游最近的一個路段時預測精度最高。隨著考慮上下游路段數(shù)量的逐漸增加,模型預測精度逐漸下降。由于本文是對交通量的實時預測進行研究,故選取距離最近的上游路段“1”的交通量數(shù)據(jù)作為模型空間序列預測部分的輸入進行預測。

表2 相鄰路段相關(guān)系數(shù)
為了進一步對所提出預測模型的預測性能進行評價,本文選用平均絕對誤差百分比(MAPE)、均方根誤差(RMSE)2個指標來衡量。MAPE用于評價預測模型性能的好壞,RMSE用于評價模型的預測精確度,具體公式如下所示
(9)
(10)

本文實驗?zāi)P途捎肨ensorFlow架構(gòu),Python語言進行編程實現(xiàn)。通過對時空特性相關(guān)性分析,確定時間序列預測模型、周期相似性預測模型、空間序列預測模型的輸入層神經(jīng)元個數(shù)分別為3、3、1;經(jīng)過實驗對比,含有2個隱含層的預測模型訓練時間和復雜度明顯減小,故選取4層架構(gòu)的神經(jīng)網(wǎng)絡(luò)預測模型;隱含層神經(jīng)元數(shù)利用式(11)計算,并利用試湊法確定,時間序列預測模型隱含層神經(jīng)元數(shù)為7、7,周期相似性預測模型隱含層神經(jīng)元數(shù)為8、6,時間特性預測模型隱含層神經(jīng)元數(shù)為5、5,空間序列預測模型隱含層神經(jīng)元數(shù)為5、3;由于模型在訓練之前需要對數(shù)據(jù)進行歸一化處理,故選取sigmoid函數(shù)作為激活函數(shù),線性函數(shù)作為各層連接函數(shù);利用自適應(yīng)梯度下降法更新權(quán)重和閾值;學習率設(shè)置為0.001,訓練次數(shù)為1000;時間特性預測值和空間序列預測值的加權(quán)因子,初始值設(shè)置為0.5和0.5
(11)
式中:i為輸入層神經(jīng)元個數(shù),o為輸出層神經(jīng)元個數(shù),a為1到10之間的整數(shù)。交通量預測只有一個預測值,故o為1。
在實驗分析與驗證階段,將數(shù)據(jù)集分成兩部分:第一部分為2015年5月11日到7月12日前八周的交通量數(shù)據(jù),用于模型的構(gòu)造與訓練;第二部分為2015年7月13日到8月9日后四周的交通量數(shù)據(jù),用于對模型進行驗證。由于人們在工作日與休息日作息規(guī)律的不同以及休息日遠途旅行的增加,導致交通量數(shù)據(jù)特征存在區(qū)別,故本文分別對其進行預測分析。
圖4所示為工作日2015年8月5日星期三基于時空數(shù)據(jù)融合的交通量預測結(jié)果,時間特性預測值和空間序列預測值加權(quán)因子為0.489和0.511。從圖中可以看出,交通量預測值曲線與實際值曲線趨勢基本一致。其中,預測值與實際值偏差較大的位置出現(xiàn)在高峰時段,主要是由于高峰時段實際交通量波動性較大而導致的。圖5所示為休息日2015年8月8日星期六基于時空數(shù)據(jù)融合的交通量預測結(jié)果,時間特性預測值和空間序列預測值加權(quán)因子為0.733和0.267。觀察圖可知,預測值曲線規(guī)律基本與實際值曲線規(guī)律一致,偏差較大的位置主要出現(xiàn)在高峰時段和波動性較大的位置,但誤差在可接受范圍內(nèi)。

圖4 工作日交通量預測值
將基于時空數(shù)據(jù)融合的交通量預測模型與時間序列預測模型、周期相似性預測模型、時間特性預測模型、空間序列預測模型進行比較,結(jié)果見表3。為了避免隨機性,表3列出了2015年8月3日到8月9日一周交通量預測性能評價值。從表中可以看出,星期三的時間特性預測值MAPE為5.57%低于時間序列預測模型和周期相似性預測模型的值,RMSE的值為15.518低于時間序列預測模型和周期相似性預測模型的值;本文所提出的時空數(shù)據(jù)融合預測模型MAPE的值為2.52%,低于時間特性預測模型和空間序列預測模型,RMSE的值為11.655,低于時間特性預測模型和空間序列預測模型的值,休息日同理。可知本文提出的預測模型優(yōu)于其它單變量預測模型,MAPE預測性能都控制在5%以內(nèi)。故基于時空數(shù)據(jù)融合的高速公路短時交通量預測模型,預測性能較優(yōu),適用于實際高速公路交通量預測中。
本文綜合考慮了高速公路交通量的時間序列性、周期相似性和空間序列性,以BP神經(jīng)網(wǎng)絡(luò)預測模型為基礎(chǔ),結(jié)合自適應(yīng)加權(quán)數(shù)據(jù)融合算法,提出了一種基于數(shù)據(jù)融合的高速公路短時交通量預測模型。通過對時空特性相關(guān)性進行計算,分析了交通量的分布規(guī)律,并根據(jù)相關(guān)性強弱選取模型輸入樣本數(shù)據(jù)。選用高速公路收費數(shù)據(jù),對該模型與時空特性單變量預測模型比較,結(jié)果表明該模型預測性能更好、預測精度更高,其預測值可為智能交通管理系統(tǒng)提供數(shù)據(jù)支持。由于BP神經(jīng)網(wǎng)絡(luò)預測模型易陷入局部極小值,下一階段將對神經(jīng)網(wǎng)絡(luò)預測模型進行優(yōu)化改進,提高模型的預測性能。