李 琦,姜桂艷
(1.吉林大學 交通學院,長春130022;2.青島市城市規劃設計研究院,山東 青島 266011;3.寧波大學 海運學院,浙江 寧波 315211)
悉尼自適應交通控制系統(Sydney coordinated adaptive traffic system,SCATS)在世界范圍內得到了廣泛的應用。1986年上海在國內最早引入SCATS系統,隨后天津、廣州、沈陽、杭州、蘇州、宜昌等許多城市也開始采用該系統控制城市交通[1-2]。目前,SCATS 線圈獲取的動態交通數據(平均車頭時距和交通流量)僅用于交通信號控制。從數據共享的角度看,如果能夠將其所獲得的動態交通數據應用于該系統所覆蓋道路的交通擁擠預測,對于低成本改善交通控制、交通誘導和交通指揮的協調性具有重要的現實意義。
短時交通預測是智能交通系統(ITS)研究與應用的關鍵技術之一[3]。然而,目前國內外對于短時交通預測的研究大部分局限于一步預測[4-8],這種預測結果實際上只能修正信息采集與處理的時間延遲,是對當前時段交通狀態的估計,無法支持交通管理者和交通出行者進行預見性決策。盡管文獻[9]提出了一種多步預測方法,但其采用的是固定預測步數,不能針對某個時間段內交通數據序列的特性決定其可預測步數,在一定程度上影響了多步預測的效果。
為了克服已有研究成果的缺陷,文獻[10]針對城市快速路線圈獲取的5min采樣間隔的交通數據,提出了一種交通數據動態可預測性分析方法,可對交通數據序列的可預測程度進行在線分析。由于短時交通預測的數據基礎是固定采樣間隔下的交通數據時間序列,而SCATS以綠燈信號相位為采樣時間單位獲取交通數據,相位時長是動態變化的,因此在SCATS中各個采樣間隔內的交通數據不具有嚴格的時間可比性,使得文獻[10]中的方法不能直接用于SCATS線圈數據的多步預測。而且,該方法通過設計關聯數據特征指標建立可預測步數估計模型,而關聯數據特征指標的使用在一定程度上會導致交通參數時間序列特征信息的損失。此外,該方法采用移動平均這種線性方法對交通參數進行多步預測,難以體現交通數據序列中的非線性特征。因此,文獻[10]的方法在可預測步數的確定以及多步預測效果方面還存在進一步提升的空間。
人工神經網絡以其良好的非線性逼近能力在短時交通預測領域得到了廣泛的應用,但目前相關文獻采用的都是靜態神經網絡[7-10],其輸出只依賴于當前的輸入,缺少反饋或時延成分。與靜態神經網絡相比,動態神經網絡具有更強的動態系統逼近能力,在非線性動態系統中的應用效果更 好[11]。 NARX (Nonlinear autoregressive model with exogenous inputs)神經網絡和FTD(Focused time-delay)神經網絡是目前最為常用的兩種動態神經網絡,本文將以此為基礎設計SCATS線圈數據的短時動態多步預測方法。
綜上所述,本文在采用文獻[12]提出的虛擬時間序列構建方法對SCATS線圈數據進行預處理的基礎上,提出了以NARX神經網絡為基礎設計SCATS線圈數據的多步預測方法,和以FTD神經網絡為基礎設計SCATS線圈數據的可預測步數在線估計方法,并采用某特大城市SCATS線圈實測數據進行驗證和對比分析。
時間序列預測是利用研究對象在當前或之前若干時間間隔的數據對其未來取值進行的估計。當需要進行多步預測時,通??蓪⒁勋@得的預測值作為已知數據用于下一時間間隔的預測。
對于一步預測,其數學模型可表示為

利用相同的預測函數,兩步預測模型可表示為

上述的迭代多步預測將預測值引入自變量,會產生誤差傳導,當預測的步數較多時,這種傳導誤差會比較嚴重,因此降低每一步的預測誤差都是非常重要的。
NARX神經網絡是一種動態遞歸網絡,通過引入時延與反饋變量,將神經網絡的函數模擬功能與時間序列的數據關聯特性相結合,有助于改善動態非線性系統的估計效果。采用NARX神經網絡進行多步預測能夠在各步預測誤差較小的情況下進行下一步預測,從而可削弱誤差傳導帶來的負面影響。
NARX神經網絡的輸入由兩部分構成:一部分是外部輸入,另一部分是反饋輸入。其模型可表示為

NARX神經網絡的基本結構如圖1所示。其中,反饋輸入可以為研究對象的實測值,也可以為NARX網絡獲得的估計值,不過利用實測值作為反饋輸入訓練的NARX網絡擬合效果更優。

圖1 NARX神經網絡的基本結構Fig.1 Architecture of NARX neural network
考慮到交通數據序列是隨著時間的推移而不斷演化的,可將其視為時間因素的函數,因此在利用NARX神經網絡對SCATS線圈數據進行多步預測時,本文將各時間間隔對應的時間點序列視為,將交通參數(如平均車頭時距或交通流量數據序列)視為Yt。在線應用時,用Y的預測值逐步替換其在輸入變量中的實測值,即可實現迭代多步預測。
文獻[11]證明了含有1個隱含層的NARX神經網絡可以逼近任意非線性連續函數,因此將隱層數設置為1。激勵函數選擇sigmoid函數,訓練算法采用Levenberg-Marquardt算法。選擇目前最為常用的平均相對誤差 MAPE[13]作為NARX神經網絡性能的評價指標,其值越小,說明NARX神經網絡的性能越優。
考慮到相同日期(周一,周二,…,周日)的交通模式具有較強的相似性[12],對于每一檢測器,在建立多步預測模型時,以相同日期的交通模式為基礎。
在應用上一節提出的多步預測方法時,只要不停止運行,則可以對SCATS線圈數據進行無限多步的預測。但實證分析表明,在特定時間點上進行多步預測時,每一步的預測誤差與預測步數之間存在正相關關系,滿足期望誤差的預測步數不可能無限多。為此文獻[10]最先提出了交通數據序列的動態可預測性的概念,并針對城市快速路線圈的5min交通數據,設計了一種可預測步數在線估計方法。其基本原理是:①分析實際交通數據序列的動態特性,建立關聯數據特征指標向量,并獲得每個時點處的關聯數據特征指標向量值;②在指定期望預測誤差的情況下,運用一定的預測方法獲得每個時點處可滿足預測誤差要求的預測步數;③運用BP神經網絡建立關聯數據特征指標向量與可預測步數之間的映射關系;④在實際運用過程中,根據所獲得的動態交通數據,在線計算當前時點的關聯數據特征指標向量值,并據此估計此時的可預測步數。
為了更充分地利用交通參數時間序列中所包含的可預測性信息,不再設計關聯數據特征指標,而是直接將交通參數的時間序列本身(包括時間點序列和交通參數數據序列)作為輸入變量,并基于FTD神經網絡建立新的可預測步數估計模型。
在交通數據序列和多步預測方法一定的條件下,交通參數可預測步數是指特定時點上交通數據序列多步預測結果的相對誤差連續小于閾值z的最大步數。因此,交通參數可預測步數是一個非實測參數,無法應用前述的NARX神經網絡建立估計模型。作為一種動態時延神經網絡,FTD神經網絡特別適用于研究對象的實測值無法在線獲取的情況[14],其基本結構如圖2所示。圖2中,輸入變量數據序列為,輸出變量數據序列為Bt。

圖2 FTD神經網絡的基本結構Fig.2 Architecture of FTD neural network
FTD神經網絡通過在輸入層引入時延變量,其輸出結果不僅依賴于當前時間間隔的輸入變量,還依賴于之前若干時間間隔的輸入變量(),能夠更為充分地利用已有的輸入變量信息。
FTD神經網絡的隱層數通常可設置為1,激勵函數選擇sigmoid函數,訓練算法采用Levenberg-Marquardt算法。
可預測步數是離散變量且數值通常較小,使用平均相對誤差MAPE不能直觀地表達可預測步數的估計效果,例如當兩組估計值和真值分別為2、1以及6、3時,盡管MAPE都為100%,但顯然前者的估計效果更優。因此,為了能夠直觀表達可預測步數估計值與真值之間絕對差異的平均水平,選擇平均絕對誤差MAE[13]作為FTD神經網絡的性能評價指標,該值越小說明FTD神經網絡性能越優。
時延長度和隱層神經元的個數決定了NARX和FTD神經網絡的基本結構,不同的(d,N )或者(d1,N1)對應不同的網絡結構,因此應選用具有最佳性能的網絡。遺傳算法是一種基于生物自然選擇與遺傳機理的全局優化算法[15],本文利用遺傳算法優化兩種動態神經網絡的結構。
在進行編碼操作時,本文采用目前遺傳算法中最常用的二進制編碼方式,例如假設時延長度和隱層神經元的個數的最大取值分別取24和50,當時延長度和隱層神經元的個數分別取2和3時,對應的二進制編碼為00010000011。
結合兩種神經網絡的性能評價指標以及適應度函數單調、連續的設計原則,本文設計的適應度函數為

式中:fiti為第i個NARX或者FTD神經網絡的適應度函數;Errori為第i個NARX或者FTD神經網絡的性能評價指標,其中NARX神經網絡對應的指標為MAPE,FTD神經網絡對應的指標為MAE。
在進行選擇、交叉以及變異操作時,分別采用目前最為常用的輪盤賭選擇、單點交叉以及基本位變異方法。
若相鄰兩代種群的平均適應度值的變化小于某一閾值,表示算法已經收斂,則退出算法。
本文所設計的基于動態神經網絡的SCATS線圈數據短時多步預測雙層模型的在線應用流程如圖3所示。由于交通參數的多步預測結果是確定可預測步數的數據基礎,因此本文方法的標定流程是基于NARX神經網絡的SCATS線圈數據多步預測方法在前,基于FTD神經網絡的SCATS線圈數據可預測步數在線估計方法在后。在實際應用過程中,則應先估計目標交通參數在當前時間間隔的可預測步數,再對可預測步數內的交通參數進行估計。

圖3 本文方法的在線應用流程Fig.3 Online application process of proposed method
實證數據來源于國內某特大城市主干道的SCATS線圈,采樣時間為2009年5月至7月,每天24h。實驗區域為該主干道A、B、C連續3個交叉口,具體路線如圖4所示。

圖4 實驗區域道路示意圖Fig.4 Road map for experimental area
利用文獻[12]提出的虛擬時間序列構建方法,確定的SCATS線圈數據虛擬采樣間隔時長為150s。因此,后續分析以150s時間尺度為例加以說明。
選取5月~6月內所有周一的數據作為標定集合,7月份所有周一的數據作為測試集合。在優化神經網絡時,將標定數據集合再次隨機分為訓練樣本、驗證樣本以及測試樣本,依次占數據總數的70%、15%和15%。
短時多步預測結果的可接受誤差閾值z應依據用戶需求進行設定,本文參照文獻[10]的方法確定為20%。為了更加充分地驗證本文方法的有效性,在實驗結果分析部分增加評價指標均方根誤差 RMSE[13]。
在使用遺傳算法優化神經網絡結構時,本文借鑒被引用次數較多的文獻[15]中的參數設置:種群規模設置為50,平均車頭時距d最大取24,隱層神經元數N 最大取50,交叉率選為0.6,變異率選為0.0033,最大迭代次數選為100。
文獻[9]提出了一種基于BP神經網絡的交通數據多步預測方法,在進行多步預測時,采用的是固定預測步數。文獻[10]以BP神經網絡為基礎,建立了交通數據序列的關聯數據特征指標向量與可預測步數的關系模型,并采用移動平均法進行多步預測。本文將上述兩個文獻中的相應方法作為對比方法,分別對固定步數多步預測結果、可預測步數估計結果以及可變步數多步預測結果進行對比分析,以評價本文方法的有效性。
下面以交叉口B西進口線圈的周一數據集合為例,說明本文方法與對比方法的實驗結果并進行分析。
5.3.1 固定步數時多步預測結果與分析
利用所設計的基于遺傳算法的NARX神經網絡結構優化方法,當平均車頭時距和交通流量的 (d,N)分別為(6,13)和(12,15)時,即時延長度分別為6和12、隱層神經元數分別為13和15時,對應的NARX神經網絡具有最佳性能。在選定的(d,N)下,該方法應用平均車頭時距與交通流量的訓練、驗證及測試樣本數據一步預測時的MAPE如表1所示。

表1 本文方法一步預測時的MAPETable 1 MAPE of one step forecasts using proposed method
以前述約定的測試數據集合為基礎,分別采用文獻[9]方法、文獻[10]方法以及本文方法對平均車頭時距和交通流量進行1~30步預測時,相應的MAPE和RMSE分別如圖5和圖6所示。

圖5 3種預測方法平均車頭時距1~30步預測結果對比Fig.5 Comparison of 1~30step forecasts for three forecasting methods of time headway
從圖5和圖6可以看出:
(1)平均車頭時距和交通流量1~30步預測結果的MAPE、RMSE總體上呈遞增的趨勢,說明預測誤差與預測步數之間存在一定的正相關關系。
(2)在對平均車頭時距和交通流量進行1~30步預測時,參與比較的各種方法在預測誤差方面存在明顯且穩定的差異,本文方法的MAPE、RMSE最小,文獻[9]方法和文獻[10]方法的MAPE、RMSE相當,后者稍大,說明本文方法具有相對優勢。

圖6 3種預測方法交通流量1~30步預測結果對比Fig.6 Comparison of 1~30step forecasts for three forecasting methods of traffic flow
5.3.2 可預測步數在線估計結果及對比分析
利用所設計的基于遺傳算法的FTD神經網絡結構優化方法,當平均車頭時距和交通流量的(d1,N1)分別為(6,16)和(8,15)時,即時延長度分別為6和8、隱層神經元數分別為16和15時,對應的FTD神經網絡具有最佳性能。在選定的(d1,N1)下,該方法應用平均車頭時距與交通流量的訓練、驗證及測試樣本數據估計可預測步數時的MAE如表2所示。

表2 本文方法估計可預測步數時的MAETable 2 MAE of predictable steps estimation using proposed method
以前述約定的測試數據集合為基礎,采用本文方法和文獻[10]方法,對實驗區域SCATS線圈數據的可預測步數進行估計,相應的誤差指標如表3所示。

表3 本文方法與文獻[10]方法可預測步數估計的 MAE、RMSETable 3 MAE and RMSE of predictable steps estimation for proposed method and literature[10]method
從表2和表3可以看出,本文方法在標定過程中表現出了良好的穩定性,而且基于測試數據集合的平均車頭時距和交通流量可預測步數估計的MAE、RMSE都明顯優于文獻[10]的方法。
5.3.3 可變步數多步預測的結果及對比分析
為了對可變步數多步預測的效果進行評價,以測試數據集合為基礎,計算全部時間間隔對應可預測步數內各步預測結果的總體MAPE、RMSE。
由于文獻[9]沒有涉及可預測步數的估計方法,在對其評價時,引入文獻[10]和本文方法,并分別簡稱為文獻[9]和文獻[10]組合方法以及文獻[9]和本文組合方法。相應方法的固定30步預測的效果與可變步數多步預測的效果如表4所示。
由表4可看出:
(1)平均車頭時距和交通流量可變步數多步預測的MAPE、RMSE都優于對應方法的固定步數30步預測方法,說明進行可預測步數估計是非常必要的。

表4 固定30步預測效果與可變步數多步預測效果Table 4 Effects of fixed 30-step and dynamic multi-step forecasting for 3methods
(2)采用本文方法,平均車頭時距和交通流量多步預測的 MAPE、RMSE均優于文獻[9]與本文的組合方法,進一步表明了本文所設計的多步預測方法的有效性。
(3)采用文獻[9]與本文的組合方法,平均車頭時距和交通流量的MAPE、RMSE均優于文獻[9][10]的組合方法,進一步說明了本文所設計的可預測步數估計方法的有效性。
(4)在4種可變步數多步預測的方法中,本文方法的預測效果優于其他兩種方法,表明本文所設計的雙層模型能夠進一步降低SCATS線圈數據短時多步預測的誤差。
針對SCATS線圈數據的獨特性,以動態神經網絡為基礎,設計了一種新的短時多步預測雙層模型,并以我國某特大城市的實測數據為基礎進行了驗證和對比分析。結果表明,本文方法能夠進一步降低SCATS線圈數據短時多步預測的誤差。本文的研究成果有助于改善SCATS覆蓋道路在交通信號控制、交通信息引導和交通指揮等方面的協調性。
[1]全永燊.城市交通控制[M].北京:人民交通出版社,1989:226-236.
[2]彭信林,王寧鳴,周劍峰,等.SCATS數據采集系統的設計與實現[J].計算機工程,2008,34(24):256-260.Peng Xin-lin,Wang Ning-ming,Zhou Jian-feng,et al.Design and implementation of data collection system on SCATS[J].Computer Engineering,2008,34(24):256-260.
[3]姜桂艷.道路交通狀態判別技術與應用[M].北京:人民交通出版社,2004:114-119.
[4]姚智勝,邵春福,熊志華,等.基于主成分分析和支持向量機的道路網短時交通流量預測[J].吉林大學學報:工學版,2008,38(1):48-52.Yao Zhi-sheng,Shao Chun-fu,Xiong Zhi-hua,et al.Short-term traffic volumes forecasting of road network based on principal compontent analysis and support vector mochine[J].Journal of Jilin University(Engineering and Technology Edition),2008,38(1):48-52.
[5]Li C X,Anavatti S G,Ray T.Short-term traffic flow prediction using different techniques[C]∥The 37th Annual Conference of the IEEE Industrial Electronics Society,Melbourne,2011:2423-2428.
[6]Gao S,Zhang Z Y,Cao C G.Road traffic freight volume forecast using support vector machine combining forecasting[J].Journal of Software,2011,6(9):1680-1687.
[7]Smith B L,Williams B M,Oswald R K.Comparison of parametric and nonparametric models for traffic flow forecasting[J].Transportation Research,Part C:Emergence Technology,2002,10(4):303-321.
[8]Hosseini S H,Moshiri B,Rahimi-Kian A,et al.Short-term traffic flow forecasting by mutual information and artificial neural networks[C]∥IEEE International Conference on Industrial Technology,Athens:IEEE,2012:1136-1141.
[9]Dougherty M S,Cobbet M R.Short-term inter-urban traffic forecasts using neural networks[J].International Journal of Forecasting,1997(13):21-31.
[10]姜桂艷,常安德,牛世峰,等.基于BP神經網絡的交通數據序列動態可預測性分析方法[J].北京工業大學學報,2011,37(7):1019-1026.Jiang Gui-yan,Chang An-de,Niu Shi-feng,et al.Dynamic predictability analysis for traffic data serials based on BP neural network[J].Journal of Beijing University of Technology,2011,37(7):1019-1026.
[11]Pisoni E,Farina M,Carnevale C,et al.Forcasting peak air pollution levels using NARX models[J].Engineering Applications of Artificial Intelligence,2009,22:593-602.
[12]姜桂艷,李琦,常安德,等.基于SCATS線圈數據的交通狀態在線定量評價與預測方法[P].中國專利:CN101739814A,2010-06-16.
[13]薛薇.SPSS統計分析方法及應用[M].北京:電子工業出版社,2004:113-115.
[14]Htike K K,Khalifa O O.Rainfall forecasting models using focused time-delay neural networks[C]∥International Conference on Computer and Communication Engineering,Kuala Lumpur, Malaysia,2010:1-6.
[15]Arifovic J,Gen?ay R.Using genetic algorithms to select architecture of a feedforward artificial neural network[J].Physica A:Statistical Mechanics and its Applications,2001,289(3-4):574-594.