劉學(xué)剛,張騰飛,韓 印 LIU Xuegang,ZHANG Tengfei,HAN Yin
(上海理工大學(xué) 管理學(xué)院,上海 200093)
隨著城市化進(jìn)程不斷推進(jìn)、智能交通系統(tǒng)的迅猛發(fā)展,汽車保有量日益增加,道路交通擁擠已經(jīng)成為制約城市發(fā)展的重要因素,僅僅依靠增加道路面積,不能有效解決交通堵塞問(wèn)題,所以越來(lái)越多的學(xué)者開始研究智能交通系統(tǒng)用以提高道路通行能力,緩解城市的交通壓力。同時(shí),短時(shí)交通流預(yù)測(cè)是實(shí)現(xiàn)智能交通系統(tǒng)中交通誘導(dǎo)與控制的首要問(wèn)題之一,該預(yù)測(cè)能夠?qū)崿F(xiàn)城市道路路網(wǎng)最大化合理利用,極大程度降低交通事故的發(fā)生概率,提高社會(huì)經(jīng)濟(jì)效益,因此,可靠的短時(shí)交通流預(yù)測(cè)很有必要。同時(shí)克服短時(shí)交通流預(yù)測(cè)隨機(jī)性、周期性與不確定性是當(dāng)下的難點(diǎn)與重點(diǎn)。自20世紀(jì)70年代以來(lái),交通學(xué)者就開始將其他領(lǐng)域應(yīng)用較為成熟的預(yù)測(cè)模型直接使用在短時(shí)交通流預(yù)測(cè)領(lǐng)域,如自回歸模型(MA)、自回歸移動(dòng)平均模型(ARMA)等。這些模型未能有限反映出交通流的不確定性,無(wú)法克服其他外在干擾因素對(duì)交通流量的影響。由于時(shí)間跨度的縮短,使得預(yù)測(cè)的交通流受非線性干擾因素的影響較大,造成預(yù)測(cè)結(jié)果與預(yù)測(cè)精度不甚理想。隨著研究的深入,為了適應(yīng)交通流不確定性與非線性的特點(diǎn),一種基于ARIMA模型(差分自回歸移動(dòng)平均模型)的短時(shí)交通流預(yù)測(cè)使用廣泛。
國(guó)內(nèi)外基于ARIMA模型的研究眾多。1993年Kim與Hobeika將ARIMA模型應(yīng)用到高速公路交通流量預(yù)測(cè)中[1-2];姚亞夫、曹鋒[3]采用ARIMA方法進(jìn)行交通流量趨勢(shì)預(yù)測(cè),并按照AIC準(zhǔn)則進(jìn)行模型定階,最終通過(guò)實(shí)測(cè)數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果表明,ARIMA模型能夠獲得較好的中短期預(yù)測(cè)精度。2008年張利、施化吉等基于ARIMA模型結(jié)構(gòu)的時(shí)間序列分析方法,用最小二乘法進(jìn)行參數(shù)估計(jì),同時(shí)對(duì)多個(gè)統(tǒng)計(jì)量進(jìn)行誤差分析,結(jié)果表明:該算法在應(yīng)用于時(shí)變性強(qiáng)的短時(shí)交通流量預(yù)測(cè)時(shí),相對(duì)于Astom算法具有更好地預(yù)測(cè)性能[4]。2017年張艷艷、劉曉佳[5]等根據(jù)已有事故資料,對(duì)事故過(guò)去發(fā)展變化的規(guī)律進(jìn)行分析,參照現(xiàn)有水上交通條件,采用時(shí)間序列分析法中的ARIMA模型進(jìn)行分析預(yù)測(cè),對(duì)水上交通事故未來(lái)發(fā)展趨勢(shì)的科學(xué)推測(cè)。2019年謝紅利、趙樹鵬、王浩宇[6]通過(guò)ARIMA模型對(duì)重慶市軌道交通進(jìn)站客流量進(jìn)行預(yù)測(cè),同時(shí)得出其所建立的預(yù)測(cè)方法可以適用于城市軌道交通的客流預(yù)測(cè)。孫旻根據(jù)崇遵高速公路車流量的時(shí)間序列,進(jìn)行了ARIMA建模的實(shí)證分析,實(shí)驗(yàn)中發(fā)現(xiàn)崇遵高速公路的出口流量序列為非平穩(wěn)序列,具有一定的趨勢(shì)和周期性,故利用ARIMA模型對(duì)該非平穩(wěn)時(shí)間序列進(jìn)行建模預(yù)測(cè),預(yù)測(cè)效果較為合理[7]。
縱觀以往的研究可以看出,盡管ARIMA模型具有波動(dòng)性及不確定性,但其對(duì)于預(yù)測(cè)短時(shí)交通流仍然具有重要意義。本文首先考慮道路交通流時(shí)間序列的非平穩(wěn)性特征,通過(guò)差分使數(shù)據(jù)變得平穩(wěn),并構(gòu)建ARIMA( 6,1,)6模型,對(duì)上海市楊浦區(qū)大連路的短時(shí)交通流進(jìn)行預(yù)測(cè),結(jié)果表明ARIMA模型可以很好地?cái)M合短時(shí)交通量數(shù)據(jù),ARIMA模型在短時(shí)交通量預(yù)測(cè)中有很大應(yīng)用價(jià)值。
ARIMA(差分自回歸移動(dòng)平均模型)是一種時(shí)間序列數(shù)據(jù)預(yù)測(cè)的統(tǒng)計(jì)方法,其描述的是某一時(shí)間序列變量自身的統(tǒng)計(jì)規(guī)律性,根據(jù)歷史時(shí)間序列的相關(guān)關(guān)系,揭示系統(tǒng)的動(dòng)態(tài)結(jié)構(gòu)特性及其發(fā)展規(guī)律。
ARIMA(差分自回歸移動(dòng)平均模型)可以分為以下幾類:AR(自回歸模型)、MA(移動(dòng)平均模型)、ARMA(自回歸移動(dòng)平均模型)、ARIMA(差分自回歸移動(dòng)平均模型)。預(yù)測(cè)思路是將預(yù)測(cè)主體隨時(shí)間變化形成的序列看作是一個(gè)隨機(jī)時(shí)間序列,通過(guò)若干次差分化使非平穩(wěn)數(shù)據(jù)轉(zhuǎn)化為平穩(wěn)序列,用一定的數(shù)學(xué)模型近似描述這個(gè)隨機(jī)序列[8]。這個(gè)模型一旦被識(shí)別,就可以用時(shí)間序列的現(xiàn)在或過(guò)去的數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)數(shù)據(jù)值。ARIMA模型在預(yù)測(cè)過(guò)程中僅考慮了時(shí)間序列的歷史數(shù)據(jù),通過(guò)發(fā)掘自身規(guī)律建立模型,提取有效信息對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),在數(shù)據(jù)預(yù)測(cè)方面有很大的應(yīng)用價(jià)值。
ARIMA(p,q,)d模型表達(dá)式為:

其中:yt是時(shí)間序列數(shù)據(jù);p是自回歸項(xiàng)的系數(shù);d是差分的階數(shù);q是移動(dòng)平均項(xiàng)的系數(shù);ε是均值為0、方差為σ2的白噪聲序列;B是滯后算子,定義為Bkyt=yt-k,?1……?p和θ1……θq是系數(shù)。
如果數(shù)據(jù)是平穩(wěn)的時(shí)間序列數(shù)據(jù),那么d=0,方程(1)就可以簡(jiǎn)化為ARMA模型,表達(dá)式如下:

其中:yt是時(shí)間序列數(shù)據(jù);C0是常數(shù);p是自回歸項(xiàng)的系數(shù);q是移動(dòng)平均項(xiàng)的系數(shù),?1……?p和θ1……θq;ε是均值為0、方差為σ2的白噪聲序列。
(1)獲取時(shí)間序列數(shù)據(jù),根據(jù)其函數(shù)圖像以ADF單位根檢驗(yàn)其方差,對(duì)序列的平穩(wěn)性進(jìn)行識(shí)別。對(duì)非平穩(wěn)序列進(jìn)行平穩(wěn)化處理。直到處理后的數(shù)據(jù)的偏相關(guān)函數(shù)值以及自相關(guān)函數(shù)值無(wú)顯著差別地趨于零后終止此項(xiàng)操作。
(2)根據(jù)時(shí)間序列識(shí)別規(guī)則,建立相應(yīng)模型。若平穩(wěn)序列的偏相關(guān)函數(shù)及自相關(guān)函數(shù)均是拖尾,則可使用ARIMA模型;然后對(duì)參數(shù)進(jìn)行定階與估計(jì),判斷其是否具有統(tǒng)計(jì)的意義。
(3)對(duì)建立的ARIMA模型參數(shù)和殘差序列進(jìn)行檢驗(yàn),同時(shí)判斷殘差序列是否為白噪聲,即檢驗(yàn)?zāi)P蛿M合是否合理。(4)通過(guò)Eviews軟件對(duì)交通量數(shù)據(jù)建立ARIMA模型并對(duì)交通量進(jìn)行靜態(tài)預(yù)測(cè),并對(duì)模型結(jié)果進(jìn)行評(píng)價(jià)分析。
本數(shù)據(jù)選取上海市大連路2015年11月9日至12日的短時(shí)交通量數(shù)據(jù),數(shù)據(jù)為電磁感應(yīng)線圈獲得,統(tǒng)計(jì)時(shí)間間隔為3分鐘,共采取1 920個(gè)數(shù)據(jù),見(jiàn)圖1。為此將1 900個(gè)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),留下20個(gè)數(shù)據(jù)進(jìn)行預(yù)測(cè)對(duì)比分析。
從圖1看出短時(shí)交通量數(shù)據(jù)Q的波動(dòng)性較大,存在一定的規(guī)律性,由此大致判斷該時(shí)間序列數(shù)據(jù)為非平穩(wěn)數(shù)據(jù),為此進(jìn)行單位根ADF檢驗(yàn)結(jié)果為非平穩(wěn)時(shí)間序列。對(duì)于非平穩(wěn)時(shí)間序列數(shù)據(jù)則需要進(jìn)行差分,一階差分后得到DQ,對(duì)差分后的數(shù)據(jù)進(jìn)行單位根檢驗(yàn),檢驗(yàn)結(jié)構(gòu)顯示t統(tǒng)計(jì)量小于1%置信水平下的值,即拒絕原假設(shè)存在單位根,所以一階差分后的序列是平穩(wěn)時(shí)間序列。檢驗(yàn)結(jié)果如表1。
因?yàn)橐浑A差分后的短時(shí)交通量數(shù)據(jù)為平穩(wěn)時(shí)間序列數(shù)據(jù),即可以進(jìn)行ARIMA(p,1,q)模型預(yù)測(cè)。而(p,q)的值則首先通過(guò)序列的自相關(guān)和偏自相關(guān)系數(shù)確定。
由圖2的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)初步判斷(p,q)的值均不大于5,由此建立不同(p,q)階數(shù)的組合進(jìn)行測(cè)試,根據(jù)AIC以及SC準(zhǔn)則選取最優(yōu)組合模型得ARIMA( 5,1,4),采用最小二乘法對(duì)模型的系數(shù)進(jìn)行估計(jì),如表2所示。

圖1 短時(shí)交通量數(shù)據(jù)

表1 一階差分后時(shí)間序列ADF檢驗(yàn)結(jié)果

圖2 一階差分序列的相關(guān)圖

表 2 ARIMA( 5,1, 4)模型
模型的表達(dá)式為:

將表達(dá)式轉(zhuǎn)換后為:

對(duì) ARIMA( 5,1, )4模型的殘差進(jìn)行白噪聲Q檢驗(yàn),檢驗(yàn)結(jié)果如圖3所示,殘差的白噪聲檢驗(yàn)均通過(guò)顯著性測(cè)試,得殘差序列為白噪聲序列,即時(shí)間序列中的信息被充分提取,模型擬合較好。

圖3 殘差的相關(guān)性檢驗(yàn)
通過(guò)Eviews軟件對(duì)交通量數(shù)據(jù)建立ARIMA( 5,1,)4模型并對(duì)交通量DQ進(jìn)行靜態(tài)預(yù)測(cè),向前20步預(yù)測(cè)得到序列的預(yù)測(cè)值,
具體預(yù)測(cè)結(jié)果見(jiàn)圖4,模型的評(píng)價(jià)指標(biāo)則采用MAPE、RMSE和MAE表示,見(jiàn)表3。
MAE、MAPE、RMSE的表達(dá)式:

其中:xi為交通量的實(shí)際值,x*為交通量的預(yù)測(cè)值,n為預(yù)測(cè)的步數(shù)。
通過(guò)圖4看出短時(shí)交通量的擬合曲線與實(shí)際值基本走勢(shì)一致,而殘差也變現(xiàn)為平穩(wěn)數(shù)據(jù),表明模型的擬合效果較好,ARIMA模型可以進(jìn)行交通量的預(yù)測(cè)。通過(guò)表3得RMSE為7.02,MAPE為26.55,MAE為5.26表明模型可以擬合短時(shí)交通量數(shù)據(jù),但MAPE相對(duì)較大,一是因?yàn)楸狙芯渴占臄?shù)據(jù)統(tǒng)計(jì)時(shí)間間隔為3分鐘,而短時(shí)交通量數(shù)據(jù)本身就具有很大的不確定性以及波動(dòng)性導(dǎo)致,二是因?yàn)锳RIMA模型再進(jìn)行預(yù)測(cè)時(shí)只考慮時(shí)間序列本身的歷史數(shù)據(jù),沒(méi)考慮外在的不確定性因素,導(dǎo)致模型在預(yù)測(cè)時(shí)不能較好地?cái)M合不確定性和波動(dòng)性大的數(shù)據(jù)。
影響短時(shí)交通量數(shù)據(jù)變化的因素有很多,本文沒(méi)有考慮外因素的影響,僅分析交通量時(shí)間序列本身的歷史數(shù)據(jù),建立ARIMA( 5,1, )4模型進(jìn)行短時(shí)交通量預(yù)測(cè),采用最小二乘法對(duì)模型進(jìn)行參數(shù)估計(jì)并采用靜態(tài)預(yù)測(cè)法對(duì)數(shù)據(jù)進(jìn)行20步預(yù)測(cè),結(jié)果顯示模型的擬合效果較好,ARIMA模型再進(jìn)行短時(shí)交通量預(yù)測(cè)時(shí)有很高的實(shí)用價(jià)值,本研究也有一些不足之處需要改進(jìn),一是ARIMA模型本身只考慮自身的歷史數(shù)據(jù)進(jìn)行預(yù)測(cè),但由于數(shù)據(jù)不足也導(dǎo)致了模型的預(yù)測(cè)精度不是很高,二是短時(shí)交通量數(shù)據(jù)本身不確定性較大,ARIMA模型不能很好地捕捉之間的規(guī)律。所以下一步的研究就是通過(guò)對(duì)ARIMA模型改進(jìn)使之可以更好地預(yù)測(cè)短時(shí)交通量數(shù)據(jù)。

圖4 交通量的擬合曲線

表3 模型的評(píng)價(jià)