(廣州科技貿(mào)易職業(yè)學(xué)院 廣東 廣州 511442)
軌道客流預(yù)測是軌道線網(wǎng)規(guī)劃、站點設(shè)計和運營管理方案制定的前提條件,預(yù)測數(shù)據(jù)的精準(zhǔn)程度將直接影響到地鐵的運營效果。短時客流預(yù)測是軌道交通精準(zhǔn)管控的重要支撐,對提高城市軌道服務(wù)水平具有重要意義。
1.軌道客流具有持續(xù)增長的特點。受城鎮(zhèn)化快速推進(jìn)影響,廣州市城市建設(shè)面積、人口及GDP持續(xù)增長,城市軌道線網(wǎng)從2000年的約18公里增長到目前的500多公里,客流量從17萬人次日增長到目前約1000萬人次/日[1]。考慮到城市軌道線位規(guī)模將在未來10余年時間內(nèi)持續(xù)增加,軌道客流總量也將持續(xù)快速增長。
2.軌道客流具有周期性變化的特點。軌道客流是城市人口工作和生活的衍生產(chǎn)物,和人的活動規(guī)律息息相關(guān)。在中觀時間層面,客流是以周為單位呈連續(xù)波動變化,周六日客流量最小,周一和周五客流量最大;在微觀層面,客流量在一天之內(nèi)呈現(xiàn)出了顯著的波峰和波谷,工作日上午8點和下午6點客流量最大[2]。
3.客流量具有突變的特點。軌道客流受節(jié)假日影響大。在非節(jié)假日期間,軌道客流特征呈現(xiàn)較為穩(wěn)定的狀態(tài),線性關(guān)系較為顯著;在節(jié)假日,客流會出現(xiàn)突增或驟減的現(xiàn)象。
4.其它影響客流變化的外部因素。天氣、政策、重大活動等均會引發(fā)較大的客流變化,如暴雨、限購、足球賽事、演唱會等。
軌道短時客流預(yù)測方法大致可以劃分為線性系統(tǒng)預(yù)測方法、人工智能預(yù)測方法和混合預(yù)測方法這幾類[3]。
線性預(yù)測方法可以分為歷史趨勢法和時間序列法兩類。其中,歷史趨勢法認(rèn)為預(yù)測數(shù)據(jù)具有特定的演化規(guī)律,且這種規(guī)律時靜態(tài)的,這種方法操作簡單,也能夠反應(yīng)數(shù)據(jù)的宏觀趨勢,但是無法處理具有動態(tài)變化特性的數(shù)據(jù)。此外,時間序列法應(yīng)用較為廣泛,它將前幾個時刻的數(shù)據(jù)作為自變量進(jìn)行滾動預(yù)測,能夠在一定程度上反映出時間序列數(shù)據(jù)除宏觀變化趨勢外的一些微觀的動態(tài)變化趨勢,目前應(yīng)用較多的此類預(yù)測模型包括自回歸法(AR)、滑動平均法(MA)、自回歸滑動平均法(ARMA)和差分自回歸滑動平均法(ARIMA)這幾類[3]。
如果時間序列ξ(1),ξ(2),…,ξ(n)滿足如下關(guān)系
ξ(i)=φ1ξ(i-1)+φ2ξ(i-2)+…+φpξ(i-p)+ai
(1)
式中:φ1,φ2,…,φp為自相關(guān)系數(shù);ai為白噪聲。則稱ξ(1),ξ(2),…,ξ(n)遵循p階自回歸(AR(p)),而式(1)成為一個p階自回歸模型。
如果時間序列ξ(1),ξ(2),…,ξ(n)滿足如下關(guān)系
ξ(i)=εi-γ1εi-1-γ2εi-2-…-γqεi-q
(2)
式中:ε1,ε2,…,εp為滑動因子;εi為白噪聲。則稱ξ(1),ξ(2),…,ξ(n)遵循q階平均滑動(MA(q)),而式(2)成為一個q階滑動平均模型。
同時具備自回歸特性和平均滑動特性的時間序列可以用式(1)和式(2)的綜合形式來描述,具體表達(dá)式為
ξ(i)=φ1ξ(i-1)+φ2ξ(i-2)+…+φpξ(i-p)+εi-γ1εi-1-γ2εi-2-…-γqεi-q
(3)
并稱式(3)為自回歸滑動平均模型,簡稱ARMA(p,q)。
式(1)中的白噪聲決定了序列符合隨機游走,而隨機游走的序列是一個非平穩(wěn)的序列,其方差是累計增長的。在現(xiàn)實中,非平穩(wěn)的序列給建模分析帶來了一定的困難,但是考慮到式(1)的差分序列是一個平穩(wěn)的序列,記1階差分序列為
Δξ(i)=ξ(i)-ξ(i-1)=(1-L)ξ(i)
(4)
式中:Δξ(i)為一階差分算子;L為AR(p)特征方程的根。因此,d階差分可記為
Δdξ(i)=(1-L)dξ(i)
(5)
對序列Δdξ(i)建立ARMA(p,q)模型,則稱之為序列ξ(i)的差分自回歸滑動平均模型ARIMA(p,d,q)。
在利用人工智能方法進(jìn)行交通流預(yù)測的時候,神經(jīng)網(wǎng)絡(luò)(neural network)是應(yīng)用最為廣泛和成功的算法。神經(jīng)網(wǎng)絡(luò)是利用計算機技術(shù)人為的構(gòu)造網(wǎng)絡(luò)模型來模擬人體大腦中神經(jīng)元的活動規(guī)則,這一算法的優(yōu)勢在于其能夠識別復(fù)雜的非線性趨勢,具有一定的智慧,可以對黑箱中的給類模式進(jìn)行自動識別。神經(jīng)元的基本結(jié)構(gòu)如圖1所示,其中序列x表示數(shù)據(jù)輸入,y表示數(shù)據(jù)輸出,w為權(quán)重,θ為閾值,輸入和輸出之間具有如下關(guān)系[3]
y=f(∑xiwi-θ)
(6)
式中的f(·)為傳遞函數(shù),可以根據(jù)實際情況選用線性函數(shù)、符號函數(shù)、Sigmoid函數(shù)、雙曲線函數(shù)等。神經(jīng)網(wǎng)絡(luò)一般由輸入層、隱含層和輸出層三個部分組成,每個層又有一個或多個單元組成,相鄰層之間的單元的連接權(quán)重決定了網(wǎng)絡(luò)的輸出特性。在進(jìn)行最終預(yù)測之前,需要利用訓(xùn)練數(shù)據(jù)對網(wǎng)絡(luò)的權(quán)重進(jìn)行迭代調(diào)整。

圖1 神經(jīng)元基本結(jié)構(gòu)
在進(jìn)行交通流預(yù)測時,BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)是利用得最多的。BP神經(jīng)網(wǎng)絡(luò)是一個誤差反向傳播的網(wǎng)絡(luò),其訓(xùn)練過程是通過不斷調(diào)整連接權(quán)值來減小網(wǎng)絡(luò)輸出和理想輸出之間的差異,是一個正向輸出傳播和反向誤差傳播的智能模型。RBF神經(jīng)網(wǎng)絡(luò)是以徑向基函數(shù)作為隱單元的‘基’,對低維的輸入數(shù)據(jù)變換到高維空間內(nèi),解決了低維空間線性不可分問題,且具有收斂速度快的優(yōu)點。
線性預(yù)測方法、智能預(yù)測方法等具有其自身的局限性,而將多種預(yù)測方法進(jìn)行有機組合,得到的混合預(yù)測算法能夠在一定程度上克服各自存在的缺陷,達(dá)到較好的效果。以小波神經(jīng)網(wǎng)絡(luò)(WNN)為例,BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中容易陷入局部最優(yōu),從而導(dǎo)致無法求出最優(yōu)解,而小波函數(shù)具有是非優(yōu)良的局部化性質(zhì),利用小波基取代BP網(wǎng)絡(luò)中的Sigmoid等非線性函數(shù),得到的混合神經(jīng)網(wǎng)絡(luò)能夠有效避免出現(xiàn)局部最優(yōu),且學(xué)習(xí)速度也能夠得到一定程度的提高。
由于城市軌道短時客流時序數(shù)據(jù)獲取難度大,故選用與軌道客流具備相似特點(周期性、突變性、天氣影響、政策影響等)的交通流數(shù)據(jù)作為短時預(yù)測方法的驗證數(shù)據(jù)。
本研究利用線性預(yù)測方法(AR)和人工智能方法(BP、RBF)為例,分別對PeMS系統(tǒng)中檢測點1111572連續(xù)10天的交通流數(shù)據(jù)進(jìn)行預(yù)測,預(yù)測數(shù)據(jù)共分為1min間隔、5min間隔、10min間隔三類,所表示的分形狀態(tài)為反持續(xù)、隨機和持續(xù)。
以1min、2min、3min、4min、5min和10min統(tǒng)計間隔的數(shù)據(jù)作為預(yù)測對象,分別令自回歸階數(shù)從1至30變化,并計算出各種情形下的平均絕對比例誤差。可以發(fā)現(xiàn),隨著統(tǒng)計間隔的增大,預(yù)測的平均絕對比例誤差也會隨之減小,且高階自回歸模型的預(yù)測結(jié)果顯著優(yōu)于低階自回歸模型預(yù)測結(jié)果,如圖2所示。基于自回歸方法的預(yù)測結(jié)果也證實了統(tǒng)計間隔越大可預(yù)測性越強這一特性。

圖2 不同統(tǒng)計間隔下的自回歸預(yù)測誤差
利用BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)對不同采樣間隔下的交通流數(shù)據(jù)進(jìn)行預(yù)測。BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果表明,隨著采樣間隔的增大,預(yù)測的平均絕對誤差值也隨之減小,且減小的速率逐漸變小;預(yù)測輸入項速度和占有率對流量的預(yù)測結(jié)果影響并不顯著,如圖3所示。

圖3 BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果
當(dāng)應(yīng)用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測時,輸入數(shù)據(jù)對預(yù)測結(jié)果的影響非常顯著,當(dāng)將速度和占有率作為預(yù)測輸入時,預(yù)測結(jié)果要優(yōu)于單一的歷史流量數(shù)據(jù)作為輸入的預(yù)測,如圖4所示。

圖4 RBF神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果
針對于單檢測器的交通流數(shù)據(jù),對比BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果和RBF神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果可以發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)能夠取得更好的預(yù)測結(jié)果。
針對PeMS系統(tǒng)中檢測點1111572連續(xù)10天的交通流數(shù)據(jù),分別利用自回歸模型、BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,預(yù)測誤差如圖5所示。其中AR(1)表示1階自回歸模型,AR(30)表示30階自回歸模型,BP(V)表示輸入數(shù)據(jù)為流量的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,BP(OSV)表示輸入數(shù)據(jù)為流量、速度和占有率的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,RBF(V)表示輸入數(shù)據(jù)為流量的RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型,RBF(OSV)表示輸入數(shù)據(jù)為流量、速度和占有率的RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型。
通過分析不同采樣間隔下的交通流量預(yù)測的MAPE值,發(fā)現(xiàn)高階自回歸模型的預(yù)測效果始終是最好的。對于低階自回歸模型,發(fā)現(xiàn)在采樣間隔小于5min的時候,其預(yù)測效果要略差于以歷史流量數(shù)據(jù)作為輸入的BP神經(jīng)網(wǎng)絡(luò)和RBF神經(jīng)網(wǎng)絡(luò);當(dāng)采樣間隔大于5min時,低階自回歸模型、以歷史流量數(shù)據(jù)作為輸入的BP模型和RBF模型的預(yù)測效果相差不大。
研究發(fā)現(xiàn),自回歸線性模型的預(yù)測誤差會隨著階數(shù)的增加而減小,且一階自回歸模型的預(yù)測效果要顯著差于二階和三階自回歸模型的預(yù)測效果。因此,高階自回歸模型的預(yù)測效果要優(yōu)于BP神經(jīng)網(wǎng)絡(luò)模型和RBF神經(jīng)網(wǎng)絡(luò)模型。但是階數(shù)過高會導(dǎo)致計算復(fù)雜、通用性差,因而并不建議采用高階數(shù)的自回歸預(yù)測模型。

圖5 預(yù)測模型預(yù)測效果比較
研究發(fā)現(xiàn),采樣間隔小于5min時,交通流量時間序列具有反轉(zhuǎn)特性,此時低階線性預(yù)測模型的預(yù)測效果要差于BP神經(jīng)網(wǎng)絡(luò)模型和RBF神經(jīng)網(wǎng)絡(luò)模型;當(dāng)采樣間隔大于5min時,交通流量時間序列具有持續(xù)特性,此時低階線性預(yù)測模型的預(yù)測效果和BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果相差不大。