顏秉洋,唐敏佳,周長庚,李銀萍
(山東建筑大學 信息與電氣工程學院,濟南 250101)
隨著社會的高速發展,越來越多的車輛出現在人們的日常生活中,給人們帶來一定程度出行便利的同時,也導致了城市交通的日益擁堵.城市短時交通流預測作為城市計算[1-3]中的一個重要研究方向,由城市交通大數據驅動,可以大大提高生活效率,提升城市的智能化水平.
短時交通流預測的研究已經發展了很多年,從統計學方法到神經網絡方法和模糊系統的方法,交通流預測越來越精確、適用.統計學方法是通過對歷史交通流數據進行線性回歸處理來進行交通流預測的.Sun 等[4]利用局部線性回歸模型對從休斯頓采集到的交通流數據進行短時預測.Dang 等[5]采用多元線性自回歸模型進行交通流預測.Williams 等[6,7]根據季節性自回歸移動平均(ARIMA)算法建模以便交通流預測.Tan 等[8]將ARIMA 模型和支持向量機(SVM)模型結合組成混合模型來預測交通流.作為樣本學習的優勢方法,支持向量機在交通流預測中也有很多應用.朱征宇等[9]把卡爾曼濾波和SVM 結合起來,發揮兩者的優勢來共同預測短時交通流.文獻[10]中提出了一種將支持向量回歸(SVR)模型用到交通流預測上的方法,進而應用到動態導航系統上.文獻[11]運用SVR 和連續蟻群算法對城市間交通流量進行了預測.神經網絡方法由于其高效的學習能力,在交通流預測中得到了越來越多的應用.Kim 等人[12]結合混合高斯和神經網絡方法建模,結合道路和環境因素進行交通流預測.文獻[13]中通過利用深信度神經網絡(DBN)的方法建模來預測交通流.文獻[14]中將卷積神經網絡(CNN)和SVR 結合起來組成預測交通流的混合模型.但上述方法其模型不具有可解釋性,近年來以規則刻劃的模糊方法在交通流預測中得到發展,特別是和神經網絡有機結合的模糊神經網絡方法.Yin 等[15]結合了模糊系統和神經網絡提出一種模糊神經模型來預測街道交通流.Quek 等[16]利用模糊神經網絡模型來預測交通流,這種模型結合了模糊推理系統和神經網絡,互補的利用兩者的特點來預測.Chan 等[17]根據模糊神經網絡和Taguchi 方法相對高精度的預測道路交通流數據.
上述研究中采用了各種各樣的模型來預測交通流,可以看出對于交通流特征學習的改進方法層出不窮,但是關于交通流數據的固有特性卻一直未能很好的利用.通過觀察交通流的數據,可以發現一些關于交通流周期性的先驗知識,如不同工作日的交通流具有相似的趨勢,即交通流量具有周期性模式.交通流的周期性是城市交通數據的重要特征,可以很好的反應出城市交通流量的特點,利用這種先驗知識訓練交通流預測模型,可以提高模型的預測性能.本文將交通流的周期性先驗知識提取出來,獲得交通流殘差數據,進而通過殘差數據訓練混合模型得到交通流預測值,通過跟BPNN 模型和普通ANFIS 模型進行對比,驗證混合模型的優越性.本方法利用ANFIS 結合交通流周期性的混合模型來預測短時交通流,即可以充分利用交通流的特性,也可以發揮ANFIS 適應交通流非線性數據的特點,可以準確的預測城市短時交通流量.該研究基于實際城市交通流數據來驗證混合模型的泛化能力,為接下來在其他應用方面的研究提供全新的思路.
為了證明混合模型在交通流預測中的優越性,本文用了混合模型跟BPNN 模型和普通ANFIS 模型相比較,ANFIS 模型和BPNN 模型具體內容如下:
自適應模糊推理系統(ANFIS)是由Jang[18]首次提出的,它有機結合了模糊推理系統(FIS)和神經網絡(NN),利用神經網絡的框架,通過自適應的混合算法在數據中提取模糊規則,進而調整前件參數和后件參數,獲取最優解,既發揮了FIS 和NN 的優點,又彌補了彼此的不足,增強了FIS 的學習能力.假定采用規則庫:

其中,Dsj是輸入變量xj的模糊集,cis(i=0,1,···,n)是模糊規則R(s)的后件部分.
對應該規則庫的ANFIS 結構如圖1所示.該ANFIS一共有5 層,第一層為模糊化層,將輸入數據x1,x2,···,xn經過隸屬函數處理輸出對應模糊集的隸屬度,第二層實現前件部分模糊集的運算,輸出為每個規則的激勵強度,第三層將各個激勵強度歸一化,第四層計算每個模糊規則的輸出,第五層計算ANFIS 的輸出.
上述ANFIS 輸入輸出關系可以描述為:

其中,fs(x)和(x)代表激勵強度和歸一化后的激勵強度,其計算公式為:

ANFIS 模型的構建過程,首先確定輸入數據的模糊劃分和模糊集合類型,然后采用反向傳播算法和線性最小二乘法的混合算法進行前件參數和后件參數的訓練,前件參數采用反向傳播算法進行訓練,后件參數運用最小二乘法進行訓練.輸入數據沿ANFIS 網絡運算到第四層,固定前件參數,用最小二乘法訓練后件參數,信號正向傳遞至輸出層,利用反向傳播算法訓練前件參數,循環迭代至全局最優.

圖1 ANFIS 結構圖
BPNN 是迄今應用范圍最廣泛的人工神經網絡之一,理論上具有無限逼近的能力,在BPNN 中,通常采用反向傳播算法或其變種來確定整個網絡的權重.在本文中考慮一個具有L個隱藏層的BPNN,具體結構如圖2所示.

圖2 BPNN 結構圖
BPNN 的輸入輸出關系可以表示為:

其中,f()為 激活函數,為連接第l層 第i個神經元和第l+1j層第 個神經元的權重.
BP 算法會通過最小化平方差公式來獲得最優值或者次優值,如下式所示:


結合上述ANFIS 模型和周期性提取方法,本文提出了一個基于ANFIS 混合模型的交通流預測模型.結構如圖3所示.

圖3 交通流ANFIS 模型
模型訓練的步驟如下:
1)提取交通流數據周期性信息,從交通數據中移除提取的周期性信息,獲得交通流殘差數據.
2)將交通流殘差數據輸入混合模型,利用混合訓練方法訓練前件、后件參數以取得最優結果.
3)將訓練完的交通流殘差數據和交通流周期性信息重新結合,得到最優交通流預測值.
假設有M天歷史交通流數據Y={Y1,Y2,···,YM},每天有T個檢測點,將交通流數據表示為:

對于每天一個周期的周期性信息,提取的方法為:

然后,殘差數據可以表示為:

這個部分主要介紹利用混合模型進行交通流預測實驗的細節和過程.
本文選用2009年10月1 號到2009年11月30 號的交通流數據用來訓練和測試,實驗數據來源于PeMS(美國加州性能測量系統),數據通過探測器每30 秒收集一次.本文用10 分鐘、15 分鐘的時間間隔進行交通流預測實驗,用來驗證模型的性能.初始數據如圖4所示.

圖4 原始交通流數據圖
模型的預測性能用均方根誤差(RMSE)、平均絕對誤差(MAE)、平均百分比誤差(APE)三個指標來衡量,具體如下:

3.3.1 交通流預測(10 分鐘間隔)
本文采用的交通流實驗數據總共有39 天,前21 天的數據作為訓練數據,余下18 天的數據作為測試數據,交通流數據每天有144 個10 分鐘間隔的數據點,所以訓練數據有21×144=3024 個,測試數據有18×144=2592 個,如圖5(a)所示,周期性數據如圖5(b)所示,去除周期性的殘差數據如圖5(c).

圖5 交通流數據(10 分鐘間隔)
利用殘差數據訓練混合ANFIS 模型,預測結果(10 分鐘間隔)如圖6所示.

圖6 交通流預測結果(10 分鐘間隔)
混合模型和其他交通流預測模型的實驗(10 分鐘間隔),各指標對比如表1所示.

表1 不同模型的指標對比(10 分鐘間隔)
3.3.2 交通流預測(15 分鐘間隔)
15分鐘間隔的交通流預測,交通流訓練數據有2016 個點,1728 個測試點,原始數據如圖7(a)所示,周期性數據如圖7(b),殘差數據如圖7(c).
將殘差數據用來訓練本文提出的混合交通流預測模型,預測結果如圖8所示.
混合模型15 分鐘時間間隔的交通流預測與ANFIS模型和BPNN 模型的預測指標對比如表2所示.
交通流數據和二次交通流預測實驗的預測值散點圖如圖9所示.
從上述兩個不同時間間隔的交通流預測實驗中可以得到以下結論:
1)RMSE、MAE、APE 三個性能衡量參數越小,證明模型的預測性能越好.從表1和表2中可以發現本文提出的混合模型同ANFIS 模型和BPNN 模型相比表現是最好的,充分表明交通流周期性的提取,進而利用殘差數據訓練模型這一方法對與提高交通流預測精度的重要性.預測準確率提升情況如表3所示.

圖7 交通流數據(15 分鐘間隔)

圖8 交通流預測結果(15 分鐘間隔)

表2 不同模型的指標對比(15 分鐘間隔)
2)圖9為交通流數據和二次交通流預測實驗的預測值之間的散點圖.圖中可以看出交通流混合模型的預測值和實際交通流數據有著很小的差別,反映了混合模型突出的預測準確度.

圖9 交通流散點圖

表3 交通流預測精度升降表(%)
本文提出了一個基于ANFIS 的混合交通流預測模型,提升了交通流預測的準確度,該模型提取了交通流的周期性,利用去除周期性數據的殘差數據訓練ANFIS 模型,進而得到交通流預測值.本模型的理論貢獻是將ANFIS 模型和交通流周期性提取方法有機結合,根據交通流周期性這一固有特征和ANFIS 模型對交通流數據非線性特點的匹配,組成ANFIS 交通流預測混合模型.另一方面,該方法在交通流預測應用中的突出表現也在實驗結果中得以驗證,證明了該混合模型的有效性和優先性.
眾所周知,很多數據如電力負荷、建筑能耗都有周期性特征的存在,混合模型的方法同樣適合應用于這些有相似時間序列的預測方向上.隨著大數據時代的不斷發展,其他同樣具有周期性特征的預測應用如大數據環境下的建筑能耗預測是本文下一步的研究方向.