吳玲玲,尹莉莉,任其亮
(重慶交通大學 交通運輸學院,重慶 400074)
隨著當前機動車保有量的激增,交通擁堵、環境污染等難題日益突出。相關研究表明,基于信息技術的智能交通系統是目前解決城市擁堵、環境污染的最有效、最根本的措施。其中,實時、準確的交通流預測是目前研究的熱點,也是實現智能化交通的關鍵所在。
目前,相關學者提出了大量的用于短期交通流的預測模型,一般可以分為2類,即參數化方法和非參數化方法。參數方法包括歷史平均值法[1]、灰色預測模型[2]、指數平滑方法[3]、卡爾曼濾波法[4]、ARIMA[5]、多元時間序列模型[6-7]、結構時間序列模型[8]等;而常用的非參數模型有人工神經網絡[9]、非參數回歸模型[10]等。這些模型在預測交通流方面各有優勢,但往往存在一定的局限性,如歷史平均值法無法應對交通流的急劇變化,卡爾曼濾波法的預測精度較低。相比之下,非參數法具有較高的精度,如劉明宇等[11]、羅文慧等[12]以神經網絡結構為基礎,交叉驗證了非參數模型的預測性能,表明非參數模型具有較高的精度。然而,非參數模型更多的是采用未知數量的參數來表達交通數據,由于交通系統的復雜性及時空變化特性,從檢測器收集的原始交通數據不可避免地會受一些未知因素的影響,此時的非參數模型中包含了這些未知因素的干擾,從而嚴重影響到交通流量預測的可靠性和準確性。因此,去除原始數據的未知因素干擾是提高交通流量預測準確度的有效手段[13]。在這些非參數方法中,使用最廣泛的是BP神經網絡模型(BPNN)。人工神經網絡的優勢在于任意非線性映射、自學習和自適應能力,該模型在短時間預測方面較其他通用的學習算法如 ARIMA等表現更為突出,然而,傳統的神經網絡使用梯度下降學習方法,對于復雜的神經網絡結構,該算法存在學習速度慢、陷入局部最小值、穩定性差等問題。在實踐中,研究人員經常使用各種改進的BPNN模型或組合模型。Leng等[14]建立了基于神經網絡和遺傳算法的預測模型,結合神經網絡較強的非線性逼近能力和遺傳算法的全局搜索能力,從而提高了網絡的收斂性和預測精度。Guo等[15]建立了BPNN子模型和ARIMA子模型,以BPNN作為最優非線性組合模型,建立了混合預測模型,結果表明混合預測方法切實可行。Zhang等[16]提出一種利用自適應粒子群優化算法調整神經網絡結構參數的SAPSO-BPNN模型,該方法能夠實現交通流趨勢的預測,具有合理、滿意的收斂性和穩定性。而對于較復雜問題的優化,差分進化算法由于算法簡單、尋優迅速等優點在各個領域被廣泛應用。
針對BPNN易陷入局部極小點的缺點以及初始交通流數據存在干擾的問題,提出了一種基于EMD的差分進化算法優化BP神經網絡(DE-BPNN)的短時交通流預測方法。首先利用EMD分解初始交通流數據,然后判斷各分量的優劣,淘汰干擾性較大的分量之后,通過建立神經網絡預測模型對各個有用的分量進行預測,最后將所有預測值歸一化得到最終預測結果。
基于經驗模態分解(empirical mode decomposition,EMD)的分析方法較多運用于非線性、非平穩信號的分析。在短時交通流預測中,將非線性、非平穩的交通流信號轉化為線性、平穩的交通流信號更能反映其物理意義。由于實質是通過特征時間尺度來識別交通流信號中所含的所有振動模態,與其他信號處理方法相比,經驗模態分解方法具有直觀、間接、自適應等特點。EMD分解方法基于以下假設條件:
1)數據至少有2個極值、1個最大值和1個最小值;若沒有極值點,只有拐點,再對數據求1次或多次微分便可以得到極值。
2)極值點間的時間尺度唯一決定交通流信號隨時間變化的趨勢。
經EMD處理后的原始交通流信號可根據其自身特點自適應分解為有限個經驗模態分量(IMF)和殘余量(RES),使原始交通流信號不同時間尺度的局部特征信號包含在各個分量中,進而使非平穩數據平穩化。其中每個IMF須同時滿足2個條件[17]:① 在整個時間范圍內,函數具有相同數目的局部極值點和過零點,或兩者最多相差1個;② 由局部最大值形成的上包絡線和局部最小值形成的下包絡線的平均值必須為0。其分解過程如下:
步驟1 首先求原始交通流信號X(t)的所有極值點,并用3次樣條插值函數擬合出原始交通流信號的上、下包絡線e1(t)、e2(t),計算上、下包絡線的平均值e(t):

(1)
將原信號X(t)與包絡線平均值e(t)作差,得到c(t):
c(t)=X(t)-e(t)
(2)
步驟2 判斷c(t)是否滿足IMF的條件,如果滿足,將c(t)作為第1個IMF,記為f1(t);如果不滿足,則把c(t)當作新的原始交通流信號,重復步驟1,至滿足IMF為止。
步驟3 將f1(t)從X(t)中分離出來,再把殘余量RESn(t)=X(t)-f1(t)作為新的原始交通流信號,重復上述步驟得到n個IMF,直到X(t)變成一個單調函數時,停止分解,將得到的n個IMF和1個殘余量RESn(t)疊加為原始交通流信號X(t):

(3)
短時交通流受各種因素的干擾,如自身因素和未知的外界因素,各個因素對交通流的趨勢變化起著不同的影響因素,因而交通流是一種典型的非平穩信號。利用EMD分解交通流之后,所得的各分量不僅趨于平穩化,且各個分量更能體現交通流的本性和特質。
由于交通系統復雜性、非線性的特點,導致交通流預測存在難題。而BPNN在處理復雜性、非線性的交通系統等方面具有獨特優勢,且可以根據收集的交通流數據序列調整參數,通過自身的數據處理能力,以任意精度逼近非線性連續函數最終完成對交通流的預測,這一優點使其在復雜非線性系統的預測中得到廣泛應用。典型的BPNN是由輸入層、隱藏層和輸出層組成[18],其中輸入層和隱含層之間通過權值連接,隱含層和輸出層則通過閾值相連,其輸入層包含n個節點,中間層包含m個節點,輸出層為1個節點。在短時交通流預測過程中,基本執行過程是由輸入信息的正向傳播和誤差的逆向傳播2個過程組成,如圖1和圖2所示。

圖1 單神經元結構示意圖

圖2 神經網絡結構示意圖
每個神經模型的激活函數為:
(4)
其中:θ為閾值;權值ωi的范圍為[-1,1];n為輸入層神經元數;y為輸出層。激活函數為:

(5)
神經元訓練是反復迭代的過程。使用來自訓練數據集的新數據修改權重,誤差的總和定義為:
(6)

模型通過調整權重來減少誤差,調整權重的等式為:

(7)

傳統的BPNN學習算法采用梯度下降法。首先,對神經網絡的權值和閾值進行隨機初始化,然后利用一部分樣本數據進行神經網絡模型的訓練,以網絡輸出值與實際值之間的均方誤差為標準來調整網絡的權值和閾值,當達到設定的誤差標準時,即完成網絡的訓練過程,得到神經網絡的初始權值和閾值。該算法的缺點是初始權值和閾值易導致訓練結果陷入局部極小值而不是全局最優值,使得網絡的預測精度達不到很高的水平[19]。針對該問題,引入差分進化算法對BPNN的參數進行優化,該算法收斂速度快且易實現,能夠彌補采用神經網絡模型預測短時交通流的不足,提高交通流預測的精度。
差分進化算法[16](differential evolution,DE)是一種基于群體的全局優化算法,由于其結構簡單、易于實現、搜索效率高、魯棒性強等優點,在數據挖掘、模式識別、人工神經網絡等領域得到廣泛應用。該算法的基本思想是:從隨機生成的初始種群中隨機選擇2個不同的個體向量相減,相減后所得向量與第3個隨機選擇的個體向量相加,生成1個新的個體,將新個體與當前個體按照一定的規則進行判斷。如果新個體的適應度優于當前個體,則在下一代中保留新個體,否則保留舊個體。變異、交叉和選擇是進化過程中的3個主要步驟,各步驟操作如下所示:
步驟1 隨機初始化種群。設定種群規模為Np、基因維數為D,每個基因的變化范圍是[Umin,Umax],種群個體xij按照式(8)產生。
xij=Umin+rand*(Umax-Umin)
(8)

(9)
其中:G為進化代數;F為變異因子;個體序號r1,r2和r3隨機選擇產生且互不相同;種群規模Np≥4。
步驟3 交叉操作。交叉操作按照式(10)產生。
(10)
其中:rand(j)∈[0,1],為均勻分布的隨機產生數;j為第j個基因;CR為交叉因子;rand(i)∈[1,2,…,D],為隨機選擇生成的參數。

(11)


(12)
其中yt是BP神經網絡的目標輸出。
基于上述對BPNN短時交通預測模型、DE-BPNN融合優化算法以及EMD分解方法的介紹,提出基于EMD和DE-BPNN的混合算法流程如下:
步驟1 將交通流數據進行EMD分解;
步驟2 確定BPNN的結構和相關參數。輸入神經元I、隱藏神經元H和輸出神經元O的個數通過實際的分析確定;
步驟3 建立DE算法與BPNN中待優化參數之間的映射關系。三層BPNN中要優化的參數可用一維向量表示:

Part 1 表示輸入層與隱藏層之間的聯系權重,記為MI×H;
Part 2 表示隱藏層的閾值,記為MH;
Part 3 表示隱藏層與輸出層之間的聯系權重,記為MH×O;
Part 4 表示輸出層的閾值,記為MO。
這些待優化參數構成了DE的個體,此時的個體維度為M=MI×H+MH+MH×O+MO。此處的M是由3層BPNN中待優化的參數構成。EMD-DE-BPNN優化算法步驟如下所示[12]:
步驟1 EMD分解得不同特征的模態函數及殘余量,接下來對每個分量分別進行預測;
步驟2 根據式(8)初始化種群;
步驟3 判斷是否達到最大迭代次數或極小值達到精度要求,達到后即停止迭代并輸出最優個體;否則,轉到下一步;

步驟5 重復步驟4,直至得到下一代種群;
步驟6 評價下一代種群的適應度值,全局極小值即最小的適應度值,對應的個體即全局最優個體;
步驟7G=G+1,返回步驟3;
步驟8 輸出DE優化后的最優個體,即神經網絡的初始權值和閾值,接下來用訓練集數據訓練神經網絡;
步驟9 用訓練后的神經網絡模型對測試集數據進行預測;
步驟10 將預測得到的每個分量結果進行重構,輸出最終預測結果。
綜上所述,基于EMD和DE-BPNN融合的短時交通流預測模型流程見圖3。

圖3 基于EMD和DE-BPNN的預測模型流程框圖
為驗證模型的適應性,選取美國加利福尼亞州高速公路2018年5月2日—2018年5月6日的1 440個5 min交通流量為實驗數據。該數據集是短時交通流預測中最常用的數據集,由加州 Caltrans 性能測量系統(PeMS)每30 s實時采集一次,選取其中某個檢測路段監測到的數據,將收集的數據每間隔5 min匯總一次,并對其中3個單向車道進行車流量的匯總。由于研究工作日交通流量的變化對日常經濟生產活動具有更大的意義,故實證分析未考慮周末和節假日的數據。預測之前首先對數據進行預處理,包括冗余數據的刪除、錯誤數據的修改以及數據的歸一化處理。交通流基本趨勢變化如圖4所示,可以看出,該交通流數據呈現明顯的非線性和非平穩性的特點,且工作日內早晚高峰表現一致,具有較強的時間相關性。

圖4 工作日內交通流曲線
仿真實驗環境為Matlab R2018a,用Matlab語言編寫算法程序。差分進化算法主要參數設置:迭代次數為100,種群規模Np為10,縮放因子F取0.5,交叉概率CR取值為[0.8,1],這樣可以使尋優率和收斂速度得到較高保證。設置BP神經網絡的迭代次數l為1 000,訓練目標誤差為0.001,學習率η為0.01[20],BPNN輸入層神經元個數為6,隱含層神經元個數為13,輸出層神經元為1個,隱含層和輸出層的激活函數分別為tansig、purelin,訓練函數為trainlm。
為評價短時交通流預測模型的性能,選取以下4個評價指標:
1)平均絕對誤差MAE:能夠很好地反映預測值誤差的實際情況。
(13)
2)平均絕對百分比誤差MAPE:MAPE越小,表示模型效果越好。
(14)
3)均方誤差MSE
(15)
4)均方百分比誤差MSPE
(16)

3.4.1EMD分解
根據EMD分解算法,對交通流量進行EMD分解,其中第1個模態分量主要為隨機干擾,在預測時可將其直接去除,分解結果如圖5所示,共分為9個IMF和1個殘余量。
從圖5可以看出:IMF1、IMF2、IMF3、IMF4、IMF5、IMF6頻率較高,為交通流數據中的高頻分量;IMF7、IMF8、IMF9周期性明顯,為交通數據中低頻分量;殘差RES為整體變化趨勢,為交通數據中的趨勢分量。由此可以看出,分解后的交通流量非平穩性逐漸降低,表明 IMF比原始數據更穩定。通過對短時交通流數據進行分解,能更精確地掌握交通流的波動變化和總體趨勢變化。對分解的各個分量分別進行預測,將其預測結果重構,可得最終短時交通流預測結果。

圖5 EMD分解結果
3.4.2模型預測及結果
考慮到工作日內早晚高峰表現一致,且具有較強的時間相關性,故選取流量數據中的80%(即周一至周四的流量數據)作為訓練集,在一定程度內,訓練集數據越多越精準,訓練效果越好,剩余的20%(即周五的交通流量數據)作為測試集。通過DE-BPNN融合優化算法,對EMD分解后的9個IMF和1個殘余量分別進行預測。各方法預測結果與實際值見圖6~9。

圖6 基于BPNN的短時交通流預測結果和實際值

圖7 基于DE-BPNN的短時交通流預測結果和實際值
圖6、7中,分析基于BP的短時交通流預測結果、基于DE-BPNN的短時交通流預測結果與實際結果發現,這些方法均不能滿足交通流的變化趨勢預測目標,在大部分時間范圍內,其預測值均高于真實值,不能很好地擬合實際結果。圖8中,基于DE-BPNN的短時交通流預測結果在某一時間內的預測值與實際值能夠高度擬合,但總體來說,擬合效果并不如意。圖9中,基于EMD-DE-BP的短時交通流預測所得預測結果與真實值結果擬合程度較好,相比其他3種預測模型,其預測輸出與實際輸出誤差較小,能夠較準確地描述短時交通流隨時間的變化趨勢。

圖8 基于EMD-BPNN的短時交通流預測結果和實際值

圖9 基于EMD-DE-BPNN的短時交通流預測結果和實際值
為更直觀地反映各預測方法的預測結果,利用誤差指標對各預測方法進行對比分析,預測方法評價指標見表1。
通過對表1、2各項誤差指標的對比分析可以看出,所提出的EMD-DE-BPNN預測方法較其他預測方法所得預測結果的誤差較小且精度較高。EMD-DE-BPNN預測效果較BP網絡預測、DE-BPNN預測、EMD-BPNN預測的MAE值分別提升了50.07%、49.36%、18.68%;MSE值分別提升了52.46%、47.84%、12.37%;MAPE值分別提升了52.11%、51.08%、35.09%;MSPE值分別提升了56.36%、52.59%、43.53%。這表明該模型在短期、趨勢性的交通流預測方面具有極大的應用價值。進一步研究表明,通過重構結果(即去除部分本征函數IMF的影響)去除干擾性較大的IMF1分量所得效果最好,比全預測結果重構的MAPE降低了3.75%,相比MSPE降低了0.31%,各項誤差指標分別提升了68.92%、66.25%、67.03%、64.58%。可以看出,EMD方法將含有噪聲的數據分成單獨的IMF并確定實時序列的總體趨勢,降低了交通數據噪聲對預測的影響,從而有效提高了預測性能和模型的魯棒性。

表1 預測方法評價指標

表2 EMD-DE-BPNN預測較其他預測方法提升百分比

表3 EMD-DE-BPNN(去除IMF1)預測較其他預測方法提升百分比

表4 EMD-DE-BPNN和EMD-DE-BPNN(去除IMF1)預測精度
1)DE-BPNN融合算法在短時交通流預測方面較其他預測方法表現更好。將原始交通數據降噪后分別進行預測,再將各分量結果進行重構,與BPNN模型、DE-BPNN模型、EMD-BP模型等相比,其預測精度有明顯的提高。
2)將干擾性較大的分量去除,其預測精度有了進一步的提升,評價指標MAE、MAPE、MSE、MSPE的值均明顯下降。
將EMD和DE-BPNN融合是一種有效的短時交通流預測方法。未來將考慮交通流受天氣、交通事故等因素影響的情況,進一步提升交通流預測的精度,將研究內容擴展至中長期交通流預測方法的探索。