王小凡 朱永強
(青島理工大學機械與汽車工程學院,山東 青島 266520)
近年來我國汽車保有率迅速上升,交通建設逐步完善,高速公路成為越來越重要的出行方式,高速公路不僅為出行提供許多便利,它還加快了周邊地區的經濟發展。但是隨著交通事業的飛速發展,高速公路上交通量猛增,甚至超出了道路通行能力造成交通擁堵和連環事故,為了提高道路的通行效率,需要對高速公路的交通量進行分類控制和合理誘導,而準確的交通量預測則是進行科學交通規劃和誘導的前提和關鍵。
隨著智能交通迅速發展,交通量預測作為智能交通系統的關鍵因素引起了越來越多的學者關注,先后提出了很多模型運用到實際交通量預測中,如學者Smith和Oswald在2002年提出非參數回歸模型,[1-2]學者Castro等創立了一種支持向量機預測模型,[3-4]學者Okutani根據卡爾曼濾波理論建立了交通流預測模型以及神經網絡等預測方法。[5]國內研究者周小鵬、馮奇等提出基于最近鄰法的短時交通流預測。[6]
目前人工智能已經成為當下的熱點方向,神經網絡可以模擬人腦信息處理的過程,具有高度自主學習性和信息處理能力,已經在許多領域進行實際的運用,[7]非常適用于解決非線性、復雜的交通系統問題,但是神經網絡自身也存在收斂速度慢,容易陷入局部極小的缺陷,造成預測誤差。因此本文根據道路交通特點結合實際情況,提出用遺傳因子優化小波神經網絡,建立一種遺傳算法優化BP神經網絡預測模型,使得神經網絡可以迅速找到最優解并提高預測精度。
BP(Back Propagation)神經網絡是一種多層前饋神經網絡,[8]由輸入層、輸出層和隱含層構成,每一層由若干節點連接,輸入信號從輸入層經隱含層逐層處理并傳向輸出層,若輸出層結果與期望輸出相比誤差過大,則將誤差信號沿輸出層反向傳遞,逐層修改和調整連接權值和閾值,反復迭代直至輸出結果和期望結果誤差滿足一定條件,BP神經網絡的拓撲結構如圖1所示:

圖 1 BP神經網絡拓撲結構圖
圖中,X1,X2,X3,…Xn為 BP 神經網絡的輸入值,Y1,Y2,Y3,…Yn是預測值,ωij和ωjk為連接權值。
(1)BP神經網絡首先需要經過網絡訓練,假設神經網絡輸入層節點數n、隱含層節點數l、輸出層節點數m、連接權值ωij,ωjk等,初始化網絡,然后計算隱含層輸出。
(2)計算神經網絡預測輸出O:


BP神經網絡憑借自身的較強的自學習、自適應、容錯性的優點已被廣泛應用于信號識別、系統優化等領域中,但是傳統的BP神經網絡也呈現出收斂速度較慢,陷入局部最優以及全局搜索能力不足的缺陷,使得BP神經網絡在預測應用中預測精度仍不能滿足需求。
美國Michigan大學Holland教授在1962年根據自然界中物競天擇的機制以及各種生物進化規律提出遺傳算法(Genetic Algorithms),這種算法主要是在計算模型中設定成生物自然地進化競爭的機制,編碼模型中問題參數成染色體,模擬自然界中生物遺傳的選擇,交叉和突變過程,并根據健康狀況保留具有良好適應值的優秀個體,遺傳算法具有自適應隨機優化搜索,可以做到全局尋優,在最優化領域方面更加成熟,收斂速度和效果更好。
GA-BP網絡預測模型首先確定BP神經網絡結構,根據擬合函數輸入和輸出參數來確定遺傳算法個體的長度。使用遺傳算法找尋網絡最優適應值,使用新的權值和閾值訓練BP神經網絡并輸出預測結果。[9]
(1)數據處理
對原始樣本數據進行預處理作為神經網絡的輸入。
(2)確定BP網絡結構
隨機初始化BP神經網絡的權值和閾值
(3)初始種群進行編碼
傳統二進制編碼存在連續函數離散化的映射誤差,實數編碼更適合應用于多維數值問題,使得遺傳算法更加接近待解問題空間,對于個體較多的神經網絡,用實數對每個個體編碼,獲得初始種群。
(4)適應度函數
個體適應度值F是指根據個體預測輸出與實際輸出之間的誤差絕對值和,計算公式為:

式中,n為網絡輸出節點數;yi為網絡的第i個節點的實際輸出;oi為第i個節點的預測輸出;k為系數。
(5)選擇操作
確定隨機選擇個體的概率與其適應度函數值成正比,遺傳算法選擇輪盤賭法(Roulette Wheel Selection):
其中Fi是第i個個體的適應度值;k為系數;N為種群個體數。
(6) 交叉操作
交叉是將上代中優秀的基因組合傳遞至下一代,在兩個個體中隨機選取一個基因位置作為交叉位置,組成新的優秀個體,產生新的尋優空間[10]:

式中,b是[0,1]間的隨機數。
(7)變異操作
將變異算子作用于群體,提高遺傳算法局部隨機搜索能力,并保持種群的多樣性。選取第i個體的第j個基因αij進行變異操作:

式中,γ2為隨機數;g為網絡已迭代次數;Gmax為網絡最多進化次數;αmax,αmin分別為基因αij的上界和下界;r為[0,1]間的隨機數。
(8)判斷網絡是否完成參數優化
如果網絡預測結果不滿足期望誤差值和迭代次數,則返回重復迭代,如果達到,則輸出最優染色體。
(9)構造訓練網絡
優化后的初始權重和閾值從GA算法部分獲得并分配給BP網絡并構建網絡。
本次實驗數據來源于遼寧省某高速公路2015年全年日交通量,共365組數據,將每5組數據分為一組,獲得71組數據,使用61組數據作為訓練樣本,剩余10組作為測試樣本。
設置GA-BP神經網絡結構為4-6-1,即將神經網絡結構設置為3層,其中輸入層為4,輸出層1,隱含層5,共有4×5+5×1=25個權值,5+1=6個閾值。GA-BP神經網絡學習概率為0.1,隱層激勵函數用tan-sigmoid,輸出層的激勵函數是linear,訓練函數是traingd.網絡中種群數目為10,遺傳迭代次數10,交叉概率為0.3,遺傳概率為0.1,誤差精度為0.001。
為了驗證遺傳算法優化BP神經網絡(GA-BP)在交通量預測中的效果,使用相同網絡結構的傳統BP神經網絡對同一樣本數據做出預測,使用平均相對誤差(MAPE),均方根誤差(RMSE)兩種評價指標對遺傳算法BP神經網絡(GA-BP)與傳統BP神經網絡預測結果進行評價和比較:

使用兩種預測模型進行訓練網絡并預測,輸出結果見表1,圖2和圖3

表1 預測評價指標對比

圖2 兩種神經網絡預測結果對比圖

圖3 兩種神經網絡MAPE對比
從表1可以看出,GA-BP兩項評價指標均優于傳統BP算法,誤差較后者比有明顯下降,表明引入遺傳算法后提高了全局搜索能力,預測精度得到顯著提升。根據圖2可知,虛線代表的GA-BP神經網絡預測交通量曲線更貼實際交通量的實線,與實際交通量的變化趨勢相符。圖3表明BP預測誤差有較大波動,而GA-BP的誤差曲線趨勢則較為平緩,由此可知由遺傳算法改進的GA-BP神經網絡預測值更貼近實際值,預測精度優于傳統BP神經網絡。
本文提出的基于GA-BP算法的交通量預測方法將BP網絡初始權重和閾值優化引入生物進化中的自然選擇和交叉變異算子。利用遺傳算法的全局搜索能力,尋找BP神經網絡的最優權值和閾值,有效地縮小了預測模型尋優參數的取值范圍,使得優化后的BP神經網絡獲得更快的收斂速度從而提高預測精度。采用遼寧省某高速公路全年日交通量作為原始數據,預測交通量,實驗數據表明傳統BP神經網絡預測結果相對誤差為13.17%,而GA-BP神經網絡預測相對誤差為6.81%,后者預測誤差較小在可接受范圍之內,而且精度更高更加貼近實際值,結果證明該預測算法具有更快的收斂速度以及更加準確的預測結果,整體預測準確度得到了提高,克服了傳統BP神經網絡容易陷入局部最優的缺點,可以為交通預測、規劃等相關工作提供一定的參考價值。