陸百川,舒 芹,馬廣露
(1. 重慶交通大學 交通運輸學院,重慶 400074; 2. 重慶交通大學 山地城市交通系統與安全實驗室,重慶 400074)
隨著計算機技術迅速發展,交通信息采集的智能化程度不斷提高[1],獲得的交通數據種類和數量越來越多。由于各類交通檢測器檢測原理不同及安裝位置變化等,使得每類交通數據中所包含的信息及所受到的限制條件各不相同,故對多源交通數據動態融合能獲得更有用的交通信息,從而才能為解決城市交通問題打下基礎。
在交通數據采集方面,陸化普等[2]分析了不同來源交通數據的基本特性,提出了交通數據分析方法將從單一數學模型轉變為集機理、知識和數據驅動為一體的混合建模發展趨勢。在交通數據融合方面,史巖等[3]利用神經網絡和回歸分析法,并基于浮動車與微波檢測器速度參數構建了融合模型,得到了更高質量的速度數據,但對兩者速度特性及差異缺乏分析;沈穎潔等[4]引入數據融合技術對不同預測方法的行程時間預測值進行處理,雖考慮了檢測器布設影響,但融合數據僅來自均勻分布的檢測器。在短時交通流預測方面,吳凡等[5]增加動量項和自適應學習率來修正GA-WNN預測模型網絡參數,以較快收斂速度獲得了較高預測精度,但對樣本數據來源可靠性缺少分析;蔣肖[6]選取交通量、占有率和平均車速為訓練參數,基于支持向量機回歸及RBF神經網絡分別建立了單交通參數及多參數融合的短時交通流預測模型,但訓練數據僅來源于單一交通檢測器。
筆者利用融合數據互補性、全面性和精準性等特點,結合遺傳算法較強地全局搜索能力和小波神經網絡較高地自適應學習性,提出利用多源數據融合與遺傳-小波神經網絡(GA-WNN)相結合方法進行交通流預測。以不同檢測器得到單一流量數據序列為基礎,分別基于GA-WNN、GA-NN與WNN構建交通流量預測模型,得到單源最優預測序列;在對多源交通數據融合和短時交通流預測必要性進行綜合分析基礎上,利用最小二乘動態加權融合算法將各單源預測結果進行處理,得到最優融合預測序列。通過案例分析證明:基于GA-WNN和多源交通數據融合的短時交通流預測結果精度高于單一數據源的結果。
目前城市交通系統中存有大量交通數據,通常包括靜態數據與動態數據。動態交通數據會隨著采集時間、地點和獲取方式差異而出現不同特征和性質,在實際運用時必須對這類數據進行分析處理,從而得到有用的交通信息。
按采集時間不同,獲得動態數據能描述斷面歷史與實時的交通狀態特征。按采集地點變化,獲得的交通數據能描述整個路網交通流空間分布特征。按采集方式差異[7],人工調查數據能直接解析調查區域交通出行特征與規律,但數據量有限且主觀性強、更新周期長;車檢設備數據能提供檢測地點的交通流特征,但精確性與布設密度有關;浮動車GPS數據能提供行駛路段區間的運行參數特征或單個車輛的實時運行特征,但穩定性、連續性差;手機信令、公交IC卡數據,獲取方便、內容完整、更新連續,能提供交通出行的精細化過程,但巨量數據分析與處理過程繁瑣。因而,不同的交通數據在時間、空間、側重點及用途上都表現出差異性[8],能以不同程度描述目標路段交通流運行特征。綜合分析、處理多源交通數據就能得到全面、可靠與互補的交通信息。
不同來源的交通數據包含著不同的且有限的交通信息,將各單源交通數據進行融合能克服單源獲取信息的局限性,能獲得更全面與有用的交通信息,以掌握整個路網交通運行狀態。
交通數據融合有3個層次[9]:① 數據級融合是直接對原始交通數據進行處理,信息量大,處理時間長且數據必須同類型;② 特征級融合是將從原始數據中提取出來的交通流量、速度及行程時間等特征信息融合,但交通特征參數提取困難且關聯復雜度高;③ 決策級融合是對每個單源信息交通輸出結果以融合處理,即使某數據源出現錯誤,也能輸出正確結果,靈活性高、信息量小。筆者以車檢(微波、視頻、地磁)數據與浮動車數據為分析要點,由于車檢數據源屬于斷面交通參數,浮動車數據源屬于區間交通參數;經數據時空匹配后兩者都有一致的時間、空間特性,故采用決策級融合,即利用各單一數據源預測的交通流量值進行融合分析,從而為解決交通問題提供更可靠的決策依據。
交通管理、控制與智能誘導不但需要掌握實時交通流狀態,還必須了解未來交通變化狀況與發展趨勢,短時交通流預測作為未來交通數據的主要來源,能為智能交通系統提供有效的未來交通信息。
對交通管理者而言,通過預測交通信息判斷路網未來交通狀態波動,為交通控制與誘導提供決策支持,實現路網交通流均勻分配,使路網交通總延誤最小與道路利用率最高;對交通出行者而言,根據預測信息獲取出行區間內路段未來交通運行狀態,為出行路徑規劃提供參考,以提前選擇出行線路、出行方式及出行時間[10],達到最小的出行成本與出行延誤,最高的出行便捷性與舒適性。
不同的交通檢測器數據采集頻率不能完全一致,使得獲得的交通數據在時間序列與空間位置上并不能完全同步,直接將原始數據進行融合無法很好反應斷面交通特性。筆者分別對各個檢測器的交通流量參數進行短時預測處理,輸出目標路段在同一時段、相同間隔的交通流量預測序列,從而保證了各單源預測序列在時間與空間上的同步;之后將預測結果進行動態加權融合,獲得最優短時交通流預測序列,如圖1。

圖1 基于多源數據的交通流預測模型
按照時間、空間特性匹配的原則收集城市道路網絡中的各交通檢測器數據,以同路段為約束將其轉換為同時段、同間隔的關聯數據;之后將各檢測器的交通量數據按相同時間范圍分為訓練集與驗證集,運用各訓練集數據擬合預測模型,以各驗證集數據為輸入得到各單源在同一時段的短時交通流預測結果;將各檢測器實際采集交通量數據與預測輸出值對比,計算不同源數據在每時段間隔內預測結果的方差;最后根據上一時段融合值與檢測值實時更新下一時段各單源交通數據預測值的最小二乘動態融合權重,得到融合后的最優短時交通流量預測序列。
遺傳算法[11](genetic algorithm, GA)是一種基于自然選擇和基因遺傳學原理的群體優化搜索算法,具有并行、高效、全局搜索等優點。小波神經網絡(wavelet neural networks, WNN)是基于小波分析與神經網絡的結合。小波分析[12]時-頻局部化性質良好,可聚焦到任一局部信號細節,能降低交通流中的噪聲干擾;神經網絡容錯性使多源數據中某信息源出現錯誤時仍可輸出可靠結果,自學習與自組織功能使系統能適應數據的不確定變化,神經網絡具有自學習和實現從輸入-輸出的任意非線性映射關系的特點,適用于對多源交通數據的融合處理。基于兩者優勢結合使小波神經網絡具有更強的函數逼近能力與適應性。
由于小波神經網絡權值、閾值及因子采用隨機化的方式初始化,使網絡的收斂速度、融合預測精度以及平穩性無法得到保證,而遺傳算法作為并行隨機搜索的最優化方法,用其去優化小波神經網絡初始參數可有效防止搜索過程收斂于局部最優解,能提高融合預測模型精度與加快收斂速度,同時能為網絡參數的初始化選擇提供依據。
選用含有3層網絡拓撲結構,即輸入層、隱含層、輸出層的遺傳-小波神經網絡(GA-WNN)對多源檢測器的交通量參數進行處理。設某種交通檢測器以5 min為一個周期進行統計,所采集交通流量序列為xi(i=1,2,3,…,k),并作為小波神經網絡的輸入交通參數,則隱含層輸出計算如式(1):
(1)
式中:s(j)為隱含層第j個節點的輸出流量值,且j=1,2,…,n;sj為小波基函數;ij為輸入層到隱含層的權值;b(j)、a(j)分別為小波基函數sj的平移因子、伸縮因子。
選擇Morlet小波作為WNN的基函數來處理所采集的交通流量序列,如式(2):
s(x)=e-x2/2cos(1.75x)
(2)
網絡輸出層計算預測交通量值如式(3):
式中:y(k)為輸出層第k個節點的預測流量輸出值;jk為隱含層到輸出層的權值;s(j)為隱含層第j個節點的輸出流量值;m、l分別為輸出層、隱含層節點個數。
聯立式(1)~(3),并經大量輸入輸出交通流量數據訓練、擬合模型后,模型便有了預測能力;通過輸入驗證流量數據序列,便可輸出基于該種檢測器數據的預測交通流量序列。但網絡模型在訓練時,會產生誤差且會反向傳播[13],引入梯度下降算法對模型各層的連接權值及參數按式(4)進行修正,使預測值逼近期望值。
{λ(i+1)n,k=λ(i)n,k+Δλ(i+1)n,k
a(i+1)k=a(i)k+Δa(i+1)k
b(i+1)k=b(i)k+Δb(i+1)k
(4)
式(4)中的修正值可按式(5)進行計算:
式中:η為小波神經網絡學習速率;e為預測誤差。
預測誤差e可按式(6)計算。
(6)
式中:yn(k)為實際交通流量值;y(k)為預測交通流量輸出值。
對目標路段上,同一時段里每種交通檢測器的流量數據都采用以上方法及步驟對其進行分析處理,從而獲得基于單源檢測器的預測流量序列,為后期的多源融合最好數據準備。
筆者以多源預測值中的加權誤差平方和最小為原則,充分利用不同數據源經GA-WNN預測輸出結果的不同交通流特性,依據預測流量值與實測流量值分別進行實時方差計算,并根據上一時段融合值與實測值實時更新下一時段各單源交通數據預測值的最小二乘動態融合權重,使精度較高交通量預測序列所占比重大,而精度較低的交通量預測序列所占比重小?;谧钚《藙討B加權融合的算法既考慮了不同數據源預測流量序列的不同交通特征信息,又考慮了隨機因素對流量檢測值的影響,增強了融合的精度與抗干擾能力。
以不同檢測器預測輸出值作為融合的基礎,并以(t-1)時段融合權重實時更新t時段動態誤差,由式(7)可得t時段融合后的交通流量預測值。
(7)
式中:yt為t時段融合后的交通流量預測值;yti為第i種交通檢測器在t時段的交通流量預測值;wt-1,i則為yti的融合權重;n為多源交通檢測器個數。
設第i種檢測器的交通流量預測方差為σi,且σi=E[(yk-yki)],k=t-1,t-2,…,t-n;yk為k時段各交通檢測器的實測流量值,yki為k時段第i種交通檢測器的預測流量值。利用式(8)能得到多源融合的預測估計方差。
(8)
取式(8)中wti的偏導數,并令其為0,取其極小值,有wti=1/σi,則t時段融合權重與方差成反比。并且將其代入(8)可得多個交通檢測器預測結果融合輸出后的估計方差,按式(9)計算:
(9)
從式(9)可看出:將不同交通檢測器的預測流量輸出值進行融合后,其預測方差比單一交通檢測器預測結果方差小,從而短時交通流預測結果精度更高,提供的未知交通信息更可靠。
基于多源交通流量數據融合及GA-WNN的短時交通流預測流程如圖2[14]。

圖2 基于多源數據與遺傳小波神經網絡的交通流預測流程
基于GA-WNN與多源交通數據的短時交通流預詳細步驟如下:
1)收集預測路段各種交通檢測器的交通參數,經預處理后使不同源數據在時間與空間上保持一致性;
3)將預測交通流量與實際采集交通流量間的誤差和確定為適應度值;
4)選擇、交叉、變異操作,且取交叉概率為0.7,變異概率為0.008;
5)重復步驟3)、4)直到達到最大迭代次數或規定適應度要求,并將遺傳算法優化而得到的最優種群依次解碼得到各種參數;
6)利用所采集的多源交通流量數據分別對步驟5)解碼后的權值及因子訓練擬合預測模型,并不斷修正及更新參數,直到訓練誤差或訓練次數滿足規定要求;
7)分別以不同檢測器的歷史交通流量數據為預測模型的輸入,將要預測時刻的流量作為預測模型的輸出,得到單一檢測器流量數據的預測結果;
8)按照各單一數據源流量預測結果精度的高低運用最小二乘加權動態融合法進行處理,得到最優短時交通流量預測序列。
筆者以合肥市某小型路網為研究對象,其實際路網如圖3。該道路網絡中分布有丁字形、十字形等交叉口,具有代表性;布設有微波、視頻、地磁等車輛檢測器,交通數據獲取方便。選取“黃山路—科學大道”交叉口至“黃山路—天智路”交叉口間路段的多源交通數據為分析基礎;其中,微波與視頻檢測器安裝在距“黃山路-天智路”交叉口停車線25m處,地磁檢測器在距停車線5、40m處都有安裝,但40m處檢測器采集的交通數據缺失,故地磁數據源以距停車線5m處的采集數據為準。

圖3 實際路網
考慮到工作日交通流的相似性,整理和處理視頻、微波、地磁與浮動車在2016年6月27日—7月1日、7月4日—8日的交通流數據;由于視頻與浮動車數據的采集在夜間缺失嚴重,故筆者只選用每天08:00—20:00的多源數據為預測樣本。為反映樣本數據采集時效性,同時降低交通流波動對數據采集結果的影響,將各單源數據以5min時間間隔劃分,實現多源數據時間同步;以固定檢測器位置(如:微波檢測器)來挑選浮動車數據,由微波檢測器DETECT_ID(設備編號)與ROAD_ID(路段編號)確定的檢測路段在浮動車LINK_ID中找到相匹配信息,實現多源數據空間同步。浮動車直接獲取的交通參數為速度,利用楊濤[15]提出的三段式速度-流量模型對求得的平均速度進行處理,得到行車區間內的交通流量推算值。表1為不同數據源在7月5日13:00—13:30時段內的初始交通流量(pcu/5min)。

表1 初始數據采集及處理結果
使用微波、地磁與浮動車流量數據融合預測短時交通流量,并將預測結果與視頻實測流量值進行比較;選取前9 d流量數據作為網絡訓練集;并以7月14日流量數據作為驗證集,預測輸出為11:30—14:30時段內的交通流量序列。采用MAE、MRE和MSE這3個誤差指標來量化評價短時預測精度及預測結果融合的可靠性。其中:MAE反映預測值誤差的實際情況;MRE反映預測偏離實測值的程度;MSE反映預測誤差的集中與離散程度。其定義如式(10):
(10)

為比較單檢測器流量數據與多檢測器流量數據融合的短時交通流預測結果。利用MATLAB平臺基于遺傳小波神經網絡模型對微波、地磁及浮動車流量數據以及預測輸出結果進行處理,得到4種數據源的交通流量預測序列及相對誤差分布,如圖4;預測誤差分析如表2。
通過4種數據源預測流量序列與實測流量序列偏離程度及平均相對誤差波動范圍的比較,預測效果由壞到好依次為浮動車數據、地磁數據、微波數據及多源融合預測。由于多源融合協調了各種數據源不同的交通特性,綜合運用了不同的交通信息,提高了預測樣本數據的時空覆蓋率,從而使預測結果相對單源較平穩,預測效果最好。

圖4 4種數據源的交通流量預測及相對誤差

表2 多源交通數據及融合預測結果對比
微波、地磁、浮動車與多源數據預測的平均絕對誤差(MAE)分別為8.65、12.21、13.15、7.71,則多源融合預測累計誤差小于單源數據預測序列誤差;平均相對誤差(MRE)分別為0.27、0.20、0.26、0.16,多源融合的MRE低于單源檢測器預測的誤差值,使預測值偏離實測值的離散程度得到改善。通過與MSE值對比,也可看出多源融合預測精度高于單源預測結果;因此基于多源融合的預測結果優于僅使用固定或移動數據的短時交通流預測序列。為驗證GA-WNN模型融合預測可靠性,利用MATLAB將實測流量分別基于遺傳神經網絡(GA-NN)模型、小波神經網絡(WNN)模型進行處理。表3為預測誤差定量化分析;圖5為不同模型預測結果比較曲線及其平均相對誤差分布。

表3 基于不同模型的融合預測結果對比

圖5 基于不同模型的交通流量預測及相對誤差
基于GA-WNN模型融合預測交通流量最接近于實測值,預測誤差波動范圍也最小,模型融合預測性能最好;基于GA-NN模型融合預測值能較好接近真實值,融合預測效果為次最優;而WNN模型的預測結果與實測值偏差最大,誤差波動范圍也最大,預測效果最差。
對于MAE指標,GA-WNN相比于GA-NN減小了7.5%,相比于WNN減小了15.1%;對于MRE指標,GA-WNN相比于GA-NN減小了7.1%,相比于WNN減小了23.2%;對于模型計算時間(TIME)指標,GA-WNN相比于GA-NN減小了3.0%,相比與WNN減小了37.5%。由此可見,筆者提出的GA-WNN模型融合預測的MAE、MRE與MSE都最小,且網絡收斂速度也快,預測可靠性及實時性強,預測效果最好。故基于遺傳小波神經網絡和多源交通數據融合的短時交通流預測序列結果最優、精度最高,能為交通管理者的判斷決策與交通出行者的路徑選擇提供更準確、全面的交通信息。
筆者通過對多源交通數據智能融合及短時交通流預測必要性的綜合分析,以微波、地磁、浮動車與視頻交通流量參數序列為基礎,分別利用GA-WNN、GA-NN與WNN進行短時流量預測,采用最小二乘動態加權融合法將單一數據源預測結果融合處理而得到最優短時交通流預測序列。利用平均絕對誤差MAE、平均相對誤差MRE和均方差MSE這3個誤差指標為各模型的短時預測序列評價標準。經實例驗證分析,基于多檢測器數據融合和遺傳小波神經網絡的短時交通流預測精度優于單一數據源的短時交通流預測序列。