李 嘉,劉春華,胡賽陽,王 芳
(1.湖南大學 土木工程學院,湖南 長沙 410082;2.中土集團福州勘察設計研究院,福建 福州 350000;3.清遠職業技術學院,廣東 清遠 511500)
在交通運營與管理中,高效的出行信息與路徑誘導系統將發揮越來越重要的作用[1].行程時間作為其中的關鍵參數,能夠為交通狀態估計和城市路網擁堵情況的發布提供數據參考[2].同時,行程時間是衡量路段通行效率和延誤的重要依據,是反映路段交通狀態的直接指標,在智能交通系統中有著廣泛應用[3].目前,行程時間的預測研究大都局限于單一交通數據源,由于單源交通數據受采集儀器的精度、采集方法、樣本量、人為誤差等影響,因而預測精度不穩定.而多源交通數據的融合,可以彌補單源數據的諸多不足,提高預測精度.本文提出利用GPS浮動車數據與微波檢測器交通數據進行融合,建立行程時間數據融合模型.目前,數據融合方法主要有以下幾種[4]:加權平均法、卡爾曼濾波、Bayes方法、統計決策理論、選舉決策法、模糊集理論、神經網絡等.其中,神經網絡具有較強的學習能力,其內部結構本質上是并行的,與數據融合的結構一致,因此具有較大的優勢.
本文擬采用小波神經網絡建立數據融合預測模型,同BP神經網絡相比,小波神經網絡具有更強的信息提取、非線性逼近和容錯能力[5],但它存在初始參數隨機選取的盲目性、易形成局部極小值而得不到整體最優值等問題[6].遺傳算法可以用來優化小波神經網絡的初始網絡參數,彌補小波神經網絡自身的不足.遺傳算法與神經網絡的有機結合[7],將其用于數據融合可以提高模型的收斂速度與泛化能力.
采集研究區域的出租車GPS數據、微波檢測數據及視頻數據,用于構建以及評價行程時間預測模型.
1)出租車GPS數據
出租車GPS數據樣本量的大小直接影響著融合結果的精度,目前主要采用數理統計抽樣方法來確定可靠估計路段行程時間所需探測車輛的最低數量.該方法在允許相對誤差和置信水平下探測車輛的最低樣本量計算公式如下:

2)微波檢測數據
微波檢測數據需經過處理才能得到行程時間.由于微波檢測器檢測的是道路斷面平均車速,因此采用如下公式將其轉化為區間速度:

式中:vo為區間車速,vs為地點車速,δs為地點車速的觀測方差.
則路段行程時間T為:

3)視頻數據
視頻數據調查時,將兩臺攝像機分別置于實驗路段起迄點,同時開始拍攝.調查后同時在計算機上播放兩測點的錄像,從起點視頻中記下車型、車牌、外廓、顏色等特征及車輛通過起點斷面的時間,然后在終點視頻中尋找該車,并同時記錄車輛通過終點斷面的播放時間,前后時間差即為該車通過調查路段的行程時間.
1)時間匹配
本文采集的出租車GPS數據、微波數據及視頻數據雖是同一天的交通流數據,但微波檢測與視頻數據采集的是早晚高峰時間段內的數據,而出租車GPS數據都是全天候的交通流數據,所以有必要依據微波與視頻數據的調查時間挑選出對應時段的出租車GPS數據,這樣多源數據反映的就是同一時間段的交通流信息.由于每條GPS數據記錄都有接收的時間,通過excel篩選可以很方便進行時間匹配.
2)空間匹配
空間匹配是指多源交通流數據必須反映的是同一地點的交通流信息,這樣進行融合才有意義.空間匹配原則是以視頻與微波數據的采集現場來篩選相應道路的出租車GPS數據.首先確定視頻與微波數據的采集路段的經緯度范圍,如圖1所示,然后用excel篩選出與采集路段相匹配的出租車GPS數據.

圖1 交通調查范圍Fig.1 Range of longitude and latitude for traffic investigation
行程時間預測融合模型的輸入參數包括出租車GPS行程時間、微波檢測器得到的行程時間.同時,由于交通行為有很大的不確定性與隨機性,道路交通量與GPS浮動車數量對行程時間的影響比較大,因此,道路交通量、GPS浮動車數量也應作為融合輸入參數予以考慮.故輸入層有4個節點,輸出層有1個節點;隱含層節點數對網絡性能的影響很大:點數過少,則局部極小值多,節點數太多又使學習時間過長,而且可能產生過擬合使得網絡泛化能力變差[8].隱含層節點數可按公式(4)估算:

式中h為隱含層節點數,m為輸入神經元數,n為輸出神經元數,a為[1,10]之間的常數.
由式(4)計算得隱含層節點數為5,因此設置小波神經網絡結構為4—5—1.得到行程時間預測融合模型如圖2所示.
1)輸入層:

式中:x1(i)為出租車GPS車輛得到的行程時間;x2(i)為微波檢測車輛得到的行程時間;x3(i)為交通流量,x4(i)為出租車GPS車輛的樣本量.

圖2 行程時間預測融合模型Fig.2 Travel time prediction fusion model
2)隱藏層:

式中:hm(i)為第m 個隱藏神經元;wj,m為連接第j個輸入神經元與第m個隱藏神經元的權重;bm為第m個隱藏神經元的小波基函數平移因子;am為第m 個隱藏神經元的小波基函數伸縮因子;φ(x)為傳遞函數,文中采用收斂效果更好的余弦調制Morlet小波函數,其表達式為:

3)輸出層:

式中:Y(i)為融合后的路段行程時間;ωk為連接第k個隱藏神經元與輸出神經元的權重;φ(x)=cx+d為線性函數.
融合模型是通過構造一個小波神經網絡來實現的.為了加快網絡收斂速度,提高融合結果精度,擬利用遺傳算法來優化小波神經網絡參數(權值Wji,Wkj,平移因子bm和伸縮因子am).遺傳算法優化小波神經網絡的流程如圖3所示.

圖3 遺傳算法優化小波神經網絡流程圖Fig.3 Flow diagram of genetic algorithm optimization wavelet neural network
遺傳算法優化小波神經網絡包括網絡結構的確定、遺傳算法優化網絡初始參數.首先對染色體進行編碼設計,通過適應度函數計算個體適應度值,遺傳算法通過選擇、交叉、變異操作找到最優適應度值對應個體.
1)染色體設計
染色體基因設計采用實數編碼,每個染色體均為一個實數串,由輸入層與隱含層連接權值Wji,隱含層與輸出層連接權值Wkj,平移因子bm,伸縮因子am共4個部分組成,故編碼為(Wji,Wkj,bm,am).在網絡結構確定的情況下,就可以構成一個權值、平移因子、伸縮因子都確定的小波神經網絡.
2)適應度函數
根據個體得到小波神經網絡的初始權值、平滑因子、伸縮因子,訓練小波神經網絡后預測系統輸出,預測輸出和期望輸出之間的誤差絕對值和即個體適應度值F,計算公式為:

式中:n為網絡節點輸出數;yi為小波神經網絡第i個節點的輸出;oi為第i個節點期望輸出.
3)選擇操作
遺傳算法的選擇操作采用輪盤賭法,每個個體被選擇的概率pi為:

式中:Fi為個體i的適應度值,k為系數,m為種群個體數目.
4)交叉操作
由于個體采用實數編碼,所以交叉操作采用實數交叉法,第k個染色體ak和第p個染色體ap在j位交叉操作方法如下:

式中:b是[0,1]間的隨機數.
5)變異操作
選取第i個個體的第j個基因aij進行變異,變異操作方法如下:


6)遺傳算法參數的選取
種群規模增大時,算法的全局搜索能力會增強,但收斂時間會增長,影響算法的效率[9].因此種群規模一般根據問題的復雜度與經驗選取.一般取20~100[10],根據程序多次運行的收斂情況,本文選擇種群規模為20,進化代數為50代.
交叉概率是決定是否進行參數數值信息互換的關鍵.交叉概率太大,就變成了隨機交叉,太小的話算法難以收斂.本文引入Srinivas[11]自適應交叉概率設計思想,交叉概率Pc為:

式中:Pc0為初始交叉概率,取值范圍為[0.6,0.9],建議取0.7;fave為參數組集合中目標吻合度的平均值;fbest為參數組集合中目標吻合度的最優值;f′為兩交叉參數組中目標吻合度的較優值;a為變異參數,范圍在[0,1]之間,a的取值與初始交叉概率和程序收斂速度有關,建議取a=Pc0/4.
遺傳算法優化過程中最優個體適應度值變化如圖4所示.

圖4 最優個體適應度值Fig.4 The best individual fitness value
從圖4可以看出,在仿真運行到15代左右,最優個體的適應度值已趨于穩定,表明遺傳算法已得到優化的小波神經網絡權值、平滑因子、伸縮因子.遺傳算法得到優化后的小波神經網絡初始權值、平滑因子、伸縮因子見表1.

表1 優化后的小波神經網絡參數Tab.1 The Optimized wavelet neural network parameter
基于改進后的小波神經網絡融合模型,采用MATLAB軟件編程預測行程時間.
加載已經初步處理的訓練和預測數據,并對訓練和輸出數據進行歸一化處理.其中input,output分別為訓練輸入和輸出數據,input_test,output_test分別為預測輸入和輸出數據.
遺傳算法主函數
步驟1:隨機初始化種群,maxgen=20,sizepop=50,pcross=0.7,pmutation=0.18;
步驟2:計算種群的適應度值,從中找出最優個體,function error=fun(x,inputnum,hiddennum,outputnum,net,inputn,outputn);
步驟3:選擇操作,function ret=select(individuals,sizepop);
步驟4:交叉操作,function cross=select(pcross,lenchrom,sizepop,bound);
步驟5:變異操作,function mutation=select(pmutation,lenchrom,sizepop,num,maxgen,bound);
步驟6:判斷進化是否結束,否則返回步驟2.
3)小波神經網絡訓練
將遺傳算法優化后的參數賦給小波神經網絡,用歸一化的數據對其進行訓練.
4)小波神經網絡預測
用訓練好的小波神經網絡預測行程時間,輸出最后的預測結果.
校正目標閾值用來判定目標吻合度是否達標,從而確定數據融合模型是否有效.該值的確定主要考慮因素有交通流狀況、道路網規模及評價指標類型等.對于大中路網,參考文獻[12]給出了校正目標閾值,如表2所示.

表2 目標閾值建議Tab.2 Recommendations of target threshold
現場交通調查地點為廣東清遠市北江新區,調查時間為2012年3月28日(周三)和29日(周四)兩天,采用視頻、微波檢測器等方式對研究區域進行交通調查.實驗路段選取清遠市北江二路,路段長991m,以2min為采樣周期,共取240組數據,其中220組用來訓練網絡,20組用來檢測模塊的準確性.現場交通調查數據及融合后的行程時間如表3所示,實驗路段行程時間對比分析見圖5.

表3 初始交通數據及數據融合結果Tab.3 Initial traffic data and results of fusion model

圖5 行程時間對比及誤差分析Fig.5 Travel time fusion effect diagram and error analysis
從圖5中可以看出,GPS出租車得到的行程時間與視頻觀測值相比偏低,誤差超過了目標閾值15%的范圍.原因在于出租車頻繁超車,車速高于路段車流.而微波檢測器得到的行程時間大于視頻觀測值,誤差超過15%的范圍.究其原因在于實驗路段大客車、大貨車較多,遮擋了車流中部分小汽車,造成小汽車數據漏檢.而融合后的行程時間與視頻觀測數據吻合性良好,誤差在8%以內,滿足目標閾值15%的要求.相比GPS出租車數據或微波檢測器數據,融合后的行程時間在準確度和穩定性方面都有了很大提高.
本文提出了基于交通數據融合技術的行程時間預測模型,彌補了單源交通數據預測行程時間精度不高的缺陷.利用遺傳算法優化小波神經網絡的權值、平移因子、伸縮因子,解決了小波神經網絡初始參數選取時盲目與隨機性問題,大大提高了小波神經網絡搜索效率與訓練速度.融合后的行程時間與視頻觀測數據吻合性良好,表明行程時間預測的數據融合模型是有效可靠的.
[1]鄒亮,徐建閩,朱玲湘,等.基于浮動車移動檢測與感應線圈融合技術的行程時間估計模型[J].公路交通科技,2007,24(6):114-117.ZOU Liang,XU Jian-min,ZHU Ling-xiang,et al.Travel time estimation model based on the floating car mobile detection and induction coil fusion technology[J].Journal of Highway and Transportation Research,2007,24(6):114-117.(In Chinese)
[2]聶慶慧,夏井新,張韋華.基于多源ITS數據的行程時間預測體系框架及核心技術[J].東南大學學報:自然科學版,2011,41(1):199-204.NIE Qin-hui,XIA Jin-xin,ZHANG Wei-hua.Based on the framework and core technology of multi-source ITS data travel time prediction[J].Journal of Dongnan University:Natural Science Edition,2011,41(1):199-204.(In Chinese)
[3]徐天東,孫立軍,郝媛.城市快速路實時交通狀態估計和行程時間預測[J].同濟大學學報:自然科學版,2008,36(10):253-260.XU Tian-dong,SUN Li-jun,HAO Yuan.The urban expressway real-time traffic state estimation and travel time prediction[J].Journal of Tongji University:Natural Science Edition,2008,36(10):253-260.(In Chinese)
[4]石章松.目標跟蹤與數據融合理論及方法[M].北京:國防工業出版社,2010.SHI Zhang-song.Target tracking and data fusion theory and methods [M].Beijing:National Defence Industry Press,2010.(In Chinese)
[5]張冬至,胡國清.基于遺傳優化小波神經網絡逆模型的油水測量[J].光學精密儀器,2011,19(7):183-189.ZHANG Dong-zhi,HU Guo-qing.Based on genetic optimization wavelet neural network inverse model of the oil-water measurement[J].Journal of Optical Precision Instruments,2011,19(7):183-189.(In Chinese)
[6]宋清昆,王建雙,王慕坤.基于遺傳算法的小波神經網絡控制器設計[J].電機與控制學報,2010,14(4):102-108.SONG Qing-kun, WANG Jian-shuang, WANG Mo-kun.Wavelet neural network controller design based on genetic algorithm [J].Journal of Electric Machines and Control,2010,14(4):102-108.(In Chinese)
[7]周昌能,余雪麗.基于BP網絡的權值更新快速收斂算法[J].計算機應用,2006,26(8):1940-1942.ZHOU Chang-neng,YU Xue-li.Fast convergence algorithm based on BP network weight update[J].Journal of Computer Applications,2006,26(8):1940-1942.(In Chinese)
[8]王楠,李成文,李巖.基于神經網絡的數據融合方法[J].光機電信息,2010,27(3):36-39.WANG Nan,LI Cheng-wen,LI Yan.Data fusion method based on neural network[J].Journal of Light Mechanical and Electrical Information,2010,27(3):36-39.(In Chinese)
[9]宗剛,劉文芝,張超,等.基于家庭決策的出行方式選擇非集計模型[J].湖南大學學報:自然科學版,2013,40(4):100-103.ZONG Gang,LIU Wen-zhi,ZHANG Chao,et al.Household decision based disaggregate mode choice model[J].Journal of Hunan University:Natural Sciences,2013,40(4):100-103.(In Chinese)
[10]鞏敦衛.交互式遺傳算法原理及其應用[M].北京:國防工業出版社,2007.GONG Dun-wei.The principle and application of interactive genetic algorithm [M].Beijing:National Defence Industry Press,2007.(In Chinese)
[11]SRINIVAS M,PATNAIK L M.Adaptive probabilities of crossover and mutation in genetic algorithms[J].IEEE,1994,24(4):656-657.
[12]HOLM P,TOMICH D,SLOBODEN J,et al.Traffic analysis toolbox volum IV:guidelines for applying CORSIM,microsimulation modeling software[M].Washington D C:Federal Highway Administration,2007:117-216.