康海貴 莫仁杰 李明偉
(大連理工大學港口、海岸及近海工程國家重點實驗室 大連 116024)
交通堵塞、交通擁擠及交通事故等問題使得城市的交通系統不堪重負.短時交通量預測是城市動態交通分配和交通誘導系統的關鍵技術,對解決城市交通問題具有重要意義,是智能交通領域的研究熱點.商蕾[1]在構建城市道路微觀交通仿真模型框架的基礎上,運用面向對象思想和技術、動態內存管理和實時視景仿真技術開發了城市道路微觀交通流仿真原型系統.孫立光等[2]提出了包含傅里葉歷史估計、自回歸和鄰域回歸3個子模型的應用于流量和速度預測的組合預測模型.張杰等[3]應用交通流一維元胞自動機模型進行仿真試驗,研究理論交通流的混沌現象.張敬磊等[4]針對智能交通系統的開發和交通流特性,應用小波Mallet分解算法建立交通流狀態辨識方法.支持向量回歸機模型(support vector regression,SVR)采用結構風險最小化原則替代經驗風險最小化原則,能在模型的復雜性和學習能力之間尋求最佳折中[5].由于其出色的學習能力和泛化性能,在短時交通流量預測方面得到了廣泛的應用[6].而SVR 模型本身并未給出模型最優參數組合的選擇方法,常用的經驗選取法和交叉試算法存在一定缺陷[7].遺傳算法[8](genetic algo-rithms,GA)具有全局尋優、魯棒性和自適應性強等優點[9],可應用于模型參數的優選.本文基于混沌logistic映射的遍歷性、初值敏感性、不容易陷入小循環和不動點的優勢,同時借以云模型云滴的隨機性和穩定傾向性特點,對標準遺傳算法進行改進,建立了基于混沌云遺傳算法(chaos cloud genetic algorithm,CCLGA)進行參數優選的CCLGA-SVR 短時交通流量預測的新方法.通過數值模擬,證明了該方法的有效性,可為短時交通管理提高依據.
設變 量y 與x 遵循某一未知聯合概率F(x,y),SVR回歸就是尋求實值函數f(x)=w·φ(xi)+b來擬合以觀測樣本集S ={(x1,y1),(x2,y2),…,(xl,yl)},使得風險R[f]=∫C(x,y,f)dρ(x,y)最小.式中:C 為損失函數.回歸時觀測值與預測值之間的誤差用ε不敏感函數|yi-f(xi)|ε=max{0,|yi-f(xi)|-ε}來度量,當x點的觀察值y與預測值f(x)之間的誤差不超過小正數ε時認為函數對這些樣本點的擬合是無差錯的.基于ε損失函數SVR 問題可表示為


SVR 回歸模型中有需要給定C,v 及核函數K 中的參數,這些參數的選取對模型結果精度、穩定性和泛化性有重要影響.參數的選取直接決定著模型的使用性能,實際應用中往往是憑經驗選取或用交叉驗證法選取,2種方法中前者經驗性太而且在模型精度上仍有待提高,后者模型參數尋優方向不明顯、計算量大,當個體的數量增加時計算量則是指數性增長、計算耗時.
混沌優化方法是利用混沌遍歷及初值敏感等性質作為全局優化機制.混沌優化方法中常用Logistic混沌映射,Logistic映射產生的混沌序列的概率密度服從兩頭多中間少的切比雪夫分布,其遍歷性解釋見文獻[10].一維Logistic映射方程為xn+1=u·xn·(1-xn).式中:xn∈[0,1],u∈[0,4],n=0,1,2,….xn是混沌變量x 在第n次的迭代值,u是控制參量.為保證混沌變量對初值的遍歷性及敏感性n 值一般?。?00~1000];x0?。?,1]區間內除0.25,0.5,0.75 以外的初值.實驗證明,當u=4 時系統完全處于混沌狀態[11],此時按映射方程得出的混沌變量可以遍歷到整個搜索區域.圖1為n=50000,u=4,x(0)=0.45時混沌變量分布,圖2給出變量500次迭代分布情況.從圖1和圖2可以看出,Logistic混沌映射軌道點能夠布滿整個區域的內部和邊界,并且區域邊界軌道點數量較多內部點數量較少但整體分布較均勻的特點.

圖1 Logistic映射混沌變量圖

圖2 變量迭代分布圖
設T 為論域u 上的語言值,映射CT(x):u→[0,1],x∈u,x→CT(x),則CT(x)在u上的分布稱為T 的隸屬云,簡稱云[12],當CT(x)服從正態分布時,稱為正態云模型.云理論模型[13]是語言值表示不確定性的轉換模型,具有隨機、模糊及穩定等特性.云模型[14]的整體特性可以用期望E、熵S、超熵H 這3個數字特征來表示.基本正態云如圖3所示,圖中E 是云滴在論域空間分布的期望;S 代表定性概念的可度量粒度;H 是熵的不確定性度量即熵的熵.云模型在知識表達時的不確定中帶穩定性特點,其期望E 可以代表父代個體遺傳的優良特征,是子代對父代的繼承,熵S和超熵H 表示了繼承過程的不確定性和模糊性,表現了物種進化過程中的變異特征,算法進化的隨機性可以避免搜索陷入局部極值,而穩定傾向性又可以很好地定位全局最優值.

圖3 正態云模型示意圖


CCLGA 算法是基于“保護”較優個體,快速進化較差個體的思想,基本思路是運用混沌Logistic映射產生初始種群,利用云模型指導算法進行交叉和變異操作,進化到一定程度時,做微小的混沌擾動生成新的種群,重新進行優選迭代,直到滿足終止條件為止.CCLGA 算法設計步驟如下.
步驟1 混沌Logistic映射生成m 個體的初始種群.
步驟2 計算每個體的適應度值,記錄最大個體染色體及其適應度值.


步驟6 將經過交叉生成的新個體和經過變異生成的新個體組合得到新的種群,轉入步驟2)進行下一輪的迭代計算,直到滿足停止條件,其中c1-c4為控制參數,本文取c1=c3=2.5p(p 為種群的大小),c2=c4=15.

本文模型預測以某市交通頻繁堵塞路段高峰期(17:00~20:00)為例,區域路網簡化如圖4所示.根據路段長度及平均行車速度取交通量數據采樣周期為10 min(時段長度確定為10 min),7d共采集數據126組.

圖4 區域道路簡化圖
圖4中,以D 斷面交通流量為預測目標集,其交通流量受到上游斷面A,B,C,及下游E 斷面流量的直接影響.X1(t),X2(t),X3(t),X4(t)分別為斷面A,B,C,E 處t 時段的交通流量,Y(t-1),Y(t)分別為預測斷面D 處的t-1和t 2個時段交通流量,Y(t+1)為該斷面t+1時段的流量.天氣因素設為第六個影響因素X5(t),其量化方法為大雪或大雨雪為1,小雪或小雨雪為0.75,大雨為0.5,小雨為0.25,晴或多云為0.因此,得影響斷面D 處給定方向t+1時段交通流量Y(t+1)的7 個影響因素X={X1(t),…,Y(t-1),Y(t)},將其作為模型的輸入向量,模型的輸出量值為Y={Y(t+1)}.由于周末高峰期車流量集中現象與工作日高峰期的特征有所差別,本文只選周一至周五為研究對象,將前4d晚高峰時段數據作為模型的訓練樣本,將第5d晚高峰時段后16組數據作為檢驗樣本進行仿真預測.
為分析模型全局尋優性能和預測精度,以控制尋優時間的方式對模型進行仿真.CCLGASVR 模型,經過迭代優選得到全局參數最優組合為C=584.5,ν=0.8763和δ=0.2197;運用不同對比模型進行仿真計算,得不同模型預測結果對比見表1,預測相對誤差曲線見圖5.

表1 不同預測模型仿真結果對比 /輛

表2 不同算法尋優過程適應度對比

圖6 算法適應度變化對比
不同參數優選模型在限定時間內尋優性能對比如表2所列;模型搜索的適應度函數值隨時間的變化曲線如圖6所示.方面優 于NF-SVR 模型,SGA-SVR 模型 優 于 基本的GA-SVR 模型,CCLGA-SVR 模型在限定時間內尋優速度及模型精度優于SGA-SVR 模型.在一定的運行時間(2000s)內,SGA 算法搜索到的個體的適應度普遍大于GA 算法;CCLGA 算法搜索到個體的適應度普遍大于GA 算法和SGA 算法.
由模型尋優搜索過程、尋優效率曲線以及預測輸出結果可看出:(1)在逼近原始流量序列方面,SVR 的預測方法明顯優于PSO-BP神經網絡模型;(2)基本的GA-SVR 模型在參數尋優性能
本文提出了模型參數選取的新方法(CCLGA算法),與NF 交叉驗算法、基本GA 算法以及傳統SGA 算法相比,CCLGA 算法在規定的時間內搜索效率更高,更適合系統利用新的數據進行模型參數的自動更新,有效降低陷入局部最小化風險,取得精度較高的模型輸出.
綜合考慮了城市短時交通流的時空分布特性及天氣影響因素,共7 個影響因子,將CCLGASVR 模型應用于城市短時交通流量預測,可以減少短時交通流預測的用時并提高預測精度和可靠度,為城市復雜交通環境下交通管理提供可靠的技術服務.實際應用中,可以根據實時預測結果,動態修改和實時發布未來幾個時段內的交通預測信息,通過調節交通指示等手段,可有效緩解整個交通網絡的擁堵狀況.
[1]商 蕾.城市道路交通流仿真系統研究[J].武漢理工大學學報:交通科學與工程版,2010,34(3):587-590.
[2]孫立光,李瑞敏,董 屾,等.短時交通流組合預測模型研究[J].武漢理工大學學報:交通科學與工程版,2010,34(5):874-876.
[3]張 杰,賀國光.基于一維元胞自動機模型的交通流混沌研究[J].武漢理工大學學報:交通科學與工程版,2009,33(1):34-36.
[4]張敬磊,王曉原.交通流狀態辨識小波算法研究[J].武漢理工大學學報:交通科學與工程版,2006,30(5):820-823.
[5]VAPNIK V.The nature of statistical learning theory[M].New York:Springer,1995.
[6]劉艷忠,邵小健,李旭宏.基于Lagrange支持向量回歸機的短時交通流量預測模型的研究[J].交通與計算機,2007,5(25):47-50.
[7]YAN H S,XU D.An approach to estimating product design time based on fuzzy-support vector machine[J].IEEE Transactions on Neural Networks,2007,18(3):721-731.
[8]孫月峰,張勝紅,王曉玲,等.基于混合遺傳算法的區域大系統多目標水資源優化配置模型[J].系統工程理論與實踐,2009,29(1):139-142.
[9]MIN S H,LEE J,HAN I.Hybrid genetic algorithms and support vector machines for bankruptcy prediction.Expert Systems with Applications,2006,31(3):652-660.
[10]李祥飛.混沌優化理論在控制系統設計中的研究[D].長沙:中南大學,2003.
[11]LU Q Z,SHEN G L,YU R Q.A chaotic approach to maintain the population diversity of genetic algorithm in network training[J].Computational Biology and Chemistry,2003,27(3):363-372.
[12]劉常昱,李德毅,杜 鹢,等.正態云模型的統計分析[J].信息與控制,2005.3,34(2):236-239.
[13]李興生.基于云模型和數據場的分類和聚類挖掘研究[D].南京:中國人民解放軍理工大學,2003.
[14]WANG Shuliang,LI Deren,SHI Wenzhong.Cloud model-based spatial data mining[J].Geographical Information Science,2003,9(2):77-78.