田保慧,郭 彬
(河南交通職業技術學院 交通信息工程系,河南 鄭州 450000)
基于時空特征分析的短時交通流預測模型
田保慧,郭 彬
(河南交通職業技術學院 交通信息工程系,河南 鄭州 450000)
交通流預測的實時性和準確性直接影響到交通流誘導系統的高效性,是智能交通領域研究的熱點。為了進一步提高短時交通流預測的精度,提出一種基于時空特征分析的短時交通流預測模型。在分析路段時空相關性的基礎上,利用云模型改進的遺傳算法對支持向量機的參數進行優化,得到最優的支持向量機模型,并實現短時交通流預測。以長春市局部路網的實測數據為基礎,驗證了所提出模型的有效性和可行性。
交通運輸工程;交通量預測;時空特征分析;云模型;遺傳算法;支持向量機
交通流預測在智能交通研究領域一直占據著舉足輕重的地位,通過國內外研究學者的不斷努力,形成了多種方法,如Kalman濾波法[1]、時間序列法[2]、神經網絡法[3]、支持向量機[4]等。由于基于單一模型的預測方法都存在缺陷,國內外學者研究了很多基于組合理論的預測方法,如灰色神經網絡預測方法[5]、基于小波包和最小二乘支持向量機的預測方法[6]、基于蟻群優化支持向量機的預測方法[7]等。
這些短時交通流預測方法在很大程度上都能得到滿意的預測結果,但是普遍沒有考慮路段時空相關性,預測因子考慮不全面,預測精度還有待于提高。為了進一步提高短時交通流預測的精確度,筆者一方面優化預測因子,充分考慮路段時空相關性,另一方面優化預測模型,通過云模型改進的遺傳算法優化支持向量機模型,提出一種基于時空特征分析的短時交通流預測模型。以長春市局部路網的實測數據為基礎,通過實例驗證了所提出模型的有效性和可行性。
1.1 相似性分析
圖1是同一日不同檢測器的交通流量變化曲線,共28個檢測器,隨機選出4個檢測器采集到的數據進行統計分析。從圖1可以看出:在這些檢測器中,部分交通流量變化曲線存在一定的相似性,這是路段截面相關性分析的基礎。
圖1 同一日不同檢測器交通流量變化曲線Fig.1 Traffic flow change curve of different detectors on the same day
1.2 相關性分析
為了進一步了解各路段截面之間的相關程度,選擇相關系數為相似系數,以相似系數作為聚類標準,采用系統聚類方法對路段截面數據進行分析。系統聚類分析法的具體步驟是:①數據的標準化處理;②確定相似系數;③計算類間距并進行聚類;④繪制系統聚類譜系圖。
相關系數是描述變量間線性關系密切程度的數量指標。設路段截面交通流量統計數據矩陣為
(1)
式中:m為截面數;n為時間點數。
相關系數計算步驟如下:
1)對原始數據標準化變換
(2)
2)計算相關系數矩陣
R=QQ′
(3)
式中:R為相關系數矩陣;Q為標準化后的交通流量矩陣;Q′為Q的轉置矩陣。
交通流預測是一種非線性回歸問題,支持向量機(support vector machine,SVM)在解決這類問題上具有優勢[8-9],因此選擇SVM模型作為基礎預測模型,其基本原理如下。
存在訓練集:
式中:xi∈Rn為預測因子,即前幾個時段的時空序列;yi∈R為預測值;i=1,…,l為訓練集包含的訓練樣本數。
(4)
(5)
(6)
對上述問題進一步變換,將式(4)改寫為
(7)
在支持向量機的參數中,對模型的預測結果影響較大的是懲罰參數C、不敏感損失參數ε和核函數參數σ。同時考慮遺傳算法存在一定的缺陷,如收斂速度慢,陷入局部最優,因此,采用基于云模型的遺傳算法對支持向量機參數進行優化。
3.1 云模型
3.1.1 云的數字特征
圖2 云模型及其數字特征Fig.2 Cloud model and its numerical characteristics
3.1.2 云發生器
云發生器有兩種,一種是由定性到定量的過程,稱為正向云發生器;另一種是由定量到定性的過程,稱為逆向云發生器。如圖3。
圖3 云發生器Fig.3 Cloud generator
3.2 基于云模型的遺傳優化支持向量機
基于云模型的遺傳算法優化支持向量機參數的具體步驟如下[12],如圖4。
圖4 遺傳優化支持向量機參數的流程Fig.4 Process of SVM parameters optimized by GA
1)初始化,隨機產生一組支持向量機參數,并對其進行編碼。
2)初始化種群,對種群規模、最大迭代次數等參數進行設定。
3)適應度評價。
4)以最大迭代次數為優化準則,如果滿足條件則輸出結果,即支持向量機的最優參數,從而得到訓練好的支持向量機;如果不滿足條件,則進行步驟5)。
5)執行選擇、交叉和變異操作,生成新種群,再從步驟1)開始新一代遺傳。
3.2.1 染色體編碼與解碼
3.2.2 適應度函數
適應度函數可以指導下一代的遺傳和進化,是自然選擇的唯一標準。通過合適地選擇適應度函數能夠提升算法的效率和解的質量。因為要實現SVM的參數優化,就要找到最優的模型,所以選擇均方根誤差函數為適應度函數。
3.2.3 個體選擇
通過個體選擇可以使適應度較高的個體遺傳下來,并在代與代之間不斷進化。筆者通過輪盤賭法進行個體選擇,則個體被選擇的概率為
(8)
3.2.4 交叉與變異
交叉的目的是保留父本的優秀基因,構成一個全新的個體。變異是為了保持種群的多樣性,避免陷入局部最優。自適應遺傳算法的交叉率和變異率函數絕對地保留了優秀個體,缺乏隨機性,因此筆者采用正向云發生器對自適應交叉率和變異率函數進行改進,得到式(9)和式(10)。
(9)
(10)
實現基于時空分析和云遺傳優化支持向量機的交通流預測需要3個步驟:①訓練樣本的準備;②利用基于云模型的遺傳算法對支持向量機模型進行訓練;③利用訓練好的支持向量機模型進行短時交通流預測。
4.1 訓練樣本的準備
訓練樣本的準備包括兩個步驟:
1)路網數據的時空分析,得到具有時空特征的樣本數據。
2)對樣本數據進行歸一化處理,將數據歸一到區間[-1,1],公式如下:
(11)
式中:x為原始數據;y為映射后數據。
4.2 云遺傳支持向量機的短時交通流預測
利用云遺傳支持向量機進行短時交通流預測的流程如圖5。
圖5 云遺傳支持向量機的交通流預測流程Fig.5 Process of traffic flow forecasting based on CGA-SVM
4.3 評價指標選取
為了評價所提出模型的有效性,選擇相對誤差XRE、平均相對誤差XMRE、最大相對誤差XMAXRE、均方根誤差XRMSE為評價指標。相關表達式如下:
實驗對象為長春市局部路網,如圖6,取其中的12個路段斷面進行分析。實驗數據為2013年8月12—16日06:30—18:30的流量數據,每5 min采集一次,12個截面共產生720組數據,以前4天的576組數據作為訓練樣本,16日的144組數據為預測樣本。在MATLAB7.0.1環境下設計云模型等相關程序,運用GA工具箱和LibSVM工具箱對支持向量機的參數進行優化。為了驗證所提出的基于時空分析和云遺傳支持向量機(時空CGA-SVM)預測模型的有效性,在實驗過程中與云遺傳支持向量機模型(CGA-SVM)和遺傳支持向量機模型(GA-SVM)進行了對比和分析。
圖6 長春市局部路網Fig.6 Local road network diagram of Changchun
首先進行路段時空特征的聚類分析,得到的聚類譜系圖如圖7。
圖7 聚類譜系Fig.7 Hierarchical graph
由此可見,截面2,6,7,截面1,3,4,8,截面9,10,11,12均為相關性較強的一組。以截面4為例,對其進行短時交通流預測,實驗分為兩種情況:①對于GA-SVM模型和CGA-SVM模型,以截面4的歷史流量作為輸入變量;②對于基于時空分析的CGA-SVM模型,以截面1,3,4,8的歷史流量作為輸入變量。
在利用3種模型進行交通流預測之前,首先要對SVM參數進行優化。設置GA和CGA的種群規模、最大迭代次數均為m=30、Gmax=100,通過優化,得到最優的SVM參數結果如表1。
表1 支持向量機的參數優化結果
通過GA-SVM,CGA-SVM和基于時空CGA得到的預測結果和預測結果的相對誤差如圖8,3種方法的評價指標值如表2。
圖8 預測結果和相對誤差Fig.8 Prediction results and relative error
模型XMREXMAXREXRMSEGA-SVM0.12030.18182.1414CGA-SVM0.10040.16891.5284時空CGA-SVM0.74490.12820.8453
由圖8可以看出,基于時空CGA模型的預測結果和實際值擬合的效果最好,同時,即使是流量變化較大的情況下,其預測結果的相對誤差也能保持基本穩定。由表2可以看出,基于時空CGA模型的XMRE,XMAXRE,XRMSE是最小的,因此所提出方法的預測精度最高。
提出了一種基于時空特征分析的短時交通流預測模型,充分考慮了交通流數據的時空特征,同時結合云模型和遺傳算法的優點,優化了支持向量機參數,得到了最優的交通流預測模型。與遺傳支持向量機模型和云遺傳支持向量機模型相比,所提出的預測模型提高了短時交通流預測的精度。實驗表明基于時空分析和云遺傳支持向量機的短時交通流預測方法具有有效性和可行性,同時,該短時交通流預測方法比較簡單,易于實現,可以進行工程應用。
[1] 朱征宇,劉琳,崔明.一種結合SVM與卡爾曼濾波的短時交通流預測模型[J].計算機科學,2013,40(10):248-278. ZHU Zhengyu, LIU Lin, CUI Ming. Short-term traffic flow forecasting model combining SVM and Kalman filtering [J].ComputerScience, 2013, 40(10): 248-278.
[2] 張曉利,賀國光,陸化普.基于K-鄰域非參數回歸短時交通流預測方法[J].計算機應用與軟件,2009,24(2):178-182. ZHANG Xiaoli, HE Guoguang, LU Huapu. Short-term traffic flow forecasting based on K-nearest neighbors non-parametric regession[J].JournalofSystemsEngineering, 2009, 24 (2): 178-182.
[3] 唐志強,王正武,招曉菊,等. 基于神經網絡和混沌理論的短時交通流預測[J].山西科技,2005(5):117-120. TANG Zhiqiang, WANG Zhengwu,ZHAO Xiaoju, et al. Short-time traffic prediction based on neural network and chaos theory[J].ShanxiScienceandTechnology, 2005(5): 117-120.
[4] 楊兆升,王媛,管青. 基于支持向量機方法的短時交通流量預測方法[J].吉林大學學報(工學版),2006,36(6):881-884. YANG Zhaosheng, WANG Yuan, GUAN Qing. Short-term traffic flow prediction method based on SVM[J].JournalofJilinUniversity(EngineeringandTechnologyEdition), 2006, 36(6): 881-884.
[5] 陳淑燕,王煒. 交通量的灰色神經網絡預測方法[J]. 東南大學學報(自然科學版),2004,34(7):541-544. CHEN Shuyan, WANG Wei. Grey neural network forecasting for traffic flow[J].JournalofSoutheastUniversity(NaturalScienceEdition), 2004,34( 7): 541-544.
[6] 姚智勝,邵春福,熊志華.基于小波包和最小二乘支持向量機的短時交通流組合預測方法研究[J]. 中國管理科學,2007,15(1):64-68. YAO Zhisheng, SHAO Chunfu, XIONG Zhihua. Research on short-term traffic flow combined forecasting based on wavelet package and least square support vector machines[J].ChineseJournalofManagementScience,2007,15(1):64-68.
[7] 劉艷忠,邵小建,李旭宏. 基于Lagrange支持向量回歸機的短時交通流量預測模型的研究[J].交通與計算機,2007,25(5):46-49. LIU Yanzhong, SHAO Xiaojian, LI Xuhong. Short-term traffic flow prediction model based on lagrange support vector regression[J].TrafficandComputer, 2007, 25(5): 46- 49.
[8] 徐鵬,姜鳳茹. 基于蟻群優化支持向量機的短時交通流量預測[J].計算機應用與軟件,2013,30(3):250-254. XU Peng,JIANG Fengru. Short-term traffic flow prediction based on SVM optimized by ACO[J].ComputerApplicationsandSoftware, 2013, 30(3): 250-254.
[9] YAN Hongsen , XU Duo. An approach to estimating product design time based on fuzzy v-support vector machine[J].IEEETransactionsonNeuralNetworks, 2007, 18(3): 721-731.
[10] 李德毅,劉常昱.論正態云模型的普適性[J].中國工程科學,2004,6(8):28-34. LI Deyi, LIU Changyu. Study on the universality of normal cloud model [J].EngineeringScience, 2004,6(8): 28-34.
[11] 楊朝暉,李德毅.二維云模型及其在預測中的應用[J].計算機學報,1998,21(11):961-969. YANG Zhaohui, LI Deyi. Planar model and ITS application in prediction[J].ChineseJournalofComputers,1998,21(11): 961-969.
[12] MIN Sunghwan, LEE Jumin, HAN Ingoo. Hybrid genetic algorithms and support vector machines for bankruptcy prediction[J].ExpertSystemswithApplications,2006,31(3):652-660.
[13] SRINIVAS M, PATNAIK L M. Adaptive probabilities of crossover and mutation in genetic algorithms[J].IEEETransonSystems,ManandCybernetics, 1994, 24(4): 656- 667.
A Short-Term Traffic Flow Prediction Model Based on Spatio-Temporal Characteristics Analysis
TIAN Baohui, GUO Bin
(Department of Traffic Information Engineering, Henan Communication Vocational Technology College, Zhengzhou 450000, Henan, P.R.China)
The real-time and accuracy of traffic flow prediction directly affect the efficiency of traffic flow guidance system, which is a hot issue of intelligent transportation system research. In order to improve the accuracy of short-term traffic flow forecasting further, a short-term traffic flow prediction model based on spatio-temporal characteristics analysis was proposed. On the basis of spatio-temporal correlativity analysis of section, the parameters of support vector machine (SVM) were optimized by using the genetic algorithm improved by cloud model. At last, the optimal SVM model was obtained, and it realized the short-term traffic flow prediction. Based on the measured data of local road network in Changchun city, the feasibility and effectiveness of the proposed model were verified.
traffic and transportation engineering; traffic flow forecasting; spatio-temporal characteristics analysis; cloud model; genetic algorithm; support vector machine
10.3969/j.issn.1674-0696.2016.03.22
2014-12-16;
2015-03-09
河南省交通運輸廳科技計劃項目(2014G21)
田保慧(1975—),女,河南鄭州人,副教授,主要從事交通信息化方面的研究。E-mail:18341615@qq.com。
U491.1
A
1674-0696(2016)03-105-05