邴其春,龔勃文,林賜云,楊兆升,曲鑫
?
基于粒子群優化投影尋蹤回歸模型的短時交通流預測
邴其春1, 2,龔勃文1,林賜云1,楊兆升1,曲鑫1
(1. 吉林大學交通學院,吉林長春,130022;2. 青島理工大學汽車與交通學院,山東青島,266520)
針對短時交通流數據的高度復雜性、隨機性和非穩定性,為了進一步提高短時交通流預測的精度,提出一種基于粒子群優化投影尋蹤回歸模型的短時交通流預測方法。通過灰色關聯度分析確定交通流預測影響因子,然后采用粒子群優化算法構建非參數投影尋蹤回歸模型,并利用上海市南北高架快速路的感應線圈實測數據進行實驗驗證和對比分析。實驗結果表明:PSO-PPR模型的短時交通流預測效果明顯提高,其平均預測精度分別比ARIMA模型和BPNN模型提高37.8%和27.2%。
智能交通系統;短時交通流預測;投影尋蹤回歸模型;粒子群優化;灰色關聯度分析
準確、可靠的交通流預測信息是智能交通系統(intelligent transportation systems,ITS)的基礎和關鍵,其預測精度直接影響著自適應交通控制系統以及動態交通誘導系統等多項ITS核心功能的應用效果。由于交通流預測信息的重要性,短時交通流預測一直是智能交通領域的研究熱點,并已研究多種預測方法與模型。VOORT等[1]將ARIMA模型應用于短時交通流預測領域;WILLIAMS等[2]考慮交通流的周期性,全面而系統地闡述了季節性ARIMA模型在短時交通流預測中的應用;聶佩林等[3]為了克服單一預測模型性能不穩定的問題,提出了基于約束卡爾曼濾波的短時交通流量組合預測模型;于濱等[4]分析了K近鄰算法的時間和空間參數,提出了4種狀態向量組合的K近鄰模型;DAVIS等[5]應用非參數回歸模型進行短時交通流預測。此外,隨著人工智能技術的發展,神經網絡模型[6?8]、支持向量機模型[9?10]等被廣泛應用于短時交通流預測領域。然而,由于短時交通流數據的高度復雜性、隨機性和非穩定性,目前的預測方法普遍存在實時性差、尋優速度慢、維數禍根以及模型假設條件過多等不足,嚴重影響著短時交通流預測的實際應用效果。針對現有預測方法存在的問題,本文作者提出基于粒子群優化投影尋蹤回歸模型的短時交通流預測方法。首先通過灰色關聯度分析確定預測影響因子,然后利用粒子群優化算法構建投影尋蹤回歸交通流預測模型,并采用上海市南北高架快速路的感應線圈實測數據進行實驗驗證,對模型的有效性進行測試。
投影尋蹤回歸(project pursuit regression,PPR)模型是將投影尋蹤技術和時間序列的回歸分析結合起來的一種新型的統計方法,最初是由FRIEDMAN等[11]針對多元回歸分析中的維數禍根問題提出來的。其基本思想是將高維數據通過某種組合,投影到低維(1~3維)子空間上,尋找出能反映高維數據結構或特征的投影,在低維空間對數據結構進行分析,達到研究和分析高維數據的目的[12]。投影尋蹤回歸模型的原理 如下。
設為維隨機變量,()是一維隨機變量,投影尋蹤回歸模型就是用若干個嶺函數加權和的形式來逼近回歸函數(),其數學表達式為
其中:G(Z)為第個嶺函數;Z=?=α11+α22+…+αx,為嶺函數的自變量,表示維向量在投影方向α上的投影;α為第個投影方向,且滿足;為嶺函數的個數;β為第個嶺函數對()貢獻的權重系數。
投影尋蹤回歸模型的實現是對參數的步步尋優,關鍵是選取投影方向α、權重系數β和嶺函數G(Z)的最優組合,使模型滿足最小二乘極小化準則:
傳統的PPR模型實現方法的實質是采用分層分組迭代交替的方法進行優化。然而,該優化過程計算復雜、編程實現難度較大,嚴重影響著PPR模型的推廣應用。以往的研究大多采用遺傳算法[13]對PPR模型的參數進行優化,但遺傳算法存在對初始種群的選擇有一定依賴性、收斂速度慢且未必得到最優解等問題。為此,本文采用收斂速度快、參數設置少的粒子群優化算法對PPR模型的參數進行優化。
粒子群優化(particle swarm optimization,PSO)算法是由KENNEDY等[14?15]提出來的一種進化計算技術,源于對鳥群捕食行為的研究。設在維搜索空間中,存在個粒子構成的粒子群體,PSO優化算法采用速度?位置搜索模型,第個粒子的空間位置x=(x1,x2,…,x),=1,2,…,表示解空間的1個可行解,將其代入優化目標函數計算相應的適應度函數值來衡量x。第個粒子的速度v=(v1,v2,…,v)決定粒子在搜索空間單位迭代次數的位移。粒子通過動態跟蹤個體最佳位置P=(p1,p2,…,p)和全局最佳位置P=(p1,p2,…,p)來更新自身的速度和位置,更新公式如下:
式中:為慣性權重系數;1和2為在[0,1]之間變化的隨機數;1和2為加速因子。
投影尋蹤回歸模型是分析和處理非線性、非正態高維數據的一種有效的統計方法[16],鑒于傳統優化方法的局限性,本文采用粒子群算法優化投影尋蹤回歸模型進行短時交通流預測。基于PSO-PPR的交通流預測建模步驟如下。
Step 1 確定預測影響因子。綜合考慮短時交通流數據的時空相關性,利用灰色關聯度分析方法確定預測影響因子x(=1,2,…,;=1,2,…,),和分別表示樣本個數和預測影響因子個數。為消除不同量綱的影響,將x進行歸一化處理:
其中,maxx和minx分別表示第個影響因子的最大值和最小值。
Step 2 線性投影。設投影方向為(=1,2,…,),則可得到一維投影值z:
Step 3 構造投影指標函數。在綜合投影時,要求投影值z應盡可能大地提取x中的變異信息,即要求z的標準差S盡可能大,同時要求z與預測目標值y的相關系數絕對值|R|盡可能大,這樣得到的投影值就可以盡可能多地攜帶預測影響因子x的變異信息,并且能夠保證投影值對預測目標y具有較好的解釋性[17]。因此,投影指標函數可構造為
其中:|?|表示取絕對值;S為投影值z的標準差;R為z與y的相關系數。
Step 4 優化投影指標函數。當預測目標和預測影響因子的樣本數據確定時,投影指標函數()只隨投影方向的變化而變化。不同的投影方向反映不同的數據結構特征,最佳投影方向就是最大可能地暴露高維數據某類特征結構的投影方向。可通過求解投影指標函數最大化問題來估計最佳投影方向,即
這是以(=1,2,…,)為變量的復雜優化問題,常規方法處理較困難。本文采用粒子群優化算法進行優化,具體步驟如下。
1) 初始化粒子群優化算法的參數。包括粒子個數、粒子維數、迭代次數、加速因子、慣性權重系數等。
2) 以投影指標函數作為適應度函數計算每個粒子的適應度,并將其與自身的歷史最佳位置適應度進行比較,若當前位置的適應度優于歷史適應度,則將當前位置取代個體歷史最佳位置。
3) 判斷粒子群的全局最佳位置。將各個粒子的個體最佳位置適應度與群體的全局最佳位置適應度相比較,若高于群體的全局適應度,則將其位置取代全局最佳位置。
4) 判斷終止條件。若不滿足終止條件,則按式(3)和式(4)更新粒子的速度和位置,否則輸出得到的最優解。
Step 5 短時交通流預測。將通過粒子群優化獲得的最佳投影方向帶入式(6)得到訓練樣本數據的投影值,根據預測目標值及其相應訓練樣本的投影值建立非參數投影尋蹤回歸預測模型。將測試樣本進行歸一化處理并計算其相應的投影值,利用得到的預測模型進行短時交通流預測。
4.1 數據來源
實驗數據來源于上海市南北高架長約10 km快速路上感應線圈檢測器采集到的交通流數據。該路段設置有24個主線檢測截面和30個匝道檢測截面,分別安裝有88個主線檢測器和60個匝道檢測器。實驗數據為2008?09—2008?10間連續5個周一的24 h感應線圈數據,原始數據采樣間隔為20 s。由于20 s采樣間隔的交通流數據波動性較大,較少應用于短時交通流預測,本文分別將其合成為1,2和5 min數據進行預測分析。
4.2 預測影響因子確定
預測影響因子與預測目標之間存在確切的相關關系是保證交通流預測精度的前提。因此,本文綜合考慮短時交通流數據的時空相關性,選取與預測交通流數據相鄰的時間和空間數據作為候選影響因子,并利用灰色關聯度分析確定最終的預測影響因子。以東側主線NBDX16(2)感應線圈檢測器2008?09?22采集到的5 min數據作為預測目標數據進行分析,其中NBDX表示南北高架東側主線,16表示檢測截面編號,②表示檢測車道編號。灰色關聯度分析結果如表1所示。
由表1可見:候選影響因子與預測目標的關聯度均在0.9以上,說明候選影響因子與預測目標之間存在較強的相關性,能夠有效保證交通流預測的精度。因此,本文選取上述8個候選影響因子作為交通流預測影響因子。

表1 預測影響因子灰色關聯度分析
4.3 實驗結果分析
為了評估本文方法在短時交通流預測上的實際應用效果,將東側主線NBDX16②感應線圈檢測器采集到的原始數據分別合成為1,2和5 min數據進行預測分析。選取2008?09?01采集的交通流數據作為擬合樣本構建預測模型,將2008?09?08的交通流數據作為測試樣本對模型的預測性能進行評估,共計1 440個1 min交通流數據,720個2 min交通流數據和288個5 min交通流數據。其中,粒子群優化算法的具體參數設置如下:粒子數為100個,粒子維數為8,加速因子1=2=2,慣性權重系數從0.9隨迭代次數線性減小至0.4,最大迭代數為100次。通過粒子群優化得到的投影方向=(1,2,3,4,5,6,7,8)如表2所示。
為直觀展現本文方法的短時交通流預測效果,圖1~3所示分別為1,2和5 min交通流數據的預測結果。
由圖1~3可見,本文方法得到的預測值與實際值之間擬合效果較好,說明本文方法對3種不同時間尺度的交通流數據均具有較好的預測效果。對比3種不同時間尺度交通流數據的預測效果可見:5 min交通流數據的預測效果最好,2 min交通流數據的預測效果次之;由于1 min交通流數據的波動性較大,少數樣本的預測值與實際值之間誤差略大,但總體能夠滿足短時交通流預測的需求。
為了對比分析本文方法在短時交通流預測上的優越性,選取具有成熟理論和較好預測效果的自回歸移動平均模型(autoregressive integrated moving average model,ARIMA)和BP神經網絡模型(back propagation neural network model,BPNN)作為對比方法,并采用平均絕對百分誤差和均等系數2個指標進行評價。

1—實際值;2—預測值。
圖1 1 min交通流數據預測結果
Fig. 1 Prediction results of 1 min traffic flow data

1—實際值;2—預測值。
圖2 2 min交通流數據預測結果
Fig. 2 Prediction results of 2 min traffic flow data

1—實際值;2—預測值。
圖3 5 min交通流數據預測結果
Fig. 3 Prediction results of 5 min traffic flow data

表2 投影方向結果

表3 3種模型的預測效果對比
其中:MAPE為平均絕對百分誤差;E為均等系數;y表示時刻的實際值,表示時刻的預測值,為樣本數。均等系數表示預測值與實際值之間演化趨勢的相似度,均等系數越大,說明預測值與實際值之間擬合度越高。
表3所示為3種方法對不同時間尺度交通流數據的預測結果對比。由表3可以看出:不同預測模型的預測效果存在明顯的差異,本文所構建的PSO-PPR模型對于3種不同時間尺度交通流數據的預測效果均優于對比方法。在平均絕對百分誤差方面,其平均預測精度較ARIMA模型提高了37.8%,較BPNN模型提高了27.2%;在均等系數方面,本文方法的擬合效果同樣優于另外2種對比方法。對于同一預測模型的不同時間尺度交通流數據,時間尺度越大,預測效果越好,這是因為隨著時間尺度的增大,交通流數據的波動性減小,數據趨于平緩,預測模型能夠更好地跟蹤交通流數據的發展趨勢。
1) 綜合考慮短時交通流數據的時空相關性,利用灰色關聯度分析方法確定了交通流預測影響因子,極大地保證了模型輸入數據的有效性。
2) 構建了適應于短時交通流預測的投影尋蹤回歸模型,并利用粒子群優化算法優化投影指標函數。
3) 以上海市南北高架快速路某路段為實驗對象,分別將實測交通流數據合成為1,2和5 min數據進行實驗驗證和對比分析,驗證了本文方法的有效性和優越性。
[1] VOORT M, DOUGHERTY M, WATSON S. Combining kohonen maps with ARIMA time series models to forecast traffic flow[J]. Transportation Research Part C: Emerging Technologies, 1996, 4(5): 307?318.
[2] WILLIAMS B M, HOEL L A. Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process: theoretical basis and empirical results[J]. Journal of Transportation Engineering, 2003, 129(6): 664?672.
[3] 聶佩林, 余志, 何兆成. 基于約束卡爾曼濾波的短時交通流量組合預測模型[J]. 交通運輸工程學報, 2008, 8(5): 86?90. NIE Peilin, YU Zhi, HE Zhaocheng. Constrained Kalman filter combined predictor for short-term traffic flow[J]. Journal of Traffic and Transportation Engineering, 2008, 8(5): 86?90.
[4] 于濱, 鄔珊華, 王明華, 等. K近鄰短時交通流預測模型[J]. 交通運輸工程學報, 2012, 12(2): 105?110. YU Bin, WU Shanhua, WANG Minghua, et al. K-nearest neighbor model of short-term traffic flow forecast[J]. Journal of Traffic and Transportation Engineering, 2012, 12(2): 105?110.
[5] DAVIS G A, NIHAN N L. Nonparametric regression and short term freeway traffic forecasting[J]. Journal of Transportation Engineering, 1991, 117(2): 178?188.
[6] 龔勃文, 林賜云, 李靜, 等. 基于核自組織映射-前饋神經網絡的交通流短時預測[J]. 吉林大學學報(工學版), 2011, 41(4): 938?943. GONG Bowen, LIN Ciyun, LI Jing. Short-term traffic flow prediction based on KSOM-BP neural network[J]. Journal of Jilin University (Engineering and Technology Edition), 2011, 41(4): 938?943.
[7] 呂進, 趙祥模, 樊海瑋, 等. 基于生長自組織神經網絡群的交通流預測[J]. 交通運輸系統工程與信息, 2013, 13(3): 33?39. Lü Jin, ZHAO Xiangmo, FAN Haiwei, et al. Traffic flow forecasting based on growing self-organized neural network group[J]. Journal of Transportation Systems Engineering and Information Technology, 2013, 13(3): 33?39.
[8] VLAHOGIANNI E I, KARLAFTIS M G, GOLIAS J C. Spatio-temporal short-term urban traffic volume forecasting using genetically optimized modular networks[J]. Computer-Aided Civil and Infrastructure Engineering, 2007, 22(5): 317?325.
[9] 傅貴, 韓國強, 逯峰, 等. 基于支持向量機回歸的短時交通流預測模型[J]. 華南理工大學學報(自然科學版), 2013, 41(9): 71?76. FU Gui, HAN Guoqiang, LU Feng. Short-term traffic flow forecasting model based on support vector machine regression[J]. Journal of South China University of Technology (Natural Science Edition), 2013, 41(9): 71?76.
[10] WANG J, SHI Q X. Short-term traffic speed forecasting hybrid model based on chaos-wavelet analysis-support vector machine theory[J]. Transportation Research Part C: Emerging Technology, 2013, 27: 219?232.
[11] FRIEDMAN J H, STUETZLE W. Projection pursuit regression[J]. Journal of the American Statistical Association, 1981, 76: 817?823.
[12] 李祚泳, 汪嘉楊, 金相燦, 等. 基于優化算法的湖泊富營養化投影尋蹤回歸預測模型[J]. 四川大學學報(工程科學版), 2007, 39(2): 1?8. LI Zuoyong, WANG Jiayang, JIN Xiangcan, et al. Evolution algorithm based forecasting model for lake eutrophication using PPR[J]. Journal of Sichuan University (Engineering Science Edition), 2007, 39(2): 1?8.
[13] 李世玲. 基于投影尋蹤和遺傳算法的一種非線性系統建模方法[J]. 系統工程理論與實踐, 2005(4): 22?28. LI Shiling. A nonlinear system modeling method based on projection pursuit and genetic algorithm[J]. System Engineering theory and Practice, 2005(4): 22?28.
[14] KENNEDY J, EBERHART R C. Particle swarm optimization[C]//Proceedings of the 4th IEEE International Conference on Neural Network, Piscataway: IEEE Service Center, 1995: 1942?1948.
[15] EBERHART R C, KENNEDY J. A new optimizer using particle swarm theory[C]//Proceedings of the 6th International Symposium on Micro Machine and Human Science. Piscataway: IEEE Service Center, 1995: 39?43.
[16] 徐飛, 徐衛亞. 巖爆預測的粒子群優化投影尋蹤模型[J]. 巖土工程學報, 2010, 32(5): 718?723. XU Fei, XU Weiya. Projection pursuit model based on particle swarm optimization for rock burst prediction[J]. Chinese Journal of Geotechnical Engineering, 2010, 32(5): 718?723.
[17] 付強, 趙小勇. 投影尋蹤模型原理及其應用[M]. 北京: 科學出版社, 2006: 144?145. FU Qiang, ZHAO Xiaoyong. Principle and application of projection pursuit[M]. Beijing: Science Press, 2006: 144?145.
(編輯 趙俊)
Short–term traffic flow prediction method based on particle swarm optimization projection pursuit regression model
BING Qichun1, 2, GONG Bowen1, LIN Ciyun1, YANG Zhaosheng1, QU Xin1
(1. College of Transportation, Jilin University, Changchun 130022, China;2. College of Automobile and Transportation, Qingdao Technological University, Qingdao 266520, China)
Considering the highly complexity, randomness and non-stability characteristics of short-time traffic flow data, a short–term traffic flow prediction method based on particle swarm optimization projection pursuit regression model was put forward. Traffic flow forecasting impact factors were determined by grey relational analysis. Then the projection pursuit nonparametric regression traffic flow forecasting model was constructed using particle swarm optimization algorithm. Finally, validation and comparative analyses were carried out using inductive loop data measured from the north-south viaduct in Shanghai. The results indicate that the proposed PSO-PPR model achieves better prediction performance than comparison methods. The average prediction accuracy of proposed method is 37.8% and 27.2% higher than ARIMA model and BPNN model, respectively.
intelligent transportation systems; short-term traffic flow prediction; projection pursuit regression model; particle swarm optimization; grey relational analysis
10.11817/j.issn.1672-7207.2016.12.041
U491
A
1672?7207(2016)12?4277?06
2015?11?05;
2016?02?03
國家高技術研究發展計劃項目(2012AA112307);國家科技支撐計劃項目(2014BAG03B03);國家自然科學基金資助項目(51308248, 51408257);吉林省科技發展計劃青年科研基金資助項目(20140520134JH)(Project(2012AA112307) supported by the National High Technology Research and Development Program of China; Project(2014BAG03B03) supported by the National Science and Technology Pillar Program; Projects(51308248, 51408257) supported by the National Natural Science Foundation of China; Project(20140520134JH) supported by Jilin Province Science and Technology Development Plan of Youth Research Fund)
龔勃文,博士,講師,從事智能交通系統研究;E-mail:gongbowen@jlu.edu.cn