999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于K-means聚類與PLS回歸模型的交通速度短時預測

2023-06-23 04:37:36賈秀燕孫秋霞李勍
青島大學學報(自然科學版) 2023年1期

賈秀燕 孫秋霞 李勍

摘要:為實現對交通流局部特征的有效提取,提高交通速度預測模型的可解釋性,提出基于K-means聚類與偏最小二乘(Partial Least Squares,PLS)回歸的交通速度短時預測模型。模型采用時空相關矩陣挖掘路網中相鄰路段交通速度之間的關聯性,利用K-means聚類算法劃分歷史數據集,并選取實測出租車GPS數據驗證模型對交通速度短時預測的準確性。實驗結果表明,與ARIMA、PLS回歸和LSTM模型相比,該模型的預測誤差減少了約30%。

關鍵詞:城市交通;速度短時預測;K-means聚類;偏最小二乘回歸;時空相關矩陣

中圖分類號:U121 文獻標志碼:A

隨著中國機動化進程不斷加快,高峰出行困難成為大中城市所普遍面臨的難題。作為智能交通運輸系統的一項重要功能,交通控制與誘導調控策略的制定主要依賴于交通速度預測的結果。交通速度預測按照預測時間窗的長度通常劃分為長時預測和短時預測,長時預測的時間步長通常以日、月或年計算,短時預測更傾向于對交通狀態的微觀描述,觀測時間通常小于15min[1-2]。預測短時交通速度,實時評價交通狀況,能夠起到疏導交通擁堵、減少環境污染和駕乘人員等待時間、提高交通參與者的安全、為駕駛人提供有效出行信息服務的作用。國內外學者利用各學科領域內的知識開發了各種用于短時交通速度預測的方法,這些方法大致分為兩大類:經典方法和基于深度學習的方法。經典預測方法包括統計方法和傳統的機器學習方法[3]。統計方法假設未來數據與歷史數據具有相似性,通過建立數據驅動的統計模型對交通速度分析預測,而交通速度數據具有復雜的非線性特征,往往不滿足統計方法的假設,且這些方法多適用于小數據集[4-5]。傳統的機器學習模型整體的非線性有限,預測效果并不是最佳的[6-8]。深度學習的出現使人工智能在交通速度預測的潛能得到進一步開發[9-14]。在數據集有限的應用情景下,深度學習模型難以有效的挖掘數據的規律,同時具有計算復雜度高、可解釋性差的缺點。為了實現交通流量、交通速度、行程時間的短時預測,將多個模型組合以提升模型預測性能[15-17]。模型的組合方式、權重參數的確定以及訓練數據集的平衡問題是組合模型研究中的難點[18-19]。為了克服傳統模型無法有效提取交通速度數據非線性特征這一缺點,本文聚焦路網交通速度之間關聯性的挖掘,建立時空相關矩陣,利用K-means聚類算法把相似狀態的交通速度聚類進行建模分析,放大數據的局部特征,更準確地把握交通速度的變化趨勢。綜合考慮模型的預測精度與計算時間復雜度,使模型具有更高的解釋性,選擇偏最小二乘回歸模型作為最終的預測模型。

1 研究方法

1.1 路網時空相關性的挖掘

為分析相關路段交通流對目標路段交通流的影響程度,估計交通流之間的相關性,而不是直接對交通流本身進行聚類。若城市道路網絡中某一區域內含有P節路段,且每一路段上都裝有環路檢測器(傳感器)以采集實時的交通速度數據,可以得到P條路段的歷史交通速度數據所組成的時間序列數據V=(V1,V2,…,VP),

2 實證分析

2.1 研究區域概況

為驗證提出模型的有效性,選取青島市西海岸新區長江中路作為主要的研究區域。青島市西海岸新區長江路是一條東西走向的主干道,沿線串聯了新區的行政、商務、教育、餐飲、居住功能區,路口較多,交通流密集,尤其是上下班的早晚高峰時段,人車交織,導致通車效率不高、交通事故頻發,長江中路路段尤為嚴重。作為新區核心位置的主干道,長江中路的交通服務品質難以滿足日益增長的社會需求,成為新區主要的道路“瓶頸”。

將青島市西海岸新區長江中路作為目標道路,為清晰、直觀地觀察各條路段的地理位置,從OpenStreetMap官網下載路網矢量數據,如圖1所示。研究地點具有典型拓撲結構,展示了交通流之間不同程度的時空相關性,這七條道路雖位于不同的方向,但間接相連,每條道路對應不同的道路名稱,具體對應關系見表1。

2.2 數據預處理

研究數據為青島市西海岸新區長江中路2017年8月7日至2017年8月20日出租車GPS軌跡數據,利用Python軟件對其預處理,獲得有效數據1 752 694條,出租車GPS原始軌跡數據示例見表2。

其中,v(k)為當前路段在時間間隔k內的平均速度,vi,n為第n輛出租車在第i個GPS點處的速度值,i為當前路段內GPS點的編號,I為當前路段內所有GPS點的數量,n是當前路段內出租車的編號,N為當前路段上所有出租車的數量,Nk是時間間隔k內經過當前路段的車輛數。

為了解西海岸新區長江中路交通速度的宏觀特征,基于預處理后的數據,利用Python軟件繪制2017年8月7日至8月20日交通速度熱力圖(圖2),交通速度存在明顯的周期性和日相似特征,即不同天的同一時間段的速度值有著相類似的趨勢規律,而同一天的不同時間段存在著較大的差異。圖2中顏色的深淺代表了交通速度值的大小,顏色越深,速度就越小,代表道路越擁堵,長江中路8月7日至8月20日的交通流速度數據存在明顯的雙峰現象,且出行的早高峰集中于07∶00~08∶30時間段,晚高峰集中17∶00~19∶00時間段。

2.3 構建時空相關矩陣

根據長江中路早晚高峰時段的分布狀況,利用式(2)分別計算長江中路2017年8月19日8∶30的早高峰時空相關矩陣與2017年8月19日19∶00的晚高峰時空相關矩陣,時間延遲d分別設置為18與24個時間間隔,每個時間間隔為5 min,相應的時空相關矩陣熱力圖如圖3所示。

圖中顏色的深淺代表了目標路段R3的交通速度與其他路段交通速度之間相關性的大小,顏色越深代表相關性越強。結果分析發現,早高峰時段,當時間延遲為0時,路段R3與路段R1、路段R4、路段R5以及路段R7的相關系數均為正值,且大于0.5。晚高峰時段,在時間延遲為0時,路段R3與路段R1、路段R2以及路段R4(相關系數的絕對值大于0.5。7條路段在不同時間延遲下相關系數的變化趨勢相似,但在同一時間延遲下路段之間交通速度的相關性強度有較大差異。這說明選擇的路段之間存在較強的相關性,可以通過時空相關矩陣的聚類來捕獲交通流之間的時空相關的異質性。

2.4 K-means聚類結果

為了確定聚類數目m值,采用方差比準則(Calinski-Harabaz Index,CHI)評價聚類效果,CHI基于數據集特性評估聚類效果,值越大代表聚類的效果越好[16]。CHI值隨m值的變化趨勢如圖4所示。可知,m=2時CHI值取得最大值,說明兩種情況均在劃分為兩簇時聚類效果最佳,因此將訓練數據集分為兩簇。

K-means聚類結果見表3。可以看出,早、晚高峰時段的數據雖均被劃分為兩簇,但兩簇之間并不完全相同。如路段R1、R3始終在同一簇中,說明路段R3與路段R1的交通狀態最為相似;而路段R6缺少辦公樓、商場、醫院等因素吸引人車流入,始終在數量少的一簇內。在不同的高峰時段,路段R4與路段R5被劃分到了不同的簇中,這可能與路段所處的地理位置、交通流流向以及周邊的興趣點(Point of Interest,POI)屬性相關。路段R4為城市主干道,西鄰富春江路小學,東鄰青島西海岸新區中心醫院,早高峰時段與相鄰路段的車流來往密切,而路段R5穿過居民區,在晚高峰時段與相鄰路段的車流關系密切,說明同一天不同時間段的交通速度之間存在差異性。

2.5 基于偏最小二乘算法的短時交通速度預測

利用K-means聚類算法得到與目標路段R3在早晚高峰時段最相關的路段,篩選出與目標路段的交通速度具有高相關性的歷史數據集,使用更新后的數據集構建基于偏最小二乘算法的短時交通速度預測模型。由偏最小二乘算法的建模過程可知,只需選取前r個主成分建立回歸方程就可以達到較好的預測精度,r個成分的選擇提取可通過進行交叉有效性檢驗來確認[20]。交叉有效性檢驗結果見表4。

由表4可知,前4個主成分的交叉有效性均大于0.097 5,但第5個主成分交叉有效性小于0.097 5,不滿足交叉有效性提取條件,表明該成分不能明顯改善模型的擬合能力,因此,模型只提取前4個主成分,得到標準化偏最小二乘回歸方程為

其中,y*zao、y*wan分別為長江中路在早高峰時段和晚高峰時段的預測模型。最終預測的效果如圖5所示。

對比圖5(a)與(b),早高峰時段交通速度的預測值更接近于真實值,晚高峰時段的預測值誤差略大,說明該模型對高頻率波動的數據預測精度相對較差,但預測值與真實值的總體變化趨勢是一致的。長江中路交通速度整體較為平緩,早高峰時段集中在15~25 km/h,晚高峰時段集中在10~20 km/h,晚高峰速度值低于早高峰,因為長江中路位于經濟開發區中心,商場較多,晚間時段人口集中,車流密度大。

2.6 模型評價

其中,yi為交通速度的真實值;i為模型預測值;N為測試樣本集的個數。對比結果見表5、表6。

添加“周”周期并采取對歷史數據集先聚類后預測的方法,模型的預測精度有了較明顯的改善。與經典模型相比,本文提出的基于K-means聚類與PLS回歸預測模型的預測精度最佳。這說明通過構建時空相關矩陣并對其進行聚類,篩選出與目標路段相關性最強的路段,更新訓練數據集,可以提高模型的預測精度。相比于LSTM模型,PLS回歸模型具有更高的預測精度,且模型的訓練時間更少。這說明PLS回歸模型不僅能夠以量化的方式給出模型提高精度過程,具有更強的解釋性,且模型的計算復雜度更低。

3 結論

本文的交通速度短時預測模型通過計算時空相關矩陣挖掘路網中相鄰路段之間交通速度的關聯性,利用K-means聚類更新數據集,結合PLS回歸模型預測交通速度。本文模型相比于傳統方法具有更高的預測精度,模型的預測速度和可解釋性也有較大的提升,是一種可行的交通速度短時預測方法。后續研究中,將考慮組合模型的方式,在模型訓練過程中選擇添加其他時段的交通速度數據,以增強模型的適用性。

參考文獻

[1]VLAHOGIANNI E I, KARLAFTIS M G, GOLIAS J C. Short-term traffic forecasting: Where we are and where we′re going[J]. Transportation Research Part C-Emerging Technologies, 2014, 43(1): 3-19.

[2]袁健, 范炳全. 交通流短時預測研究進展[J]. 城市交通, 2012,10(6):73-79.

[3]周輝宇, 李瑞敏, 黃安強, 等. 基于時空關聯規則挖掘的城市交通擁堵傳導預測[J]. 系統工程理論與實踐,2022, 42(8): 2210-2224.

[4]張國赟, 金輝. 基于改進ARIMA模型的城市軌道交通短時客流預測研究[J]. 計算機應用與軟件, 2022, 39(1): 339-344.

[5]LI W, WANG J X, FAN R, et al. Short-term traffic state prediction from latent structures: Accuracy vs. efficiency[J]. Transportation Research Part C-Emerging Technologies, 2020, 111: 72-90.

[6]CHEN R, LIANG C Y, HONG W C, et al. Forecasting holiday daily tourist flow based on seasonal support vector regression with adaptive genetic algorithm[J]. Applied Soft Computing, 2015, 26: 435-443.

[7]LI Y F, JIANG X, ZHU H, et al. Multiple measures-based chaotic time series for traffic flow prediction based on Bayesian theory[J]. Nonlinear Dynamics, 2016, 85(1):179-194.

[8]PRIAMBODO B, AHMAD A, KADIR R A. Spatio-temporal K-NN prediction of traffic state based on statistical features in neighboring roads[J]. Journal of Intelligent and Fuzzy Systems, 2021, 40(5): 9059-9072.

[9]RUMELHART D E, HINTON G E, WILLIAMS R J. Learning representations by back-propagating errors[J]. Nature, 1986, 323: 533-536.

[10]? SUN Z Y, HU Y J, LI W, et al. Prediction model for short-term traffic flow based on a K-means-gated recurrent unit combination[J]. IET Intelligent Transport Systems, 2022, 16(5): 675-690.

[11] KANG C L, ZHANG Z Y. Application of LSTM in short-term traffic flow prediction[C]// 2020 IEEE 5th International Conference on Intelligent Transportation Engineering (ICITE). Beijing, 2020: 98-101.

[12] LI Z Y, GE H X, CHENG R J. Traffic flow prediction based on BILSTM model and data denoising scheme[J]. Chinese Physics B, 2022,31(4):214-223.

[13] BRUNA J, ZAREMBA W, SZLAM A, et al. Spectral networks and locally connected networks on graphs[DB/OL].[2022-08-30]. https://arxiv.org/pdf/1312.6203.pdf.

[14] SHEN G J, HAN X, CHIN K, et al. An attention-based digraph convolution network enabled framework for congestion recognition in three-dimensional road networks[J]. IEEE Transactions on Intelligent Transportation Systems, 2021,23(9): 14413-14426.

[15] CHENG Z Y, WANG W, LU J, et al. Classifying the traffic state of urban expressways: A machine-learning approach[J]. Transportation Research Part A-Policy and Practice, 2020, 137: 411-428.

[16] 王旭鵬, 王夢靈. 基于相似性聚類的交通流概率組合預測模型[J]. 華東理工大學學報(自然科學版), 2022, 48(3): 381-387.

[17] ZHANG Z H, WANG Y P, CHEN P, et al. Probe data-driven travel time forecasting for urban expressways by matching similar spatiotemporal traffic patterns[J]. Transportation Research Part C-Emerging Technologies, 2017, 85: 476-493.

[18] GUO Y N, YANG H, CHEN M Y, et al. Ensemble prediction-based dynamic robust multi-objective optimization methods[J]. Swarm and Evolutionary Computation, 2019, 48: 156-171.

[19] YANG L K, GUO Y N, CHENG J, et al. Manifold distance-based over-sampling technique for class imbalance learning[C]// 33rd AAAI Conference on Artificial Intelligence/31st Innovative Applications of Artificial Intelligence Conference/ 9th AAAI Symposium on Educational Advances in Artificial Intelligence. Hawaii, 2019: 10071-10072.

[20] 王德政, 張益農, 楊帆. 基于MapReduce的并行PLS過程監控算法實現[J]. 計算機工程與應用, 2018, 54(24): 61-65+175.

Short-term Prediction of Traffic Speed Based on K-means Clustering and PLS Regression Model

JIA Xiu-yan, SUN Qiu-xia, LI Qing

(College of Mathematics and Systems Science, Shandong University of Science and Technology, Qingdao 266590, China)

Abstract: To achieve effective extraction of local features of traffic flow and to improve the interpretability of traffic prediction models, a K-means clustering and PLS regression model was proposed to predict short-time traffic speed. The Spatio-temporal correlation matrix was calculated to explore the correlation between the traffic speeds of adjacent road sections in the road network. The K-means clustering algorithm was used to divide the historical data set. The PLS regression model was used to make the predictions. To verify the accuracy of the model for short-time traffic speed prediction, the GPS data of taxis was selected for validation. The experimental results show that the models prediction error is reduced by about 30% compared with the ARIMA, PLS regression, and LSTM models.

Keywords: urban transportation; short-term speed prediction; K-means clustering; partial least squares regression; spatio-temporal correlation matrix

收稿日期:2022-09-09

基金項目:山東省自然科學基金面上項目(批準號:ZR2021MF113)資助。

通信作者:孫秋霞,女,博士,副教授,主要研究方向為交通大數據分析與建模。E-mail:qiuxiasun@sdust.edu.cn。

主站蜘蛛池模板: 亚洲成a人片在线观看88| 久久综合九色综合97网| 58av国产精品| 国产精品极品美女自在线网站| 国产精品尤物在线| 久久精品无码一区二区国产区| 久久99精品久久久久纯品| 亚洲第一网站男人都懂| 91久久国产成人免费观看| 欧美一级爱操视频| 乱码国产乱码精品精在线播放| 国产黑丝视频在线观看| 亚洲国产精品一区二区第一页免 | 亚洲天堂.com| 国产真实乱子伦视频播放| 中文字幕欧美成人免费| 国禁国产you女视频网站| 午夜欧美在线| 久久午夜夜伦鲁鲁片无码免费| 亚洲第一视频免费在线| 亚洲区欧美区| 日本在线国产| 日韩无码视频专区| 天天色天天综合网| 久久免费成人| 99热国产这里只有精品9九| 在线观看无码av免费不卡网站| 91九色最新地址| 国产成人AV男人的天堂| 国产女人在线观看| 国产第一色| 青青草国产免费国产| 国产精品无码制服丝袜| av在线人妻熟妇| 欧美一级高清免费a| 成人在线观看一区| 国产www网站| 国产黄视频网站| 高清精品美女在线播放| 国产剧情伊人| 免费一级大毛片a一观看不卡| 国产一区二区在线视频观看| 毛片在线看网站| 欧美一级特黄aaaaaa在线看片| 日韩在线观看网站| 精品乱码久久久久久久| 国产爽歪歪免费视频在线观看 | 激情综合婷婷丁香五月尤物| 免费无码AV片在线观看国产| 国产成人精品亚洲日本对白优播| 亚洲国产在一区二区三区| 不卡视频国产| 欧美成人手机在线观看网址| 日本成人福利视频| 成人亚洲国产| 亚洲中字无码AV电影在线观看| 热九九精品| 国产喷水视频| 国产精品内射视频| 91久久国产综合精品| 亚洲V日韩V无码一区二区| 亚洲男人的天堂久久香蕉| 无码专区国产精品第一页| 久久青草免费91观看| 婷婷丁香在线观看| 91精品专区国产盗摄| 茄子视频毛片免费观看| 日韩福利视频导航| 中文字幕自拍偷拍| 亚洲精品视频免费观看| 亚洲人成成无码网WWW| 国产福利在线观看精品| 欧美不卡视频在线观看| 国产激情国语对白普通话| 亚洲香蕉在线| 五月天婷婷网亚洲综合在线| 五月天综合网亚洲综合天堂网| 人妻精品久久无码区| 国产美女视频黄a视频全免费网站| 国产中文一区二区苍井空| 精品视频一区在线观看| 国产一二三区在线|