999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于MI-CEEMDAN-ADABOOST的快速路短時交通流預測

2022-08-03 13:40:18奇興族
公路交通科技 2022年6期
關鍵詞:模型

奇興族

(深圳市城市交通規劃設計研究中心,廣東 深圳 518000)

0 引言

短時交通流預測是當前針對快速路狀態判別的一個重要領域。目前,國內外關于短時交通流預測方面的研究成果較多,并建立了大量預測模型[1-4]。針對交通流短時預測的模型主要有以下幾類:統計模型[5-6]、非線性預測模型[7-8]、深度學習模型[9-10]、組合預測模型[11-12]等,其中,將不同預測模型相結合的預測方式逐漸成為研究重點。如Guo等[13]提出了一種基于圖注意網絡(GAT)和時間卷積網絡(TCN)的深度學習流量預測框架,利用GAT處理空間特征和TCN處理時間特征的組合預測模型。Liu等[14]提出了一種鄰域信息煙花算法,通過產生不同階段的煙花亞種群,將相鄰種群的煙花信息融合并結合極限學習機進行交通流預測。Lu等[15]提出了一種基于自回歸積分移動平均(ARIMA)和長短時記憶(LSTM)神經網絡的短時交通流預測模型。該模型基于歷史交通數據對未來交通流量進行短時預測,利用滾動回歸ARIMA模型及LSTM網絡進行訓練捕捉,并通過滑動窗口的動態加權進行交通流預測。

由于交通流的非線性及不確定性較為突出,在短時交通流預測方面通常需要進行先驗分析,有助于提高模型的預測精度。Wu等[16]提出了一種基于集成經驗模態分解(EEMD)的算法,該算法能夠依據數據自身的時間尺度特征來進行信號分解,無須預先設定任何基函數,但該算法在分解時間序列的過程中會殘留一定的白噪聲,影響后續的分析和預測,而本研究使用CEEMDAN算法[17],將自適應正負高斯白噪聲加入到時間序列的分量中,有效地解決了白噪聲從高頻到低頻的轉移傳遞問題。在交通流預測方面,針對常規的BP神經網絡具有容易陷入局部極小值和收斂速度慢的缺點,目前許多學者們提出了許多改善優化算法,其中包括Adaboost算法、粒子群算法、多目標遺傳算法等[18-20]。而Adaboost算法則將多個BP神經網絡弱分類器組成的強分類器,預測準確率得到大幅度的提升。

為了提高城市快速路交通流的預測準確性,本研究提出一種基于MI-CEEMDAN-Adaboost的組合預測模型,并采用美國西雅圖快速路數據驗證模型的有效性和可行性。

1 MI-CEEMDAN數據分解與重組

1.1 互信息量確定歷史交通流相關性

本研究以歷史交通流數據為基礎,首先確定目標路段歷史交通流之間的相關性。由于互信息量(MI值)可以估計任意一種隨機變量之間的關系,包括線性與非線性關系,并且目前已有多種方法使用互信息概念來進行交通流分析和預測。因此,本研究選用MI值對歷史交通流進行分析與選擇。

MI值可由兩個離散隨機變量X和Y定義,其中p(x,y)為X和Y的聯合概率密度函數,而p(x)和p(y)分別為X和Y的邊緣概率密度函數,并在連續隨機變量的情況下可替換為二重定積分,即:

(1)

MI值在選擇變量方面必須滿足以下2個條件: (1)所選擇的變量必須為高度相關。(2)每個選定的變量與選定變量子集內的任何其他變量之間的冗余應該很小。

假設輸入的數據標簽有M個變量,則變量的總數可能為2M個,很難遍歷所有變量的子集。因此,選擇基于互信息的貪心搜索,用于選擇出目標路段交通流相關性強的時間序列,即:

(2)

式中,Xi和Xj分別為要添加到子集S的候選變量和在t時刻已選擇的變量;C為目標變量;X為所有變量的集合;St為t時刻所選變量的子集;|St|為子集St的基數。

式(2)中的第1項為給定變量Xi與目標變量C之間的相關性,第2項為候選變量與被選變量之間的冗余度,第3項描述了C中的候選變量與St子集變量之間相互作用的程度。在時刻t,通過式(2)從變量集合St中選擇第(t+1)個變量Xt+1,通過選擇使得J(Xi)最大化的變量并將其加入到集合St中,得到新的集合St+1。

(3)

St+1←St∪{Xt+1}|。

(4)

利用該等式,可以選擇出與目標變量相關性最大的變量子集,同時降低變量之間的冗余度。

1.2 CEEMDAN數據分解與提取

經驗模態(EMD)是一種用于分析非線性非平穩信號的自適應方法,它將時間序列在不同的波動頻率下進行分解,將一維的時間序列轉換到多維的相位空間中。然而,EMD在分解過程容易出現一些問題,例如在模態中存在振幅相差很大的振蕩,或在不同的模態中存在非常相似的振蕩,稱為模態混合。為了克服這些問題,提出了一種新的方法:集合經驗模態(EEMD)。它在信號中加入高斯白噪聲的集合上進行EMD,通過加入高斯白噪聲,利用EMD的二元濾波器組特性填充整個時頻空間,解決了模態混合的問題。然而,EEMD也產生了新的問題,由于重構信號中包含了殘余噪聲,不同信號加入噪聲后可能會產生不同數量的分量,為解決這一問題,本研究將使用EEMD的改進方法自適應經驗模態分解(CEEMDAN)。首先,將一維交通流時間序列分解為有限個本征模函數(IMF),所分解出來的各個IMF分量包含了原始交通流序列的不同時間尺度的局部特征信號,并且分解出來的各個IMF分量需要滿足以下條件才可判斷為真分量,否則為假分量,若為假分量則需要進一步分解:

(1)數據至少有2個極值點,1個極大值點和1個極小值點。

(2)數據的局部時域特性是由極值點間的時間尺度唯一確定的。

(3)如果數據沒有極值點但有拐點,則可以通過對數據微分1次或多次求得極值,然后通過積分來獲得分解結果。

設1個一維的交通流時間序列為s(n)={si|i=1, 2,…,I},則第i(1, 2,…,I)次添加的標準正態分布的白噪聲序列為vi(n),則進過i次經驗模態分解后的交通流序列為si(n)=s(n)+vi(n)。根據嵌入延時理論,如果嵌入維數m和時間延遲τ選擇適當,則進行重構后的相空間與原始相空間等價,具有相同的拓撲結構。則重構后的相空間表示為S={Si|Si=[si+si+τ,…,si+(m-1)τ],i=1,2,…,M}。其中,M=N-(M-1)τ為相點數,在重構相位空間中,每個相點包含了m個元素,并且每2個相鄰的元素之間的間隔為τ。其中,嵌入維數和時間延遲的確定可決定相空間重構與原信號的相似程度,在近幾年的研究中發現,嵌入維數m和時間延遲τ有密切關系,可利用延遲時間窗τw=(m-1)τ建立2個未知參數之間的關系。通過C-C算法建立關聯積分并構建統計量和時間延遲之間的關系求解τ和τw,從而計算得出嵌入維數,關聯積分定義為:

(5)

式中,M為相點數;r為鄰域半徑;dij為相空間中兩點之間的歐氏距離;H(z)為Heaviside階躍函數,可定義為:

(6)

將交通流時間序列為s(n)={si|i=1, 2,…,I}劃分為n個不相交的子序列,對于每個不相交的子序列有:

(7)

對所有的s(m,N,r,t)取平均值:

(8)

式中,M為嵌入維數;j為r的個數。本研究定義ΔS(m,t)為r的最大偏差,則:

ΔS(m,t)=max{S(m,rj,t)}-min{S(m,rj,t)}。

(9)

研究表明,當樣本量小于1 024時,嵌入維數m通常取值小于6,當樣本量大于1 024時,嵌入維數m取值范圍在6附近可以獲得穩定的排列熵。為了更加精確地求得嵌入維數和延遲時間,分別計算以下3種統計量:

(10)

(11)

(12)

2 BP-Adaboost預測模型構建

自適應增強(Adaboost)算法是一種迭代算法,其核心思想是針對同一個訓練集訓練不同的分類器(弱分類器),然后將這些弱分類器集合起來構成1個強分類器。開始時,每個訓練樣本的權重是相同的,在此樣本下訓練第1個弱分類器,對于分類出現錯誤的樣本,增加其對應的權重,而對于分類正確的樣本,則減小其對應的權重,之后得到了1個新的樣本分布,在新的樣本下再次對新樣本進行訓練得到第2個弱分類器。以此類推,經過N次循環得到N個弱分類器,最后將這N個弱分類器進行組合,通過加權的投票機制讓分類效果較好的弱分類器具有較大的權重,而分類效果較差的分類器具有較小的權重。具體算法步驟如下。

步驟1:從訓練樣本中隨機選擇N組訓練數據構建訓練數據集T={(x1,y1), (x2,y2),…, (xN,yN)},初始化訓練樣本的權值分布:D1=(w1,1,w1,2,…,w1,i),w1,i=1/N,i=1, 2,…,N,根據樣本的輸入輸出維數確定神經網絡結構,初始化BP神經網絡權值和閾值。

步驟2:弱分類器預測。使用具有權值分布Dm的訓練集進行學習,訓練BP神經網絡并預測訓練輸出,得到弱分類器Gm(x),計算Gm(x)在訓練集上的分類誤差率:

(13)

步驟3:計算Gm(x)在強分類器中所占的權重:

(14)

步驟4:測試數據權重調整。根據預測序列的權重更新訓練數據集的權重分布:

(15)

步驟5:構建強分類器。通過進行N輪的弱分類器訓練,將各個分類器按照分類精度重新分配權值組合,構成一個強分類器進行分類:

(16)

通過上述5個步驟構建BP-Adaboost組合預測模型,并對CEEMDAN分解后的有效分量IMF進行預測和重組。

3 模型驗證

選用美國西雅圖高速公路檢測器數據進行驗證,選擇該高速公路路段104號檢測器的歷史數據作為訓練集。數據采集時間為2019年10月1日至2019年10月31日,采集時間間隔為5 min,每天采集144組數據,共采集4 464組數據,試驗環境為MatlabR2019b。

計算樣本中的交通流數據之間的互信息量,并從中選出相關性最高的10 d的數據作為模型的訓練集,MI值計算結果分布圖如圖1~2所示。i,j分別為目標交叉口的第i天和第j天的交通流柵格化數據,其中亮度越高表明相關性越高,任意2個變量之間的MI值反映了兩者之間的相關性。副對角線MI值均為1,是由于各個數據的自相關性最高。

圖1 MI值相關性分布值三維圖Fig.1 Three-dimensional plot of MI correlation distribution values

圖2 MI值相關性分布值二維熱圖Fig.2 Two-dimensional heatmap of MI correlation distribution values

通過對31 d數據計算MI值,選擇出其中相關性最高10 d的交通流數據作為模型的訓練集進行訓練,將前9 d的數據作為訓練集訓練模型,將第10 d數據進行驗證。

通過MATLAB編程將訓練集中的原始交通流數據進行CEEMDAN分解,并在分解時添加標準差為0.2的白噪聲。原始交通流數據被分解為12個不同尺度的IMF分量,相鄰IMF分量之間的波動程度相似,其中IMF12為時間序列的殘余分量。

為了驗證該方法的有效性,本研究將原始交通流序列分別使用EMD和CEEMDAN進行分解,并對分解過程進行分析。通過觀察2種方法分解分量的數量和迭代次數來評價方法的優劣性,分解結果如圖3所示。使用EMD分解后的分量數與CEEMDAN分解后的分量數相同。但是,EMD分解過程中的迭代次數遠遠大于CEEMDAN,因此,使用CEEMDAN算法分解更加高效。

圖3 與IMF箱線圖Fig.3 Boxplot of IMF components

由于交通流數據具有一定的隨機性和非平穩性,使得分解后得到的交通流IMF分量較多。因此,為了減少與原始信號相關性較小的IMF的干擾,通過計算各個IMF的時間序列復雜性,選擇流量序列相關性最高的幾個IMF分量。

圖4 交通流量時間序列的曲線和 Scor(t)-t 曲線Fig.4 and Scor(t)-t curves of traffic flow time series

將計算得出的嵌入維數和延遲時間代入排列熵中,計算各個IMF的排列熵值,選擇其中最大值的1/10作為閾值進行篩選,由圖5可得分量IMF8的排列熵為最大值,因此篩選閾值為PE(IMF8)/10=0.087 35,圖中位于虛線以上的IMF即為有效分量,分別為IMF1,IMF4,IMF5,IMF6,IMF7,IMF8,IMF9,其中IMF12為余項分量,在重組階段添加。

圖5 有效分量選取Fig.5 Effective component selection

選用神經網絡-自適應增強(BP-Adaboost)對交通流進行預測分析。自適應增強是一種提升方法,將多個弱分類器組合成強分類器。該方法可充分利用不同分類算法的優勢進行建模,這樣訓練的模型精度高于單一設置的模型。BP-Adaboost模型是將BP神經網絡作為弱分類器,反復訓練BP神經網絡預測樣本,通過Adaboost得到多個BP神經網絡弱分類器組成的強分類器。

圖6 BP-Adaboost模型預測結果及有效性Fig.6 Prediction result and effectiveness of BP-Adaboost model

使用BP-Adaboost模型對各個分量進行訓練和預測,并將各分量預測重組得到最終的預測結果。各個分量及分量預測結果重構如下,真實值與預測值之間相關系數達到0.97。

為驗證本方法的有效性,分別構建KNN,SVM,ELM,CEEMDAN-KNN,CEEMDAN-SVM,CEEMDAN-ELM進行對比試驗,預測評價指標選取平均均方誤差MAE、均方根誤差RMSE、平均絕對百分誤差MAPE。

(17)

(18)

(19)

由表1及圖7可知,與其他預測模型相比,經過本研究的MI-CEEMDAN-Adaboost組合預測模型的MAE,RMSE,MAPE均低于其他模型,說明其預測誤差最小,預測精度最高。ELM模型與真實值的擬合度最低,而SVM和KNN模型的擬合度逐漸提高,但仍低于經過經驗模態分解后的CEEMDAN-ELM,CEEMDAN-KNN,CEEMDAN-SVM的模型預測精度,表明經過MI-CEEMDAN重構后的模型預測效果有所提高。

表1 各模型預測結果對比Tab.1 Prediction results of different models

圖7 各模型經過MI-CEEMDAN處理后的預測結果對比Fig.7 Comparison of prediction results of different models after MI-CEEMDAN processing

綜上所述,基于MI-CEEMDAN-Adaboost的組合預測模型對快速路短時交通流預測有較好的預測效果。

4 結論

本研究利用快速路歷史交通流時間序列,提出了一種基于MI-CEEMDAN-Adaboost的快速路短時交通流量預測方法,該方法與其他經典模型相比,交通流預測值更加接近真實值,并且MAE,RMSE,MAPE均低于其他模型。

利用互信息量對歷史交通流時間序列進行相關性分析,選擇相關性較高的時間序列,剔除相關性低的樣本,能夠保證訓練樣本的有效性。

通過對模型進行MI-CEEMDAN分解并重構,各模型的預測誤差均明顯降低,預測精度明顯提高。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 午夜福利视频一区| 久久这里只有精品国产99| 色窝窝免费一区二区三区 | 国产va欧美va在线观看| AV片亚洲国产男人的天堂| 任我操在线视频| 蜜桃视频一区| 国禁国产you女视频网站| 久久精品一品道久久精品| 97在线免费| 久久久久人妻一区精品| 尤物视频一区| 99热这里只有精品久久免费| a级毛片免费播放| 亚洲国产中文综合专区在| 中文字幕乱妇无码AV在线| 玖玖精品视频在线观看| 国产第二十一页| 精品无码国产自产野外拍在线| 欧美a在线视频| 一本大道视频精品人妻 | 日本久久网站| 久久精品66| 久久精品娱乐亚洲领先| 99精品福利视频| 成人在线观看一区| 韩日无码在线不卡| 午夜a级毛片| 这里只有精品国产| 色综合天天娱乐综合网| 国产欧美性爱网| 国产专区综合另类日韩一区| 免费一级毛片在线播放傲雪网| 亚洲天堂网视频| 国模极品一区二区三区| 久久99热66这里只有精品一| 在线免费看片a| 久久99国产乱子伦精品免| 综合天天色| 国产乱人伦AV在线A| 久久香蕉国产线看观| 精品偷拍一区二区| 日韩在线第三页| 欧美成人免费一区在线播放| 国产一区二区三区精品久久呦| 亚洲精品大秀视频| 亚洲视频无码| 在线a网站| 国产小视频在线高清播放| 久草视频中文| 国产美女在线免费观看| 久久99蜜桃精品久久久久小说| 国产丝袜丝视频在线观看| 成人久久精品一区二区三区| 在线亚洲天堂| 欧洲欧美人成免费全部视频| 干中文字幕| 熟女成人国产精品视频| 久久无码免费束人妻| 成·人免费午夜无码视频在线观看 | 欧美一级高清视频在线播放| 国产一级在线播放| 97成人在线观看| 国产亚洲精品yxsp| 激情综合激情| 在线观看免费国产| 国产精品无码一区二区桃花视频| 色天天综合| 国产日韩欧美成人| 色悠久久综合| 欧美自慰一级看片免费| 91久久国产成人免费观看| 99精品国产自在现线观看| 亚洲精品自在线拍| 亚洲色图综合在线| 亚洲无码高清免费视频亚洲| 一本大道香蕉中文日本不卡高清二区 | 欧美区一区二区三| 亚洲欧美成人在线视频| 91久久国产综合精品| 最新国产成人剧情在线播放| 综合色在线|