999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多源數據的車流量時空預測方法*

2021-12-11 13:26:16龔永勝蔡世杰黃騰飛
汽車工程 2021年11期
關鍵詞:特征提取特征模型

胡 杰,龔永勝,蔡世杰,黃騰飛

(1.武漢理工大學,現代汽車零部件技術湖北省重點實驗室,武漢430070;2.武漢理工大學,汽車零部件技術湖北省協同創新中心,武漢430070;3.新能源與智能網聯車湖北工程技術研究中心,武漢430070)

前言

在智慧城市[1]建設過程中,隨著車載傳感器增加,車輛行駛過程中將產生大量的交通數據,如何充分挖掘隱含在數據中的普遍規律從而進一步推動智慧交通系統的發展,已經引起了大量學者[2]的關注。準確的車流量預測不僅有利于城市道路的規劃建設,還有助于提高車輛的通行效率,緩解城市交通擁堵,減少資源浪費和環境污染。

為了提高交通流量的預測精度,研究人員做了大量探索。在基于狀態估計的交通流量預測中,卡爾曼濾波的預測模型得到了廣泛的應用[3-7]。由于不同路段的交通流量之間存在一定的線性關系,因此可使用卡爾曼濾波對線性函數的參數進行估計,從而實現交通流量的預測。該方法的缺點是模型容易產生滯后現象,難以適應日益復雜的城市路網結構。

在機器學習模型中,車流量被視為單一時間序列問題,使用機器學習模型擬合歷史交通流的變化趨勢從而實現對未來的預測。Marco等[8]提出了一種基于支持向量回歸(support vector regression,SVR)的交通流量預測模型,考慮到交通流量的季節變化,該模型采用季節核來度量兩個時間序列樣本之間的相似性,實驗證明該模型與傳統的自回歸滑動平均模型和卡爾曼濾波組合模型相比,在預測精度相同的情況下,大幅降低了模型的時間復雜度。Hu等[9]提出了一種基于混合PSO-SVR的短期交通流量預測模型,該模型采用快速粒子群優化算法(particle swarm optimization,PSO)對SVR的參數進行優化。Ge等[10-11]對復雜的交通流量序列采用小波變換轉變為不同尺度下的單一特征,然后使用SVR模型分別對不同尺度下的子序列進行預測,該方法較大限度地挖掘了時間序列中的隱含信息和特征的變化,實現了較好的預測效果。在其他機器學習算法的研究中,樊漢勤[12]采用隨機森林算法來實現交通流量的預測,可實現與SVR相似的效果。隨著神經網絡的發展,其優秀的非線性擬合能力使得神經網絡在交通流量預測領域得到了廣泛的青睞[13-16]。文獻[17]和文獻[18]中利用多層感知機(multilayer perception,MLP)和長短時記憶神經網絡(long short-term memory networks,LSTM)對交通流量進行預測,并引入早停機制[19-20]來防止模型過擬合。基于時間序列的預測方法雖然改進了傳統方法的預測精度,但該方法忽略了城市交通的空間連通性,不適于復雜交通系統的交通流量預測。

為了在時間序列預測的基礎上進一步探索城市交通中的空間關系,基于圖神經網絡的圖節點信息提取得到了廣泛的應用[21]。文獻[22]~文獻[25]中提出了不同的圖表示學習方法,實現了圖節點的向量表示。圖表示方法與傳統時間序列模型相結合可實現交通流量的時空預測,改善交通流量的預測效果。劉道廣[26]提出了一種基于圖卷積網絡(graph convolutional network,GCN)和LSTM相結合的時空預測模型,取得了較好的預測效果。Zhao等[27]提出了一種基于圖卷積神經網絡(GCN)和門控循環單元(gated recurrent unit,GRU)組合的時間圖卷積網絡(temporal graph convolutional network,T-GCN)模型來實現交通流量預測,充分考慮了城市交通中的空間特性。Zhang等[28]提出了一種基于殘差網絡的時空特征提取方法,并考慮了天氣和節假日的影響,為車流量預測研究提供了新的思路。

為了充分考慮天氣、時間、興趣點(point of interest,POI)等外部因素對車流量的影響,本文中提出了一種基于多源數據與時空預測模型相結合的車流量預測方法。同時,提出了一種基于圖表示學習和時間卷積的時空預測模型,并融合了基于歷史出租車軌跡的空間鄰接權值提取模型,進而提高模型的空間特征提取能力。

1 多源數據的預處理和分析

1.1 數據介紹

1.1.1 道路交通卡口數據集

道路交通卡口數據來源于DataCastle競賽平臺,采用的是青島市107個道路交通卡口在2019年8月至9月7:00-19:00的車輛通行數據,時間跨度為35天,共計94 180 760條。數據的特征維數和空間分布如表1所示。

表1 道路交通卡口數據樣本

1.1.2出租車數據集

出租車數據集采用的是DataCastle網站提供的青島市2019年8月1日至19日中7:00-19:00之間的出租車行駛軌跡數據。數據采集的時間間隔為20 s,共計100 740 505條。數據維度如表2所示。

表2 出租車數據樣本

1.1.3 天氣數據

天氣數據來自WunderGround網站,數據包括時間(小時)、溫度、濕度、風速、氣壓和天氣狀況6個維度,如表3所示。

表3 天氣數據樣本

1.1.4 POI數據

POI數據來自Openstreetmap平臺,數據包含POI名稱、POI類別、行政區、經度和緯度,如表4所示。

表4 POI數據樣本

1.2 流量轉換

1.2.1 道路交通卡口數據集的流量轉換

道路交通卡口數據集包含道路車輛通行記錄,以5 min為時間間隔,對各卡口的車輛通行記錄進行流量統計轉換。轉換后的數據點代表5 min內的車流量。轉換后的部分卡口(100051、100117、100335)車流量數據如圖1所示。

圖1 交通卡口車流量變化趨勢

1.2.2 出租車數據集的流量轉換

對于出租車數據集的處理,首先對出租車的軌跡進行坐標轉換,將車載傳感器采集的WGS84坐標系轉換為GCJ02坐標系。其次,計算相鄰兩軌跡點之間的平均速度,剔除平均速度大于120 km/h的異常軌跡點,并使用線性插值法補全缺失。最后,基于Geohash6[29]對城市進行網格劃分,以5 min為間隔統計每個網格的出租車流量,從而實現出租車數據集的流量轉換。轉換后的部分流量如圖2所示。

圖2 出租車流量變化趨勢

1.3 Kalman數據平滑

受限于數據采集設備的精度,原始數據中不可避免地存在少量噪聲。為了減少噪聲,采用了基于Kalman濾波的數據平滑方法[30]。

1.4 特征相關性分析

1.4.1 時間相關性分析

充分挖掘車流量時間序列的時間特征有助于提高模型的預測精度。

(1)以天為單位的周期性分析

兩個數據集前3天的變化趨勢圖如圖3和圖4所示。由圖可見,車流量的變化趨勢基本相同,說明車流量具有明顯的周期性特征。

圖3 車流量的周期性分析(天)-交通卡口流量的周期性對比

圖4 車流量的周期性分析(天)-出租車流量的周期性對比

(2)以星期為單位的周期性分析

以星期為單位的周期性分析如圖5所示。由圖可見,工作日平均車流量較高,呈現明顯的早晚高峰特性,且與周末的車流趨勢有較大差異。

圖5 車流量的周期性分析(星期)

1.4.2 天氣相關性分析

天氣狀況會影響城市交通流。兩個數據集在不同天氣下的平均流量圖如圖6所示。由圖可見,晴天的車流量都明顯高于雨天,說明市民更傾向晴天出行。

圖6 天氣相關性分析

1.4.3 POI相關性分析

不同POI下的平均流量的統計分析如圖7所示,可知不同POI對應的流量存在較大差異,說明POI能間接反映市民的出行意圖對城市交通存在影響。

圖7 POI相關性分析

2 多源特征表示

2.1 時間特征表征

為了加強模型的時間特征學習能力,提出了一種基于Time2vec[31]的時間周期特征提取模型。Time2vec模型通過嵌入神經網絡層可以實現從輸入時間序列中自動提取隱含的時間周期特征。Time2vec的周期特征表達式為

式中:ω和φ分別為正弦三角函數中的頻率和初始相位;t為輸入的時間特征(時間標量);i為第i個特征表示輸出。

2.2 天氣特征表征

為了更精確地描述天氣舒適度對車流量的影響,提出了一種基于K-means聚類的出行舒適性分類方法。

K-means的輸入包括天氣特征中的溫度、濕度、風速和氣壓4個維度,k值根據輪廓系數確定。聚類結果和輪廓圖分別如圖8(a)和圖8(b)所示,當k取3時對應輪廓系數最大,說明聚類標簽為3時最為合適。類別標簽將經過One-Hot編碼后輸入模型。

圖8 POI相關性分析

2.3 POI特征表征

2.3.1 道路交通卡口數據集的POI匹配

POI點和交通卡口點的匹配,采用了基于最近鄰算法(K-nearest neighbor,KNN)的匹配方法。通過進行對照實驗得知,當近鄰參數k=50時,匹配效果最佳。匹配結果如圖9所示,匹配后卡口的POI標簽將通過One-Hot編碼實現特征表征。

圖9 道路卡口的POI匹配

2.3.2 出租車數據集的POI匹配

出租車數據集的流量為GeoHash6網格區域流量,首先計算每個網格內各類型的POI數量,其次將數量最大的類別作為網格的POI類別從而完成網格的POI匹配。所有的POI類別都將通過One-Hot編碼實現特征表征。

3 基于多特征融合的車流量時空預測模型

為了充分考慮多源特征對車流量的影響,本文中從外部特征、空間特征和時間特征3個角度進行了綜合建模,即采用外部特征、空間特征和時間特征提取模型經過張量拼接輸入至MLP單元中進行多模型的融合,從而實現基于多特征融合的車流量時空預測方法。預測模型的總體結構如圖10所示。

圖10 預測模型整體結構

3.1 外部特征提取模型

外部特征包括多源特征表征中的時間、天氣和POI屬性。對此類特征進行相應的張量拼接后將連接到全連接網絡實現外部特征的建模。外部特征提取模型的輸出將與其他模型的輸出融合后輸入多層感知機網絡中。

3.2 空間特征提取模型

3.2.1 基于圖表示學習的空間鄰接特征提取模型

在城市路網中,相鄰道路交叉口之間的上下游關系會對整體的車流量產生重要影響。考慮到道路的空間分布對城市交通的交叉影響,采用了一種基于結構深層網絡嵌入(structural deep network embedding,SDNE)的空間分布特征提取方法[25],其中1階相似性用來捕獲路網空間局部結構相關性,2階相似性用來捕獲路網空間全局結構相關性。圖表示學習SDNE算法的總體結構如圖11所示。

圖11 SDNE模型總體結構

在SDNE模型中,每個輸入數據(節點鄰接信息)需要經歷相應的編碼和解碼過程,該過程對應為SDNE的2階相似性學習。在節點編碼時,通過多層非線性單元將節點信息從低維映射到高維從而得到節點信息的表示空間。在解碼時,通過多層非線性元素進一步映射表示空間得到重構的節點鄰接矩陣。

SDNE模型的輸入為交通鄰接圖數據。該模型包含兩個網絡層,每層包含64個和128個隱藏神經元,用于學習交通卡口之間的隱含空間關聯。

3.2.2基于歷史軌跡的空間權重特征提取模型

針對空間權重問題,提出了一種基于出租車歷史軌跡的鄰接權重特征提取方法。首先,將出租車軌跡數據通過Geohash6網格編碼;然后將軌跡編碼去重后視為文本語言輸入詞嵌入Word2vec模型學習網格間的權重關系,從而實現網格間的實際車輛流動關系的探索;最后在網格的基礎上實現交通卡口數據集和出租車數據集中各流量統計點的空間權重匹配。

詞嵌入Word2vec模型為圖12中所示的CBOW(continuous bag-of-words model)模型,模型包括輸入層、隱含層和輸出層。該模型的詞窗口大小為5,圖中ωi-1、ωi-2、ωi+1和ωi+2分別為CBOW模型中經過One-Hot編碼后的輸入,ωi為輸出,也即CBOW模型根據當前單詞的前后4個單詞來預測當前詞。

圖12 CBOW模型結構

Word2vec模型訓練后,其隱含層中的嵌入向量將被保存至模型的詞典中,詞向量可通過查詢字典的方式獲取。每個單詞的嵌入維度由隱含層的神經元個數決定,嵌入后的詞向量將包含單詞間的相似度信息,也即空間權重信息。在詞嵌入模型中,詞窗口大小設置為4,嵌入維數為60,空間權重特征提取模型的結構如圖13所示。

圖13 鄰接特征提取過程

在空間相關提取模型由SDNE模型和詞嵌入的CBOW模型融合而成,其中SDNE負責空間鄰接特征提取,CBOW負責鄰接權重特征提取,空間相關提取模型的最終輸出xspace是SDNE的輸出xSDNE和Word2vec的輸出xWord2vec的張量拼接。

3.3 時間特征提取模型

車流量作為時間序列數據,具有強烈的時間相關性。時間卷積網絡(temporal convolutional net?works,TCN)中加入的因果卷積,加強了模型對序列數據的學習能力,同時通過膨脹卷積極大的擴展了模型的感受野。TCN還引入殘差單元用于緩解梯度爆炸和梯度消失,從而使深TCN網絡的實現成為可能。為了提高模型的效率,采用了基于TCN的時間相關性建模方法[32]。

為了提高模型的時間特征提取能力,建立了基于近鄰預測和日周期預測的雙基線時間特征提取模型。如圖14所示,近鄰基線上的TCN模型根據前12條(1 h)流量預測后續流量;在日周期基線上,模型根據前一天同一時間的流量預測當前值。

圖14 雙基線數據采樣方法

3.4 多頭自注意力機制

多頭自注意力機制[33]能增強模型對長序列的“記憶能力”,增強模型對長期依賴的學習。在深度學習中,注意力機制被廣泛用于增強模型對重要信息的關注度。自注意力模型的輸出向量可根據式(3)計算得出,其中dk為調節參數,Q、K、V分別為查詢向量序列、鍵向量序列和值向量序列,3種序列可由輸入信息經過線性變換獲得。

多頭自注意力模型的輸出計算方法如式(4)和式(5)所示,其中WQ、WK、WV和WO為隱藏參數矩陣,headi為第i個放縮點積注意層的輸出。為了避免模型訓練過程中出現過擬合現象,同時加入早停算法。

4 實驗結果與分析

4.1 實驗設置

4.1.1 評價指標

本文中以均方根誤差(root mean squared error,RMSE)和平均絕對誤差(mean absolute error,MAE)為評價指標實現預測模型的對比評估。兩個評價指標越小,則表示預測效果越佳。

4.1.2 相關參數設置

通過多個對照實驗分析預測效果,模型最佳效果的相關參數設置如下:訓練集、驗證集和測試集的比例分別為60%、20%、20%。在外部特征模塊中,Time2vec的神經元數為32,K-means聚類標簽為3,KNN近鄰參數為50,Geohash編碼長度為6。在空間特征提取模塊中,SDNE模型的批量大小和迭代次數分別為128和50;鄰接權值模型的單詞窗口大小和嵌入尺寸分別為4和60。在時間特征提取模型中,批量大小為256,早停容忍度為5,早停閾值為0.001,模型的優化算法為Adam。

4.2 結果分析

4.2.1 多源特征對比及結果分析

該部分設置了以TCN為基模型的多源特征驗證方案。車流量的輸入步長為12(1 h),預測長度為6(30 min),對照實驗如下所示:

TCN,交通流序列作為輸入;

Time-TCN,在TCN的基礎上添加時間特征;

Wea-TCN,在TCN的基礎上添加天氣特征;

POI-TCN,在TCN的基礎上添加POI類別特征;

GTCN,在TCN的基礎上組合空間特征提取模型SDNE與鄰接權重提取模型Word2vec。

兩個真實數據集的對照模型預測結果(3次重復實驗后的平均值)如圖15所示。

圖15 多源特征預測結果對比

由對比結果可知,多源特征的引入改善了模型的預測效果。空間相關性特征的引入最大程度提升了模型的預測效果,驗證了空間相關性建模的有效性;時間、天氣和POI特征的引入均不同程度地提升了模型的預測精度,驗證了基于多源數據方法的合理性。

4.2.2 預測模型對比及結果分析

為了驗證MF-AGTCN模型的預測效果,該部分以RNN、LSTM、GRU、CNN、TCN和Zhao等提出的基于圖卷積網絡(GCN)與GRU的組合模型TGCN[27]為對照模型設計了對照實驗。所有的對照模型均調至最佳狀態,并設置隨機失活率為0.5以防止過擬合。同樣,模型的輸入步長為12(1 h),預測長度為6(30 min)。實驗結果如圖16所示。

圖16 不同模型的預測結果對比

實驗結果表明,MF-AGTCN模型在兩個數據集的多個預測步長上都呈現出更好的預測效果。相比于5個模型的平均提升對比,MF-AGTCN相比RNN的提升最大,相比TCN模型提升相對較小,說明TCN模型在兩個交通數據集上優于傳統遞歸神經網絡,也驗證了MF-AGTCN模型中的基于TCN模型的時間相關性建模的合理性。在MF-AGTCN與T-GCN模型的對比中,由于時間特征提取模型Time2vec和多頭注意力機制的引入使MF-AGTCN模型改善了未來25~30 min的車流量預測精度,說明MF-AGTCN模型具備更優異的中長時預測性能。

MF-AGTCN模型在兩個真實交通數據中的部分預測效果如圖17和圖18所示。由圖可見,MFAGTCN模型較好地擬合了真實的交通流波動趨勢,且在預測步長為30 min時依然表現穩定,進而驗證了其良好泛化能力。

圖17 道路交通卡口流量數據集MF-AGTCN預測結果

圖18 出租車流量數據集MF-AGTCN預測結果

5 結論

本文中提出了基于多源數據的特征工程和時空預測模型相結合的車流量預測方法,該方法從外部特征、空間特征和時間特征的角度建立車流量預測模型,其中基于圖表示學習SDNE模型的空間特征提取模型與基于出租車歷史軌跡的空間權重模型的引入,改善了空間依賴性特征的提取能力,有利于提高模型對復雜交通系統的適用性。多組對照實驗結果表明,MF-AGTCN預測模型實現了預測精度的提升,并具有良好的泛化能力,同時還改善了對長序列數據的學習能力,使模型具備更優異的中長時預測性能。

猜你喜歡
特征提取特征模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
基于Gazebo仿真環境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
一種基于LBP 特征提取和稀疏表示的肝病識別算法
3D打印中的模型分割與打包
基于MED和循環域解調的多故障特征提取
主站蜘蛛池模板: 国产精品自在线拍国产电影| 国产高清免费午夜在线视频| 99久视频| 日韩区欧美区| 国产精品欧美亚洲韩国日本不卡| 另类欧美日韩| 免费一级大毛片a一观看不卡| 亚洲国产亚洲综合在线尤物| 久久一日本道色综合久久| 欧美亚洲日韩中文| 午夜免费视频网站| 四虎成人精品| 免费一级全黄少妇性色生活片| 成人午夜久久| 国产精品亚洲va在线观看| 青青久视频| 国产成人精品2021欧美日韩| 91视频区| 亚洲欧美在线综合图区| 亚洲精品成人片在线观看| 美女视频黄又黄又免费高清| 亚洲天堂视频在线观看免费| av一区二区无码在线| AV熟女乱| 欧美综合区自拍亚洲综合天堂| 国产成人精品一区二区免费看京| 国产成人久久综合777777麻豆| 91网红精品在线观看| 国产成人91精品免费网址在线| 91午夜福利在线观看| 91国内视频在线观看| av性天堂网| 91亚瑟视频| 99国产精品国产高清一区二区| 免费可以看的无遮挡av无码| 欧美成a人片在线观看| 99久久精品国产精品亚洲| 亚洲视频影院| 精品综合久久久久久97超人| 沈阳少妇高潮在线| 狠狠做深爱婷婷综合一区| 午夜精品区| 国产精品久久精品| 免费aa毛片| 日韩午夜福利在线观看| 成年人福利视频| 欧美午夜网站| 亚洲中文字幕久久无码精品A| 亚洲第一成年网| 在线观看91精品国产剧情免费| 亚洲区欧美区| 亚洲视频一区在线| 99er精品视频| 日韩一区精品视频一区二区| 91麻豆精品国产91久久久久| 永久免费无码日韩视频| 久久精品只有这里有| 亚洲婷婷丁香| 国产地址二永久伊甸园| 伊人久久大香线蕉综合影视| 国产午夜不卡| 日韩毛片免费| 亚洲a级毛片| 亚洲视频无码| 一区二区日韩国产精久久| 国产日韩精品一区在线不卡| 九九免费观看全部免费视频| 不卡无码h在线观看| 欧美成人综合在线| 国产精品片在线观看手机版| 亚洲男人的天堂网| 夜夜拍夜夜爽| 在线欧美一区| 久久情精品国产品免费| av一区二区三区在线观看| 国产永久在线观看| 亚洲精品午夜天堂网页| 99视频在线看| 伊人色天堂| 国产精品三级av及在线观看| 五月婷婷综合在线视频| 亚洲人成人无码www|