999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

混合模型在網約車出行預測研究中的應用

2022-08-16 07:01:18帥春燕王昱翔
關鍵詞:特征區域模型

帥春燕,王昱翔,許 庚

(1.昆明理工大學 交通工程學院,昆明 650500; 2.昆明市規劃設計研究院 市政與交通所,昆明 650051)

0 引言

在網約車出行領域,打車軟件可以對海量的網約車出行訂單數據進行收集,對網約車出行數據進行分析運用是一個較為關鍵的現實問題。網約車出行交通流的預測是目前交通領域的研究熱點,主要是基于交通流時間序列來構建合適的模型,如經典統計模型,差分整合移動平均自回歸[1],人工神經網絡,長短期記憶神經網絡[2]。通過獲取不同的交通流[3]特征和變化規律,對短期交通流進行不同精度的預測,而合理的模型可以有效提高精度,減少誤差。

在交通流實時預測方面,Smith等[4]運用差分整合移動平均自回歸模型(ARIMA)對高速公路交通流進行預測分析,但ARIMA模型通常要求交通流序列滿足平穩性和自相關,難以捕獲非線性關系;林永杰等[5]通過人工神經網絡(ANN)模型對出租車出行需求進行預測,驗證了人工神經網絡在需求預測上更優于傳統自回歸滑動平均模型;崔淑敏等[6]運用深度學習方法DLDP提取軌跡特征,從而提高對出租車目的地預測準確率,但模型計算復雜,對數據稀疏程度較敏感。

在混合模型交通流預測方面,段宗濤等[7]根據歷史數據,構建了機器學習混合模型,引進殘差單元來加深網絡層數,并結合數據臨近性、周期性和趨勢性來對出租車需求進行預測;羅文慧等[8]將CNN和LSTM集成在DL結構中,對時空序列問題進行了挖掘和分析;Cai等[9]等利用GSA算法對SVR參數進行尋優,對交通流時間序列進行實時預測;Feng等[10]通過對交通流的非線性和隨機性進行研究,提出了一種基于時空相關性的自適應多核支持向量機(AMSVM)短期交通流預測模型,但由于耗費大量時間,基于SVR的模型很難實現大規模的訓練樣本。陸百川等[11]結合交通流時空特性和數據特征,提出GA-WNN路網短時交通流預測模型;趙陽陽等[12]運用經驗模態分解將時間序列轉化為本征模函數及殘差,并利用長短時記憶神經網絡對地鐵客流進行預測。

雖然基于神經網絡的模型在交通流預測中表現良好,但這些模型仍然難以對交通流的隨機波動性和規律性進行完全捕捉。為解決這些問題,有研究者運用經驗模態分解(EMD)[13]和奇異譜分析(SSA)[14]對短期交通流時間序列進行分解降噪,并運用LSTM、ANN等模型進行預測分析。本文提出一種基于SSA-LSTM-SVR的網約車實時訂單出行交通流預測模型來對交通流進行更準確地預測。首先,利用SSA將短時交通流分解為1個主分量和多個隨機分量,對于反映交通流的規律性和周期性的主成分,采用LSTM進行預測,對于不穩定的隨機分量,引入SVR模型進行預測。最后將各分量對應的預測結果疊加融合,形成預測值。同時引入粒子群優化(PSO)算法[15]對SSA-LSTM-SVR模型的分解參數進行優化,最后通過實際交通流數據對模型進行了驗證,并與其他模型的預測效果進行了比較。

1 模型介紹

1.1 奇異譜分析(SSA)

奇異譜分析(singular spectrum analysis,SSA)主要運用于非線性時間序列的研究,對原始的時間序列進行分解和重構處理,可以對原始時間序列進行降噪,處理后的序列相比原始序列更加光滑,有利于預測精度的提升,本文運用SSA算法,將短期交通流的軌跡矩陣進行分解和重構,并提取出周期項和趨勢項,對噪聲干擾進行去除。SSA分解主要分為4個步驟。

步驟1構建軌跡矩陣

對于長度為T的交通流X(t)=[x1,x2,x3,…,xT],構建L×K階軌跡矩陣如式(1),L為嵌套緯度,通常也稱為窗口長度,其中,L(2

(1)

步驟2奇異值分解(SVD)

X=X1+X2+X3+…+Xd

(2)

步驟3分組

將Xi(i=1,2,3,…,d)劃分為p個不同的組,即:

(3)

對于給定分量Xi的貢獻率為:

(4)

步驟4重構

將分組得到的矩陣轉換為長度為T的重構成分,所有重構成分疊加即為新的序列,定義Ri(t)=[r1,r2,r3,…,rT]為經過對角平均化處理后得到的序列,Ri(t)序列中第k個元素為矩陣Xi=(zij)L×K中滿足i+j=k+1的所有元素均值,對角平均化具體操作如式(5):

(5)

對角平均化處理后,原始交通流序列X(t)=[x1,x2,x3,…,xT]分解為N個序列之和。

(6)

其中,i+n≤d,1≤k≤Γ,Xk(t)是原始時間序列的特征序列,每個特征序列都有自己獨特的特征,并且相互變化,Xk(t)的和等于原始級數,即:

(7)

為了使短期交通流的預測結果接近地面真實情況,首先利用SSA將網約車出行交通流分解為主分量和多個隨機分量,根據它們各自的特點,討論適合各個分量特征的預測模型。

1.2 長短期記憶神經網絡(LSTM)

由于SSA分解的網約車出行交通流主成分能較好地反映交通流的周期性和規律性,因此引進LSTM進行預測。長短時神經網絡LSTM在RNN的基礎上,解決了基礎RNN模型在預測過程中隨著層數增加而產生梯度爆炸的問題。LSTM主要由4個部分組成:輸入門、遺忘門、輸出門以及存儲單元。當輸入門被激活,輸入的每一個時間步長信息都會累積到該單元,同時遺忘門會有幾率把過去的細胞狀態進行“遺忘”操作,輸出門控制最終狀態,存儲單元控制信息流,并在單元中計算梯度。在交通流預測中,X(t)為輸入網約車出行交通流數據,LSTM模型具體結構如圖1所示。

圖1 LSTM結構圖

如圖1所示,xt和ht表示在t時刻的輸入和輸出。ft、gt和οt分別為遺忘門、輸入門、輸出門的輸出,其映射函數如下:

ft=σ(Wf[ht-1,xt]+bf)

(8)

gt=σ(Wg[ht-1,xt]+bg)

(9)

Jt= ReLU(WJ[ht-1,xt]+bJ)

(10)

οt=σ(Wο[ht-1,xt]+bο)

(11)

st=ft*st-1+gt*Jt

(12)

ht=οt*ReLU(st)

(13)

1.3 支持向量回歸(SVR)

針對網約車出行交通流隨機分量特征復雜、非線性強的特點,引進支持向量回歸(SVR)算法對隨機分量進行預測分析。SVR是一種應用廣泛的交通流預測模型,它將數據點盡可能映射到高維狀態空間的最優超平面上,實現回歸和預測。對于一個規模為{(xi,yi),i=1,2,3,…,T}的樣本集,其中xi和yi分別為輸入值和輸出值,SVR的回歸函數為:

f(x)=〈w·xi〉+b

(14)

其中,〈w·xi〉表示向量w和x的內積,b是偏移量,損失函數為:

(15)

誤差ε>0,w和b可以通過求解最小目標函數得到:

(16)

C>0是懲罰因子,在不同的核函數中,徑向基核函數(RBF)因優良的非線性特性而被廣泛應用,其定義為:

(17)

(18)

1.4 SSA-LSTM-SVR模型

SSA-LSTM-SVR模型混合模型由SSA、LSTM和SVR 3個模型組成,SSA-LSTM-SVR模型結構如圖2所示,SSA將網約車出行交通流序列X(t)分解為Γ個分量,第k個分量記為Xk(t)。通常分解得到的第1個分量為原始時間序列的主分量,其余子分量均為隨機分量。由式(7)得知,各分量之和為X(t)。Xi(t)(i∈{1,2,3,…,Γ})所對應的奇異值個數占奇異總數的百分比記為μi,同時通過PSO算法對模型分解參數μi進行優化,μi的和等于1,符合:

圖2 SSA-LSTM-SVR模型結構

(19)

本文根據網約車出行交通流特征將原始序列X(t)分為1個主分量和3個隨機子分量。對于SSA分解后的不同分量Xi(t),根據其規律和特點,采用LSTM模型對規律性和平滑性較強的主分量進行預測,對3個隨機性和突變性較強的隨機分量采用SVR模型預測,最后將所有分量的預測值Yi(t)進行疊加融合,得到原始時間序列X(t)的預測值Y(t),即:

(20)

2 實驗分析

2.1 評估指標

本文采用均方根誤差RMSE、平均絕對誤差MAE、正確率ACC、決定系數R2、平均絕對百分比誤差MAPE這5個評估指標對模型預測性能進行評估。

(21)

(22)

(23)

(24)

(25)

2.2 出行區域劃分

實驗數據采用2017年7、8月份海口市中心區區域網約車出行流量數據,為方便對出行區域進行分析,將海口市中心區域進行網格劃分。每個網格代表一個出行區域。為合理劃分出行區域網格的邊長大小,對2個月內270萬條訂單的出行距離進行統計,3 km(起步標準)以內的出行訂單量約占25%,低于6.8 km的訂單量約占50%,12 km以內的訂單量約占90%,訂單出行的平均距離為6.8 km。可以得知網約車出行主要是短距離出行,據此,選擇以起步價3 km長度為網格邊長,將海口市中心區域劃分為7×12個網格區域,并對劃分后的網格進行編號,劃分結果如圖3所示。

圖3 地圖網格化

2.3 網約車出行流量特征分析

以60 min為時間間隔對各個劃分區域的流量數據進行提取,以編號31網格出行區域為例,抽取了10天的交通流時間序列,如圖4所示,可以看出交通流量每天都在變化,且變化趨勢和規律相對固定,隨機性較強,交通流在一天中會呈現不同狀態,具有明顯的高低峰出行特征。根據出行特征,將一天分為3個時段,其中7∶00—9∶00和18∶00—20∶00為早晚高峰時段,24點至次日7點為休息時段,其他為非高峰時段。

圖4 原始交通流時間序列

圖5展示了7月1日的出行流量在地圖網格化基礎上的熱力圖,可以看出網約車打車出行范圍非常集中,不同出行區域訂單量差距較大。為方便實驗,根據出行區域內訂單量的數量將出行區域分為大量級和中量級。

圖5 出行流量熱力圖

2.4 SSA分解

對編號31出行區域的網約車出行交通流進行SSA分解,以60 min為時間間隔,一天有24個值,選取窗口為24,然后得到組分的數量和權重,分別為μ1=0.3、μ2=0.3、μ3=0.3和μ4=0.1。

SVD首先對交通流序列構建的軌跡矩陣進行分解,尋找并提取交通流序列的內在自相關關系。然后根據這些相關性,通過對序列進行分組、重構和分解,找出序列內在的變化規律和隨機特征,這些步驟將交通流序列分解為不同的分量,有利于突出其各自的規律和特點,弱化分量混雜造成的相互影響。根據交通流的特征,將其分解為1個主分量和3個隨機分量,對于模型來說,LSTM更適合于規律性和平滑性強的主分量,SVR更適合于隨機性和突變性強的隨機分量,圖6中主分量與原始交通流時間序列(圖4)的大小和變化規律與原始交通流基本一致,變化更平穩,因此采用LSTM捕捉這些特征并進行短期預測;而3個隨機分量的幅值小,隨機擾動大,且沒有明顯的變化規律,這些特性會大大增加預測的難度,SVR更適合于隨機性和突變性強的隨機分量。最后將每個分量部分的預測值疊加融合,得到最終預測值。

圖6 交通流SSA分解曲線

2.5 預測結果分析

利用這些分解參數,對市中心區域網約車出行交通流進行分析,選取時間粒度為60 min,根據出行區域量級大小的不同,抽取了部分典型出行區域進行模型預測性能驗證。為了更好地凸顯SSA-LSTM-SVR模型的預測性能,引進了SVR、LSTM、ARIMA、BP、RNN 5個模型進行對比分析:① 自回歸整合移動平均值(ARIMA)模型是把出行流量時間序列分解為線性平穩序列;② BP神經網絡通過反向傳播誤差進行訓練;③ 循環神經網絡(RNN)通常用于處理和預測序列數據。不同量級區域模型預測結果如表1所示。

表1 大/中量級出行區域預測指標結果

可以看出,區域量級的大小會對預測的精度和誤差造成影響,數據稀疏程度越高,誤差會變大,對精度的影響也越大。

對具有規律性、突發性和隨機性等復雜特征的時間序列,單一模型具有局限性,RNN模型由于梯度爆炸問題,導致預測效果不佳;ARIMA模型很難捕捉序列的非線性關系;BP模型訓練效率不高,容易出現過擬合;而SVR與LSTM對交通流中的序列特征均難做到完全捕捉,從而造成誤差增大。

SSA-LSTM-SVR混合模型對交通流序列進行了分解處理,并結合不同模型的特點,可有效捕捉序列特征,預測指標MAE、RMSE和MAPE均為最小,擬合度R2和預測精度均高于其他模型,相比于其他對比模型,SSA-LSTM-SVR模型的MAPE平均下降了4%以上,預測精度平均提高了6%以上,表明SSA-LSTM-SVR模型能夠更好地識別交通流時間序列的短期變化規律,同時也說明SSA-LSTM-SVR模型具有較好的泛化能力和較好的預測性能。

2.6 真實值與預測值對比

為了進一步觀察出行區域預測值和真實值的差異,從不同量級中各抽取了2個典型區域進行對比,從圖7、圖8可以看出SSA-LSTM-SVR的預測值在不同量級區域,都能很好地與真實值擬合,能夠捕捉到時間序列的細微變化,包括高低峰時段的上升和下降的突變趨勢。而SVR、LSTM總體預測誤差較大,尤其是在交通流時間序列發生突變的情況下。隨著交通流量的下降和上升,LSTM和SVR不能很好地捕捉到時間變化趨勢。

圖7 大量級區域真實值預測值曲線

圖8 中量級區域真實值預測值曲線

2.7 分時段預測

為了進一步觀察SSA-LSTM-SVR模型在一天中的預測細節,從不同量級區域中挑選了編號30、31、19、42這4個典型出行區域進行分時段預測,結果如圖9所示,可以看出一天中精度和誤差在不同時段上存在差異,這是因為在不同時段出行流量大小不同,出行流量大的時刻,數據密集程度高,模型訓練效果較好。同時,在不同量級區域,ACC和RMSE指標的變化趨勢相同,表明SSA-LSTM-SVR模型無論數據稀疏大小,都可以很好地捕捉到一天中出行交通量的變化趨勢。

圖9 分時段預測結果曲線

3 結論

網約車出行交通流的短時預測一直是智能交通研究中的重要課題,由于網約車出行交通流的內在復雜性,單一模型的預測精度有限,因此,本文提出了組合預測模型的思想。在SSA-LSTM-SVR中,SSA根據交通流序列的線性自相關進行分量分解,LSTM和SVR分別捕捉不同分量的非線性關系,實驗表明,與RNN模型、ARIMA模型、BP模型、SVR模型以及LSTM模型相比,SSA-LSTM-SVR模型能夠捕獲更多的特征,具有更好的預測性能,預測值與真實值的差值最小,擬合效果最好。SSA-LSTM-SVR模型的MAPE平均下降4%以上,預測精度平均提高6%以上。結果表明,由于時間序列具有規律性、突發性和隨機性等復雜特征,單一模型很難完全捕捉網約車出行復雜交通流序列的特征,采用混合模型進行短期預測效果會更好。

本文只考慮部分典型出行區域的交通流,未來將進一步探討不同出行區域之間交通流的相互影響,實現更準確的短時交通流預測。

猜你喜歡
特征區域模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
關于四色猜想
分區域
基于嚴重區域的多PCC點暫降頻次估計
電測與儀表(2015年5期)2015-04-09 11:30:52
主站蜘蛛池模板: 大香网伊人久久综合网2020| 亚洲色图欧美激情| 久久精品国产亚洲麻豆| 精品少妇人妻一区二区| 老司国产精品视频| 美女视频黄频a免费高清不卡| 久久不卡国产精品无码| 国产成人精品亚洲日本对白优播| 伊人无码视屏| 中文字幕在线日本| 亚洲第一色网站| JIZZ亚洲国产| 国产成人久久综合777777麻豆| 久久国产精品影院| 欧美 国产 人人视频| 亚洲视频二| 永久天堂网Av| 国产一线在线| 全免费a级毛片免费看不卡| 中文字幕在线一区二区在线| 黄色三级网站免费| 久久久精品无码一区二区三区| 久久伊人色| h视频在线播放| 这里只有精品在线| 99九九成人免费视频精品| A级毛片无码久久精品免费| 无码一区18禁| 2021精品国产自在现线看| 97se亚洲综合不卡| 黄色免费在线网址| 国产精品毛片一区| 性色在线视频精品| 无码网站免费观看| 麻豆精品视频在线原创| 婷婷色在线视频| 亚洲男人天堂2018| 91探花国产综合在线精品| 91精品国产福利| 国产成人综合在线观看| 在线观看亚洲精品福利片| 久久性视频| 国产日韩欧美在线视频免费观看| 永久免费无码日韩视频| 亚洲日韩国产精品无码专区| 亚洲第一天堂无码专区| 老司机久久精品视频| a网站在线观看| 99在线观看免费视频| 亚洲欧美成aⅴ人在线观看| 日本成人福利视频| 亚洲一级毛片在线观播放| 国产一区亚洲一区| 久久国产精品嫖妓| 狠狠做深爱婷婷久久一区| 午夜精品久久久久久久2023| yjizz国产在线视频网| 亚洲国产中文精品va在线播放| 四虎影院国产| 亚洲三级a| 美女无遮挡拍拍拍免费视频| 另类欧美日韩| 在线看片免费人成视久网下载 | 超级碰免费视频91| 亚洲国产理论片在线播放| 天堂亚洲网| 国产91在线免费视频| 69免费在线视频| 手机在线免费不卡一区二| 精品無碼一區在線觀看 | 免费一级全黄少妇性色生活片| 久久久精品国产亚洲AV日韩| 国产精品午夜福利麻豆| 久久网欧美| 97在线国产视频| 国产无码精品在线播放 | 亚洲手机在线| 国产精品刺激对白在线| 欧洲av毛片| 中国一级特黄大片在线观看| 欧美啪啪网| 亚洲日韩精品伊甸|