999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于可變形卷積時空網(wǎng)絡(luò)的乘車需求預(yù)測模型*

2021-02-25 12:16:06于瑞云林福郁高寧蔚
軟件學(xué)報(bào) 2021年12期
關(guān)鍵詞:區(qū)域模型

于瑞云,林福郁,高寧蔚,李 婕

1(東北大學(xué) 軟件學(xué)院,遼寧 沈陽 110169)

2(東北大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,遼寧 沈陽 110169)

在城市交通日漸發(fā)達(dá)的今天,建立一個高效的交通系統(tǒng)已成為打造智慧城市的核心問題.準(zhǔn)確的需求預(yù)測模型,成為解決此類問題的關(guān)鍵.如果我們能夠準(zhǔn)確地預(yù)測出乘客的出行需求,就可以預(yù)先分配資源,即可避免空載現(xiàn)象發(fā)生,從而達(dá)到節(jié)約資源、緩解交通壓力的目的.目前,隨著滴滴、Uber 等出租車服務(wù)的日益普及,我們能夠以前所未有的規(guī)模收集大量需求數(shù)據(jù).如何利用大數(shù)據(jù)來更好地預(yù)測交通需求的問題,已經(jīng)引起了人工智能研究界越來越多的關(guān)注.

本文主要研究區(qū)域乘車需求預(yù)測問題,即通過歷史乘車請求數(shù)據(jù)來預(yù)測未來時間的區(qū)域乘車請求數(shù)量.隨著道路上車流量逐年遞增以及乘客對出租車、快車等服務(wù)需求量的不斷增大,乘車服務(wù)供需不匹配的問題逐漸暴露出來.例如:有時候,一些司機(jī)因?yàn)樗趨^(qū)域乘客需求量較少而導(dǎo)致無單可接;同時,由于周邊地區(qū)的乘客需求遠(yuǎn)超過出租車數(shù)量,導(dǎo)致大量乘客在惡劣天氣或高峰時段很難乘車.所以,對出租車、快車等營利性車輛的需求預(yù)測,在近些年就越發(fā)引起研究人員重視.

以往的文獻(xiàn)顯示研究人員已經(jīng)對交通數(shù)據(jù)預(yù)測進(jìn)行了長期研究.其中,預(yù)測對象包括人流量、車流量、出租車需求量等.在研究初期,研究人員把城市進(jìn)行區(qū)塊化處理,并把其中一塊區(qū)域不同時間段的車輛需求數(shù)量看作時間序列,進(jìn)而對時間序列進(jìn)行預(yù)測.比較有代表性的方法為:整合移動平均自回歸模型(ARIMA)[1]及其相關(guān)變種,上述方法已被廣泛應(yīng)用于交通預(yù)測[2,3].在之前的研究基礎(chǔ)上,Abadi 等人[4]、Wu 等人[5]以及Tong 等人[6]意識到天氣、節(jié)假日、場地以及特殊事件等外在因素對城市的交通流量仍具有很大影響,所以就把此類影響因素加入到預(yù)測模型中.雖然研究表明,通過結(jié)合各類外部因素可以改善預(yù)測精度,但它們?nèi)匀粺o法捕捉到復(fù)雜且非線性的時空相關(guān)性.

近幾年,機(jī)器學(xué)習(xí)與深度學(xué)習(xí)在國內(nèi)外科研人員的不懈努力下都取得了突破性的進(jìn)展,同時也給交通流量預(yù)測場景帶來了新的解決方案.Yi 等人[7]與Wang 等人[8]使用深度神經(jīng)網(wǎng)絡(luò)(DNN)對交通流量進(jìn)行預(yù)測并取得了較高的準(zhǔn)確度,但Zhao 等人[9]分別使用馬爾可夫模型與神經(jīng)網(wǎng)絡(luò)(ANNs)模型對出租車需求進(jìn)行預(yù)測,并將結(jié)果進(jìn)行對比,實(shí)驗(yàn)結(jié)果表明,馬爾可夫模型在可預(yù)測性高的場景下效果要好于神經(jīng)網(wǎng)絡(luò)模型.由此可見:在此場景下,簡單的神經(jīng)網(wǎng)絡(luò)并不能捕捉到復(fù)雜的時空相關(guān)性.

然而,深度學(xué)習(xí)在計(jì)算機(jī)視覺領(lǐng)域取得的成就卻給了研究人員新的啟發(fā).例如:可以將整個城市的出租車需求按一定時間段切片,然后把城市每塊區(qū)域內(nèi)的需求數(shù)量看作一個像素點(diǎn),這樣就可以得到一張單位時間內(nèi)的城市出租車需求圖像.給定一組歷史需求圖像,用模型預(yù)測下一個時間戳的出租車需求圖像.其中最典型的模型就包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)[10]以及循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[11]:一些學(xué)者使用CNN 及其變種模型來模擬城市復(fù)雜的空間相關(guān)性[12-14];另一些學(xué)者則使用RNN 以及長短期記憶網(wǎng)絡(luò)(LSTM)[15]模擬城市交通流量的時序性[16-18].與之前的回歸模型、神經(jīng)網(wǎng)絡(luò)等模型相比,這些開創(chuàng)性的嘗試在性能上表現(xiàn)出明顯的優(yōu)越性.然而,這些嘗試都沒有同時考慮到時間和空間的相關(guān)性.近些年,Ke 等人[19]與Zhou 等人[20]則將CNN 與LSTM 相結(jié)合,使用卷積LSTM[21]對出租車需求進(jìn)行預(yù)測并取得了很好的效果.在此基礎(chǔ)上,Yao 等人[22]在AAAI2018 會議中提出在一個聯(lián)合模型中捕捉空間和時間的復(fù)雜非線性關(guān)系,從而對城市交通流量進(jìn)行預(yù)測,其預(yù)測效果較之前模型有很大提升.

但是該類模型也存在不足之處,模型中使用CNN 對城市流量進(jìn)行空間特征提取.眾所周知,傳統(tǒng)CNN 中感受野的形狀是固定的,所以在提取特征信息時,只能提取到關(guān)鍵像素點(diǎn)與其相鄰區(qū)域內(nèi)的特征信息.然而就實(shí)際情況而言,某一塊區(qū)域內(nèi)的交通情況可能與另一塊相距較遠(yuǎn)的區(qū)域有很大關(guān)聯(lián)[23].如圖1 所示,這是將地圖網(wǎng)格化處理后,兩塊在11×11 范圍內(nèi)且曼哈頓距離大于4 的區(qū)域乘車需求對比圖.由圖可得,兩塊區(qū)域在高峰時期需求趨勢相似.然而這僅為可以被可視化的顯性關(guān)聯(lián),還有很多隱性關(guān)聯(lián)隱含在數(shù)據(jù)中.如果使用CNN 進(jìn)行空間特征提取,很可能使這些關(guān)聯(lián)在池化層進(jìn)行下采樣時被模糊掉,最終導(dǎo)致空間特征提取結(jié)果存在誤差.

Fig.1 Comparison of demand in different regions圖1 不同區(qū)域需求對比

文獻(xiàn)[23-25]將算計(jì)視覺領(lǐng)域的圖卷積網(wǎng)絡(luò)(GCN)[26]應(yīng)用到交通流量預(yù)測領(lǐng)域,以嘗試解決上述問題.實(shí)驗(yàn)表明,其在空間特征提取上有了很大的改善.但GCN 在交通流量預(yù)測領(lǐng)域的應(yīng)用還不完善,例如無法很好地獲取各個時間片圖之間的時間特征,并且部分該類模型也沒有考慮到城市中興趣點(diǎn)(POI)對乘車需求的影響.大量的調(diào)研[27]結(jié)果也證實(shí)了POI 對交通流量存在不可忽視的影響.

為解決以上問題,本文提出了可變形卷積時空網(wǎng)絡(luò)(deformable convolution spatial-temporal network,簡稱DCSN)模型.其使用可變形卷積網(wǎng)絡(luò)(DCN)[28]與LSTM 共同捕捉空間和時間的復(fù)雜非線性關(guān)系,并使用圖結(jié)構(gòu)來模擬各區(qū)域間POI 和出租車需求的相似關(guān)系.如圖2 所示:之所以使用DCN 來對城市交通空間特征進(jìn)行提取,因?yàn)镈CN 可以改變卷積核映射在目標(biāo)圖像上感受野的形狀,使得不相鄰且相對較遠(yuǎn)的兩塊區(qū)域的空間特征也能保留下來,進(jìn)而解決傳統(tǒng)CNN 模型提取城市交通流量空間特征信息時誤差較大的問題.但如果將整個城市的出租車需求視為圖像并在此圖像上應(yīng)用DCN 模型,是無法取得最佳效果的.因?yàn)橥ㄟ^研究發(fā)現(xiàn),在預(yù)測目標(biāo)區(qū)域中包含相關(guān)性較弱的區(qū)域?qū)嶋H上會損害模型性能、降低預(yù)測準(zhǔn)確度.所以,本文借鑒了Yao 等人[22]論文中僅對局部區(qū)域做特征提取的方法,僅對要預(yù)測目標(biāo)附近區(qū)域使用DCN 模型.然而所選區(qū)域的大小對模型至關(guān)重要,本文對其大小進(jìn)行對比實(shí)驗(yàn),既保證DCN 在CNN 的基礎(chǔ)上提取到更多不相鄰的空間特征,也保證DCN 模型不被相關(guān)性較弱的區(qū)域影響.只對目標(biāo)附近區(qū)域做特征提取顯然是不夠全面的,通過研究[6,22]發(fā)現(xiàn):POI 整體差異較小且乘車需求波動相似的兩塊區(qū)域,在需求預(yù)測問題上可以為彼此提供助力.所以,本文對距預(yù)測目標(biāo)較遠(yuǎn)區(qū)域基于POI 差異進(jìn)行需求建模,通過圖結(jié)構(gòu)來捕捉兩個區(qū)域需求的潛在關(guān)系,并使用嵌入算法將區(qū)域信息以向量形式嵌入到模型中.本文使用滴滴出行的真實(shí)訂單數(shù)據(jù)進(jìn)行大量實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,本文提出的方法優(yōu)于其他現(xiàn)有車輛需求預(yù)測方法.

Fig.2 Comparison of convolution patterns between CNN and DCN圖2 CNN 與DCN 的卷積模式對比

本文的主要貢獻(xiàn)概括如下:

? 本文提出,使用由可變形卷積時空模型以及POI 需求關(guān)聯(lián)模型組成的聯(lián)合模型來對區(qū)域車輛需求進(jìn)行預(yù)測,它同時考慮了時間、空間以及不同區(qū)域的需求關(guān)聯(lián)性等因素;

? 在可變形卷積時空模型中,使用DCN 與LSTM 提取時空特征;在POI 需求關(guān)聯(lián)模型中,使用區(qū)域間的POI 差異化指數(shù)以及需求差異化指數(shù)來捕捉區(qū)域間的需求相似關(guān)系.

1 相關(guān)工作

交通流量預(yù)測問題在眾多研究學(xué)者多年來的探索實(shí)踐下,取得了許多突破性的進(jìn)展.從傳統(tǒng)統(tǒng)計(jì)學(xué)方法到機(jī)器學(xué)習(xí)與深度學(xué)習(xí),都在使預(yù)測精度逐漸提高.本節(jié)將主要討論與交通流量預(yù)測的相關(guān)工作.

Li 等人[2]提出了一種基于ARIMA 的預(yù)測方法來預(yù)測熱點(diǎn)地區(qū)乘客的時空變化,以幫助司機(jī)找到他們的下一位乘客.Moreira-Matias 等人[3]使用滑動窗口集合框架,將時變泊松模型、加權(quán)時變泊松模型和ARIMA 模型相結(jié)合,對乘客需求進(jìn)行預(yù)測,并取得了不錯的效果.

Abadi 等人[4]進(jìn)一步考慮了外部環(huán)境數(shù)據(jù)(例如場地以及特殊事件等)對交通流量預(yù)測的影響,并基于自回歸模型對交通流量進(jìn)行預(yù)測.Wu 等人[5]通過實(shí)驗(yàn)揭示了天氣與城市交通數(shù)據(jù)間隱藏的相關(guān)性.Tong 等人[6]結(jié)合POI 信息提出具有高維度特征的統(tǒng)一線性回歸模型LinUOTD,并設(shè)計(jì)了一系列的優(yōu)化技術(shù)來對模型進(jìn)行有效的訓(xùn)練和更新.模型突出的靈活性,使其在交通流量預(yù)測場景取得不錯的效果.雖然此類方法結(jié)合外部因素使預(yù)測精度有所提升,但它們?nèi)匀粺o法捕捉到復(fù)雜且非線性的時空相關(guān)性.

隨著機(jī)器學(xué)習(xí)與深度學(xué)習(xí)的飛速發(fā)展,研究人員們嘗試使用神經(jīng)網(wǎng)絡(luò)解決交通流量預(yù)測問題.Yi 等人[7]使用實(shí)時交通數(shù)據(jù)利用DNN 對交通流量進(jìn)行預(yù)測,其實(shí)驗(yàn)結(jié)果表明,該模型具有較高的準(zhǔn)確性.Wang 等人[8]受到殘差神經(jīng)網(wǎng)絡(luò)(ResNet)[23]的啟發(fā),提出一個名為“深度供需(DeepSD)”的端到端框架,其框架具有高度的靈活性和可擴(kuò)展性,可利用多個數(shù)據(jù)源(例如打車指令、天氣數(shù)據(jù)和交通數(shù)據(jù))來實(shí)現(xiàn)對交通流量的高精度預(yù)測.Zhao等人[9]使用ANN 模型對出租車需求進(jìn)行預(yù)測,實(shí)驗(yàn)結(jié)果表明:在可預(yù)測性高的場景下,馬爾可夫模型預(yù)測精度為89%,比神經(jīng)網(wǎng)絡(luò)模型高11%.可見,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在此場景下表現(xiàn)并不理想.

進(jìn)而,研究人員又把目光投向了近些年在計(jì)算機(jī)視覺領(lǐng)域聲名鵲起的CNN.Wang 等人[12]和Zhang 等人[13]將城市交通流量視為圖片,進(jìn)而使用CNN 及其變種ResNet[29]對交通流量進(jìn)行預(yù)測.Liu 等人[14]提出一個面向時空數(shù)據(jù)的大規(guī)模車輛需求預(yù)測集成框架,其使用注意力機(jī)制將多個基礎(chǔ)模型和3 個注意力模塊(通道注意力模塊、空間注意力模塊和位置注意力模塊)組合在一起,進(jìn)而提高原有基礎(chǔ)模型的性能.其中,空間注意力模塊使用卷積網(wǎng)絡(luò)進(jìn)行空間特征提取.以上方法都取得了很好的成績,但因?yàn)閭鹘y(tǒng)CNN 固定的卷積模式,導(dǎo)致提取空間特征時產(chǎn)生了一定的誤差;此外,雖然這些方法確實(shí)使用歷史時間戳的交通圖像進(jìn)行預(yù)測,但它們沒有明確地模擬時序依賴性.進(jìn)而,Zhao 等人[18]使用LSTM 網(wǎng)絡(luò)通過由許多存儲器單元組成的二維網(wǎng)絡(luò)來模擬交通系統(tǒng)中的時空相關(guān)性,進(jìn)而對交通流量進(jìn)行預(yù)測.遺憾的是:他們在考慮交通流量的時序變化時僅模擬了單塊區(qū)域的時序依賴性,卻忽略了各個區(qū)域間的空間關(guān)聯(lián)性.

通過多年的不懈研究和不斷改進(jìn),終于有學(xué)者將時序依賴性和空間關(guān)聯(lián)性結(jié)合到一起.Ke 等人[19]與Zhou等人[20]使用卷積LSTM 來處理出租車需求預(yù)測的時空依賴性.在此基礎(chǔ)上,Yao 等人[22]提出了一個深度多視圖時空網(wǎng)絡(luò)(DMVST-Net)框架來模擬空間和時間關(guān)系,從而對出租車需求進(jìn)行預(yù)測.其模型包括3 個視圖:時間視圖、空間視圖和語義視圖.通過使用大量真實(shí)出租車數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),證明該模型預(yù)測效果優(yōu)于上述方法.然而該模型也存在不足之處,如未解決傳統(tǒng)CNN 在交通流量預(yù)測場景下的誤差問題以及并未考慮城市中POI 對出租車需求的影響等.

總體來說,與上述研究方法相比,本文提出的DCSN 模型創(chuàng)新點(diǎn)在于設(shè)計(jì)并結(jié)合了可變形卷積時空模型與POI 需求關(guān)聯(lián)模型.即:使用DCN 與LSTM 共同捕捉空間和時間的復(fù)雜非線性關(guān)系,并基于POI 差異指數(shù)以及歷史需求差異指數(shù)對不同區(qū)域需求相似性進(jìn)行建模.最后將兩個模型輸出,通過全連接神經(jīng)網(wǎng)絡(luò)得出最終的預(yù)測結(jié)果.

2 算法設(shè)計(jì)

圖3 展示了本文所提出的DCSN 模型總體框架圖,其主要由兩部分組成,分別為可變形卷積時空模型與POI需求關(guān)聯(lián)模型.其中,可變形卷積時空模型包括DCN 與LSTM,使用DCN 卷積對不同時間片同一塊區(qū)域做空間特征提取.輸出的特征向量與當(dāng)前時間片的天氣、溫度等上下文特征相連接作為LSTM 中一個時間單元的輸入,可變形卷積時空模型最終的輸出為時空特征向量.POI 需求關(guān)聯(lián)模型首先構(gòu)建區(qū)域的加權(quán)圖(POI 差異指數(shù)和歷史需求差異指數(shù)為權(quán)重影響因子);將所要預(yù)測的區(qū)域節(jié)點(diǎn)編碼為向量,將兩個模型輸出的向量相連接,再使用全連接網(wǎng)絡(luò)進(jìn)行聯(lián)合訓(xùn)練;最后,得出區(qū)域需求預(yù)測結(jié)果.

Fig.3 DCSN model overall architecture diagram圖3 DCSN 模型整體架構(gòu)圖

2.1 問題定義

本小節(jié)將對出租車需求預(yù)測問題進(jìn)行定義.將地圖進(jìn)行網(wǎng)格化處理.L={l1,l2,…,ln}為城市地圖中的所劃分的區(qū)域集合,其中,n為將地圖劃分的網(wǎng)格數(shù)量;T={t1,t2,…,tm}為按相等時間間隔劃分的時間片集合,其中,m為時間片數(shù)量總和.解決區(qū)域出租車需求預(yù)測問題的實(shí)質(zhì),即為使用前h個時間片的乘車需求來預(yù)測第h+1 個時間節(jié)點(diǎn)該區(qū)域的需求數(shù)量.結(jié)合本文提出的模型,其主要問題具體可表達(dá)為

其中,

?PL為區(qū)域的POI 信息.

公式中,h為時間步長.公式整體意為:將前h個時間片的乘車需求信息、天氣信息以及區(qū)域POI 信息輸入到本模型中,最終得出當(dāng)前區(qū)域下一時間片的出租車需求數(shù)量.

2.2 可變形卷積時空模型

可變形卷積時空模型由時間和空間兩部分組成,如圖3 所示.本文使用DCN 對地圖區(qū)域中的需求進(jìn)行空間特征提取,進(jìn)而將其結(jié)果應(yīng)用于LSTM 模型中模擬出租車需求的時間依賴性.接下來,本小節(jié)將著重對這兩個部分進(jìn)行分析講解.

2.2.1 空間特征:局部DCN 模型

DCN 在CNN 的基礎(chǔ)上引入了兩個全新的模塊(即可變形卷積模塊與可變形RoI 池化模塊),其主要思想為:從目標(biāo)任務(wù)中學(xué)習(xí)偏移量,然后使用額外的偏移量來改變模型中的空間采樣位置,從而有效提升CNN 的泛化能力.本文研究發(fā)現(xiàn),DCN 通過學(xué)習(xí)偏移量改變感受野范圍的特性.在此場景下,能更好地模擬空間相關(guān)性,從而提取出更為準(zhǔn)確的特征信息.

本文使用DCN 對地圖區(qū)域間的需求進(jìn)行空間特征提取時,借鑒Yao 等人[22]論文中所使用的局部分解方法,僅將要預(yù)測的區(qū)域以及其周圍信息輸入到模型中.在不同的時間片中,本文將每個區(qū)域及其周圍鄰域的乘車需 求數(shù)量視為具有一個通道的s×s圖像集合(圖像中,城市邊界缺失部分用0 補(bǔ)齊),其中,尺寸s控制空間粒度.對于區(qū)域i的不同時間片t,都可以得到二維張量圖像,進(jìn)而將輸入到DCN 模型中進(jìn)行卷積.對于中一個像素x0的卷積操作可表示為

其中,R={(-1,-1),(-1,0),…,(0,0),…,(1,0),(1,1)}表示卷積核為3×3 的感受野網(wǎng)格,網(wǎng)格中心點(diǎn)坐標(biāo)(0,0)映射到要做卷積操作的像素點(diǎn)x0.W(·)表示獲取卷積核中對應(yīng)位置的卷積權(quán)重,d(·)表示獲取張量圖像中對應(yīng)像素點(diǎn)的值.DCN 與CNN 的主要差別就在于Δrn,即為上文所提到的偏移量,通過對像素點(diǎn)周圍部分圖像卷積所得.具體形式為二通道矩陣,分別對應(yīng)橫縱坐標(biāo)偏移量.

對單一像素點(diǎn)的卷積過程如圖4 所示.

Fig.4 Deformable convolution process schematic圖4 可變形卷積過程示意圖

本文將區(qū)域i不同時間片t的乘車需求特征圖饋送到K個卷積層,第k層卷積表達(dá)式如下:

2.2.2 時間特征:LSTM 模型

本文使用LSTM 來捕獲乘車需求時序相關(guān)性,該模塊的基本表達(dá)式為

2.3 POI需求關(guān)聯(lián)模型

本文通過研究發(fā)現(xiàn),空間上不相近的兩塊區(qū)域在乘車需求上也可能存在相似關(guān)系.例如:大型商場所在的區(qū)域在周末可能具有較高的乘車需求,而居民區(qū)所在的區(qū)域在工作日的清晨將迎來乘車需求高峰等.因?yàn)榍懊嫠岬降木植緿CN 模型僅提取目標(biāo)像素點(diǎn)鄰近區(qū)域的空間相似性,所以本文從POI 以及歷史需求兩個方面來提取較遠(yuǎn)區(qū)域間的相似關(guān)系.這樣即可與局部DCN 模型相互補(bǔ)充,使模型預(yù)測結(jié)果更加準(zhǔn)確.

因?yàn)樵诘貓D中每塊區(qū)域皆可互通,所以本文將目標(biāo)地圖按區(qū)域劃分后轉(zhuǎn)換成一張無向完全圖,具體定義為G=(V,E,W).V為節(jié)點(diǎn)集合,對應(yīng)城市地圖中的所劃分的區(qū)域集合L;E為圖中點(diǎn)與點(diǎn)之間邊的集合;W為每條邊上的權(quán)重,即表示兩個區(qū)域之間的相似程度.W的表達(dá)式為

其中,Dm與Pij分別為區(qū)域間的POI 差異化指數(shù)與需求差異化指數(shù),將在接下來的部分著重講解求解方法.δ(·)為min-max 標(biāo)準(zhǔn)化方法,為了避免因兩個差異化指數(shù)數(shù)值上差距過大從而對結(jié)果造成影響;α則是為了權(quán)衡兩種差異化指數(shù)對權(quán)重大小的影響,本文通過多次實(shí)驗(yàn)得出,當(dāng)α取值在0.4 與0.6 之間時,模型準(zhǔn)確性最高,所以本文將其最優(yōu)區(qū)間平均數(shù)0.5 作為α的最終取值.

2.3.1 區(qū)域POI 差異化指數(shù)

現(xiàn)實(shí)生活中,POI 對其所在的區(qū)域乘車需求影響非常大,所以本文提取不同區(qū)域間的POI 相似性,并將其嵌入到模型中.本模塊著重考慮地鐵站、公交車站、旅游景點(diǎn)、大型商場、醫(yī)院、學(xué)校以及居民區(qū)這七類不易變更的POI,使用線性神經(jīng)網(wǎng)絡(luò)模型[30]提取不同種類POI 對乘車需求的影響權(quán)重.其中,線性神經(jīng)網(wǎng)絡(luò)的輸入為各個區(qū)域不同種類POI 的數(shù)量以及當(dāng)前區(qū)域各個時間片乘車需求數(shù)量的總和,訓(xùn)練得出的不同種類POI 對乘車需求的影響權(quán)重即為所求.表達(dá)式如下:

2.3.2 區(qū)域需求差異化指數(shù)

經(jīng)本文研究發(fā)現(xiàn):在捕捉兩個區(qū)域的相似關(guān)系時,不僅要從POI 功能的角度出發(fā),還應(yīng)該考慮兩個區(qū)域需求序列的相似性.本模塊以周為單位對各個模塊每個時間片的乘車需求數(shù)量取平均值,得出各區(qū)域一天的需求序列.進(jìn)而對不同區(qū)域間的需求序列使用動態(tài)時間規(guī)整算法(DTW)[31]求出區(qū)域需求差異化指數(shù),其計(jì)算公式如下:

其中,Si,Sj代表兩個不同區(qū)域的平均需求序列,DTW(·)為動態(tài)時間規(guī)整算法,Dm即為所求區(qū)域需求差異化指數(shù).

得到區(qū)域POI 差異化指數(shù)Pij及區(qū)域需求差異化指數(shù)Dm后,即可使用公式(5)完成無向完全圖中,邊權(quán)重W的計(jì)算.在獲取完整的圖信息后,本文使用Node2vec 圖嵌入方法[32]將區(qū)域節(jié)點(diǎn)i轉(zhuǎn)化為多維向量gi.為使嵌入的多維向量gi能與整個網(wǎng)絡(luò)架構(gòu)進(jìn)行協(xié)同訓(xùn)練,本模塊將區(qū)域節(jié)點(diǎn)i的特征向量饋送到全連接層,其公式定義為

其中,Wpd與bpd都為可學(xué)習(xí)的參數(shù),即為整個POI 需求關(guān)聯(lián)模型的輸出.

2.4 模型整合

為了使前面兩小節(jié)的模型相關(guān)聯(lián),本小節(jié)將可變形卷積時空模型輸出的特征向量與POI 需求關(guān)聯(lián)模型輸出的特征向量相連接,進(jìn)而得到向量.此時,已經(jīng)包含區(qū)域i的時空以及POI 等特征,最后將其饋送到全連接網(wǎng)絡(luò)以獲取區(qū)域i的最終需求預(yù)測值.最終預(yù)測函數(shù)如下:

其中,Wf與bf都為可學(xué)習(xí)的參數(shù).因?yàn)檎鎸?shí)的需求值經(jīng)過標(biāo)準(zhǔn)化處理,所以σ(·)為Sigmoid函數(shù)使最終輸出的 區(qū)間為[0,1],目的為使整個模型更快收斂.模型使用的損失函數(shù)定義為

其中,γ為超參數(shù).上述損失函數(shù)實(shí)際由均方誤差和平均絕對百分誤差兩部分組成.因?yàn)榫秸`差易受極端值影響,為了避免訓(xùn)練被大值樣本支配,所以引入平均絕對百分誤差.

3 實(shí)驗(yàn)與結(jié)果分析

3.1 數(shù)據(jù)集處理

本文使用快車平臺真實(shí)的訂單軌跡數(shù)據(jù)CD2Data 與XA2Data 來驗(yàn)證模型的有效性,數(shù)據(jù)集來自滴滴出行“蓋亞”數(shù)據(jù)開放計(jì)劃.

? CD2Date:數(shù)據(jù)為2016 年10 月和11 月成都市二環(huán)部分區(qū)域快車平臺訂單數(shù)據(jù);

? XA2Date:數(shù)據(jù)為2016 年10 月和11 月西安市二環(huán)部分區(qū)域快車平臺訂單數(shù)據(jù).

本文將兩個數(shù)據(jù)集中2016 年10 月8 日至2016 年11 月23 日(共47 天)的數(shù)據(jù)作為訓(xùn)練集,2016 年11 月24 日至2016 年11 月30 日(共7 天)的數(shù)據(jù)作為測試集.數(shù)據(jù)集中,2016 年國慶假期期間的數(shù)據(jù)因?yàn)檩^平時相比波動過大所以舍棄.處理數(shù)據(jù)時,本文將兩個數(shù)據(jù)集所對應(yīng)的區(qū)域進(jìn)行網(wǎng)格化處理,劃分成20×20 個小區(qū)域.并且僅將早6 點(diǎn)到晚21 點(diǎn)之間的數(shù)據(jù)作為觀測數(shù)據(jù),每個時間片的時間跨度設(shè)為半小時.進(jìn)而提取出每塊區(qū)域每個時間片的需求數(shù)量.值得注意的是:因?yàn)楸疚闹饕治龅膯栴}為乘車需求預(yù)測,所以訂單的位置以乘客的初始位 置為準(zhǔn).最后將單位需求數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,進(jìn)而得到所有區(qū)域單個時間片的需求數(shù)據(jù)集合.DCSN 模型 除了應(yīng)用到了乘車的軌跡數(shù)據(jù),還應(yīng)用了外部數(shù)據(jù)以及城市的POI 數(shù)據(jù).本文將天氣等外部離散數(shù)據(jù)轉(zhuǎn)化為One-Hot 向量嵌入到模型中;POI 數(shù)據(jù)則使用百度地圖信息檢索功能獲取,同樣將其進(jìn)行網(wǎng)格劃分,進(jìn)而統(tǒng)計(jì)每塊區(qū)域的POI 種類及數(shù)量.

當(dāng)測試預(yù)測結(jié)果時,本文使用待預(yù)測時間片的前8 個時間片(即前4 小時)來對該區(qū)域接下來的乘車需求進(jìn)行預(yù)測.并且在實(shí)驗(yàn)過程中,本文過濾掉了區(qū)域需求小于5 的樣本,這是工業(yè)中常用的做法.因?yàn)樵诂F(xiàn)實(shí)生活的應(yīng)用程序中,人們并不關(guān)心這種低需求場景.

3.2 實(shí)驗(yàn)參數(shù)設(shè)置

本文基于Tensorflow 和Keras 框架實(shí)現(xiàn)DCSN 模型.在空間特征提取時,控制輸入特征圖大小的s取11,即對目標(biāo)及其周圍11×11 的區(qū)域進(jìn)行空間特征提取.在DCN 模型中,本文將卷積層數(shù)K設(shè)為3,濾波器大小設(shè)為3×3,濾波器數(shù)量設(shè)為64.經(jīng)過多次對比實(shí)驗(yàn)后,本文將LSTM 模型中時間步長h設(shè)為8.在DCSN 模型中,除了作為最終預(yù)測組件的全連接層,其中的激活函數(shù)為Sigmoid函數(shù),其余全連接層中的激活函數(shù)皆為ReLU函數(shù).模型的損失函數(shù)已在第2.4 節(jié)中具體說明,模型使用的優(yōu)化算法為Adam.

本文使用平均絕對百分比誤差(MAPE)和均方誤差(RMSE)作為評價指標(biāo),其具體計(jì)算公式下:

3.3 對比實(shí)驗(yàn)結(jié)果分析

本小節(jié)將DCSN 模型與以下5 種主流及最新的交通流量預(yù)測方法進(jìn)行比較.

? 歷史均值法(HA):使用歷史流量的平均值來作為下一時間片的預(yù)測值.此處,本文同樣使用前8 個時間片的歷史數(shù)據(jù)來預(yù)測下一時間片的乘車需求數(shù)量;

? ARIMA 是一種眾所周知的時間序列預(yù)測模型,它結(jié)合了移動平均和自回歸分量來建模時間序列;

? LSTM 在傳統(tǒng)RNN 的基礎(chǔ)上改進(jìn),新增遺忘門等機(jī)制,有效解決傳統(tǒng)RNN 所存在的梯度爆炸和梯度消失等問題.作為目前解決時間序列預(yù)測問題的主流算法之一;

? ST-ResNet[13]:ST-ResNet 是一種基于深度學(xué)習(xí)的流量預(yù)測方法,該方法將不同時間片的城市交通流量繪制成圖像,然后使用殘差神經(jīng)網(wǎng)絡(luò)提取圖像特征,進(jìn)而完成流量預(yù)測;

? DMVST-Net[22]:DMVST-Net 是一種基于多視圖的深度學(xué)習(xí)框架,用于出租車需求預(yù)測.它由3 個不同的視圖組成,分別為時間視圖、空間視圖和語義視圖.

為了對比公平,在實(shí)驗(yàn)時,除HA 與ARIMA 外的其他算法都使用公式(11)所定義的損失函數(shù).DCSN 模型與其他5 個主流交通流量預(yù)測方法性能對比見表1.

Table 1 Performance comparison of different approaches表1 不同方法性能對比

表1 顯示了本文所提出的模型與其他基準(zhǔn)算法在數(shù)據(jù)集CD2Data 與XA2Data 上的性能對比.DCSN 模型在所有方法中實(shí)現(xiàn)了最低的MAPE 和最低的RMSE.更具體地說,HA 和ARIMA 等傳統(tǒng)方法因?yàn)橥耆蕾囉跉v史需求值并且建模能力有限,所以預(yù)測表現(xiàn)不佳.LSTM 與ST-ResNet 在預(yù)測時考慮空間特征和時間特征對交通流量的影響,使預(yù)測誤差較傳統(tǒng)方法大大降低,但并未將二者相結(jié)合.DMVST-Net 模型使用三層視圖將時空特征以及外部特征相融合,取得了非常不錯的預(yù)測效果.本文所提出的DCSN 模型在DMVST-Net 模型的基礎(chǔ)上進(jìn)行改進(jìn),使用DCN 進(jìn)行空間特征提取,并將POI 對乘車需求的影響因素加入到模型中,使模型的預(yù)測性能進(jìn)一步提升.

DCSN 模型的平均訓(xùn)練時長為47.2s/輪,基準(zhǔn)算法中效果最好的DMCVST-Net 模型的平均訓(xùn)練時長為45.4s/輪.因?yàn)槭褂肈CN 代替了CNN 并加入了POI 需求關(guān)聯(lián)模型,所以使前者的模型復(fù)雜性略高于后者.但整體訓(xùn)練時長差距不大,且DCSN 模型準(zhǔn)確性得到顯著提升.

3.4 消融實(shí)驗(yàn)結(jié)果分析

本文為了研究DCSN 模型內(nèi)部各改進(jìn)之處對性能的影響,在CD2Data 數(shù)據(jù)集下分別對其進(jìn)行消融實(shí)驗(yàn).

? CLN:僅包含時空模型,但將本文的可變形卷積時空模型中的DCN 用傳統(tǒng)CNN 替代.即,僅使用CNN和LSTM 的組合對乘車需求進(jìn)行預(yù)測;

? DLN:僅使用本文所提出的可變形卷積時空模型對乘車需求進(jìn)行預(yù)測,不包含POI 需求關(guān)聯(lián)模型;

? CLMN:在CLN 的基礎(chǔ)上添加需求關(guān)聯(lián)模塊,但公式(5)中α取1,即,僅考慮區(qū)域需求差異化指數(shù)對模型的影響;

? DLMN:在DLN 的基礎(chǔ)上添加需求關(guān)聯(lián)模塊,同樣,α取1;

? CLPDN:在CLN 模型的基礎(chǔ)上加入本文所提出的POI 需求關(guān)聯(lián)模型;

? DCSN:為本文所提出的完整模型.

此外,本文還對DCSN 模型中所使用的損失函數(shù)進(jìn)行消融實(shí)驗(yàn),以找出最優(yōu)的損失函數(shù).所作對比如下.

? LMSE:僅使用最常用的均方誤差(MSE)作為模型的損失函數(shù);

? LMAPE:僅使用MAPE 作為模型的損失函數(shù);

?L:模型最終使用的損失函數(shù),結(jié)合了均方誤差和平均絕對百分誤差,其中,γ取0.01.具體形式已在第2.4節(jié)中詳細(xì)說明.

各方案性能對比如圖5 所示.

Fig.5 Improved program performance comparison chart圖5 改進(jìn)方案性能對比圖

DLN 模型在CLN 模型的基礎(chǔ)上將卷積神經(jīng)網(wǎng)絡(luò)改進(jìn)為可變形卷積神經(jīng)網(wǎng)絡(luò),從結(jié)果來看,模型整體效果有所提升.所以可以證明:可變形卷積神經(jīng)網(wǎng)絡(luò)在此場景下提取空間特征信息,可以取得很好的效果.CLMN 模型與DLMN 模型在DLN 模型與CLN 模型的基礎(chǔ)上加入了僅考慮區(qū)域需求差異化指數(shù)的需求關(guān)聯(lián)模型,使得模型的準(zhǔn)確性得到顯著提升.最后兩個模型則在前兩個模型的基礎(chǔ)上加入了完整的POI 需求關(guān)聯(lián)模型,從圖中可以看出,預(yù)測誤差大大減小,證明了在POI 需求關(guān)聯(lián)模型中POI 差異化指數(shù)的必要性.POI 需求關(guān)聯(lián)模型既將POI對乘車需求的影響因素加入到模型中,又彌補(bǔ)了局部DCN 模型在空間上的距離局限性.同時可以看出,本文所使用的損失函數(shù)L效果最好.所以綜上所述,當(dāng)前DCSN 模型效果最佳.

本文還在實(shí)驗(yàn)過程中對DCN 模型中輸入特征圖尺寸s的大小以及濾波器的大小做了調(diào)優(yōu)實(shí)驗(yàn).特征圖的尺寸對局部DCN 模型很重要,這決定模型將提取目標(biāo)區(qū)域周圍多大范圍內(nèi)的空間特征信息.同樣,濾波器的大小本身也是DCN 模型的重要屬性,所以在CD2Data 數(shù)據(jù)集下對其進(jìn)行調(diào)優(yōu)實(shí)驗(yàn).卷積層數(shù)都設(shè)為3,具體實(shí)驗(yàn)結(jié)果如圖6 所示.

Fig.6 Tuning experiment results comparison chart圖6 調(diào)優(yōu)實(shí)驗(yàn)結(jié)果對比圖

由實(shí)驗(yàn)結(jié)果可以得出,DCN 模型中輸入特征圖尺寸s取11 并且濾波器尺寸為3×3 時模型性能最佳,故模型實(shí)驗(yàn)最終采用此參數(shù).

本文研究發(fā)現(xiàn),時間步長h是進(jìn)行時間特征提取的重要參數(shù).為了確定其對模型性能的影響,所以本文在CD2Data 數(shù)據(jù)集下對h的不同取值進(jìn)行對比實(shí)驗(yàn).具體實(shí)驗(yàn)結(jié)果見表2.

Table 2 Performance comparison of different sequence length表2 不同時間步長性能對比

由表2 可以得出,模型誤差整體上隨時間步長h的增長而下降.由此可以說明時間步長對時間特征提取的重要性.當(dāng)時間步長為8 時,模型性能最佳.此外,h增加到8 以上時模型性能略有下降.一個潛在的原因是:在考慮更長的時間依賴性時,需要學(xué)習(xí)更多的參數(shù),進(jìn)而使訓(xùn)練變得更加困難.

4 總 結(jié)

本文在乘車需求預(yù)測場景下對傳統(tǒng)時空模型進(jìn)行改進(jìn),提出多組件的可變形卷積時空網(wǎng)絡(luò)DCSN.本模型將傳統(tǒng)時空模型中的卷積神經(jīng)網(wǎng)絡(luò)改進(jìn)為可變形卷積神經(jīng)網(wǎng)絡(luò),使對目標(biāo)區(qū)域的空間特征提取效果得到提升.本文還將POI 對乘車需求的影響因素加入到模型中,彌補(bǔ)了局部DCN 模型在空間上的距離局限性,使DCSN 模型效果優(yōu)于其他已有的乘車需求預(yù)測方法.

未來,本文將在兩個主要方面對模型進(jìn)行改進(jìn).將更多對乘車需求有顯著影響的外部因素進(jìn)行更合適的建模,并將其嵌入到模型中;本文在進(jìn)行預(yù)測時僅考慮了近4 個小時的歷史需求對未來需求的影響,在接下來的研究中,本文將進(jìn)一步考慮長周期(如日或周)歷史數(shù)據(jù)對未來需求的影響并將其加入到模型中,使預(yù)測結(jié)果更加準(zhǔn)確.

致謝實(shí)驗(yàn)數(shù)據(jù)來自滴滴出行“蓋亞”數(shù)據(jù)開放計(jì)劃.

猜你喜歡
區(qū)域模型
一半模型
永久基本農(nóng)田集中區(qū)域“禁廢”
分割區(qū)域
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
3D打印中的模型分割與打包
關(guān)于四色猜想
分區(qū)域
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
基于嚴(yán)重區(qū)域的多PCC點(diǎn)暫降頻次估計(jì)
電測與儀表(2015年5期)2015-04-09 11:30:52
主站蜘蛛池模板: 国产精品亚洲va在线观看| 99伊人精品| 网友自拍视频精品区| 欧美综合区自拍亚洲综合天堂| 色综合久久综合网| 日本一区中文字幕最新在线| 高清色本在线www| 欧美激情二区三区| 免费观看男人免费桶女人视频| 久久永久免费人妻精品| 日本高清有码人妻| 中文精品久久久久国产网址 | 国产99视频精品免费视频7| 无码AV高清毛片中国一级毛片| 成人免费一区二区三区| 久久99国产精品成人欧美| 免费一级毛片在线观看| 精品综合久久久久久97超人| 日韩色图在线观看| 99视频在线观看免费| 久久狠狠色噜噜狠狠狠狠97视色| 亚洲精品爱草草视频在线| 亚洲无码四虎黄色网站| 国产成人福利在线视老湿机| 粉嫩国产白浆在线观看| 国内熟女少妇一线天| 国产成人一二三| 亚洲swag精品自拍一区| 久久精品中文字幕免费| 国产极品美女在线播放| 国产在线自乱拍播放| 国产欧美成人不卡视频| 国产91小视频| 国产一级一级毛片永久| 亚洲欧美日韩中文字幕一区二区三区| 91口爆吞精国产对白第三集| 无码AV日韩一二三区| 成年av福利永久免费观看| 手机成人午夜在线视频| 在线永久免费观看的毛片| 99激情网| 亚洲欧洲综合| 精品视频福利| 中文字幕日韩丝袜一区| 最新国产网站| 国产精品熟女亚洲AV麻豆| 国产哺乳奶水91在线播放| 欧美日韩精品一区二区视频| 国产福利一区在线| 国产高清在线观看91精品| 中国国语毛片免费观看视频| 免费一级毛片在线播放傲雪网| jizz在线免费播放| 亚洲视频在线青青| 狠狠亚洲五月天| www欧美在线观看| 毛片免费在线| 亚洲国产成人久久77| 国产精品大白天新婚身材| 在线观看免费国产| 国产精品一线天| 色综合婷婷| 2019年国产精品自拍不卡| 国产综合欧美| 亚洲专区一区二区在线观看| 亚洲视屏在线观看| 亚洲av成人无码网站在线观看| 欧美精品xx| 欧美自拍另类欧美综合图区| 中文字幕亚洲电影| 精品午夜国产福利观看| 四虎影视8848永久精品| 国产成人盗摄精品| 精品久久综合1区2区3区激情| 美女视频黄又黄又免费高清| 色AV色 综合网站| 欧美成人影院亚洲综合图| 国产精品亚洲精品爽爽| 日本一区中文字幕最新在线| 亚洲男人天堂网址| 真实国产乱子伦视频 | 一级毛片基地|