999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多交通模式改進的共享單車需求預測算法研究

2024-04-29 00:00:00胡智維張建同
軟件工程 2024年2期

關鍵詞:非負矩陣分解;圖卷積神經網絡;共享單車需求;可解釋性

0 引言(Introduction)

共享單車是當前公共交通系統中的重要組成部分,但共享單車需求的潮汐效應也給公共交通系統和共享單車系統運營方帶來了額外的壓力[1-2],因此一個高效的調度系統對共享單車系統的高效運營非常重要,而調度系統的高效運營依賴于精確的短期需求預測[3-4]。國內外的學者對共享單車短期需求預測進行了大量的研究,使用的方法大多基于機器學習[5-6]和深度學習等數據驅動方法。例如,張建同等[7]結合隨機森林、極端梯度提升(eXtreme Gradient Boosting, XGBoost)及梯度提升決策樹(Gradient Boosting Decision Tree, GBDT)三類算法提出了組合預測模型;孫啟鵬等[8]分析了單車出行模式,并嘗試將單車出行模式與多層前饋神經網絡結合預測共享單車需求;姜曉等[9]、陸凱韜等[10]、ZHANG等[11]嘗試使用長短期記憶網絡進行預測。共享單車作為一種交通系統,具有天然的圖結構,因此圖卷積神經網絡[12]在交通流預測中也被廣泛使用,CHAI等[13]基于圖卷積神經網絡提出了多圖卷積神經網絡預測共享單車系統中的需求。但是,以上研究大多將共享單車需求視為單一系統,忽略了其與其他交通系統之間的聯系。近年的部分研究主張在共享單車需求預測任務中結合其他公共交通系統的信息,以提升需求預測的準確度。例如,LIANG等[14]考慮了如地鐵人流量等其他交通模式的信息,有效改善了共享單車需求的預測效果。CHO等[15]比較了不同交通系統與單車系統之間的聯系。

本文提出一種基于非負矩陣分解改進的多圖卷積網絡預測模型,在共享單車需求預測任務中結合其他公共交通系統的信息,以達到提升預測效果的目的。實驗結果表明:與不考慮其他交通方式影響的模型相比,使用非負矩陣分解算法改進的圖卷積神經網絡的平均絕對誤差下降了10.84%,并且非負矩陣分解方法能較好地解釋輔助交通系統是如何提升單車需求預測效果的。

1 數據與模型(Data and model)

1.1 數據來源與預處理

本文主要使用兩個數據集:(1)紐約市自行車系統公開數據(NYC Citi Bike),記錄的信息類型有單車ID、出發時間、結束時間、出行持續時長、出發點和終點坐標等,包括2020年7月至9月紐約市內1 104個區域的單車出行數據,共有約690萬條的出行記錄,本文將起止點距離小于50 m的記錄去除,并排除每天平均用車記錄小于10條的區域,共得到848個區域2020年7月至9月每小時的用車需求。(2)紐約市出租車需求數據集,來自紐約市出租車和豪華轎車委員會(TLC),記錄了2020年7月至9月約55萬條用車記錄,包括乘客的上車時間、下車時間、上車區域ID、下車區域ID、上車地點、下車地點和出行里程等信息。兩個數據集的簡介如表1所示。

本文根據數據集中上車和下車地點名稱,結合谷歌地圖中的數據獲取上車和下車位置的坐標信息,同樣去除每天平均用車需求小于10條的區域和起止點距離小于500 m的區域。紐約市出租車出行模式作為輔助交通模式輸入,幫助改善單車需求預測效果。

1.2 使用非負矩陣分解(NMF)改進的多關系圖卷積神經網絡

對共享單車需求進行預測的大多數算法通常將共享單車需求視為封閉系統,忽略了共享單車系統與其他交通系統之間的相互作用。但是,共享單車作為交通系統的一個組成部分,成為解決“最后一公里”問題的存在。因此,共享單車系統的需求很難不受其他交通系統的影響。例如,乘坐地鐵的乘客很可能在出站后選擇共享單車,出租車需求旺盛的區域或目的地區域可能代表這些區域是交通熱點,共享單車在這些區域可能有比其他區域更高的需求。多關系圖卷積神經網絡(Multi-Relational Graph Neural Network)[14]是一種用于在跨交通模式中提取信息在預測節點中共享并提升預測效果的網絡結構。但是,多關系圖卷積神經網絡缺乏可解釋性,也無法解釋輔助交通模式中的哪一部分信息提升了預測效果。本文基于非負矩陣分解改進多關系圖卷積神經網絡,希望通過非負矩陣分解幫助模型學習更多深層次信息的同時,還可以直觀地觀察輔助交通模式中的信息是如何提升模型預測效果的,使模型具有良好的可解釋性。本文選取紐約市出租車的出行數據集作為單車需求預測的輔助數據集,也可以應用其他任意出行模式的數據作為輔助數據或是多個交通模式的數據集同時作為輔助數據進行預測。

基于非負矩陣分解方法改進后的多關系圖卷積神經網絡利用從輔助數據集和共享單車歷史需求數據中提取的時空特征預測單車需求。為了直觀地觀察輔助交通模式中的哪一部分信息改善了單車需求的預測,在使用多關系圖卷積神經網絡提取時空特征之前,要先使用非負矩陣分解法將出行矩陣分解為k 種出行模式。非負矩陣分解法的非負約束讓分解出的矩陣非負,因此分解后得到的基矩陣Wm×k=[w1,w2,…,wm ]T、系數矩陣Hk×t= h1,h2,…,ht 具有明確的物理意義。根據現實意義,wm 可以理解為k 種出行模式在區域m 的出行規模大小,ht 可以理解為k 種出行模式在時間點t 的出行強度,wTm和ht 均為k 維向量,則將Wm×k 和Hk×t 中對應的第k 種出行模式的行向量和列向量相乘,得到m ×t 維矩陣V'k,其中[V'k]ij=WikHkj。矩陣V'k 為估計的第k 種出行模式的需求矩陣,將矩陣V'k 和單車出行矩陣一起作為預測模型的輸入,多關系圖卷積神經網絡負責捕捉各個出行模式內部的和跨模式的出行節點之間的有效信息,預測層利用卷積模塊捕捉到的各個站點的信息表示和依賴關系完成單車需求的預測。基于非負矩陣分解方法改進后的多關系圖卷積神經網絡模型的整體結構如圖1所示。

1.2.1 使用非負矩陣分解法的出行模式分解

非負矩陣分解法于1999年被提出,與傳統的奇異值分解(SVD)、獨立成分分析(ICA)、主成分分析(PCA)等方法相比,非負矩陣分解法對分解出的子矩陣有非負約束,該特性讓非負矩陣分解法分解出的子矩陣擁有良好的可解釋性。本文以非負矩陣分解法為基礎,將龐大的出租車出行矩陣分解為子矩陣,拆解為可解釋的不同出行模式,并將其作為輔助共享單車需求預測的輔助交通模式。

非負矩陣分解法的基本思想可以概括為對于非負矩陣V,非負矩陣分解法可以找到一個非負矩陣W 和一個非負矩陣H,使V≈WH,由于分解算法很難求得完全相等的分解矩陣,因此使用約等號。非負矩陣分解法保證了分解過程的非負性,分解出的矩陣往往是具有實際物理意義的。對于出租車出行矩陣,假設有出行矩陣Vm×t,記錄了m 個空間區域內在t 個時間點的出行需求,找到矩陣Wm×k =[w1,w2,…,wm ]T 和矩陣Hk×t= h1,h2,…,ht ,wTm、ht 均為k 維向量。使Vm×t ≈Wm×kHk×t,矩陣Wm×k 被稱為基矩陣,矩陣Hk×t 被稱為系數矩陣。在對有實際意義的出行矩陣Vm×t 的分解過程中,wm可以理解為k 種出行模式在區域m 的出行規模大小,ht 可以理解為k 種出行模式在時間點t 的出行強度。通過對基矩陣和系數矩陣的分析可以得出出租車出行模式在空間和時間維度的分布特征。本文僅介紹非負矩陣分解法的具體步驟而不做推導。

Step 5:計算損失函數,判斷它是否滿足小于ε,若滿足,更新結束;若不滿足,則返回Step 4繼續更新,直到損失函數小于ε 或達到迭代上限為止。

由于非負矩陣分解需要對需求矩陣整體進行分解,為了不影響測試集結果,所以訓練和測試階段的分解方法略有不同,在訓練階段使用的分解法為非負矩陣分解法的分解步驟,在Step 4中使用梯度下降法,同時更新基矩陣Wm×k 和系數矩陣Hk×t。而在測試階段,本文假定在各個出行區域中的不同出行模式的占比在一定時間內是穩定的,因此固定在訓練階段生成的基矩陣Wm×k,依據現有的基矩陣W 生成系數矩陣H,步驟如下:固定基矩陣Wm×k 后,基于測試集數據使用梯度下降法生成新系數矩陣Hk×t。

1.2.2 多交通模式的時空圖建模

本文將不同區域的共享單車出行和出租車出行之間的聯系建模為時空圖。紐約市的各個出行區域為構造的圖的頂點,頂點特征為各個區域的需求信息。由于本文需要提取不同交通模式之間的依賴關系,因此除了構建一般的單個交通模式內部的時空圖,還需要構建跨交通模式的時空圖。對于單個交通模式內部的時空圖,以共享單車為例,它的內部圖被構建為GB =(VB ,AB ),其中VB 為需求站點,AB 為站點間依賴關系的鄰接矩陣。同理,出租車出行需求也可以被構建為GT =VT,AT ,并且出租車需求被分解后的不同需求模式共享同樣的內部圖。對于跨交通模式的時空圖,其作用是捕捉共享單車站點和出租車需求區域之間的聯系。本文將跨交通模式的時空圖定義為GBT =(VB ,VT ,ABT ),其中VB 、VT 為共享單車需求站點和出租車出行區域,ABT 為VB 、VT 之間依賴關系的鄰接矩陣。

為了更有效地捕捉不同站點和出行區域之間的相互依賴關系,本文從不同的視角定義鄰接矩陣。紐約市的各個需求站點和出行區域為構造的圖的頂點,頂點特征為各個區域的需求信息,可以從距離和歷史流量相似度視角出發,構建鄰接矩陣:

其中:距離函數Dist為兩點之間的曼哈頓距離,ρij 為兩個區域歷史流量的相似度,相似度函數用皮爾遜相關系數定義。因此,最終構造有以下不同的圖結構,分別代表單車需求站點和出租車需求區域內部和互相的依賴關系:

公式(3)至公式(6)代表出租車出行時空圖和單車出行時空圖分別根據距離和相關系數定義的圖連接結構,公式(7)和公式(8)代表共享單車需求節點和出租車出行區域共同構成的時空圖根據距離和相關系數的圖連接結構。

1.2.3 多關系圖卷積神經網絡

多關系圖卷積神經網絡是一種用于在跨交通模式中提取信息在預測節點中共享,并提升預測效果的網絡結構[14]。本文基于非負矩陣分解法改進多關系圖卷積神經網絡,在提升模型預測效果的同時,使結果具備良好的可解釋性,可以直觀地展示不同的交通模式如何改善共享單車需求預測的結果。

多關系圖卷積神經網絡是在圖卷積神經網絡的基礎上改進的,它可以從不同交通模式的異構圖中根據連接情況提取各頂點的有效信息,本文根據前文定義的距離圖和流量相似度圖提取有效信息。多關系圖卷積神經網絡結構如圖2所示。

圖卷積神經網絡結構是一種非常高效地從圖結構數據中提取有效特征的網絡結構,而交通網絡具有天然的圖結構,因此圖卷積網絡被廣泛地應用于交通流預測領域并取得了良好的效果。在圖卷積神經網絡中,圖中來自鄰居的信息被匯總并用于逐步更新頂點的隱藏狀態,這些信息在過渡網絡中傳播,最終使每個頂點都能捕獲大鄰域的信息。圖卷積神經網絡的卷積公式如下:

其中:σ 為激活函數;D 為自連接的鄰接矩陣的度矩陣;Hl 為輸入特征矩陣,代表網絡圖的節點的特征;wl 為第l 層的可訓練參數;A=A+IN ,代表有自連接網絡的鄰接矩陣。本文使用在圖卷積結構的基礎上改進的多關系圖卷積神經網絡提取跨交通模式的異構圖中節點的相互信息。以共享單車和出租車兩種出行模式為例,多關系圖卷積神經網絡的卷積公式如下:

1.2.4 預測

本文將從各個交通模式內部提取的時空特征輸出和從跨交通模式提取的時空特征輸出融合后作為預測層的輸入,預測層由L 個全連接層組成,模型訓練目標是最小化共享單車出行需求和預測需求間的誤差。損失函數如下:

2 紐約市出租車出行模式分析(Analysis oftaxi travel modes in New York city)

使用NMF分解出行矩陣后,可以得到基矩陣W 和系數矩陣H。從物理意義的角度解釋,基矩陣W 可以代表不同出行模式在空間分布上的強度,系數矩陣H 則代表不同出行模式在不同時間段的強度。本文對紐約市出租車需求數據集進行非負矩陣分解,使用手肘法確定最優模式數k=4。因此,最終分解出4種基本出行模式。利用系數矩陣H 分析4種出行模式的時間分布情況,截取一個自然日內不同模式的出行強度并繪制折線圖,出租車出行模式時間分布如圖3所示。

通過觀察圖3可以看出,峰值出現在上午和晚上的出行模式為典型的通勤出行需求,分為通勤晚高峰的居民用車需求(需求高峰為16:00~18:00)和通勤早高峰的用車需求(需求高峰為7:00~9:00)。從9:00開始緩慢增加,到22:00~23:00達到高峰的出行需求推測為不需要工作的居民的娛樂出行需求;對于8:00、12:00和19:00均出現一個小高峰的出行需求,則推測為其他零散的出行需求。

3 共享單車需求預測結果及可解釋性分析(Prediction results and interpretability analysisof demand for shared bicycles)

3.1 模型設置及實驗結果

將2020年7月至9月紐約市內不同站點、不同區域的共享單車需求量和出租車需求量作為輸入,數據集中記錄每小時的需求數據,本文將數據集中的60%作為訓練集,20%作為驗證集,20%作為測試集。本文設置時間步數為12,將每12 h的需求數據作為輸入,預測后12 h的需求,epoch 設置為100,學習率設定為0.001。模型訓練完成后在測試集中的預測誤差如表2所示。

表2展示了經非負矩陣分解法改進的多關系圖卷積神經網絡與線性回歸模型(LR)、全連接神經網絡(MLP)、時空圖卷積神經網絡(STGCN)的預測誤差的對比。NMF-MRGCN為基于非負矩陣分解法改進的多關系圖卷積神經網絡模型,表2展示了將不同的出租車出行模式作為輔助交通模式輸入模型時的預測誤差。從表2中可以看到,同時輸入4種出行模式的預測誤差最低,平均絕對誤差僅為1.903 80,相比不考慮其他交通模式信息的STGCN,平均絕對誤差下降了10.84%,提升效果最顯著,說明模型從輔助模式中學習了有助于提升預測精度的信息。在各個輔助模式中,早高峰對預測結果的提升最明顯,平均絕對誤差為1.926 30,其他三種出行模式對預測結果的改善也有較明顯的作用,主要誤差指標均顯著低于STGCN。GCN-Taxi為不進行非負矩陣分解,直接將出租車的需求數據輸入模型作為輔助交通模式得到的模型預測精度,平均絕對誤差為2.181 60,甚至略低于STGCN,預測效果明顯差于基于非負矩陣分解法改進后的模型,說明矩陣分解模塊在提升模型可解釋性的同時,也較好地將出行模式的信息顯性表達,讓模型能更高效地學習輔助模式的特征。

3.2 可解釋性分析

首先觀察4種出行模式同時輸入的NMF-MRGCN相對于STGCN的預測提升效果。STGCN沒有加入出租車出行數據作為輔助預測模式,將STGCN在每個單車需求點的測試集中的平均絕對誤差取均值,并與NMF-MRGCN在每個單車需求點的平均絕對誤差取均值作差,這個差值代表NMFMRGCN相對于STGCN的預測結果中平均絕對誤差的下降幅度,將單車節點在鄰接矩陣ABT,D 、ABT,P 中與出租車出行區域連接的權重加和,可得到單車節點與出租車出行節點的連接強度,NMF-MRGCN相對于STGCN的精度提升效果同單車節點與出租車出行節點連接強度的關系如圖4所示。

圖4中的橫軸表示單車節點與出租車出行節點的連接強度,連接強度為鄰接矩陣中與這個單車節點連接的出租車出行節點的權重之和,連接強度越大,說明單車節點與周圍區域的出租車出行節點連接越緊密。縱軸表示加入出租車節點作為輔助模式后與STGCN相比減少的平均絕對誤差。從圖4可以看出,單車出行節點與出租車節點聯系越緊密,預測效果的改善程度越好,說明模型可以從單車出行點周圍的出租車節點學習有效信息進而輔助預測。

從表2的實驗結果中可以觀察到,與不考慮輔助交通模式的STGCN相比,將4種出行模式中的任意一種作為輔助模式輸入NMF-MRGCN中都對預測精度有所提升,其中早高峰和其他出行需求提升效果均較為明顯,提升效果最好的輔助模式為早高峰出行模式。將不同的出行模式作為輔助模式時的NMF-MRGCN模型在不同時段預測結果的均方誤差進行對比,可以觀察到以不同的出行模式作為輸入時,NMF-MRGCN模型可以在STGCN的基礎上提升預測性能,如圖5所示。

圖5展示了測試集上的不同輔助模式按時間段分別計算的預測均方誤差,4種輔助模式均對預測結果有較明顯的改善,并且在晚高峰時間段的改善效果最明顯。從圖5中可以看到,當輔助模式為早高峰模式時的預測性能最接近4種輔助模式同時輸入的完整模型,說明早高峰模式提供的出行信息對提升預測效果的貢獻最大,其他三種出行模式作為輔助模式時整體預測結果接近,沒有明顯區別。

從地理分區的角度看,紐約的分區稅務數據庫(ZoningTax Lot Database)記錄了紐約各個分區的主要區域功能。將各個單車需求預測點與對應區域進行匹配,可以分區域觀察不同的輔助模式在不同功能區的預測中發揮的作用,分區域誤差表如表3所示。

表3記錄了不同出行模式作為輔助模式時,對應功能區的所有單車預測點位的均方誤差平均下降幅度。整體而言,輔助模式在商業區和居民區發揮的作用最大,在工業區的輔助預測效果不夠顯著,尤其是娛樂出行模式和其他出行模式,可以推測可能是因為在工業區的總體出行需求中以早、晚高峰需求為主。早、晚高峰出行模式則對表3中三種區域的共享單車出行需求預測精度均有一定的提升效果。

4 結論(Conclusion)

本文提出了一種使用非負矩陣分解算法改進的多關系圖卷積神經網絡模型,首先將輔助交通模式分解為可解釋的模式,其次將各個出行模式的需求信息作為輔助信息和共享單車歷史需求數據一起輸入圖卷積網絡中進行預測。在實驗中,本文以紐約市共享單車預測為例,將出租車需求分解為4種可解釋的出行模式作為輔助信息幫助進行共享單車需求的預測,結果表明每種可解釋的出行模式都對共享單車需求預測效果的改善有一定的幫助。與出租車出行區域聯系越緊密的單車需求節點,對共享單車需求的預測精度提升越大,表示出租車需求數據可以向模型提供關于出行區域的額外信息,進而幫助改善預測效果。其中,出租車的早高峰出行模式的輔助對提升模型預測精度的作用最顯著。對不同的功能區域而言,商業區和居民區的單車需求點位的改善效果最明顯,工業區的改善效果最不明顯。本文提出的使用非負矩陣分解法改進的多圖卷積預測模型可以更高效地捕捉不同交通模式之間存在的潛在聯系,從而獲得比將共享單車視為單一封閉系統的模型更低的預測誤差。

主站蜘蛛池模板: 欧美69视频在线| 国内精品免费| 国产成人综合在线视频| 婷婷六月在线| 国产h视频在线观看视频| 亚洲高清在线播放| 成年人国产视频| 亚洲乱码精品久久久久..| 91亚洲免费视频| 免费A级毛片无码无遮挡| 最新亚洲人成网站在线观看| 54pao国产成人免费视频| 欧美日韩一区二区三区四区在线观看| 2021精品国产自在现线看| 这里只有精品在线| 中文字幕欧美成人免费| 国产粉嫩粉嫩的18在线播放91 | 91久久精品日日躁夜夜躁欧美| 亚洲国产欧美国产综合久久 | 亚洲,国产,日韩,综合一区| 久久黄色小视频| 亚洲综合二区| 国产杨幂丝袜av在线播放| 一级毛片在线播放免费| 人妻无码中文字幕一区二区三区| 91娇喘视频| 99免费在线观看视频| 久久国产乱子伦视频无卡顿| 在线看片中文字幕| 99久久性生片| 91精选国产大片| 中文无码毛片又爽又刺激| 一级毛片高清| 91国内外精品自在线播放| 极品国产一区二区三区| 国禁国产you女视频网站| 69综合网| 欧美精品在线看| 久久夜色精品国产嚕嚕亚洲av| 无码中文字幕精品推荐| 性激烈欧美三级在线播放| 成人久久18免费网站| 精品国产99久久| 99热这里只有成人精品国产| 欧美成人精品一级在线观看| 91精品aⅴ无码中文字字幕蜜桃 | 91视频国产高清| 狼友视频一区二区三区| 免费国产在线精品一区| 亚洲日本中文字幕乱码中文| 国产超碰一区二区三区| 666精品国产精品亚洲| 亚洲a级毛片| 国产精品xxx| 欧美日韩在线观看一区二区三区| 亚洲男人天堂网址| 中文字幕欧美日韩| 亚洲—日韩aV在线| 亚洲区第一页| 色综合天天视频在线观看| 国产区在线看| 亚洲中文字幕无码爆乳| 狠狠色丁香婷婷| 国产精品熟女亚洲AV麻豆| 国产不卡网| 亚洲第一黄色网| 色香蕉网站| 国产偷国产偷在线高清| 久久伊人久久亚洲综合| 91免费观看视频| 亚洲男人的天堂久久香蕉| 一本久道久综合久久鬼色| 免费人成视网站在线不卡| 综合色在线| 91毛片网| 国产午夜一级淫片| 久久国产精品77777| 成人伊人色一区二区三区| 欧美日韩午夜视频在线观看| 最新国产高清在线| 一本久道热中字伊人| 91系列在线观看|