999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于時空注意力機制的加油站級客流量預測

2021-04-29 03:21:50包恒彬馬玉鵬楊奉毅韓云飛
計算機工程 2021年4期
關鍵詞:模型

包恒彬,馬玉鵬,楊奉毅,韓云飛

(1.中國科學院新疆理化技術研究所新疆民族語音語言信息處理實驗室,烏魯木齊 830011;2.中國科學院大學,北京 100049)

0 概述

加油站流量可反映城市的能源消耗及經濟水平,對加油站的客流量進行準確預測可幫助相關部門及企業制定更符合各站點實際需求的選址、運營以及調配策略,還可為需要加油的顧客提供推薦信息,以幫助其尋找排隊時間最短的加油站[1]。

目前,針對加油站短時客流量預測的研究尚少,而加油站客流數據是一種典型的時空數據,這種時空特性使得加油站客流量預測問題與交通領域的其他問題具有概念上的相似性。早期研究通常采用如差分自回歸移動平均(Autoregressive Integrated Moving Average,ARIMA)模型[2]及其改進方法來解決該類預測問題,而后期結合復雜特征工程與傳統機器學習模型的方法被應用到該領域。然而,這些傳統的時間序列模型或機器學習模型具有較大局限性,不能有效捕捉復雜的非線性時間與空間依賴的關系。

近年來,由于深度學習憑其優異的端到端學習能力而在解決自然語言處理、計算機視覺等領域任務時取得顯著效果[3],因此研究人員逐漸將循環神經網絡(Recurrent Neural Network,RNN)[4]和卷積神經網絡(Convolution Neural Network,CNN)[5]應用到交通領域預測問題中。RNN 可對時間序列數據進行復雜建模并提取數據中的時間依賴關系,CNN 通過在像素級矩陣中不斷進行卷積操作來捕捉數據間的空間相關性。同時,結合RNN 與CNN 構成一個復雜深度神經網絡模型以克服傳統方法的局限性,使得整個模型具有強大的時空數據多維非線性關聯處理能力。將CNN 應用于大規模時空數據時需要進行特殊的預處理操作,目前主流的處理方法是將使用網格矩陣表示的時空數據轉換為圖像,以學習數據中的空間依賴關系。但該方法不適用于站點級的預測問題,且當網格設置較大時,同一網格會覆蓋多個站點,無法滿足所需的預測粒度。反之,如果網格尺寸小到只包含一個站點,則構成的巨大圖像矩陣與冗余零元素將大幅增加計算量。

因為加油站客流數據在時間維度上具有以天為單位的周期性,所以結合最近幾小時內的短期序列與過去幾天的周期性序列,可以更準確地對數據時序依賴進行建模。然而,實際中加油站客流數據并不具有嚴格意義上的周期性,例如雖然每日的周期趨勢大致相同,但是客流高峰出現的時段并不固定,且在一定范圍內發生漂移,這種現象被稱為周期性數據中的時間漂移。因此,僅對過去幾天相同時段的周期性序列進行建模顯然忽略了時間漂移所帶來的影響。

受交通預測領域研究的啟發,本文結合加油站客流數據特征,提出利用路網矩陣對站級客流數據進行建模,并使用基于注意力機制的時空網絡(Attention Mechanism-based Spatial Temporal Network,AMSTN)模型同時捕獲數據的空間與時間維度依賴關系,從而對加油站客流量進行預測。采用該模型對數據內空間與時間維度的關聯關系分別進行建模,利用局部CNN捕獲站點間的空間依賴關系,再采用多個長短期記憶(Long Short-Term Memory,LSTM)網絡[6]建模短期與長期時間依賴性,并引入注意力機制修正時間漂移問題對長期預測結果的影響,以提高預測結果的準確性。

1 相關工作

加油站客流量預測問題與交通領域的相關預測問題具有相似性。本質上,交通預測的目標是預測某時間某位置的相關指標值,例如出租車需求量、區域客流量等,而這些指標的形成過程是相似的。因此,交通預測領域的相關研究工作可為加油站客流預測問題提供參考。交通預測領域中的現有模型大致可以分為基于傳統機器學習方法的預測模型和基于深度學習的預測模型。

1.1 基于傳統機器學習的預測模型

交通預測問題的主要研究對象是時空序列數據,它是一種特殊的時間序列數據,早期研究主要根據數據的時間維度進行預測,采用經典的時間序列預測方法依賴于特征工程和特征選擇來獲得較好的預測特征。傳統的交通客流預測方法可以分為參數方法與非參數方法。其中,參數方法包括基于ARIMA 及其改進方法[7-9],非參數方法包括K-近鄰(K-Nearest Neighbor,KNN)非參數回歸法[10]、歷史平均法(Historical Average,HA)與向量自回歸法(Vector Autoregressive,VAR)[11]等。然而,基于ARIMA及其改進方法的模型依賴于不間斷的輸入序列,不適用于分析缺少數據的時間序列。HA 方法不能有效捕捉交通數據的動態變化(如周期性特征)。VAR方法可以捕捉相關時間序列之間的線性相關性,但忽略了預測值之間的相關性。由于上述方法僅考慮了時序特征,因此不能捕捉到數據間復雜的非線性時空依賴關系。

1.2 基于深度學習的預測模型

受圖像識別領域的研究啟發,現有的深度學習預測模型多數將同時段的預測量按空間位置建模為類似于圖像的數據矩陣,并按時間順序組織各時段的數據矩陣,為預測模型保留數據中豐富的空間與時間維度信息。文獻[12]利用基于CNN 的網絡模型捕捉空間依賴,并采用殘差神經網絡對城市人群流動進行預測。文獻[13-14]使用基于RNN 的模型來建模時序依賴關系。雖然上述研究均明確對空間依賴或時序依賴進行建模,但它們都沒有同時考慮空間與時間兩種維度間的依賴關系。因此,文獻[15-17]嘗試結合CNN 與LSTM 的優勢同時建模交通數據的空間和時間依賴性。文獻[16]通過將卷積LSTM 單元與注意力機制相結合來增強代表性數據對每一步預測的影響權重。文獻[17]采用局部CNN、LSTM 和語義圖嵌入分別集成空間、時間和語義多個角度進行區域級出租車需求量預測。文獻[18]提出門控機制和周期注意機制,使模型具有同時捕獲靜態與動態時空依賴的能力。

針對加油站領域預測的相關工作較少,文獻[19]利用出租車GPS 數據,通過出租車在加油站的等待時間來估計加油站內的排隊長度,并預測此時加油站內的客流量及銷量。文獻[20]將城市劃分為網格空間,并結合多種深度學習網絡建模區域內的時間、空間與語義三種維度的相關性,從而對區域級的油品銷量進行預測。然而在加油站級客流量預測問題中,客流數據間的站級復雜非線性空間與時間依賴關系也是影響預測結果準確性的重要因素,而以上研究都沒有進行相關的分析建模。因此,本文提出使用路網矩陣建模站級客流數據,并通過AMSTN 模型處理數據間復雜空間與時間維度依賴關系,實現對加油站級客流量的準確預測。

2 問題定義

將加油站站點集合定義為S={s1,s2,…,sM},時間間隔集合為T={t1,t2,…,tn},每個時間間隔t的長度為30 min。本文對客流記錄、客流量及路網矩陣進行定義,并在此基礎上對加油站級客流量預測問題進行形式化定義與描述。

定義1(客流記錄)用三元組(o.t,o.s,o.uid)表示一條客流記錄,其中,o.t、o.s和o.uid 分別為記錄時間戳、加油站唯一編碼與顧客唯一編碼。

定義2(客流量)用表示站點s在時間間隔t內的客流量,=|{o:o.t∈T?o.s∈S}|,|o|表示集合的基數。

定義3(路網矩陣)用Bt表示時間間隔t內所有站點客流量構成的路網矩陣。

路網矩陣大小為a×b,a、b分別為包含加油站的橫向街道數與縱向街道數,將站點根據空間分布對應到路網矩陣的相近節點,節點值為一個站點在該時間間隔內的客流量(s∈S),無對應站點的節點值始終為0。

定義4(加油站級客流量預測問題)以路網矩陣的形式給定各加油站歷史客流量{Bt|t∈T},并預測t+1 時刻各站點的客流量(s∈S)。

3 基于時空注意力機制的預測模型

本節將詳細介紹本文提出的AMSTN 模型,該模型結合CNN、LSTM 與注意力機制同時捕獲加油站客流數據中存在的空間與時間維度相關性。圖1展示了AMSTN 模型的總體架構,時空數據首先輸入到用于處理站點間空間依賴的CNN,CNN 提取出空間關聯后,將輸出分別輸入到提供短期時序預測的短期LSTM 網絡,以及引入了注意力機制修正時間漂移影響后提供長周期時序預測的長期LSTM 網絡,結合2 個時序網絡的輸出得到網絡的最終預測結果。

圖1 AMSTN 模型架構Fig.1 Architecture of AMSTN model

3.1 局部CNN

CNN 通過持續的卷積操作可有效提取像素矩陣內的空間相關性,受此啟發,本文使用CNN 提取站點間的空間依賴關系。采用路網矩陣對一個時間間隔內所有站點的客流記錄進行建模,然后將該矩陣作為一維灰度圖像輸入到AMSTN 模型的CNN 組件中進行學習。但對整個矩陣直接應用CNN 會考慮大量的距離較遠且相關性較弱的站點,削弱了CNN 對站點間強相關性的學習能力,從而影響整體預測性能。因此,本文使用局部CNN[18]僅對當前預測站點臨近的局部范圍采用CNN 網絡提取站點間空間維度的依賴關系。

在一個時間間隔t內,以路網矩陣中一個節點i為中心,提取其周圍D×D范圍內所有節點的流量值,得到D×D大小的一維圖像,并將其作為該節點的輸入樣本∈?D×D×1。圖2 以路網矩陣中數值為6的節點為中心,取D=3 構造樣本,位于矩陣邊界的節點周圍使用0 補全。

圖2 D=3 時構造的樣本Fig.2 Sample constructed when D=3

局部CNN 將提取出的原始輸入作為輸入到K層卷積層,使用二維卷積提取空間依賴,且每一層卷積公式為:

其中,k(k∈K)為卷積層數,*為卷積操作,使用ReLU作為激活函數,Wk和bk是需要學習的參數。在卷積操作后使用全連接網絡將提取到的空間關聯信息處理為LSTM 網絡輸入。

3.2 短期LSTM 網絡

LSTM 網絡對輸入的隱狀態向量,采用轉移函數來解決RNN 網絡在處理長序列時可能出現的梯度消失和梯度爆炸問題,從而達到在時序數據建模中具有更好的性能。本文使用一個LSTM 網絡學習短期時序依賴,根據預測時間點前L個時間間隔的短期時序數據給出短期預測結果,網絡輸入的短期序列及LSTM 網絡的簡化轉移公式可表示為:

3.3 基于注意力機制的長期LSTM 網絡

短期LSTM 網絡僅處理預測時間點前幾個時間間隔的短期時序依賴,忽略了以天為周期的長期時序依賴。然而僅增加序列輸入長度會增大梯度消失的風險,削弱模型直接捕獲長期時序依賴的能力。因此,本文使用與預測時間點相同時間的過去連續P日的數據構成長期序列(如P=2,代表昨天和前天的同一時間),將其作為長期LSTM 網絡輸入來捕獲長期依賴進行預測,輸入序列可表示為:

僅提取如式(5)所示的過去相同時間點序列進行長期時序依賴學習,忽略了周期性數據中的時間漂移問題。加油站客流數據雖然每日的趨勢大致相同但并不具有嚴格意義上的周期性。圖3 以某站點連續5 天的客流數據及客流高峰出現時間為例,展示了站點客流高峰出現時間會在一定時間范圍內漂移的現象,這種時間漂移現象在加油站客流量時序數據中普遍存在。其中,圖3 中的每個時間間隔為30 min。

圖3 時間漂移現象示例Fig.3 Example of time drift phenomenon

本文通過引入注意力機制來修正時間漂移的影響,并得到最終的長期LSTM網絡輸入序列。如圖1所示,采樣過去P天中預測時間點前后共有Q個時間間隔的歷史數據作為長期網絡的輸入樣本。例如,如果預測的時間間隔是上午10:00—10:30,則需提取預測時間的前后1小時范圍數據作為輸入(即上午9:00—11:30,此時Q=5),使用LSTM提取每天的時序信息用于學習不同時刻對當天最終向量表示的貢獻權重,應用的注意力機制及權重分配公式如下所示:

其中,為站點i在第p日預測時間點t的最終向量,為注意力貢獻權重,s為貢獻評分函數,vT、WH、WX與bX為學習的參數,表示站點i在第p日q時段的向量,為站點i在第p日q時段的CNN 網絡輸出。基于注意力機制的LSTM 網絡組件的輸入序列及預測網絡可表示為:

其中,為網絡修正時間漂移現象影響后給出的長期預測。

3.4 融合訓練

其中,Wf、bf為學習的參數,輸出結果在[?1,1]內,將結果反歸一化得到站點i在t+1 時刻的預測值。

4 實驗與結果分析

4.1 數據集與預處理

本文以某市屬行政區內所有加油站從2019-02-12—2019-04-02 共50 天的客流量數據作為數據集。數據集的前40 天用于訓練與驗證模型,后10 天用于評估模型性能。

將該行政區域構造成大小為11×11 的路網矩陣作為輸入,并將站點按照在路網中的空間分布對應到路網矩陣的近似節點。使用30 min 作為數據處理的時間間隔得到各站點客流量數據,并對所有客流量數據進行最大-最小(Max-Min)歸一化處理,處理后的數據分布在[0,1]。訓練數據集的80%用于訓練,20%用于驗證。根據學術界及工業界經驗,在測試模型性能時過濾客流量等于0 的樣本不參與評估[18]。

4.2 實驗參數設置

本文提出的 AMSTN 模型使用 Python、TensorFlow1.14.0 和Keras2.3.1 實現,并在真實加油站客流數據集上驗證了該模型的預測能力。實驗中AMSTN 模型具體超參數設置如表1 所示。

表1 AMSTN 模型的超參數設置Table 1 Hyper-parameter setting of AMSTN model

4.3 評價指標

實驗使用均方誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)與平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)3 個標準評價指標對實驗結果進行評價。3 個評價指標的計算方法如式(13)~式(15)所示:

4.4 結果分析

HA 模型使用各時段的歷史客流平均值作為預測,LSTM 網絡是一種改進的RNN 模型,其可以處理時間序列數據中的順序依賴性,雙向長短期記憶(Bi-LSTM)網絡由前向LSTM 與后向LSTM 組合而成,其可同時從前后兩個方向對時間序列進行建模。實驗對HA、LSTM、Bi-LSTM 與本文模型的預測效果進行對比,結果如表2 所示,表中的數據是10 次實驗結果的平均值。從表2 可以看出:在本文選擇的數據集上,LSTM 與Bi-LSTM 模型的預測能力一般,雖然相比HA 模型在RMSE 與MAE 指標上有一定提升,但MAPE 結果表現略差,這是因為MAPE 指標對數據中的較低值更敏感,而僅考慮時序特征的方法更傾向于擬合數據中的較高值,所以出現RMSE 與MAE 指標提升而MAPE 下降的現象;3 個評價指標均驗證了本文所提AMSTN 模型預測能力均優于其他3 種對比模型,與HA 模型相比,本文模型在RMSE 與MAE 指標上分別提高了22.89% 與21.39%。

表2 4 種模型的評價指標結果對比Table 2 Comparison of evaluation index results of four models

HA、LSTM 與本文模型對同一個站點連續兩天的預測結果如圖4 所示。其中,Ground Truth 為該站點兩天內的實際客流量,且經過Max-Min 歸一化處理,每個時間間隔為30 min。從圖4 可以看出,本文模型相較于其他模型更貼近實際結果,且具有最佳的預測能力。

圖4 本文模型與其他模型的預測結果對比Fig.4 Comparison of prediction results between the proposed model and other models

移除AMSTN 模型中部分組件的消融實驗結果如表3 所示。其中:表3 中的AMSTN-S 模型是在本文模型的基礎上移除注意力機制的長期LSTM 組件,僅使用局部CNN 組件與短期LSTM 組件提取數據中的空間依賴與短期時序依賴關系;AMSTN-L 模型是在本文模型的基礎上移除短期LSTM 組件,僅使用局部CNN 組件與基于注意力機制的長期LSTM組件提取數據的空間依賴、長期時序依賴以及長期時序依賴中的時間漂移。

表3 消融實驗結果對比Table 3 Comparison of ablation experiment results

從表3 可以看出:AMSTN-S 與AMSTN-L 模型的預測性能相比本文模型均有一定程度的下降,這是因為數據中的短期時序依賴、長期時序依賴和時間漂移因素共同提升了本文模型的預測準確性,而AMSTN-S 與AMSTN-L 模型在預測時分別遺失了部分時間維度依賴關系;AMSTN-S 模型的預測能力優于AMSTN-L 模型,這說明在預測時數據中的短期時序依賴相較于長期時序依賴和時間漂移對最終預測結果的影響更大。

為了考察空間CNN 輸入樣本大小與短期LSTM網絡輸入時序長度2 個重要超參數對AMSTN 模型的性能影響,本文進行不同超參數設置的對比實驗,結果如圖5 所示。從圖5(a)可以看出:隨著D值的增大,本文模型的預測性能呈下降趨勢,當D=3 時輸入樣本大小為3×3,此時本文模型的預測性能最佳;當空間輸入大小接近整個矩陣大小時,模型預測能力顯著降低,這可能是因為過多弱關聯數據削弱了本文模型中CNN 組件捕獲與保存空間強關聯關系的能力。從圖5(b)可以看出:不同輸入長度對預測性能的影響較大,當輸入序列長度為6 時,AMSTN模型的預測性能最佳;隨著輸入序列長度的增大,模型預測能力逐漸穩定,但整個模型的訓練時間明顯增加。

圖5 不同超參數對本文模型預測性能的影響Fig.5 Effect of different hyper-parameters on the prediction performance of the proposed model

5 結束語

針對加油站級客流量預測問題,本文提出一種基于時空注意力機制的深度神經網絡預測模型。該模型通過路網矩陣對站級時空數據進行建模,并采用結合多個深度網絡組件的模型處理站點間復雜的時空依賴關系。實驗結果表明,該模型可對各站點的客流量進行準確預測。本文模型通過舍棄空間距離較遠的數據輸入來保障其預測性能,然而少量空間距離較遠的站點間也可能存在強關聯性。因此,下一步將從多源數據中提取少量的遠距離強關聯性站點關系,并將其與本文模型相融合,以進一步提升模型預測準確性。

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 蝌蚪国产精品视频第一页| 91av国产在线| 亚洲精品黄| 无码精品国产dvd在线观看9久 | 亚洲综合在线最大成人| 福利片91| 久久无码免费束人妻| 亚洲侵犯无码网址在线观看| 午夜啪啪网| av在线无码浏览| 日本人妻一区二区三区不卡影院| 国产av色站网站| 国产综合精品一区二区| 久久综合伊人 六十路| 综合色区亚洲熟妇在线| 超清无码一区二区三区| 午夜欧美理论2019理论| 亚洲一区二区日韩欧美gif| 免费全部高H视频无码无遮掩| 日本一本在线视频| 久久黄色影院| 午夜欧美理论2019理论| 国产视频 第一页| 日本人妻丰满熟妇区| 精品91视频| 欧美国产视频| 九九香蕉视频| 国产精品真实对白精彩久久| 久久婷婷六月| AV不卡国产在线观看| 手机精品福利在线观看| 无码人妻免费| 国产午夜精品鲁丝片| 搞黄网站免费观看| 露脸国产精品自产在线播| 亚洲综合在线网| 成人在线观看一区| 在线观看精品自拍视频| a欧美在线| 小蝌蚪亚洲精品国产| 国产高清在线观看91精品| 日韩在线视频网| 在线无码av一区二区三区| 国产老女人精品免费视频| 亚洲人成人无码www| 网久久综合| 人妻中文字幕无码久久一区| 亚洲视频一区| 日韩精品资源| 色偷偷一区二区三区| 国产成人精品优优av| 国产美女精品一区二区| 国产欧美综合在线观看第七页| 亚洲无码精彩视频在线观看| 亚洲人成亚洲精品| 精品撒尿视频一区二区三区| 69精品在线观看| 欧美精品成人| 国产香蕉97碰碰视频VA碰碰看 | 白浆视频在线观看| 动漫精品中文字幕无码| 国内精品自在自线视频香蕉 | 99re在线观看视频| 亚洲一级毛片在线观播放| 欧美一区二区啪啪| 亚洲黄色网站视频| 亚洲日韩精品伊甸| 好吊色妇女免费视频免费| 丰满人妻久久中文字幕| a毛片在线播放| 久久久亚洲色| 国产成人精彩在线视频50| av尤物免费在线观看| 91啦中文字幕| 黄片在线永久| 国产一级裸网站| 免费人成又黄又爽的视频网站| 久久中文字幕av不卡一区二区| 国产00高中生在线播放| 国产裸舞福利在线视频合集| 欧美日韩国产系列在线观看| 亚瑟天堂久久一区二区影院|