999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的人群活動流量時空預測模型

2021-04-28 00:25:34劉海硯郭文月
測繪學報 2021年4期
關鍵詞:特征模型

李 靜,劉海硯,郭文月,陳 欣

1. 信息工程大學數據與目標工程學院,河南 鄭州 450052; 2. 信息工程大學地理空間信息學院,河南 鄭州 450052

人群活動流量預測是探索人類移動規律的重要環節,也是時空預測的核心問題之一[1]。對人群活動流量的預測研究能夠用來分析城市的交通狀況,幫助理解城市的功能區域及人口活動分布等,在交通運維[2]、災難響應[3]、旅游推薦[4]、城市規劃[5]等方面均具有重要應用價值。當前對于該問題的研究主要是在對地理區域進行基本單元劃分的基礎上,通過建立區域間人群流量的時空關聯來實現對人群活動流量的預測。然而,這種時空關聯包含了人群活動的時間依賴性和空間依賴性,是相對復雜的非線性數學模型。因此,如何對這種復雜的時空關聯進行構建是該研究領域的主要挑戰之一。

早期研究側重關注時間依賴性,即區域內人群活動流量隨時間的動態變化,包括周期性和趨勢性,常用的方法有時間序列模型[6]、線性回歸模型[7]和卡爾曼濾波模型[8]等。文獻[9]使用歷史平均模型(historical average,HA),將歷史時期交通量的平均值作為預測值,該方法不需要任何假設,計算簡單快速,但沒有顧及時間特征,且預測精度相對較低。文獻[10]使用非參數化的自回歸移動平均模型(autoregressive integrated moving average model,ARIMA)對興趣點的人流量進行時序建模,但不能夠很好地擬合非平穩性歷史時序數據。以上方法均只考慮了時間依賴性,忽略了空間特征對于人群活動規律的影響。空間依賴性是指人群活動與空間之間的相互影響,例如上游道路交通狀態通過傳遞效應影響下游道路交通狀態,下游道路交通狀態通過反饋效應影響上游道路交通狀態[11]。文獻[12]根據區域人流情況的相似性,將相鄰的城市格網區域聚集來得到城市的功能區域,進而用核密度估計的方式預測每個區域的人流量分布。文獻[13]對道路網使用矩陣分解來學習道路連接區域之間的潛在空間以預測流量。這些方法在時間依賴的基礎上考慮了空間依賴關系,但卻沒有將二者同時結合起來,因此無法很好地擬合復雜的時空非線性關系。

由于深度神經網絡對于不連續、非線性的問題具有更好的性能[14],近些年也逐漸被學者用于時空預測問題上,通過循環神經網絡(recurrent neural network,RNN)提取時間維度的特征,通過卷積神經網絡(convolutional neural network,CNN)提取空間維度特征,然后將二者結合構建時空網絡模型。文獻[15]同時構造3個相同的卷積結構來提取人群活動時間特征的趨勢性、周期性和鄰近性。文獻[16]提出了一種用于需求預測的多視點時空網絡,該網絡通過集成長短時記憶網絡(long short-term memory,LSTM)、局部卷積神經網絡和語義網絡嵌入,同時學習時空相關性。文獻[17]采用圖神經網絡用于學習復雜的拓撲結構來捕獲空間依賴關系,同時考慮了時間尺度對預測結果的影響。文獻[18]將LSTM與注意力機制(attention mechanism)結合的方法用來同時提取時間的短期和長期特征。以上方法盡管能夠擬合時空非線性關系,但這些方法多是基于靜態的、單一尺度的空間特征,難以顧及動態的空間交互特征以及空間多尺度特征對于深度學習模型的學習能力和預測結果的影響。

針對上述問題,本文提出一種融合空間多尺度特征的時空網絡預測模型(multi-scale characteristics spatio-temporal network,MST-Net),將靜態的人群流量和動態的人群交互流作為卷積神經網絡輸入來提取空間特征,同時使用并聯卷積進行空間多尺度特征融合,隨后使用門控循環單元(gate recurrent unit,GRU)來提取時間特征。試驗結果證明,本文提出的時空網絡模型能夠提高預測精度和學習效率,實現人群活動流量預測,為感知人類的時空移動規律提供方法支持。

1 融合空間多尺度特征的時空預測模型

時空預測不僅包含時間序列的分析,同樣也受到實體空間特征的影響。基于這一假設,本文提出的MST-Net模型主體由兩部分組成:①通過局部卷積神經網絡提取不同尺度下的空間特征來描述空間依賴性;②通過門控循環單元提取時間特征來描述時間依賴性,網絡主要結構如圖1所示。首先,為使網絡更好地學習位置間的空間依賴性,網絡中同時顧及區域內人群活動靜態流量和區域間交互人群流量,再將局部卷積神經網絡提取的不同尺度下的空間特征進行融合。然后,將融合后的特征輸入門控循環單元中。時間序列數據不僅具有短期依賴性還具有一定的周期性,即長期依賴性,通過GRU中單元間的信息傳輸能夠實現長時與短時間特征的提取與表征。此外,網絡對于所提取的特征是按照等權的處理方式參與運算,具有顯著性的特征則難以在網絡中發揮更大作用,基于此,本文進一步引入注意力機制[19]來提取流量數據的長短周期性以增強GRU所提取特征的顯著性,從而提升時空預測任務的精度。最后,將學習到的時間特征向量輸入到全連接層,經過激活函數進行回歸運算,從而得到下一個時刻的流量值。

圖1 MST-Net模型結構Fig.1 The network structure of MST-Net

1.1 基于局部卷積神經網絡的靜態和動態空間特征提取

根據地理學第一定律可知,人群活動在空間上存在一定的相關性[20],區域的人群活動受其鄰域空間變量影響,而卷積神經網絡能夠通過卷積運算捕獲局部的空間特征[21];對于時空預測問題,下一時刻的流量依賴該區域的歷史流量,區域間的人群流動能夠強化區域間的動態空間關系[22]。基于此,本文采用卷積神經網絡提取空間特征,通過規則格網劃分將整個研究區域轉換為規則格網,將格網內流量視為對應像素的灰度,從而將其轉換為圖像,利用時間間隔劃分人群流量圖和人群交互流圖作為網絡輸入,通過人群流量圖提取靜態空間特征,通過人群交互流圖提取動態空間特征。

為了方便空間關系表達,本文采用文獻[18]的空間劃分方式將區域進行規則格網劃分,研究區域G在時間段T內的時空關系。假設區域被劃分為n個格網單元G={g1,g2,…,gi,…,gn},將時間段T內m個等步長時間間隔T={t1,t2,…,ti,…,tm}內,定義如下時空參數以方便后續描述。

(1)

圖2 基于格網單元的交互流、輸入流與輸出流Fig.2 Interaction flow,input flow and output flow based on grid cell

1.2 基于并聯卷積的空間多尺度特征融合

尺度是地理信息科學最重要的話題之一[23]。不同空間尺度對模型的預測精度有一定影響。在卷積網絡中,每一層輸出的特征圖上的像素點在輸入圖片上映射的區域大小稱為感受野(receptive-field)[24]。在圖像大小一定的情況下,卷積核的尺寸決定了感受野的大小[25],從而決定了圖像內提取特征的范圍,對應于參與運算的地理范圍,即卷積核對應的空間尺度。由圖3可知,當圖像比例尺確定時,卷積核尺寸越大對應的視覺感受野越大,特征圖能表示的原始圖像范圍越大,越能表現原始圖像更大尺度的空間特征;當卷積核越小,其對應的感受野越小,特征圖表示的原始圖像范圍越小,越能表現圖像的局部特征[26]。此外,隨著卷積層數的增加,其感受野也越大。例如,圖3中尺寸為5×5的卷積核與尺寸為3×3的卷積核串聯,其對應的感受野等效于一個尺寸為7×7卷積核的感受野。

圖3 當卷積核步長為1時不同卷積核對應的感受野Fig.3 The receptive field corresponding to different convolution kernels when the stride parameter equals 1

本文通過控制卷積核的大小來實現不同空間尺度特征的提取,同時使用并聯卷積的方式將不同大小卷積核提取的多維特征向量扁平化為一維特征向量后進行拼接輸入下一層網絡中,實現不同空間尺度下的特征融合,如圖4所示。

圖4 基于并聯卷積的空間多尺度特征融合Fig.4 Spatial multiscale feature fusion based on parallel convolution

經過并聯卷積融合后的輸出特征可表示為

(2)

1.3 基于門控循環單元的時間特征提取

目前,應用最廣泛的處理序列數據的神經網絡是遞歸神經網絡(RNN)[27]。但是,傳統的RNN在處理長期依賴問題上存在梯度消失和梯度爆炸等問題[28]。長短時記憶網絡(LSTM)[29]和門控循環單元(GRU)[30]作為RNN的改進,通過增加門控機制被證實已能夠很好解決長期依賴的問題。LSTM和GRU在訓練效果上都有很好的表現,但是由于LSTM結構相對復雜,需要的訓練時間較長,且訓練參數較多。因此,本文選用結構相對簡單,需要訓練時間較短且參數較少的GRU來進行時間特征的提取。如圖5所示,rt是重置門,用于忽略前一時刻信息的程度;ut是更新門,用于控制前一時刻信息進入當前時刻的程度;ct為當前時刻的候選隱藏狀態; GRU將t-1時刻的隱藏狀態ht-1,t時刻的空間特征αt作為t時刻的輸入,從而獲取當前時刻的信息。

圖5 門控循環單元模型結構Fig.5 The structure of GRU

2 試驗及分析

2.1 試驗數據集與數據預處理

本文選取紐約市曼哈頓區人群活動簽到數據集(NY)和舊金山市人群活動簽到數據集(SFO)兩個真實數據集對模型的預測性能進行測試,數據來源于Foursquare[31]社交媒體簽到平臺。原始數據包含如圖6所示的簽到時間、簽到經緯度等7個字段。根據本文模型,首先需要將矢量的簽到點數據通過格網劃分、時間間隔劃分成時間序列圖像后再輸入模型,具體流程如圖6所示。對不同時間間隔的人群流量進行統計,能夠得到人群流量時間序列圖像;對于相鄰時間間隔用戶的區域轉移情況進行統計,能夠得到人群輸入輸出流的時間序列圖像。具體的人群輸入輸出流的計算原理如圖7所示。假設用戶I在t-1時段處于gi,在t時段處于gj,則說明用戶I在t時段由區域gi轉移至gj。對于區域gj在t時段有一個用戶進入,區域gi在t時段有一個用戶流出。通過用戶編碼可以鎖定一個用戶在不同時段所處區域,從而可以統計得到某一區域在某一時段用戶輸入輸出情況,進而量化為人群輸入輸出流的時間序列圖像。

圖6 原始數據詳情及數據預處理流程Fig.6 Details of raw data and data preprocessing process

圖7 人群活動輸入輸出流計算過程Fig.7 Calculation process of crowd activity input and output flow

試驗分別選取兩個數據集2012年1月1日至2012年10月7日共280 d的簽到數據,選取前168 d的數據作為訓練集、中間42 d的數據作為驗證集,后70 d作為測試集。顧及人群簽到數據采樣時間較長且稀疏,若時間間隔劃分過小,則無法展現數據的顯著性;若時間間隔過大,則無法反映數據的周期性。因此,為了避免數據過于稀疏,且考慮到時間語義信息,本文將一天的24 h劃分為4個時間間隔,即凌晨(0:00—06:00)、上午(06:00—12:00)、下午(12:00—18:00)和晚上(18:00—24:00)。參照文獻[18]的格網劃分方式,研究將NY數據集劃分為20行×10列的規則格網,將SFO數據集劃分為20行×20列的規則格網。具體試驗數據量及數據安排見表1。

表1 試驗數據量及訓練、驗證、測試數據安排

2.2 模型訓練及參數設定

試驗的批大小設置為試驗設備的顯存上限256,加速訓練過程。學習率采用常用值0.001[17-18]。GRU隱藏單元數會影響模型的性能和預測精度,研究分別將單元數設置為16、32、64、100和128,并利用式(3)計算不同單元數對應的預測誤差,結果如圖8所示,當單元數為128時對應的預測誤差最小,故將隱藏單元數設置為128。試驗將迭代次數設置為55,由圖9可知,模型收斂正常。

圖8 不同隱藏單元數對應的預測誤差Fig.8 Prediction errors under different hidden units

模型采用局部卷積神經網絡提取空間特征并將每一個鄰域大小設置為7×7。卷積核的尺寸、卷積層數量和連接方式都會影響學習能力和預測結果[32]。為了驗證本文所提出的融合空間多尺度特征的時空網絡模型的有效性,試驗設置了3×3與5×5兩種卷積核尺寸,并設計了4種不同的空間特征提取方案:①一層64個5×5卷積核的卷積層直接提取特征;②兩層卷積層串聯,即先經過32個3×3卷積核,再經過32個5×5卷積核提取特征;③兩層卷積層并聯后經過乘積運算融合特征,即將經過32個3×3卷積核直接提取的特征與經過32個5×5卷積核直接提取的特征通過乘積運算得到融合后的特征;④兩層卷積層并聯后經過拼接融合特征,即將經過32個3×3卷積核直接提取的特征與經過32個5×5卷積核直接提取的特征通過拼接得到融合后的特征。其中,方案④為本模型使用的融合方案。

圖9 損失值隨迭代次數增加的變化曲線Fig.9 Evolution of loss value with increasing number of epochs

2.3 試驗結果及分析

2.3.1 模型精度評價指標

試驗選用常用的模型預測結果衡量指標均方根誤差(RMSE)和平均百分比誤差(MAPE)來對模型精度進行評價。均方根誤差能夠衡量觀測值與真實值之間的偏差,平均百分比誤差能夠考慮預測值與真實值的誤差,以及誤差與真實值之間的比例。二者的值越小說明模型的精度越高。其計算公式如下

(3)

(4)

2.3.2 不同空間尺度和融合方式的精度對比

根據2.2節中設計的4種空間特征提取方案分別在兩個數據集上進行試驗,結果見表2。通過對比4種方法在兩個數據集上的試驗結果發現,本文方法在兩個評價指標上都具有更高的精度,主要結論為:

(1) 從卷積核數量來看,單一卷積核精度較多卷積核精度低,說明網絡通過增加卷積核及卷積層數量能夠提高模型的準確率和穩定性。

(2) 從卷積層連接方式來看,本文中采用卷積層并聯的方式比串聯的方式百分比誤差小1.9%~6.4%,這是因為串聯方式增大了感受野(原理如圖3所示),雖然強化了全局特征,但缺失了局部特征。而并聯方式同時提取了不同尺度下的空間特征,包含全局特征和局部特征,提升特征的豐富度,從而強化了下一層網絡的輸入,使輸出精度提高。

(3) 從并聯卷積層的特征融合方式對比,采用特征拼接比特征乘積方式百分比誤差小3.9%~4.4%,特征乘積后會導致特征間的線性關系改變,從而無法完全保留原有特征的特性,而使用拼接方式既能夠對特征進行融合,同時也保持了特征間的線性關系,是一種更為合理的融合方式。

此外,通過對比,在相同方案下NY數據集比SFO數據集的預測誤差要小19.9%~20.9%。說明在模型結構相同的情況下,數據的特性對于預測的結果也有較大的影響。在數據獲取條件相同的情況下,主要考慮數據稀疏度和密度。研究將數據的稀疏度定義為無人群流量的空白格網單元數占總格網數的比例,利用式(5)對數據的稀疏度進行計算

(5)

利用式(6)計算除去空白格網后單元格網的數據密度

(6)

式中,nv=0表示人群流量為0的空白格網數;n代表研究區域的格網總數;v代表單元格網區域的人群流量。

計算結果見表3。從表3可以看出,NY數據集比SFO數據集更稀疏,且單元格網的數據密度更大,這說明NY數據集存在更多無數據的空白區域,使得數據在空間分布上更加聚集,這種聚集效應增加了空間特征的顯著性,使得數據的特征明顯。

表2 不同空間特征提取方案的精度比較

研究選取某一格網單元在特征提取方案①和方案④(本文模型所采用的融合方案)的真實值與預測值進行了可視化,如圖10所示。發現在相同數據集上方案④的擬合效果更好,在不同數據集上,NY數據集的擬合效果更好。對于SFO數據集,在流量峰值附近的預測值與真實值誤差較大,說明模型對于峰值的預測有所欠缺。同時,對選取兩個數據集上一天中4個時間間隔的人群活動流量的真實圖和預測圖進行熱力圖繪制,如圖11所示。從預測結果上分析,NY數據集的預測圖與真實圖更接近,SFO對于流量高的區域預測結果較差;從人群活動區域分析,人群活動主要集中在固定的區域,說明人群活動遵循一定的空間規律;從時間語義上分析,不同時段同一區域的流量不同,比如凌晨的人群活動流量較其他時間間隔流量較少,說明人群活動遵循一定的時間規律。

圖10 不同方案人群流量真實值與預測值擬合結果Fig.10 Comparison of real value and predicted value of crowd flow in different schemes

圖11 不同時間間隔人群流量真實值與預測值熱力圖Fig.11 The visualization of real and predicted values of crowd flow at different time intervals

2.4 本文方法與常用時空預測方法精度對比

為驗證本文方法MST-Net模型相比于其他方法的有效性,試驗選取歷史平均模型HA[9]、自回歸平均移動模型ARIMA[10]、支持向量回歸SVR[33]、門控循環單元GRU[29]和時空動態網絡(spatial-temporal dynamic network,STDN)[18]5種方法進行對比,結果見表4。試驗結果表明,在均方根誤差和平均百分比誤差上,MST-Net模型優于其他方法,尤其在NY數據集上的表現更為顯著,平均百分比誤差最大降低了76.81%,表明了本文提出模型對人群活動流量預測任務上的有效性。傳統的時間序列模型(HA和ARIMA),和基于回歸的方法(SVR),在該任務上表現欠佳,主要因為這些方法一方面依賴于歷史數據,忽略了空間因素,另一方面是對于這種具有周期性和趨勢性的非平穩的時間序列數據難以很好的擬合;而GRU和STDN在該問題上取得了較好的效果,說明基于神經網絡的方法能夠較好地擬合復雜的非線性的時空數據。但是GRU在進行預測時,只提取了時間維度的特征,同樣忽略了空間特征,STDN雖然考慮了空間特征,卻只考慮了單一尺度,而本文方法能夠較好地擬合復雜的非線性時空關系且顧及空間多尺度特征,因而具有更高的精度。

表4 本文方法與常用時空預測方法精度對比

3 結 論

由于傳統時空預測模型大多基于單一尺度的空間特征進行時空預測,難以顧及多尺度空間特征對預測結果的影響,因此,本文提出基于卷積神經網絡且通過并聯卷積方式融合空間多尺度特征的時空網絡人群活動預測模型,并在兩組真實的社交媒體簽到數據集上來驗證模型的有效性。試驗結果表明,與基于單一尺度空間特征的時空預測模型相比,基于多尺度空間特征的時空預測模型能夠獲取更完備的空間特征以提高預測精度,進而更好地提取人群活動在空間上的動態變化,實現人群活動規律的探索。

但是本文提出的方法是基于規則格網上的,受格網單元形狀和大小的限制。一方面,時間尺度對于模型的邊界效應和影響程度需要進一步試驗和論證;另一方面,本文僅采用社交媒體簽到數據,存在不能充分反映人群流量的問題。下一步可融合其他類型的感知數據,例如GPS軌跡數據等來反映人群流量;此外,人群活動還包含有豐富的空間語義信息,如何融合空間語義信息,實現人群活動規律的可解釋性也是下一步研究的重點。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 91国内视频在线观看| 伊人查蕉在线观看国产精品| 日本中文字幕久久网站| 中文字幕在线看| 亚洲V日韩V无码一区二区| 伊人久久福利中文字幕| 一级毛片在线免费看| 91精品专区国产盗摄| 亚洲欧美国产视频| 久久综合久久鬼| 一级毛片免费的| 日韩在线观看网站| 精品91视频| 香蕉伊思人视频| 色婷婷在线播放| 少妇精品在线| 999国产精品永久免费视频精品久久 | 久久综合干| 国产高清毛片| 国产乱论视频| 亚洲视频二| 国产91视频观看| 成人福利在线免费观看| 久久96热在精品国产高清| 精品视频在线一区| 天堂av高清一区二区三区| 国产精品视频导航| 欧美激情网址| 久久a毛片| 日韩高清中文字幕| 婷婷五月在线| 九九视频在线免费观看| 久久99精品久久久久久不卡| 色天天综合久久久久综合片| 色哟哟精品无码网站在线播放视频| 国产丝袜无码精品| 成人国产精品网站在线看| 亚洲国产91人成在线| 国产成人无码AV在线播放动漫 | 日本成人精品视频| 中文字幕人妻无码系列第三区| 欧美日韩国产综合视频在线观看| 亚洲色图欧美视频| 国产精品成人观看视频国产 | 国产高清在线观看| 大陆精大陆国产国语精品1024| 亚洲精品无码不卡在线播放| 亚洲熟女偷拍| 日本不卡视频在线| 日韩毛片免费| 日韩人妻少妇一区二区| 国内精品小视频在线| 日韩欧美中文在线| 青青青国产视频手机| 国产乱人乱偷精品视频a人人澡| 六月婷婷激情综合| 91亚瑟视频| 国产精品部在线观看| 国产在线精彩视频二区| 精品一区二区无码av| 中文字幕在线一区二区在线| 中文国产成人久久精品小说| 亚洲人成网址| 一本久道久久综合多人| 91精品啪在线观看国产60岁| 亚洲欧美精品一中文字幕| 香蕉在线视频网站| 亚洲最新在线| 丰满人妻一区二区三区视频| 黄色网页在线观看| 色婷婷啪啪| 国内精品一区二区在线观看| 欧美第一页在线| 国产午夜一级淫片| 亚洲AⅤ永久无码精品毛片| 久久一日本道色综合久久| 成年网址网站在线观看| 一级毛片免费播放视频| 亚洲精品视频免费观看| 久久精品日日躁夜夜躁欧美| 国产欧美精品一区aⅴ影院| 亚洲色图欧美激情|