999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

SARIMA-LSTM組合模型在鐵路疫情短時客流的預測研究

2023-04-11 12:41:54魏姝瑤
關鍵詞:疫情模型

魏姝瑤,張 瑾

(昆明理工大學 交通工程學院, 昆明 650504)

2019年12月武漢市發現新型冠狀病毒后,為了抑制病毒的快速蔓延,國家采取了一系列全國范圍內的交通管制措施,這些政策性措施對鐵路客運組織造成了巨大沖擊[1]。目前鐵路運營管理仍舊是依靠調度員的經驗來判斷客流變化,這就造成部分鐵路部門應對像新冠肺炎這樣的重大公共衛生突發事件的能力和準備不足,難以適應客流的波動特征[2]。因此,有必要研究鐵路突發性事件的短時客流預測問題,為運營管理提供理論依據。

鐵路客流短時預測的方法大致可分為線性模型、非線性模型和組合模型3種[3]。時間序列模型作為最傳統的線性客流預測方法,如Zhu[4]通過n日移動平均客流量指標,建立ARlMA模型預測上海地鐵客流的變化情況;Rusyana等[5]運用SARIMA季節模型將數據建模為依賴于前一個季節的值而不是之前的原始序列值,應用這種方法更加精確地預測了吉隆坡國際機場入境游客數量。這類模型的缺陷在于只關注數據在時間維度上的變化特征,通過測量其相關性和變化趨勢來建立模型并用于預測,但顯然還有許多其他因素和信息尚未參考,如難以捕捉的空間維度信息等。因此,經典時間序列模型對于復雜的多變量非線性關系的建模并不理想。隨著數據采集手段的進步和歷史數據量的增加,以神經網絡為代表的非線性模型發展迅速,在模式識別、樣本分類、預測等領域得到廣泛應用,如Sha等[6]提出了一種基于RNN的地鐵客流預測方法,但是隨著相關理論知識的不斷完善,發現RNN不能很好地處理遠距離依賴的問題;Liu等[7]將LSTM模型應用于短時客流預測,解決了RNN在訓練期間梯度消失的問題。Chen等[8]則針對長短期記憶(LSTM)模型在城市交通流預測中準確率低的問題,提出了一種基于注意機制的LSTM模型。該模型計算每個過去值和當前值之間的相關性,為這些過去值分配不同的權重,并衡量它們對當前值的重要性。為了更加充分地發揮二者在線性方面和非線性方面的互補優勢,近年來,出現了將以上2種方法混合建模的發展趨勢,如ARIMA和BP神經網絡[9]、ARIMA模型和小波神經網絡[10]等組合模型。因為隨著經濟的快速發展,軌道交通給人們帶來快速便捷出行方式的同時,不可否認線路的日益復雜和客流的迅速增加也給鐵路運營的調試和管理帶來了巨大的壓力,而運用組合模型預測短時客流對緩解軌道交通壓力具有重要意義。

上述組合模型的研究雖有助于短期客流預測,但是都缺少對短期異常客流預測的關注。本文將因新冠疫情對春運期間日客流量造成的異常波動稱之為異常客流。在面對新冠肺炎疫情這樣的突發事件時,客流的變化具有很大不確定性,所以降低了歷史數據的參考價值。因此,對于罕見的相似樣本(例如在春運期間本該持續上升的客流量卻因疫情防控的管制而持續大幅下降的現象所產生的數據樣本)和不確定的發展趨勢,短期異常客流預測是困難的。在研究疫情期間客流的估計問題時,根據相關研究和實例分析,SARIMA模型在基于相似歷史樣本的線性回歸中具有優勢,能夠很好地進行客流預測。然而,對于罕見的相似樣本,就需要結合非線性分析來減弱SARIMA季節模型局限性帶來的誤差。因此,提出SARIMA-LSTM滾動優化模型,在SARIMA線性回歸基礎上,增加LSTM神經網絡模型,運用滾動優化的方法進行訓練。同時,受自然語言處理中注意力機制的巨大成功的啟發,基于交通流數據也是時間序列數據的事實,嘗試將注意力機制加入LSTM模型中,并將該模型應用于短時交通流預測領域,以反映罕見的大隨機波動。

1 基于SARIMA-LSTM運用滾動算法建立短期客流預測模型

1.1 SARIMA季節模型

春運期間鐵路日客流量有明顯的季節性和周期性波動現象,為了處理這類時間序列問題,采用季節性時間序列模型(SARIMA),即SARIMA(p,d,q)(P,D,Q)S。其中p和P分別表示自回歸和季節自回歸的順序;d和D分別代表著根據不同差異和不同季節差異進行的排列組合;q和Q分別表示移動平均線和季節移動平均線的順序[11]。公式如下:

(1)

其中,

φ(BS)=1-φ1BS-…-φpBS

?(BS)=1+?1BS+…+?qBS

1.2 LSTM神經網絡模型

由于疫情期間很少有相似的歷史數據,SARIMA模型也無法反映異常的客流波動。因此,設計了滾動優化方法來訓練長短期記憶(LSTM)神經網絡,充分利用實時數據,及時反映異常波動。LSTM神經網絡的核心是增加存儲器神經元和柵極控制單元,存儲神經元通過存儲當前信息和提取數據將信件填充到時間序列鏈中[12]。因此,以較早的時間為單位的信息可以以較晚的時間為單位傳輸,從而減緩信息丟失的速度,提高信息存儲容量。LSTM網絡的神經元結構如圖1所示。Xt、ht和Ct分別表示時間t的輸入向量、隱藏狀態和單元狀態。相應的LSTM正向傳播方程[13]如下:

it=σ(Wiixt+Whiht-1+bi)

(2)

ft=σ(Wifxt+Whfht-1+bf)

(3)

gt=tanh(Wigxt+Whght-1+bg)

(4)

Ot=σ(Wioxt+Whoht-1+bo)

(5)

Ct=ft*Ct-1+it*gt

(6)

ht=Ot*tanh(Ci)

(7)

其中:it、ft、gt分別是輸入門、遺忘門和輸出門;Wii、Whi、bi分別是輸入權重矩陣、回歸權重矩陣和輸入門的偏差項;Wif、Whf、bf分別是輸入權重矩陣、回歸權重矩陣和遺忘門的偏差項;Wig、Whg、bg分別是輸入權重矩陣、回歸權重矩陣和輸入層到隱藏層的偏差項;Wio、Who、bo分別是輸入權重矩陣、回歸權重矩陣和輸出門的偏差項;σ代表sigmoid函數。

圖1 LSTM網絡的神經元結構示意圖

1.3 LSTM滾動優化預測算法

由于時間相關性有一定的社會原因,任何一天的乘客需求都會受到其他時間的影響,特別是受到相鄰時間段的影響。為了表示這種相關性,運用滾動優化預測算法,這種算法在模型預估時,每個采樣時刻都要根據當前的預估誤差重新計算控制作用的變化量,不斷滾動計算。就算是遇到類似新冠疫情的重大公共衛生突發事件,也能通過這種累計方法使預測值始終處于一種動態平衡狀態。

1.4 SARIMA-LSTM組合模型

本文中建立的組合預測模型結合了2種性能互補算法,有效克服了單一算法在預測方面的局限性,提高了預測精度。因為SARIMA模型可以很好地擬合序列中的線性關系,LSTM神經網絡可以挖掘序列中的非線性關系。通過2種模型的結合,可以發揮兩者的優勢,對復雜時間序列進行有效預測。而鐵路短時客流因受新冠疫情影響,形成了2條不同特征的客流曲線,這就是一種復雜的時間序列。

因此,采用Attention Mechanism的方法,可以幫助模型對輸入的X每個部分賦予不同的權重,抽取出更加關鍵及重要的信息,使模型做出更加準確的判斷,同時不會對模型的計算和存儲帶來更大的消耗[15]。把SARIMA模型的異常值代入LSTM神經網絡后,訓練集數據波動較大,隨著網絡深度的不斷加深,會造成網絡退化問題。而AttentionMechanism機制的引入有效緩解了網絡模型訓練過程中反向傳播梯度消失的問題,還解決了深度網絡的訓練難度和性能下降的問題[16]。注意力層的實現是由LSTM編碼器保留輸入序列的中間輸出結果,計算前一層的中間輸出結果與當前輸出的相似度,得到權重因子,最后得到注意力系數,如圖2所示。

圖2 在LSTM模型中增加注意力機制的過程示意圖

H=[h1,h2…hn]

(8)

(9)

(10)

(11)

(12)

式中,首先使用向量H和H′進行計算獲得權重的相似度,其次使用softmax功能對權值進行歸一化,然后使用歸一化權值ai和hj加權求和,最后得出的結果就是注意力權重值Ci。

2 實例分析

2.1 數據分析

本文以南昌火車站春運期間的原始客流數據為依據作出客流時序圖。從圖3(a)中可以發現,2015—2019年春運期間鐵路局的日客流量呈周期性上升狀態,而2020年本應上升的趨勢卻因新冠疫情的影響,導致了春運期間總客流量同比2019年下降53.6%。2021年在疫情常態化背景下,“就地過年”成為越來越多人的選擇,客運量較往年降幅依然明顯,雖然比2020年同比增長11.2%,但也僅為疫情前正常年份的51.6%。

圖3 2015—2021年春運期間日客流量曲線

通過分析圖3(b)可以發現,2020年春運前14 d符合春運周期性變化趨勢,然而從1月24日(除夕)開始鐵路日客流量呈現斷崖式下降。所以,首先利用2015—2019年南昌站春運期間前14 d的客流數據建立SARIMA季節模型,預測2020年前14 d的日客流量,從第15 d開始因受疫情影響,將其導入LSTM滾動優化模型進行計算,得到后26 d非線性預測模型的計算結果。最后為精度評定,除了將預測值與2020春運實測值進行比較外,還使用了SARIMA季節模型和門控循環單元網絡(GUR)來預測樣本,比對預測數據,驗證預測模型。

2.2 預測步驟

結合SARIMA季節模型與LSTM滾動優化神經網絡,構建組合預測模型,算法流程如圖4所示,對疫情期間鐵路春運日客流進行預測,該模型輸入數據為南昌站2015—2019年春運40 d的原始客運量,輸出數據為用組合模型預測出的2020年春運日客流量。

圖4 算法流程框圖

對在疫情期間鐵路春運客流量的原始數據進行去均值化處理。通過一階差分后,對數據的平穩性進行檢驗,使用的是單位根檢驗(即ADF),表1顯示的t統計值為-4.306,明顯比各顯著水平的臨界值小,故差分后的序列可以通過平穩性檢驗。

表1 ADF檢驗

通過繪制自相關圖(ACF)和偏自相關圖(PACF)對模型進行定階。如果有一個進入藍色置信區域(一般取95%)的點,并且在其之后的點大部分都在此區域內浮動,該點就可以暫定為q和p的值,如圖5和圖6所示。

圖5 自相關圖(ACF)

圖6 偏自相關圖(PACF)

通過赤池信息準則(AIC)對上述函數所產生的所有參數項進行評估,篩選后得出在SARIMA(1,1,1)*(0,1,1,12)時,AIC最小。由此,可以利用SARIMA模型通過2015—2019年春運前14 d預測2020年春運前14 d的客流量。

通過時間序列對數據的處理,發現春運第15 d開始因受疫情影響,日客流量大幅度下降,這與上階段數據分析中的結果相吻合。因此,從第15 d開始的客流量定義為異常值,將其權重置零,即讓SARIMA特征檢測器暫時停止工作,導入LSTM神經網絡進行計算。首先通過輸入層將預處理后的輸入數據傳輸到下一層,并在神經網絡中嵌入了注意機制模塊,在Attention LSTM模型的構建中確定網絡的結構。將輸入層的大小設置為輸入系列長度,隱藏層編號設置為2,把歷史數據和最新數據共同作為訓練集數據,對新的訓練集數據持續學習,不斷調整模型參數,滾動更新數據變化,找出最新規律,以提高預測的準確率。運算過程中產生了殘差學習單元,把它們組成殘差模塊,該單元主要由2個分支組成,第一個是殘差學習分支,另一個是輸入的身份映射分支。用X表示輸入,F(x)表示殘差映射,那么殘差學習單元的輸出就是H(x)=F(x)+x,如果殘差結果趨近于白噪聲序列,那么累加層只用于恒等式映射。因此,接下來的訓練目標是將殘差結果趨近于白噪聲序列,這樣隨著網絡的深入,精度就不會再下降。其次進入輸出層,對神經網絡計算的分量進行歸一化處理,得到LSTM滾動優化模型的預測結果;最后將前14 d的SARIMA線性模型預測數據與后26 d的LSTM神經網絡模型預測數據代入權重組合法,計算前一層的中間輸出結果與當前輸出的相似度,得到權重因子,同時得到注意力系數,再利用梯度下降法對2種互補算法的訓練結果進行權重優化,計算出組合模型的預測誤差,得到2020年春運40 d客流預測數據。

2.3 預測結果及精度評定

首先,將被歸一化的樣本數據輸入到SARIMA-LSTM組合模型中。使用梯度下降的公式進行反向傳播計算,不斷更新模型的權重。每迭代1次,都要計算模型的當前誤差精度,結果如圖7所示。可以看出,經過200次迭代訓練,訓練誤差的精度線損失從0.727 8下降到0.042 5并保持穩定,效果良好。

圖7 迭代誤差變化曲線

其次,使用SARIMA季節模型和SARIMA-GUR組合模型來預測樣本數據,將結果與本文選取的SARIMA-LSTM組合模型進行比較。由圖8可知,僅使用SARIMA季節模型預測的春運日客流量真實值與預測值差距很大,嚴重失真。而在加入了神經網絡模型對非線性部分進行擬合后,實驗精度得到了極大提高,這是因為線性模型對隨機性、突發性強的交通流數據的預測效果不佳,組合模型具有更好地預測控制性。

圖8 2020年春運實際日客流量與 3種模型預測值曲線

最后,為了驗證長短期記憶網絡(LSTM)和門控循環單元網絡(GRU)在短時客流中的預測精度,比較這2種神經網絡在組合模型中的性能差異。使用平均百分比誤差(MAPE)和均方根誤差(RMSE)作為檢驗模型的評價指標,公式如下:

(13)

(14)

表2顯示了不同模型的預測結果誤差。結果表明,在整個預測期內,SARIMA-LSTM組合模型的預測精度總體上優于SARIMA-GRU組合模型。從模型原理分析原因,門控循環單元網絡(GUR)只有一個門控來遺忘和選擇內存,且參數較少,而長短期記憶人工神經網絡(LSTM)可以使用更多的門控和更多的參數來完成相同的任務,所以在客流異常且波動很大的情況下,與LSTM相比,GRU的性能損失更為嚴重。

表2 預測結果誤差

3 結論

1) 提出了一種基于SARIMA-LSTM的組合模型對疫情期間南昌火車站的春運日客流數據進行了預測。該方法中,穩態序列由SARIMA季節模型計算,將穩態序列和時間序列作為周期特征輸入。同時設計了一種LSTM滾動優化模型,該模型利用實時樣本和歷史樣本進行滾動預測,可以更及時、更近似地反映異常流量的波動情況。最后,將2種模型的預測結果加權求和得到最終的預測數據。

2) 利用SARIMA模型和LSTM滾動優化模型的互補優勢,在模型的預測中,大大降低了組合模型的平均百分比誤差(MAPE)和均方根誤差(RMSE),提高了在突發事件中異常客流的預測精度,其精確度達到了72.7%。當面臨突發性重大衛生公共事件時,可以解決鐵路短時客流預測問題,緩解因客流大幅減少而造成的鐵路客運部門直接性經濟損失。

3) 實驗中還存在一些不足,比如實驗數據只使用實時樣本和歷史樣本,沒有考慮其他外部因素。因此,在后期的研究工作中,還需考慮影響客流的其他環境因素,如天氣、臨時組織措施與地鐵等其他交通方式的連接狀態等,從而得到更準確的預測模型。

猜你喜歡
疫情模型
一半模型
戰疫情
重要模型『一線三等角』
抗疫情 顯擔當
人大建設(2020年5期)2020-09-25 08:56:22
疫情中的我
疫情當前 警察不退
北極光(2020年1期)2020-07-24 09:04:04
重尾非線性自回歸模型自加權M-估計的漸近分布
待疫情散去 春暖花開
文苑(2020年4期)2020-05-30 12:35:48
疫情期在家帶娃日常……
37°女人(2020年5期)2020-05-11 05:58:52
3D打印中的模型分割與打包
主站蜘蛛池模板: 亚洲精品无码AⅤ片青青在线观看| 欧美成一级| 五月婷婷精品| 欧美色丁香| 国产不卡在线看| 欧美一区福利| 欧美啪啪一区| 国产自视频| 亚洲欧美另类中文字幕| 久久99国产综合精品1| 国产91麻豆视频| 一级毛片免费观看久| 国产jizz| 国产呦视频免费视频在线观看| 好紧好深好大乳无码中文字幕| 亚亚洲乱码一二三四区| 亚洲欧洲一区二区三区| 国产杨幂丝袜av在线播放| 免费三A级毛片视频| 国产精品播放| 亚洲成人高清在线观看| 青草午夜精品视频在线观看| 国产91小视频| av大片在线无码免费| 天堂va亚洲va欧美va国产| 熟妇丰满人妻| 国产精品午夜电影| 亚洲精品自拍区在线观看| 久久成人国产精品免费软件| 亚洲成网站| 国产一区二区丝袜高跟鞋| yjizz国产在线视频网| 国产在线专区| 爱爱影院18禁免费| 欧美v在线| 看看一级毛片| 亚洲欧洲日韩久久狠狠爱| 亚洲天堂网站在线| 国产无码高清视频不卡| 麻豆精品在线| 免费无码AV片在线观看中文| 综合色亚洲| 91年精品国产福利线观看久久 | 国产美女精品在线| 国产熟女一级毛片| 亚洲欧美自拍中文| 亚洲中文字幕23页在线| 欧美午夜在线视频| 国产午夜精品鲁丝片| 在线国产毛片| 91丨九色丨首页在线播放 | 欧美日韩在线成人| 嫩草在线视频| 91香蕉视频下载网站| 亚洲综合色婷婷中文字幕| 性网站在线观看| 免费人成视网站在线不卡| 无码内射中文字幕岛国片| 亚洲综合专区| 国产青榴视频| 国产成人精品免费av| 97超碰精品成人国产| 91国语视频| 69国产精品视频免费| 91成人免费观看在线观看| 58av国产精品| 被公侵犯人妻少妇一区二区三区| 国产精品黄色片| 一级做a爰片久久免费| 蜜芽国产尤物av尤物在线看| 99视频国产精品| 欧美一级爱操视频| 国产精品分类视频分类一区| 蜜桃视频一区二区| 国产精品亚洲片在线va| 色欲不卡无码一区二区| 一边摸一边做爽的视频17国产| 国产永久无码观看在线| 欧美日韩综合网| 国产麻豆aⅴ精品无码| 狼友视频国产精品首页| 色天天综合久久久久综合片|