999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于改進Logistic-SSA-BP神經網絡的 地鐵短時客流預測研究

2023-05-09 05:02:36胡明偉何國慶吳雯琳
關鍵詞:模型

胡明偉,何國慶,吳雯琳,趙 千

(1. 深圳大學 土木與交通工程學院,廣東 深圳 518060; 2. 濱海城市韌性基礎設施教育部重點實驗室(深圳大學), 廣東 深圳 518060; 3. 深圳大學 未來地下城市研究院,廣東 深圳 518060)

0 引 言

城市地鐵以其經濟、便利、高效的運營優勢,逐漸成為大眾出行的首要選擇,現在城市地鐵的客流也與日俱增[1]。據相關統計,截至2021年6月全國41個城市地鐵總客運量達19.61億人次,日平均6 577.76萬人次,比2019年6月上漲0.94%。面對日益龐大的地鐵客流,通過歷史客流數據精準預測未來的短時客流量,是地鐵運營公司制定日常行車計劃和突發事件緊急疏散預案的重要依據。因此,如何對城市地鐵短時客流量進行高效、準確預測是地鐵運營管理者所關注的問題。

近些年來,地鐵客流短時預測領域的研究已受到國內外學者高度關注,常見的客流預測方法可分為統計學的客流預測方法和機器學習的客流預測方法。

統計學的客流預測方法包括平均模型、時間序列模型、指數平滑模型、卡爾曼濾波模型和非參數回歸模型等[2-3]。B.M.WILLIAMS等[4]提出了基于季節性移動平均(SARIMA)的客流預測模型;韓超等[5]通過改進ARIMA,減少遺忘因子,以達到提升模型預測精度的目的;熊杰等[6]通過構建卡爾曼濾波模型,實時采集最新數據,以此得到早晚高峰期客流量的精準預測。

機器學習的客流預測方法主要包括支持向量機、貝葉斯及神經網絡等[7]。HAN Huiting等[8]提出了基于XGBoost的高速鐵路客流預測模型,通過對高鐵訂票信息作為重要的客流特征進行模型訓練,得到的預測值比傳統模型預測值精度更高;張淑玉等[9]從歷史客流數據和預售期已售票額出發,提出了基于發車時間、行車時間、休息日等客流特征的貝葉斯預測模型,在客流預測中取得較好效果;李若怡等[10]將時空特征作為輸入層,采用改進的LSTM模型對運營客流OD數據進行預測。

BP神經網絡作為最典型的深度學習方法,被眾多學者用于客流預測[11-12]。但傳統BP神經網絡常伴著準確度低、收斂時間長、結果易陷入局部最優等情況[13-17]。因此,學者們常通過其他算法對BP神經網絡模型加以改進,從而提高預測結果的準確性和收斂速度。惠陽等[18]通過改進的粒子群算法,優化了BP神經網絡,使地鐵客流預測的準確性有極大提升;傅晨琳等[19]提出了基于集合經驗模態分解法優化BP神經網絡,構建了地鐵客流短時預測模型,探究了日間客流波動的影響因素;張藝銘等[20]通過將余弦思想和動態權重改進的灰狼算法,與BP神經網絡結合,達到提高軌道交通短時客流預測的目的;王國梁等[21]提出通過麻雀算法優化BP神經網絡,建立了小米米粉糊化預測模型,由實驗對比發現,優化后的BP神經網絡能提高在小米米粉糊化特征指標回歸、預測上的優勢。

麻雀搜索算法(sparrow search algorithm, SSA)[22-25]是近年來提出的一種新型啟發式算法,它來源于麻雀的捕食和反捕食行為,具有尋優能力強、收斂速度快、全局性良好等特點;在故障檢驗、關鍵參數辨識、路徑優化等方面有著較好的效果,但在地鐵客流預測上的研究較少。鑒于此,筆者提出了一種新的BP神經網絡回歸預測模型(Logistic-SSA-BP)。該模型利用Logistic混沌映射后的麻雀搜索算法(Logistic-SSA)尋優能力強、收斂速度快的特點,對傳統的BP神經網絡進行改進,提升了其在地鐵客流預測中的收斂速度和預測精度,并通過深圳地鐵歷史客流數據進行了實例驗證。

1 SSA與BP神經網絡原理

1.1 SSA原理

SSA算法是根據麻雀捕食與躲避捕食行為提出的新型啟發式優化算法。相較于其他傳統算法,該算法在精度、收斂速度和穩定性上都具有一定優勢[26]。SSA算法建模過程如圖1。

圖1 麻雀算法(SSA)流程

其具體步驟如下:

步驟1:確定初始化種群;

步驟2:確定種群迭代次數,以及初始探索者和融入者比例;

步驟3:計算族群適應度值;

步驟4:通過式(1)迭代探索者位置;

步驟5:通過式(2)迭代融入者位置;

步驟6:通過式(3)迭代預警者位置;

步驟7:計算適應度值和麻雀位置;

步驟8:判斷是否符合終止條件,若符合則退出計算,并輸出最終結果,否則,回到步驟2重新開始計算。

麻雀群作為一個智能群體,在捕食過程中具有明顯的分工行為,分別為探索者、融入者和預警者。其中:探索者作為主要的食物搜索個體,往往最快找到食物,融入者是一部分跟隨探索者的個體,預警者是麻雀群中負責預警的個體,當危險來臨時,會提醒放棄捕食行為。通常由于探索者負責發現食物,所以具有最大的搜索區域[27],在模型中表現為較高的適應度值。探索者和融入者身份是隨時動態變化的,當預警值大于安全閥值時,探索者會將融入者帶到其它安全地區進行捕食。

SSA算法中經過每次迭代,探索者的位置更新為如式(1):

(1)

若R2≥SST時,意味著族群中一部分麻雀發現危險,并向族群發出預警信息,此時整個種群中的麻雀會立即飛往其它安全地區捕食;若R2

融入者在跟隨探索者過程中,其位置更新如式(2):

(2)

式中:A為l×d的矩陣,矩陣中每個元素取值為1或-1,且A+=AT(AAT)-1;n為族群規模;XP為當前探索者位置;Xworst為當前所有捕食的最差位置。

若i>n/2時,表示第i個融入者的適應度值較低,必須到其他區域捕食,以此獲得更多能量。

預警者作為族群中最先發現危險的麻雀,初始位置會在族群中隨機生成,其表達如式(3):

(3)

若fi>fg時,說明麻雀正位于族群邊緣,可能會出現被捕食的危險;若fi=fg時,說明麻雀察覺到危險,為躲避危險,會盡可能向其它麻雀靠攏。

1.2 BP神經網絡原理

BP(back propagation)神經網絡實質是多層感知器的一種,它能按誤差逆傳播進行算法訓練,是應用最為普遍、最為成功的神經網絡模型之一[28-29]。BP神經網絡模型結構由3部分組成,分別為輸入層(input)、隱藏層(hide layer)和輸出層(output layer),每部分可由多個神經元組成,常見的BP神經網絡中隱藏層可有單層和多層之分,其結構如圖2。

圖2 BP神經網絡結構

對于絕大部分預測模擬實驗而言,單層隱藏層具有精度高且速度快的優勢[30]。通常決定BP神經網絡性能高低的參數主要取決于隱藏層節點數、激活函數和學習效率的選取。隱藏層神經元個數越少,BP神經網絡模擬效果就越差,反之隱藏層神經元個數越多,BP神經網絡模擬效果越好;激活函數和學習率的選取決定了識別率和收斂速度,若設定的學習率過低,會造成神經網絡的收斂時間變長,相反若設定的學習率過高,則可能導致模擬無法收斂,甚至還會降低識別率。

2 改進的Logistic-SSA-BP預測模型

2.1 Logistic混沌映射優化

為避免麻雀搜索算法(SSA)因收斂變化使族群多樣性下降,陷入局部最優問題,筆者采用Logistic混沌映射初始化麻雀族群,對族群中的適應度進行排序,取靠前個體作為初始化族群,以此在一定程度上增加族群多樣性,提高輸出結果精確度。Logistic混沌映射作為經典的混沌映射方法之一,被廣泛的應用于安全、通信領域。其表達如式(4):

Xn+1=α×Xn× (1-Xn)

(4)

式中:α∈[0, 4],Xn∈[0, 1]。

當0≤Xn≤1時,初始條件X0在Logistic映射下其序列呈現非周期、不收斂狀態,而此范圍之外,產生的序列必定收斂于特定值。

2.2 Logistic-SSA-BP模型

筆者采用Logistic混沌映射方法優化麻雀搜索算法(SSA),提高初始麻雀族群質量,有助于增強算法收斂性和精確性,然后將改進后的算法用于優化BP神經網絡,并結合訓練集和測試集數據樣本,設計改進麻雀算法的適應度函數EFitness,其模型如式(5):

(5)

式中:TTrain為訓練集的樣本;TTest為測試集的樣本。

根據適應度函數值的大小,能直觀反應訓練和預測的準確性,若計算得到的適應度函數值越小,即均方誤差EMS越小,表示訓練越準確,且模型的預測精度更好。

筆者構建了Logistic-SSA-BP神經網絡預測模型,借助Logistic-SSA算法的優秀尋優能力和迅捷收斂優勢,能提升預測結果的精度。其建模過程如圖3。

圖3 Logistic-SSA-BP預測模型流程

具體步驟如下:

步驟1:初始化參數;

步驟2:確定BP神經網絡的拓撲結構;

步驟3:通過Logistic混沌映射法對族群進行初始化處理,調整族群規模、迭代次數、探索者、融入者和預警者比例;

步驟4:計算族群中適應度值,并對不同的適應度值進行排序,得到最優適應度fg和最差適應度fw;

步驟5:通過式(1)~式(3),更新探索者、融入者、預警者位置信息;

步驟6:判斷位置信息是否滿足終止條件,若滿足,則輸出最優位置信息,進入步驟7,若不滿足,則回到步驟3,直至位置信息滿足終止條件(是否達到最大迭代次數或達到最初設定的收斂精度);

步驟7:根據最優位置信息,輸出BP神經網絡最優權值和閥值參數;

步驟8:對數據訓練集進行神經網絡訓練;

步驟9:測試集進行仿真預測,輸出預測結果。

3 模型準確性評價指標

在深度學習領域中,預測模型的準確性評價是一個不可或缺的環節,不同類型的模型評價方法也大相徑庭。為反映真實值和預測值誤差的同時,還能進一步計算誤差占真實值的百分比,因此筆者以平均絕對誤差、均方根誤差及平均絕對百分誤差作為客流預測模型準確性的評價指標。

3.1 平均絕對誤差(MAE)

在真實值和預測值差值的絕對值基礎上,通過求解算術平均值的方式來避免誤差抵消問題。平均絕對誤差(MAE)指標值大小(用EMA表示)直接反映模型性能的好壞,若值越小則性能越好,若越大,則相反。其具體表達如式(6):

(6)

3.2 均方根誤差(RMSE)

對于某些誤差值比較敏感,能夠明顯反映預測值與真實值的偏離程度。若均方根誤差值(用ERMS表示)越小,則反映預測值與真實值越接近,對應的預測模型性能越好;若均方根誤差值越大,則表明預測模型性能越差。其具體表達如式(7):

(7)

3.3 平均絕對百分誤差(MAPE)

在反映預測模型真實值和預測值之間誤差的同時,還反映誤差與真實值的百分比。若平均絕對百分誤差值(用EMPA表示)越小,則表明模型預測值越接近真實值,模型性能越好,預測精度越高,若平均絕對百分誤差越大,則相反。其具體表達如式(8):

(8)

在式(6)—式(8)中:xi表示真實值;x′i表示預測值;N代表樣本個數。

4 實例分析

4.1 樣本數據來源

為檢驗文中所提出的Logistic-SSA-BP回歸預測模型是否有效。筆者選擇深圳地鐵一號線西鄉站2017年9月1日—9月30日早上06:30—23:30的AFC進、出站刷卡數據作為實驗原始數據,原始數據以30 min為粒度進行統計,數據量共2 040組。其中:實驗以9月份前29 d進、出站刷卡數據為訓練樣本,第30 d進、出站數據為測試樣本,將得到的預測值分別與真實值進行對比(用于檢驗真實值與不同模型預測值情況)。

4.2 模型參數設置

根據對3種模型(BP、SSA-BP、Logistic-SSA-BP)預測流程的分析,為方便對比不同種類神經網絡預測模型的預測精度及收斂速度,實驗中所有神經網絡預測模型均采用部分相同參數的設置。例如:模型訓練次數統一設為1 000次,模型學習速度為0.01,訓練目標最小誤差為0.000 01,最大迭代次數為100。具體參數設置如表1。

表1 3種預測模型參數設置

4.3 預測結果分析

實驗采用MATLAB 2016a軟件對原始數據進行編程處理,處理過程包括錯誤與冗余數據修改,劃分訓練集與測試集,對數據進行歸一化處理等。將處理完畢的數據分別輸入到文中構建的BP、SSA-BP、Logistic-SSA-BP神經網絡預測模型中,進行地鐵短時客流預測,最終實驗預測結果,如圖4、圖5。圖4為測試數據集的真實值與不同模型短時預測值對比情況;圖5為Logistic-SSA-BP與SSA-BP適應度曲線情況。

由圖4可知:深圳市西鄉站全天進、出站客流存在明顯的早晚高峰潮汐現象,早高峰一般集中在07:30—08:30,晚高峰一般集中在18:00—19:00。圖4中:無論是傳統BP神經網絡預測模型,還是改進過的SSA-BP及Logistic-SSA-BP模型,都可以捕捉到西鄉站進、出站客流早晚高峰的客流特征,對客流的變化態勢以及峰值擬合都較為準確,可以實現較好的客流預測效果。

由圖5可知:經Logistic混沌映射的麻雀搜索算法優化BP神經網絡,其預測速度及適應度值下降速度明顯加快、種群進化代數明顯更少,反映出改進后的模型其預測效率更高。

圖4 不同模型預測結果與真實值對比

圖5 Logistic-SSA-BP與SSA-BP的適應度曲線

為更明顯評判3種BP神經網絡模型的預測結果,筆者根據式(6)~式(8)分別計算3種預測模型的MAE、RMSE和MAPE,并通過計算值進行橫向對比分析。具體指標對比情況如表2。

表2 3種預測模型的評價指標對比

由表2可知:不同模型的評價指標值存在明顯差異,改進后的BP模型要比傳統BP神經網絡預測模型效果更好。Logistic-SSA-BP模型的進站客流預測,EMA=39.83,ERMS=52.52,EMAP=14.96%;出站客流預測,EMA=41.83,ERMS=56.16,EMAP=13.73%。與傳統BP預測模型相比,Logistic-SSA-BP進站客流預測結果的EMA下降了20.64,ERMS下降了26.37,EMAP下降了20.32%;出站客流預測的EMA下降了28.34,ERMS下降了25.38,EMAP下降了18.99%。這表明:Logistic-SSA-BP比傳統BP模型預測值更加接近真實值,模型精度越高、性能也越好。

為更好的驗證文中提出的Logistic-SSA-BP模型在地鐵客流預測方面的優越性和穩定性,利用RNN神經網絡對地鐵客流進行預測,并將預測結果與文中模型進行對比。為保證結果可比性,在RNN神經網絡預測中,同樣選取數據集前29 d數據為訓練集,最后一天數據(以1 h為時間間隔)為測試集。兩者的相對誤差如表3。

表3 RNN與Logistic-SSA-BP預測結果相對誤差及平均值

從表3可看出:RNN預測結果與真實值的相對誤差為9.11%~33.43%;Logistic-SSA-BP的相對誤差為8.35%~29.71%。Logistic-SSA-BP的相對誤差平均值比RNN小3.11%,由此說明在客流預測的優越性和穩定性上Logistic-SSA-BP模型效果更好。

綜上,通過Logistic-SSA優化BP神經網絡,并將其用于地鐵客流預測是可行的,與其他算法相比,具有更好的效果。

5 結 論

地鐵短時客流預測對提高城市軌道交通系統的運行效率,優化運營組織結構,為乘客提供更加安全、優質的出行服務具有重要意義。筆者鑒于傳統BP神經網絡模型在預測客流時表現出的準確度低、收斂速度慢、易陷入局部最優值的問題,利用麻雀搜索算法(SSA)對BP神經網絡的權值和閥值進行優化,以此提高客流預測精確度和準確性。同時考慮到SSA算法全局搜索能力較弱的缺點,利用Logistic混沌映射對SSA算法種群進行初始化,以此提高算法全局搜索能力和穩定性,最終得到了改進后的BP神經網絡回歸預測模型(Logistic-SSA-BP)。

通過比較基于MAE、RMSE和MAPE這3種評價指標的模型預測結果可發現:與傳統BP神經網絡預測模型相比,進出站的EMA平均減少24.49,ERMS平均減少25.88,EMAP平均減少19.66%;此外通過與RNN預測模型對比,相對誤差范圍和平均值更小。由此表明基于Logistic-SSA算法優化后的BP神經網絡預測模型在短時客流預測方面效果更好,準確度更高。

筆者利用改進后的SSA算法優化了BP神經網絡模型,并將其應用于城市軌道交通短時客流預測研究中;通過深圳市西鄉地鐵站的進、出站客流數據進行了實例驗證。

猜你喜歡
模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
一個相似模型的應用
主站蜘蛛池模板: 久久久久国产一区二区| 欧美亚洲欧美| 在线观看网站国产| 日韩少妇激情一区二区| 精品久久久久成人码免费动漫| 亚洲浓毛av| 97se综合| 亚洲精品高清视频| 996免费视频国产在线播放| 免费在线观看av| 国内自拍久第一页| 真实国产乱子伦视频| 91亚洲精品国产自在现线| 国产高清不卡视频| 亚洲视频无码| 亚洲综合九九| 国产女人在线视频| 中文纯内无码H| 露脸国产精品自产在线播| 亚洲一区二区三区麻豆| 欧美狠狠干| 午夜a视频| 在线免费亚洲无码视频| 精品视频在线观看你懂的一区| 国产真实乱子伦视频播放| 中文一级毛片| 日本高清免费一本在线观看 | 欧美日韩亚洲综合在线观看| 国产午夜一级淫片| 中文字幕欧美日韩高清| 精品国产免费第一区二区三区日韩| 伊人婷婷色香五月综合缴缴情| 欧美成人精品在线| 欧美在线一二区| 色欲综合久久中文字幕网| 国产高颜值露脸在线观看| 亚洲视频欧美不卡| 中文字幕在线看视频一区二区三区| 中文字幕在线永久在线视频2020| 亚洲精品无码专区在线观看| 色天堂无毒不卡| 美女扒开下面流白浆在线试听 | 国产一区在线视频观看| 亚洲人成人伊人成综合网无码| 国内丰满少妇猛烈精品播| 免费看久久精品99| 国产成本人片免费a∨短片| 亚洲AV人人澡人人双人| 欧美日韩高清在线| 国产日韩久久久久无码精品| 精品国产成人高清在线| 国产第一福利影院| 久久精品人人做人人综合试看| 国产自在线播放| 全部免费毛片免费播放| 亚洲AV无码久久精品色欲| 国产在线一区视频| 高清免费毛片| 成人午夜精品一级毛片| 中文字幕欧美日韩高清| 亚洲床戏一区| 免费在线视频a| 欧美午夜一区| 免费一级毛片在线观看| 丰满人妻一区二区三区视频| 91欧美在线| 久久精品人人做人人爽电影蜜月| 在线免费看片a| 欧美伊人色综合久久天天| 又爽又大又黄a级毛片在线视频 | 亚洲日韩精品综合在线一区二区| 久久综合国产乱子免费| 91精品啪在线观看国产| 欧美福利在线观看| 欧美97欧美综合色伦图| 91精品啪在线观看国产| 国产美女自慰在线观看| 在线观看无码av免费不卡网站| 国产精品主播| 毛片视频网址| 凹凸精品免费精品视频| 久久熟女AV|