摘要:為準(zhǔn)確把握軌道交通短時(shí)客流量的變化情況,在深度學(xué)習(xí)算法基礎(chǔ)上,提出短時(shí)客流量預(yù)測(cè)的方法,分別構(gòu)建基于LSTM神經(jīng)網(wǎng)絡(luò)和NGO-VMD-LSTM的預(yù)測(cè)模型,以某軌道交通換乘站和鄰近小區(qū)的居住站為對(duì)象,以30"min為時(shí)間段,對(duì)客流時(shí)序數(shù)據(jù)進(jìn)行訓(xùn)練,預(yù)測(cè)一段時(shí)間內(nèi)的客流量變化趨勢(shì)。根據(jù)研究結(jié)果可知,NGO-VMD-LSTM模型能夠充分提取客流波動(dòng)特征,可提高高峰時(shí)段的車站管理效率,為軌道交通運(yùn)營(yíng)部門的車輛調(diào)度、乘客管理等提供參考依據(jù)。
關(guān)鍵詞:深度學(xué)習(xí)算法""軌道交通""客流短時(shí)預(yù)測(cè)""LSTM模型
中圖分類號(hào):U231.92
Application"Analysis"of"Deep"Learning"Algorithm"in"Short-Term"Prediction"of"Urban"Rail"Transit"Passenger"Flow
HE"Jiangjiang""ZHANG"Peng""WANG"Fangling
Guangzhou"Railway"Polytechnic,"Guangzhou,"Guangdong"Province,"511300"China
Abstract:"In"order"to"accurately"grasp"the"change"of"short-term"rail"transit"passenger"flow,"on"the"basis"of"Deep"Learning"Algorithm,"this"paper"puts"forward"the"short-time"passenger"flow"prediction"method,"andnbsp;construct"prediction"models"based"on"LSTM"neural"network"and"NGO-VMD-LSTM"respectively."With"a"rail"transit"transfer"station"and"the"neighboring"residential"stations"as"the"object,"it"trains"the"passenger"flow"time"series"data"for"a"period"of"30"minutes,"predicts"the"flow"trend"over"a"period"of"time."According"to"the"research"results,"the"NGO-VMD-LSTM"model"can"fully"extract"the"characteristics"of"passenger"flow"fluctuation,"improve"the"efficiency"of"station"management"during"peak"hours,"and"provide"a"reference"for"the"vehicle"dispatching"and"passenger"management"of"the"rail"transit"operation"department.
Key"Words:"Deep"Learning"Algorithm;"Rail"transit;"Short-term"passenger"flow"prediction;"LSTM"model
當(dāng)前國(guó)內(nèi)軌道交通發(fā)展速度加快,運(yùn)營(yíng)線路不斷增加,交通網(wǎng)絡(luò)日益完善,客流量逐漸增加,常常出現(xiàn)客流過度飽和情況,特別是在早晚高峰期,很容易因人流擁擠引發(fā)安全事故。對(duì)此,相關(guān)部門應(yīng)引入深度學(xué)習(xí)算法,通過LSTM模型、NGO-VMD-LSTM模型的構(gòu)建和應(yīng)用,學(xué)習(xí)大量輸入數(shù)據(jù)的特征規(guī)律,提高運(yùn)算速度,對(duì)短時(shí)客流量進(jìn)行準(zhǔn)確預(yù)測(cè),提前制訂科學(xué)可行的疏導(dǎo)方案,使軌道交通運(yùn)營(yíng)更加順暢有序,切實(shí)保障乘客的生命安全,提高出行體驗(yàn)。
1"軌道交通客流預(yù)測(cè)模型的構(gòu)建
1.1"LSTM模型
循環(huán)神經(jīng)網(wǎng)絡(luò)中各神經(jīng)元之間通過鏈?zhǔn)浇Y(jié)構(gòu)相互連接,可用于處理存在時(shí)序關(guān)系的數(shù)據(jù)。在此基礎(chǔ)上,利用該網(wǎng)絡(luò)捕捉短時(shí)客流的時(shí)序特點(diǎn),能夠有效提高精準(zhǔn)度。以往的循環(huán)神經(jīng)網(wǎng)絡(luò)應(yīng)用時(shí),如若需要處理大量時(shí)序數(shù)據(jù),很容易因記憶衰退速度過快導(dǎo)致梯度消失,無法取得理想的訓(xùn)練效果。針對(duì)上述問題,LSTM模型創(chuàng)建時(shí),將LSTM細(xì)胞單元引入進(jìn)來,采用輸出門、輸入門和遺忘門等結(jié)構(gòu),實(shí)現(xiàn)選擇性的記憶保存和刪除,使傳遞的信息更加可控,賦予該模型長(zhǎng)期記憶功能。LSTM細(xì)胞單元經(jīng)過門限結(jié)構(gòu),對(duì)原有記憶進(jìn)行更新,將所需記憶傳遞到指定位置。在此期間,先根據(jù)前一階段的細(xì)胞單元輸入,利用遺忘門剔除無價(jià)值信息,確定上一時(shí)間段的單元狀態(tài),確定有多少需要被保留下來,模型如下:
式(1)中:ft表示輸入門權(quán)值向量;Wf表示遺忘門相匹配的權(quán)重向量;表示sigmoid函數(shù)中,輸出[0,1]范圍內(nèi)的數(shù)值,其中0為徹底遺忘,1為全部記憶,然后將其傳遞到候選門中,使細(xì)胞狀態(tài)得以更新,公式如下:
式(2)中:Ct表示當(dāng)前時(shí)刻細(xì)胞狀態(tài);C為輸入門的偏置量;Ct-1表示選門權(quán)值向量。根據(jù)上述模型,通過各門限結(jié)構(gòu)件的相互作用,可使循環(huán)神經(jīng)網(wǎng)絡(luò)的長(zhǎng)期依賴問題得到良好解決,細(xì)胞之間的鏈?zhǔn)浇Y(jié)構(gòu)更加完善,能夠延長(zhǎng)該模型的記憶時(shí)間,遺忘信息經(jīng)過長(zhǎng)時(shí)間訓(xùn)練后仍可全部記憶,還可結(jié)合模型輸入,使當(dāng)前細(xì)胞狀態(tài)得到靈活調(diào)整[1]。
1.2"NGO-VMD-LSTM模型構(gòu)建
軌道交通中進(jìn)站客流數(shù)據(jù)較多,具有諸多不確定性,屬于非平穩(wěn)時(shí)間序列。為使客流數(shù)據(jù)在不同時(shí)間段的變化趨勢(shì)得以展現(xiàn),可在LSTM模型基礎(chǔ)上傳創(chuàng)建組合模型,即NGO-VMD-LSTM模型,使預(yù)測(cè)效果得到進(jìn)一步提升。在客流預(yù)測(cè)中,該組合模型包含兩個(gè)部分,即客流數(shù)據(jù)分解重構(gòu)、整合,流程如下。首先,確定模型輸入,將歷史進(jìn)站客流數(shù)據(jù)輸入組合模型內(nèi),作為一維時(shí)間序列;其次,確定VMD算法參數(shù),取值范圍為[K,a],因NGO算法的更新速度較快,在上述區(qū)間內(nèi)選值更易取得最佳計(jì)算結(jié)果,將組合模型內(nèi)的歷史進(jìn)站客流數(shù)據(jù)分解開來,獲得大量IMF和1個(gè)Res。在VMD算法應(yīng)用中,需要整合歷史客流數(shù)據(jù),將其根據(jù)時(shí)間尺度的不同,分成1個(gè)Res和多個(gè)IMF,全部分量相加之和與歷史客流數(shù)據(jù)相同,數(shù)據(jù)的物理意義并未變化,計(jì)算公式如下:
式(3)中:表示站點(diǎn)i的歷史客流值;n表示客流值分解后所得的IMF數(shù)量;表示第i個(gè)IMF分量;Res表示分解后余量。
因分量眾多,無法將不同頻率下的客流量特點(diǎn)準(zhǔn)確表示出來,采用Pearson相關(guān)系數(shù)進(jìn)行檢驗(yàn),以系數(shù)值為依據(jù)表示相關(guān)度,使分量得以重構(gòu),再輸入LSTM模型內(nèi)訓(xùn)練,將重構(gòu)完畢的全部分量預(yù)測(cè)結(jié)果相加,便是進(jìn)站客流量的預(yù)測(cè)結(jié)果[2]。
2"軌道交通客流預(yù)測(cè)模型的實(shí)際應(yīng)用
2.1"數(shù)據(jù)采集和處理
本研究數(shù)據(jù)源于某城市軌道交通的閘機(jī)刷卡記錄,研究開始前將AFC數(shù)據(jù)預(yù)處理,轉(zhuǎn)換成LSTM模型可識(shí)別的數(shù)據(jù)。對(duì)于不同類型的站點(diǎn)來說,客流分布特點(diǎn)和進(jìn)站時(shí)間規(guī)律也不盡相同,換乘站往往客流波動(dòng)性更強(qiáng),而周圍鄰近居民區(qū)的站點(diǎn)能夠體現(xiàn)出市民的出行規(guī)律,客流時(shí)空分布規(guī)律相對(duì)較強(qiáng)。
本研究以某鄰近小區(qū)的居住站點(diǎn)1號(hào)、某換乘站2號(hào)為對(duì)象,以AFC數(shù)據(jù)為依據(jù),研究2023年5月1號(hào)到6月30號(hào)之間的進(jìn)站客流量。進(jìn)站客流量受首末班車發(fā)車時(shí)間、節(jié)假日的影響較大。對(duì)于大多數(shù)站點(diǎn)來說,在6:30—20:30之間的進(jìn)站客流量較多,剩余時(shí)間較少,被研究的兩個(gè)站點(diǎn)也不例外,因此該研究以6:30—20:30為研究區(qū)間,以30"min為間隔,對(duì)兩個(gè)站點(diǎn)的進(jìn)站客流情況進(jìn)行調(diào)查。在預(yù)處理階段,為使特征集間的量綱差別產(chǎn)生的不良影響被消除,該研究利用min-max標(biāo)準(zhǔn)化,對(duì)采集的數(shù)據(jù)歸一化處理,幫助加快模型參數(shù)收斂速度,便于模型求解。
2.2"評(píng)價(jià)指標(biāo)
受多種因素影響,任何預(yù)測(cè)算法在客流預(yù)測(cè)應(yīng)用中,所得結(jié)果都只是無限接近真實(shí)值,但二者之間勢(shì)必存在誤差,可利用誤差進(jìn)行模型效果評(píng)價(jià),判斷不同模型的性能與應(yīng)用效果。該研究采用決定系數(shù)(M1)、均方根誤差(M2)、平均絕對(duì)誤差(M3)作為定量評(píng)價(jià)指標(biāo)。
2.2.1決定系數(shù)
該指標(biāo)的作用在于評(píng)價(jià)模型擬合程度,可將模型對(duì)數(shù)據(jù)方差的比例,適用于多種模型的對(duì)比,取值范圍為0~1。當(dāng)取值為1時(shí),說明模型預(yù)測(cè)的精準(zhǔn)度達(dá)到100%;當(dāng)取值為0時(shí),說明預(yù)測(cè)準(zhǔn)確度較差,公式如下。
M1""""(4)
式(4)中:M1表示決定系數(shù)y1表示客流量的預(yù)測(cè)值,單位為人;y2表示客流量的實(shí)際值,單位為人;y3表示預(yù)測(cè)客流量的平均值,單位為人;n表示預(yù)測(cè)客流數(shù)量。
2.2.2均方根誤差
該指標(biāo)是指真實(shí)值和預(yù)測(cè)結(jié)果間的差值的平方和,可展示二者間的差異程度,所得數(shù)值越小,說明模型預(yù)測(cè)的準(zhǔn)確度越高,公式如下:
式(5)中:M2表示均方根誤差。
2.2.3平均絕對(duì)誤差
該指標(biāo)為真實(shí)值和預(yù)測(cè)值間的絕對(duì)誤差均值,可將預(yù)測(cè)結(jié)果的平均誤差程度展現(xiàn)出來,當(dāng)MAE數(shù)值越小時(shí),說明預(yù)測(cè)準(zhǔn)確度越高,公式如下。
式(6)中,M3表示平均絕對(duì)誤差;n表示預(yù)測(cè)客流數(shù)量"[3]。
2.3"參數(shù)設(shè)置
該研究采用TensorFlow學(xué)習(xí)框架進(jìn)行模型構(gòu)建,利用ReLU激活函數(shù),以MSE為損失函數(shù),LSTM模型設(shè)置3層,有效避免過擬合情況發(fā)生。在各個(gè)LSTM層后方增加Dropout層,利用網(wǎng)絡(luò)檢索的方式,確定迭代次數(shù)的數(shù)值,該法的搜索面積較大,所得出的迭代次數(shù)取值可進(jìn)行批量處理。
站點(diǎn)1的LSTM模型批量處理取值為32,迭代次數(shù)取值為500;站點(diǎn)1的組合模型批量處理取值為32,迭代取值為400。站點(diǎn)2的LSTM模型批量處理取值為32,迭代次數(shù)取值為500;站點(diǎn)2的組合模型批量處理取值32,迭代取值為500。對(duì)上述參數(shù)批量處理和迭代次數(shù)取值后,一同納入已經(jīng)創(chuàng)建的LSTM模型內(nèi)展開訓(xùn)練,反復(fù)實(shí)驗(yàn)3次,計(jì)算平均值[4]。
2.4"結(jié)果分析
2.4.1"站點(diǎn)1的預(yù)測(cè)結(jié)果
采用LSTM模型能夠計(jì)算該站客流量的周期特征、總體變化情況,但對(duì)客流峰值時(shí)段的學(xué)習(xí)能力不高。在工作日,高峰期的客流預(yù)測(cè)值低于真實(shí)值,低谷階段的預(yù)測(cè)值超過真實(shí)值,與原始曲線之間的擬合度較差。在非工作日,峰值階段的模型預(yù)測(cè)值和真實(shí)值偏差較大,且客流變化趨勢(shì)較為復(fù)雜,模型無法準(zhǔn)確高效地學(xué)習(xí)客流變化規(guī)律。采用組合模型能夠得到該站客流量的整體情況,但客流波動(dòng)較小的時(shí)段,預(yù)測(cè)波動(dòng)超過單一模型[5]。究其原因,組合算法對(duì)客流分解能夠獲得頻率屬性,因此對(duì)客流波動(dòng)較大時(shí)段的學(xué)習(xí)能力較強(qiáng),反之則較弱。可見,組合模型盡管能夠提高該站點(diǎn)的預(yù)測(cè)精度,但無法高效學(xué)習(xí)客流波動(dòng)較小時(shí)段的特征。
2.4.2"站點(diǎn)2的預(yù)測(cè)結(jié)果
采用LSTM模型能夠計(jì)算該站客流量的整體情況,但預(yù)測(cè)曲線的波動(dòng)較大,與原始曲線之間的擬合度較差,在低谷時(shí)期的預(yù)測(cè)準(zhǔn)確度不高,預(yù)測(cè)值超過真實(shí)值,說明該模型無法準(zhǔn)確預(yù)測(cè)該站的客流變化趨勢(shì)。究其原因,站點(diǎn)2為換乘站,進(jìn)站客流量較大,情況較為復(fù)雜,規(guī)律性較低,該模型對(duì)站點(diǎn)2客流特征的學(xué)習(xí)能力不足,容易受到波動(dòng)干擾,影響最終預(yù)測(cè)結(jié)果。采用組合模型能夠得到該站客流量的整體情況,且高峰和低谷期的預(yù)測(cè)準(zhǔn)確度較高,但仍與實(shí)際數(shù)值有所差異,特別是在低谷時(shí)期,客流預(yù)測(cè)值超過真實(shí)值。究其原因,當(dāng)客流量較小的情況下,組合模型的學(xué)習(xí)能力不高。與單一模型相比,高峰和低谷期的預(yù)期差值明顯縮小,這說明組合模型對(duì)客流波動(dòng)的干擾性較小,整體預(yù)測(cè)結(jié)果準(zhǔn)確度較高[6]。
3"結(jié)語
綜上所述,隨著軌道交通建設(shè)規(guī)模日益擴(kuò)大,運(yùn)營(yíng)計(jì)劃制訂難度隨之增加,應(yīng)以短時(shí)進(jìn)站客流量為依據(jù),使車站動(dòng)態(tài)管理效率得以提升。在客流量預(yù)測(cè)過程中,相關(guān)部門可采用深度學(xué)習(xí)算法,創(chuàng)建NGO-VMD-LSTM模型,充分提取客流波動(dòng)特征。根據(jù)實(shí)例分析可知,組合模型與單一LSTM模型相比預(yù)測(cè)精準(zhǔn)度更高,適用于非線性、非周期性波動(dòng)的短時(shí)客流數(shù)據(jù)處理,且計(jì)算結(jié)果準(zhǔn)確穩(wěn)定,可為車站動(dòng)態(tài)管理提供科學(xué)依據(jù)。
參考文獻(xiàn)
[1]侯曉云,邵麗萍,李靜,等.基于深度學(xué)習(xí)的城市軌道交通短時(shí)客流起訖點(diǎn)預(yù)測(cè)[J].城市軌道交通研究,2020,23(1):55-58.
[2]王雪琴,許心越,伍元?jiǎng)P,等.基于混合深度學(xué)習(xí)模型的城軌短時(shí)客流預(yù)測(cè)[J].鐵道科學(xué)與工程學(xué)報(bào),2022,19(12):3557-3568..
[3]卡達(dá)(Anish"Khadka).基于深度學(xué)習(xí)的城市軌道交通短期客流預(yù)測(cè)[D].南京:東南大學(xué),2018.
[4]張文娟,楊皓哲,張彬,等.考慮多時(shí)間尺度特征的城市軌道交通短時(shí)客流量預(yù)測(cè)模型[J].交通運(yùn)輸系統(tǒng)工程與信息,2022,22(6):212-22.
[5]王佳琳.基于深度學(xué)習(xí)模型的城市軌道交通短時(shí)客流預(yù)測(cè)方法研究[D].北京:北京交通大學(xué),2020.
[6]李莎,王秋雯,陳彥如,等.基于SAE-ConvLSTM深度學(xué)習(xí)模型的多站城軌短時(shí)客流預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用研究,2022,39(7):2025-2031..