張國赟 金 輝
(遼寧工業大學汽車與交通工程學院 遼寧 錦州 121001)
近年來中國經濟水平迅速提升,交通行業中乘客出行對交通工具的需求量大幅度增加,中國城市軌道交通的水平也步入快速發展的新篇章。出于緩和城市交通擁堵問題的考慮,給城市居民帶來更快速、更優質的出行服務,越來越多的城市選擇具有客運量大的公共交通系統來解決這一問題。而城市軌道交通很快成為城市公共交通系統中交通工具的第一選擇,不但因為其客運量大,更是因為其具有快捷迅速等突出特點。因此,做到對城市軌道交通站點的短時客流量的準確預測是非常有必要的。
對城市軌道交通站點的短時客流預測的模型現如今主要分成以下幾類,第一類有基于時間序列的預測模型[1]、基于回歸分析的預測模型[2]等,統稱為線性預測模型,這類模型容易理解,有利于決策分析,但難以很好地表達高度復雜的數據;第二類有小波理論預測模型[3]等,統稱為非線性預測模型;第三類有元胞自動機模型[4]等,統稱為基于模擬交通的預測模型;第四類有基于模糊神經網絡的預測模型[5]、基于BP神經網絡的預測模型[6]等,統稱為基于各種神經網絡的預測模型;第五類有由兩種預測模型組合而成等,統稱為組合預測模型。Chiang等[7]使用回歸分析(具有自回歸誤差校正)、神經網絡和ARIMA模型對客流影響因素進行分析,隨后進行客流預測,發現這些預測方法的簡單組合比單獨的模型會產生更高的預測精度,但是存在建模難度較大的問題。Gutiérrez等[8]采用地理信息系統(GIS)、距離衰減函數和多元回歸模型相結合的方法建立了系統乘客預測模型,經過分析表明,預測中使用距離衰減函數對變量進行加權,系統地提供了較好的結果,但數據受限較大,分析具有局限性。鄒巍等[9]建立了運用遺傳算法優化小波理論的軌道交通客流預測模型,這個模型的優勢在于能夠避免客流預測陷入部分最小值情況的發生。李科君等[10]構建了非線性自回歸神經網絡模型對地鐵進站客流進行短時預測。
通常短時客流量預測會隨時間的變化從而發生改變,長短時記憶網絡模型[11](Long Short Time Memory Network,LSTM)會在原有基礎上增添時間屬性,能對模型進行深度的訓練和特點提取。Kumar等[12]應用人工神經網絡(ANN)對過去的交通數據進行交通流量的短期預測;Polson等[13]設計了一個深度學習模型來預測交通流,建立了一種序列擬合的線性模型體系結構;李梅等[14]通過建立深度學習LSTM網絡模型,并用模型來對地鐵站客流量進行短時客流預測;李若怡[15]通過優化LSTM網絡的神經元以及隱藏層的方法,構造得到了改良后的LSTM模型,但輸入層僅為OD客流數據,具有局限性;張偉林[16]通過分析客流量的特點,構建利用優化神經網絡的深度學習預測模型。
本文利用成都軌道交通一號線火車北站2020年1月4日至1月13日的進站客流量真實數據,綜合考慮能夠影響城市軌道交通站點客流量的內外部因素,設計一種基于改進PSO-LSTM模型的城市軌道交通站點短時客流預測方法,并通過模型的運行求解以及與其他模型的結果比較,驗證改進后的PSO-LSTM模型在客流預測中具有較高的精度,能夠取得更好的預測效果。
自動收費系統(Automatic Fare Collection System,AFC)中保存有乘客刷卡進出車站的數據,通常作為基本數據對城市軌道交通站點進站客流進行實時預測。AFC系統具備自動售票、檢票、收費等功能,是一種電腦統一控制并且封閉的全自動化網絡系統。近年來,我國對城市軌道交通車站的AFC系統不但進行了大量的研究,并且提出了多重形式并行的新模式。隨著電腦技術的穩步發展,中國城市軌道交通AFC系統也逐漸走向成熟,并且完成了很多大城市的AFC系統與居民城市刷卡通行的同步,甚至還實現了城市內或者城市與城市之間的刷卡通行同步。
成都軌道交通1號線上的火車北站是一個換乘車站,它串聯著成都軌道交通1號線與成都軌道交通7號線,客流相對比較密集,方便研究。因此采集成都地鐵1號線火車北站2020年1月4日至1月13日進站客流數據,由原始數據分析可得,火車北站有進站客流的時間段為5:00到00:55,以5分鐘為時間間隔,一天共包含240個時間段,每條數據包含起始時間、輸入流、輸出流、結束時間等信息。
長短時記憶網絡是一種目前常用的使用特殊方式把循環神經網絡改良的神經網絡,具備處理長時間儲存信息的功能。一般的循環神經網絡(Recurrent Neural Network,RNN)存在一個弊端就是不能夠處理信息的過度依賴問題。為了彌補循環神經網絡的這個弊端,設計了長短時記憶網絡模型。LSTM的優勢在于它對信息的長期過度依賴具備良好的自然處理能力。LSTM模型的主要設計結構有兩個:存儲元組和非線性門單元。存儲元組的作用是維護保持模型的正常系統模式,非線性門單元起到調整各個不同節點輸入和輸出存儲元組的信息的作用。LSTM與RNN一樣,模型中的每個遞歸神經網絡都可以無限向下分化,成為無數個反復的基本神經單元。在一般的RNN結構中,分化出的反復基本神經單元網絡層結構非常簡易,通常每個神經單元網絡層只由一個基本的tanh模塊組成,如圖1所示;而在LSTM神經網絡層中,組成結構相對來說較為復雜,通常有互相聯系作用的四個模塊組成,如圖2所示。LSTM的總體網絡結構如圖3所示。

圖1 RNN神經網絡層

圖2 LSTM神經網絡層

圖3 LSTM網絡結構
在LSTM神經網絡中,每個神經元里面都加入了三個基本單元門,分別是忘記門ft、輸入門i和輸出門Ot。忘記門的作用是幫助確定我們需要忘記的所有信息,并且幫助辨別前一時刻的隱含層狀態ht-1,然后幫助讀取當前時刻的輸入Xt,讀取完成后輸出結果,最后再為Ct-1賦值,這個結果的輸出數值保持在0~1之間,兩個端點分別表示信息的全數拋棄和信息的全數保留,具體算法如下:
ft=σ(Wf·[ht-1,Xt]+bf)
(1)
式中:ft為忘記門的輸出值;σ為Sigmoid函數;Wf為忘記門的權重矩陣;bf為忘記門的偏置項。
輸入門的作用是指定新的信息保存到Cell中。輸入門由兩部分構成,一部分是根據Sigmoid層函數來計算輸入值,另一部分是添加新的候選值向量。新的候選值向量遵循tanh層的規則重新計算得來,具體計算方法如下:
it=σ(Wt·[ht-1,Xt]+bi)
(2)
對Cell的新貢獻見式(3)。
(3)

(4)
輸出門主要基于Cell當前時刻的狀態經由濾波器進行過濾后輸出。先利用Sigmoid函數計算出Cell狀態中將要輸出的值,然后利用tanh函數計算Cell狀態中將要輸出的值,最后把兩個計算結果相乘,得到最終要輸出的值。具體計算方法為:
Ot=σ(Wo·[ht-1,Xt]+bo)
(5)
ht=Ot·tanh(Ct)
(6)
式中:W為權重值;b為偏置項;tanh為雙曲正切激活函數。
粒子群優化算法(Particle Swarm Optimization,PSO)是一種能夠相互推動并且能夠在不同狀態下隨機產生的優化算法,即使要被優化的函數存在不連續、不可導等特點,也可以憑借較快的速度優化收斂。粒子群優化算法的根本概念是研究鳥類的取食行為的結果,所以這個算法中任何一個問題的結果都可以比作搜索空間中的一只鳥,也就是我們所說的粒子。解空間的所有替代解由所有粒子確定,所有粒子的匹配度值由優化函數確定,并且憑借任意速度在全解空間中隨意活動,通過與其他粒子之間建立一種特定形式的信息交換來獲得發現信息,從而能夠引導整個組的運動。
首先將粒子群初始化為任意粒子組,然后經過迭代計算得到最佳解。粒子每次重復運動時都會更新速度向量和位置向量。用追蹤粒子通過的位置和粒子群通過的位置的方法,可以獲得這兩個結果的最佳值。具體方法見式(7)和式(8)。
vi=vi+c1×(pbesti-xi)+c2×(gbesti-xi)
(7)
xi=xi+vi
(8)
式中:i=1,2,…,N,N是此群中粒子的總數;vi為粒子的速度;xi為粒子的當前位置;c1和c2為學習因子;pbesti為粒子本身經歷過的最優位置;gbesti為粒子群經歷過的最優位置。
為了獲得更好的尋優結果,引入慣性因子ω,方便對粒子群算法的全體搜索能力和部分搜索能力進行調節,使其能夠在PSO搜索過程中依據粒子群算法功能中的一個搜索函數發生改變。當慣性因子值較大時,粒子群算法的全體搜索結果較好,部分搜索結果較差;反之,則粒子群算法的全體搜索結果較差,部分搜索結果較好。具體方法見式(9)和式(10)。
vi=ω×vi+c1×(pbesti-xi)+c2×(gbesti-xi)
(9)
(10)
式中:ωstart表示開始時的慣性因子權值;ωend表示結束時的慣性因子權值;t1表示當前時刻的迭代次數;t表示迭代完成的最大迭代次數。
圖4為改進PSO的求解流程。

圖4 改進PSO求解流程
具體操作步驟如下:
步驟1初始化粒子群并設定好相關參數,種群大小設置為N,隨機位置為x,速度為v。
步驟2確定各個粒子的適應度值。
步驟3確定粒子通過的最佳位置和粒子群通過的最佳位置。
步驟4確定是否滿足粒子群算法的收斂條件,如果滿足條件,那么輸出最后的尋優結果;如果不滿足條件,那么繼續下面的步驟。
步驟5依據粒子通過的最優位置和粒子群通過的最優位置來更新速度向量。
步驟6依據更新的速度向量來更新粒子的位置向量。
步驟7更新全體最優粒子和部分最優粒子。
步驟8返回步驟4,直至滿足收斂準則,輸出最優結果和迭代次數。
本文使用MATLAB軟件對LSTM預測模型進行編程設計。首先設定訓練集函數與測試集函數,設定訓練集數量為75%,測試集數量為25%;其次設定神經網絡變量;最后建立LSTM城軌交通站點短時客流量預測模型。通過運行模型,最優隱藏節點數為101,最優學習速率為0.001,最優迭代次數為30時,LSTM預測模型得到的預測結果最優。運行得到的進站量預測結果如圖5所示。

圖5 LSTM進站量預測結果
從圖5結果可以看出,雖然利用LSTM預測模型得到了結果,但是精度并不太高,因此本文設計了改進PSO來優化LSTM預測模型,希望能得到預測精度較高的結果。本文構建改進PSO-LSTM模型來實現城市軌道交通站點短時客流預測,經過反復實驗,最優隱藏節點數為101,最優學習速率為0.001,最優迭代次數為30時,預測精度最高,預測結果如圖6所示。與沒有經過優化的LSTM模型作對比,對比結果如圖7所示。

圖6 改進PSO-LSTM進站量預測結果

圖7 改進PSO-LSTM進站量預測結果對比
遺傳算法(Genetic Algorithm,GA)擁有天然選擇能力和種群傳播制度,有著較強的全體尋優本領,是一種常用的傳統搜索算法。天然選擇和種群傳播過程中通常伴隨著交配、繁衍、變異現象的發生,遺傳算法極佳地模仿了這種現象。基本的遺傳算法包含選擇操作、交叉操作、變異操作三種常規操作。
本文通過設計GA-LSTM預測模型對城市軌道交通站點進行短時客流預測,為保證其結果能與上述結果進行公平合理的對比,預測時選用與上述模型預測時相同的數據,模型得出預測結果如圖8所示。與沒有經過優化的LSTM模型作對比,結果如圖9所示,并與LSTM模型預測結果、改進PSO-LSTM預測結果進行比較,結果如圖10所示。

圖8 GA-LSTM進站量預測結果

圖9 GA-LSTM進站量預測結果對比
為了更好地比較LSTM模型、改進PSO-LSTM模型、GA-LSTM模型的預測效果,本文運用均方根誤差(RMSE)以及平均絕對誤差(MAE)兩個常用的誤差評價方法進行比較分析,其計算公式如下:
(11)
(12)

均方根誤差計算的是客流預測值與客流實際值的平方誤差與總數量N的比值的平方根,一般用來解釋預測中的離散程度;平均絕對誤差計算的是客流預測值與客流實際值的偏差,一般用于預測值與真值的比較。分別計算上述三種預測模型的結果誤差分析如表1所示。

表1 預測結果誤差分析
計算的RMSE以及MAE兩種評價指標數值越小,證明相對應的模型的預測性能越好。可以看出,改進PSO-LSTM預測模型的兩種指標數值較小,所以預測性能較好,預測精度也比其他兩種模型更高。
針對城市軌道交通站點短時客流預測問題,本文搭建了LSTM預測模型,并且提出改進方法——改進粒子群優化算法(PSO)與LSTM模型的結合。通過實例研究,與優化前的LSTM模型以及GA-LSTM模型預測結果進行比較,得到以下結論:改進PSO-LSTM預測模型預測精度提高較大,可以提供更加準確的預測結果。