孟 歌 郝曉培 張軍鋒 王洪業 李 永 毛子今
(中國鐵道科學研究院集團有限公司電子計算技術研究所, 100081, 北京∥第一作者, 助理研究員)
目前,城市軌道交通(以下簡稱“城軌”)正向智慧化、綠色化方向發展,其中重要的前提之一就是使軌道交通系統具備預測能力,以達到自動化、系統化、智慧化的目標。智慧軌道交通需要強大的感知能力作為支持,準確掌握城軌車站的客流量是關鍵基礎。只有精準預測未來車站客流量,才能夠做出準確決策并進行快速響應,以提高城軌系統的智慧化水平。同時,在掌握客流變化趨勢的基礎上,可以合理安排資源配置,減少空置和浪費,達到綠色可持續發展的目標。
在交通預測領域,常用的方法主要包括專家意見法、回歸分析法、支持向量機[1]、神經網絡[2]及時間序列[3]等。其中:專家意見法依靠人工判斷,結果較為主觀,不利于城軌信息系統的自動化建設發展;回歸分析法適用于變量間的相關性為線性或簡單非線性的情況,不適用于復雜非線性情況;時間序列方法建立在線性平穩模型的基礎上,但城軌客流并非正態分布的平穩序列,客流波動性強烈,會導致預測效果不佳;神經網絡方法為非線性自回歸模型,適用于大部分預測場景,但需要調整的參數較多,且網絡的構建與構建者的經驗有關,因此預測性能因人而異,泛化能力較弱;支持向量機具有堅實的理論基礎和良好的泛化能力,尤其在解決小樣本、非線性問題時具有許多優勢,但由于其中參數選擇的范圍較大,難以獲得最優參數,因此需要對其進行優化。基于此,本文提出了一種基于PSO(粒子群優化)-FSVR(模糊支持向量回歸機)的城軌客流預測模型(以下簡稱“基于PSO-FSVR的城軌客流預測模型”),并將其應用在北京軌道交通線路的實際客流數據預測中。與常用的GRNN(廣義回歸神經網絡)和BP(反向傳播)神經網絡相比,本文方法具有更加良好的預測性能,可以有效對城軌車站客流數據進行精準預測。
SVR (支持向量回歸機)是建立在有限樣本SLT(統計學習理論)基礎上的通用學習方法[4]。FSVR是將模糊數學和SVR相結合的一種新型的SVR,其通過引入模糊隸屬度,來提高機器學習的魯棒性和泛化能力。
FSVR的基本原理是依靠預測誤差最小化尋找某一目標函數,利用非線性映射函數φ(·)將輸入空間的數據點xi映射至高維空間H中,進而在H中采取線性回歸方法進行計算,以獲得原來低維空間中非線性回歸的效果。
由于在真實環境中,數據點xi在訓練過程中的貢獻度有所不同,因此FSVR將模糊參數引入模型中,以消除歧義點對訓練過程的影響,進而解決由其導致的過學習問題,即存在1個模糊隸屬度si與任意數據點xi有聯系,則最終產生的訓練集含有模糊成員。
在FSVR構建時,設訓練集S={(x1,y1,s1),(x2,y2,s2),…,(xi,yi,si),…,(xN,yN,sN)},其中:xi∈Rn(Rn為n維實數集),yi∈R(yi為真實值),si∈[0,1],i=1,2,…,N。在時間序列問題中,si是時間序列ti(i=1,2,…,N)的函數,模糊隸屬度函數l(ti)是ti的二次函數,即:
si=l(ti)
(1)
(2)
式中:
λ——(0,1]區間內的實數。
si的邊界條件為:
(3)
進而,求解二次規劃問題:
(4)
(5)
式中:
ω——回歸超平面權值向量;
b——偏差系數;
C——懲罰系數;
ε——回歸超平面帶寬;
φL(·)——拉格朗日目標函數;
式(4)的對偶形式為:
(6)
(7)
式中:
K(xi,xj)——核函數。
求解式(5),得到FSVR函數f(x):
(8)
啟發式算法在工程應用中越來越流行,且由于其易于實現和不需要梯度信息的優點,經常被用于處理優化問題。PSO算法具有快速、高效的特點[5],因此在啟發式算法中脫穎而出。該理論由Eberhart等人提出,它是一種模仿飛禽尋覓食物的PSO算法,可用于對預測模型的參數進行優化。根據該理論,每只飛禽都可以被看作1個粒子,則空間中的所有粒子就會組成1個飛禽群體,任意粒子都擁有自身的位置和速度元素,粒子群中每個粒子的信息都是不斷迭代和更新的,迭代中獲得的粒子局部最佳位置xbest,i和全局最佳位置xbest,就是潛在的理想解。
(9)
式中:
vi(k)——經過k次迭代后粒子i的速度;
xi(k)——經過k次迭代后粒子i的位置;
τ——慣性權重;
r1、r2——[0,1]區間內的隨機數;
c1、c2——學習因子。
式(7)中,vi(k)和xi(k)會不斷進行改變。
選擇不同的核函數,可以生成不同的FSVR。選取多項式和高斯徑向基兩種核函數進行對比,就效果而言,高斯徑向基核函數要優于多項式核函數。此外,在FSVR模型中需要確認C和ε。該模型參數的優化步驟如下:
1) 隨機初始化粒子群,并對整個群體的xi(k)和vi(k)進行隨機化。記錄種群的全局最佳位置xbest和第i個粒子的局部最佳位置xbest,i,其中i=1,2,…,N。
2) 對于每次迭代,評估第i個粒子的適應度值。如果第i個粒子的適應度值大于記錄值,則設置xbest,i為迄今為止的個體最佳位置;如果群體適應度值大于群體記錄值,則設定xbest為迄今為止的群體最佳位置。
3) 計算慣性權重,并更新粒子的速度和位置。
4) 重復步驟2)、3),直到達到迭代最大值。
5) 根據最佳粒子,計算FSVR模型所需的入參值。
以北京地鐵2號線(以下簡稱“2號線”)某車站2023年6月7日至2023年6月13日的進出站客流數據作為試驗對象,以15 min為粒度對數據進行統計。由于地鐵客流具有明顯周期性,因此分別對工作日(周一—周五)及節假日(周六—周日)的進站和出站客流進行預測。經過數據清洗,篩選出1 050條數據進行數值試驗,其中:訓練數據975條,測試數據75條。2號線某車站節假日及工作日進出站客流部分原始數據如圖1所示。
a) 工作日
由圖1可以看出:地鐵客流具有明顯的周期特征,工作日客流量整體上大于節假日客流量;工作日高峰時段客流量可達2 500~3 000人次/15 min,節假日高峰時段客流量為1 000~1 500人次/15 min,且工作日客流具有明顯的雙峰值,分別為早、晚高峰時段;而節假日客流波峰不明顯,基本呈現平鋪波動趨勢。通過觀察還可以發現,進站客流與出站客流呈近似對稱波動。通過基于PSO-FSVR的城軌客流預測模型對2號線某車站工作日進出站客流量預測結果見圖2。節假日進出站客流量預測結果見圖3。
a) 進站客流量
a) 進站客流量
由圖2可以看出:2號線某車站工作日進出站客流規律明顯,尤其在早晚高峰時段客流突出,其余時段客流波動相對平穩;基于PSO-FSVR的城軌客流預測模型在工作日的客流量預測結果與原始值基本吻合,尤其在客流極值點處表現較好,擁有較高的預測準確性。
通過圖3能夠發現:2號線某車站節假日客流量整體偏低,其峰值客流量明顯小于工作日客流量;節假日各時段客流波動相對頻繁,客流變化規律性較弱,預測難度相對較高。基于PSO-FSVR的城軌客流預測模型的客流量預測結果與原始值基本一致,且在客流量波動頻繁的拐點處依舊能夠較好地刻畫出其波動規律,這證明基于PSO-FSVR的城軌客流預測模型在工作日和節假日均能夠準確地對進出站客流量進行預測。
為了驗證基于PSO-FSVR的城軌客流預測模型的性能,引入常用的BP神經網絡模型和GRNN模型作為對照組進行數值分析,分別對工作日、節假日進站客流量進行預測。其中:BP神經網絡模型由正向和反向兩種計算過程組成,該方法在網絡理論和性能方面比較成熟,具有非線性映射能力強和網絡結構柔性好等優點,但學習訓練速度較慢且容易陷入局部極值,推廣能力稍弱。GRNN是基于徑向基函數網絡的一種改進模型,學習收斂速度較快,非線性函數逼近能力強,同時克服了BP神經網絡容易陷入局部極小值的問題,但解釋性較差且參數確定困難。使用相同的訓練集,利用3種方法分別對工作日、節假日進站客流進行預測。不同方法下2號線某車站工作日進站客流量預測結果如圖4—圖5所示。
圖4 不同方法下2號線某車站工作日進站客流量預測結果
圖5 不同方法下2號線某車站節假日進站客流量預測結果
通過圖4可以發現:在工作日進站客流預測中,基于PSO-FSVR的城軌客流預測模型的客流量預測效果優于改進的GRNN和模型BP神經網絡模型,且該模型在客流高峰和低谷時段的客流量預測均表現較好;GRNN模型在單調增長或下降區間內的客流量預測效果較好,但在客流高峰時段的極值點處表現不佳,BP神經網絡模型的客流量預測數據雖然與原始數據相似,但整體準確率較低,尤其在客流低谷區域客流量預測結果偏小。
通過圖5可以發現:GRNN模型整體客流量預測結果偏大;BP神經網絡模型客流量預測趨勢波動過大,且預測準確率較低;與兩者相比,基于PSO-FSVR的城軌客流預測模型在節假日進站客流量預測中表現較為優秀,且該模型的客流量預測趨勢更為準確,且預測精度更高。
為了更加直觀地對比上述3種方法的預測性能,采用ERMS(均方根誤差)、P值(顯著性參數)及k(相關系數)作為指標對預測結果進行評價。其中:P值表示出現比預測結果更極端結果的概率,P值越小,預測結果越顯著;k表示預測值與原始值間相關性的緊密程度,k越大,兩者間的關系越緊密;ERMS表示預測值和原始值間的偏差與觀測次數之比的平方根,用于體現兩者間的誤差,ERMS越小,預測精度越高。2號線某車站工作日客流量預測模型性能對比結果如表1和表2所示。
表1 2號線某車站工作日客流量預測模型性能對比
表2 2號線某車站節假日客流量預測模型性能對比
從表1和表2可以看出:基于PSO-FSVR的城軌客流預測模型下,2號線某車站工作日、節假日進站客流量的ERMS分別為7.010 4和8.778 5,且在3種方法中最小,代表該方法預測精度最高;基于PSO-FSVR的城軌客流預測模型下,工作日、節假日進站客流量的相關系數分別達到0.993 0和0.955 8,高于另外兩種預測方法,表示PSO算法-FSVR的客流量預測結果與原始數據的趨勢更加一致;在顯著性上,一般認為P<0.05即為顯著,3種方法下客流量預測結果的P均遠小于0.05,證明3種客流量預測模型的結果均顯著。由此可見,在2號線某車站工作日、節假日的進站客流量預測中,基于PSO-FSVR的城軌客流預測模型的客流量預測性能均表現得更加優異。
通過本文分析可知,基于PSO-FSVR的城軌客流預測模型能夠對城軌進出站客流進行精準預測,且性能良好。常用的GRNN模型和PB神經網絡模型雖然能夠預測客流量,但精度和趨勢一致性均有不足;而基于PSO-FSVR的城軌客流預測模型整體預測效果穩定,且在客流極值點處的預測結果更加準確。基于PSO-FSVR的城軌客流預測模型有效地處理了客流數據的非線性情況,為城軌客流預測提供了創新的方法,并且可在類似情況下推廣應用。
未來將對客流量預測方法的成本和復雜性做進一步深入分析,以期提高城軌客流量預測的效率,同時降低能耗,進一步向智能化、綠色化目標發展。