唐繼強(qiáng),鐘鑫偉,劉 健,李天瑞
(1.重慶市軌道交通(集團(tuán))有限公司,重慶 401120;2.重慶理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,重慶 400054;3.西南交通大學(xué) 信息科學(xué)與技術(shù)學(xué)院,四川 成都 611756)
以輕軌和地鐵為代表的軌道交通已經(jīng)成為大城市重要交通方式;軌道客流預(yù)測對于軌道建設(shè)、交通運(yùn)營和日常出行至關(guān)重要[1]。在城市交通資源日趨緊張、人們出行交通壓力越來越大的情況下,軌道交通對優(yōu)化土地資源利用、緩解城市交通擁堵提供了有效解決途徑,成為城市交通現(xiàn)代化發(fā)展的重要手段。軌道交通具有準(zhǔn)時(shí)、方便、快捷等特點(diǎn),成為人們?nèi)粘3鲂械氖走x。然而,隨著城市規(guī)模增加、社會(huì)節(jié)奏加快、社會(huì)活動(dòng)頻繁,軌道交通也面臨巨大挑戰(zhàn)。如今的城市軌道交通呈現(xiàn)出總體客流暴增、客流分布不均衡等新特點(diǎn),使得軌道交通運(yùn)營和服務(wù)、人們出行時(shí)刻和線路選擇變得越來越困難。為了提高運(yùn)營效率、提升服務(wù)水平、引導(dǎo)人們舒適出行,需要準(zhǔn)確預(yù)測客流,以便構(gòu)建有效的應(yīng)對策略。
客流預(yù)測是通過對歷史客流數(shù)據(jù)分析和建模,對將來某時(shí)間段的客流進(jìn)行估計(jì),可劃分為長期預(yù)測和短期預(yù)測。客流長期預(yù)測是通過分析城市土地資源利用、交通調(diào)查、人口出行統(tǒng)計(jì)等方式估計(jì)交通出行OD矩陣,典型的客流長期預(yù)測方法為四階段法。四階段法是將客流預(yù)測劃分為交通生成、交通分布、交通方式劃分和交通量分配這4個(gè)階段。四階段法主要用于交通規(guī)劃和建設(shè),主要預(yù)測城市區(qū)間長期的交通流量,對軌道交通運(yùn)營和人們?nèi)粘3鲂袔椭淮蟆3鞘熊壍澜煌ㄊ且环N封閉交通,通過自動(dòng)檢售票系統(tǒng)(AFC)檢票進(jìn)出車站,并記錄每次出行的時(shí)間和站點(diǎn)。AFC系統(tǒng)提供了精確的客流歷史記錄,目前大多數(shù)軌道交通預(yù)測均利用AFC數(shù)據(jù)進(jìn)行客流預(yù)測。軌道交通預(yù)測關(guān)注的是以小時(shí)、天或周為單位的短期預(yù)測。短期預(yù)測可發(fā)現(xiàn)軌道交通出行模式和客流分布,對于優(yōu)化車輛調(diào)度、引導(dǎo)人們出行具有重要意義。
軌道交通客流短期預(yù)測方法主要有線性預(yù)測方法、非線性預(yù)測方法和組合預(yù)測方法。軌道交通客流短期預(yù)測研究的核心是通過對AFC檢票數(shù)據(jù)分析獲得數(shù)據(jù)特征,建立數(shù)學(xué)模型對客流進(jìn)行預(yù)測。線性預(yù)測方法是通過擬合線性客流預(yù)測模型,對客流進(jìn)行預(yù)測,典型的線性預(yù)測方法包括時(shí)間序列分析方法、回歸分析方法等;非線性預(yù)測方法是基于軌道交通客流的非線性特征,通過擬合非線性客流模型,對客流進(jìn)行預(yù)測,典型的非線性方法包括人工神經(jīng)網(wǎng)絡(luò)預(yù)測方法、卡爾曼濾波方法、支持向量機(jī)方法等。一般而言,線性預(yù)測方法算法結(jié)構(gòu)較簡單,處理速度較快,但預(yù)測精度相對較低;非線性預(yù)測方法算法結(jié)構(gòu)較復(fù)雜,預(yù)測精度相對較高,但處理速度較慢。為充分利用線性和非線性預(yù)測方法優(yōu)點(diǎn),學(xué)界提出了組合預(yù)測方法。組合預(yù)測方法是通過多種預(yù)測模型組合進(jìn)行預(yù)測,典型的預(yù)測方法包括時(shí)間序列+人工神經(jīng)網(wǎng)絡(luò)、時(shí)間序列+小波分析、時(shí)間序列+支持向量機(jī)等方法。組合方法一般使用線性方法進(jìn)行初步預(yù)測,再使用非線性預(yù)測方法改進(jìn)預(yù)測方差,最終以獲得預(yù)測速度和預(yù)測精度平衡。
上述方法中,時(shí)間序列客流預(yù)測是一種以統(tǒng)計(jì)理論為基礎(chǔ)的線性預(yù)測方法[2],該方法嚴(yán)謹(jǐn)、處理速度快、改進(jìn)空間大,廣泛用于軌道交通客流預(yù)測。滑動(dòng)平均方法(MA)是最簡單的時(shí)間預(yù)測方法,孟品超等[3]采用滑動(dòng)平均法對軌道交通短期客流進(jìn)行實(shí)時(shí)預(yù)測,發(fā)現(xiàn)該方法處理速度快。自回歸滑動(dòng)平均方法(ARMA)是時(shí)間序列的代表性方法,盧志義等[4]采用該方法對軌道交通短期客流進(jìn)行了預(yù)測。自回歸差分滑動(dòng)平均方法(ARIMA)可處理不穩(wěn)定的時(shí)間序列,李明敏等[5]對比了時(shí)間序列的滑動(dòng)平均、ARIMA等方法,發(fā)現(xiàn)ARIMA模型預(yù)測效果最好。楊靜等[6]在時(shí)間序列數(shù)據(jù)預(yù)處理階段進(jìn)行了改進(jìn),通過分析時(shí)間序列變點(diǎn),找出分布較一致的時(shí)間序列進(jìn)行預(yù)測。段金肖等[7]采用廣義自回歸條件異方差方法(GARCH)對軌道客流方差和波動(dòng)性進(jìn)行了研究,發(fā)現(xiàn)GARCH法不能有效提升預(yù)測精度,但是可減小預(yù)測置信區(qū)間。何九冉等[8]采用ARIMA-RBF組合法預(yù)測了短期客流,其主要工作是采用ARIMA法作基本預(yù)測,采用RBF神經(jīng)網(wǎng)絡(luò)對ARIMA法預(yù)測殘差進(jìn)行二次預(yù)測和改進(jìn)。此外,李得偉等[9]采用ARIMA+小波神經(jīng)網(wǎng)絡(luò)組合方法對軌道交通的短期客流進(jìn)行了預(yù)測。
通過對AFC檢票時(shí)間序列數(shù)據(jù)分析,發(fā)現(xiàn)天氣和氣溫等因素對客流不存在統(tǒng)計(jì)上的顯著影響,但上下班、周末和節(jié)假日等社會(huì)活動(dòng)對客流有顯著影響。王夏秋等[10]針對AFC檢票數(shù)據(jù)時(shí)間序列周期性特點(diǎn),建立了以月為時(shí)間跨度的季節(jié)指數(shù),對時(shí)間序列進(jìn)行季節(jié)指數(shù)調(diào)整后,采用ARIMA法進(jìn)行預(yù)測,顯示出該方法良好的數(shù)據(jù)適應(yīng)性。蔡昌俊等[11]、趙鵬等[12]、B.M.WILLIAMS等[13]、S.V.KUMAR等[14]分別采用ARIMA乘法季節(jié)模型對短期客流進(jìn)行了預(yù)測,發(fā)現(xiàn)該方法具有很高的精度和良好的適應(yīng)性。白麗[15]在ARIMA乘法季節(jié)模型基礎(chǔ)上,針對節(jié)假日非常規(guī)客流,對客流建立虛擬變量,采用ARIMA和多元線性回歸組合法進(jìn)行了短期客流預(yù)測,其研究顯示該法具有較強(qiáng)的適應(yīng)性和較好的預(yù)測精度。
針對軌道交通客流周期性、季節(jié)性和社會(huì)活動(dòng)隨機(jī)性等特點(diǎn),筆者提出采用時(shí)間序列季節(jié)分類模型進(jìn)行短期客流預(yù)測。該預(yù)測方法在數(shù)據(jù)預(yù)處理階段以天為時(shí)間單位,將AFC檢票數(shù)據(jù)按照工作日、周末、節(jié)假日等進(jìn)行分類,根據(jù)分類建立不同的ARIMA季節(jié)預(yù)測模板模型;在預(yù)測階段,根據(jù)預(yù)測當(dāng)天分類,選擇對應(yīng)預(yù)測模板進(jìn)行客流預(yù)測。
時(shí)間序列乘法季節(jié)模型全稱為乘法季節(jié)自回歸差分滑動(dòng)平均模型,其是在基本自回歸差分滑動(dòng)平均模型[16]基礎(chǔ)上,引入乘法季節(jié)思想構(gòu)建的時(shí)間序列模型[17]。
自回歸差分滑動(dòng)平均模型將數(shù)據(jù)模型表示為差分、自回歸和滑動(dòng)平均這3種成分[2],乘法季節(jié)自回歸差分滑動(dòng)平均模型是在自回歸差分滑動(dòng)平均模型基礎(chǔ)上,增加了擬合時(shí)間序列周期性相關(guān)關(guān)系的差分操作、自回歸項(xiàng)和滑動(dòng)平均項(xiàng)。該模型表示為ARIMA(p,d,q)(P,D,Q)s,如式(1)~(5)。
φ(B)Φ(B)(1-B)d(1-Bs)DYt=θ(B)Θ(B)et
(1)
φ(B)=1-φ1B-φ2B2-…-φpBp
(2)
θ(B)=1-θ1B-θ2B2-…-θqBq
(3)
Φ(B)=1-Φ1Bs-Φ2B2s-…-ΦPBPs
(4)
Θ(B)=1-Θ1Bs-Θ2B2s-…-ΘqBQs
(5)
式中:p、d、q分別為自回歸階數(shù)、差分階數(shù)、滑動(dòng)平均階數(shù);B為延遲算子;φ(B)、θ(B)分別為自回歸項(xiàng)、滑動(dòng)平均項(xiàng)的時(shí)間滯后;P、D、Q分別為擬合周期性關(guān)系的自回歸項(xiàng)的階數(shù)、差分操作階數(shù)、滑動(dòng)平均項(xiàng)的階數(shù);S為季節(jié)周期;Φ(B)、Θ(B)分別為自回歸項(xiàng)、滑動(dòng)平均項(xiàng)的季節(jié)性滯后。
乘法季節(jié)自回歸差分滑動(dòng)平均模型建模過程如圖1,該過程包含模型識(shí)別、參數(shù)估計(jì)和模型診斷這3個(gè)階段。模型識(shí)別階段采用平穩(wěn)性檢驗(yàn)和相關(guān)性檢驗(yàn)識(shí)別模型系數(shù),平穩(wěn)性檢驗(yàn)用于識(shí)別階數(shù)d和D,相關(guān)性檢驗(yàn)用于識(shí)別p、q、P和Q。識(shí)別模型系數(shù)后,在模型參數(shù)估計(jì)階段采用回歸分析方法,以確定線性組合參數(shù)φ(B)、Φ(B)、θ(B)和Θ(B)。模型診斷階段對模型殘差進(jìn)行相關(guān)性檢驗(yàn),確定殘差不存在相關(guān)性,若未通過檢驗(yàn)則需回到模式識(shí)別階段重新建模,通過殘差相關(guān)性檢驗(yàn)?zāi)P途涂捎糜陬A(yù)測。

圖1 乘法季節(jié)自回歸差分滑動(dòng)平均模型建模過程
筆者以重慶軌道交通6號(hào)線茶園站(編號(hào)0601)在2018年9月共計(jì)30 d的AFC檢票數(shù)據(jù)為例,建立時(shí)間序列季節(jié)分類模型,對該站點(diǎn)2018年10月的客流進(jìn)行預(yù)測。
為了對軌道交通客流特征有更加直觀認(rèn)識(shí),筆者選擇該站點(diǎn)2018年9月共計(jì)30 d的AFC檢票數(shù)據(jù)進(jìn)行分析。軌道運(yùn)營時(shí)間為06:00—23:15。設(shè)置數(shù)據(jù)統(tǒng)計(jì)時(shí)間間隔為15 min,每天分別生成69個(gè)進(jìn)站數(shù)據(jù)和出站數(shù)據(jù),30 d共計(jì)2 070個(gè)進(jìn)站數(shù)據(jù)和出站數(shù)據(jù)。圖2分別為該站點(diǎn)進(jìn)站和出站的客流時(shí)間序列。

圖2 茶園站點(diǎn)進(jìn)出站客流季節(jié)性特征
從圖2可看出:進(jìn)站與出站的客流模式基本一致,具有較突出的季節(jié)特征:① 進(jìn)出站客流都表現(xiàn)出以“天”為時(shí)間單位的周期性;② 進(jìn)出站每個(gè)周期的客流都表現(xiàn)出早晚高峰;③ 9月1、2、8、9、22、23、24日這幾天進(jìn)出站客流波形呈現(xiàn)出較小的早晚高峰,其他日期進(jìn)出站客流波形呈現(xiàn)出較大的早晚高峰;④ 出站較進(jìn)站平峰客流有較大波動(dòng)性。
從時(shí)間上看,9月1、2、8、9、22、23日為周末,9月24日為中秋節(jié),而其他時(shí)間為工作日。這些季節(jié)性特征不僅僅是該站點(diǎn)的獨(dú)有特征,對其他站點(diǎn)客流數(shù)據(jù)分析也具有相似特征。
針對軌道客流特征和模式,筆者提出使用工作日、周末、節(jié)假日等日歷模板分別建立分類預(yù)測模型。日歷模板包括:星期一、星期二、星期三、星期四、星期五、星期六、星期天、元旦節(jié)、春節(jié)、清明節(jié)、勞動(dòng)節(jié)、端午節(jié)、中秋節(jié)、國慶節(jié)等。對于有多天的節(jié)日,可細(xì)分為節(jié)日第1、2、3天等;對于周末調(diào)休,將該日調(diào)整為對應(yīng)的工作日;對于智博會(huì)、大型展覽等重大社會(huì)事件,可建立對應(yīng)的分類。表1為2018年9月的日歷模板。圖3為時(shí)間序列季節(jié)特征分類預(yù)測模型建立過程。

表1 2018年9月季節(jié)模板

圖3 時(shí)間序列的季節(jié)特征分類預(yù)測模型
以星期五日期類型為例,具體說明模型識(shí)別和參數(shù)估計(jì)過程。星期五類型包含9月7、14、21、28、30日共5個(gè)周期數(shù)據(jù),如圖4。

圖4 2018年9月星期五日期類型進(jìn)站子時(shí)間序列
檢驗(yàn)時(shí)間序列平穩(wěn)性,以推斷序列的差分階數(shù)d、季節(jié)差分階數(shù)D。筆者采用Kass法進(jìn)行檢驗(yàn),測試函數(shù)是R語言庫的ndiffs函數(shù),對星期五日期類型的時(shí)間序列進(jìn)行循環(huán)檢查,直到原始序列和季節(jié)調(diào)整序列均平穩(wěn),最后確定差分系數(shù)d=1、D=1。對星期五日期類型序列進(jìn)行d=1、D=1的差分計(jì)算,其結(jié)果如圖5。

圖5 2018年9月星期五日期類型進(jìn)站差分序列(d=1、D=1)
檢驗(yàn)時(shí)間序列相關(guān)性,以識(shí)別序列的自回歸階數(shù)p、移動(dòng)平均階數(shù)q、季節(jié)回歸階數(shù)P和季節(jié)移動(dòng)平均階數(shù)Q。筆者選擇AIC作為模型選擇標(biāo)準(zhǔn)。識(shí)別模型階數(shù)的過程為:通過acf自相關(guān)函數(shù)確定移動(dòng)平均階數(shù),pacf偏自相關(guān)函數(shù)確定自回歸階數(shù),eacf擴(kuò)展自相關(guān)函數(shù)確定自回歸和移動(dòng)平均項(xiàng)的階數(shù)。在實(shí)際搜索建模過程中,R語言庫的auto.arima函數(shù)有助于提供初步選擇[18],該函數(shù)給出模型ARIMA(2,1,2)(0,1,0)69,其AIC=2 760.72。繪制該序列的acf自相關(guān)函數(shù),如圖6(a)。圖6(a)中:1~2階滯后和69~70階滯后相關(guān)性顯著,故可考慮模型ARIMA(0,1,2)(0,1,1)69,其AIC=2 690.58。繪制該序列的pacf偏自相關(guān)函數(shù),如圖6(b)。圖6(b)中:1~5階滯后和69階滯后偏自相關(guān)性顯著,故可考慮ARIMA(5,1,0)(1,1,0)69,其AIC=2 710.37。通過計(jì)算eacf擴(kuò)展自相關(guān)矩陣,發(fā)現(xiàn)非季節(jié)部分選擇p=2、q=5,季節(jié)部分選擇P=1、Q=1較好,獲得備選模型ARIMA(2,1,5)(1,1,1)69,其AIC=2687.34。根據(jù)AIC準(zhǔn)則,預(yù)測模型ARIMA(0,1,2)(0,1,1)69和ARIMA(2,1,5)(1,1,1)69的AIC較小,但從模型簡潔性和計(jì)算性能等方面考慮,更傾向于選擇模型為ARIMA(0,1,2)(0,1,1)69。

圖6 2018年9月星期五日期類型進(jìn)站差分平穩(wěn)序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)
對識(shí)別模型的自回歸參數(shù)φ(B)、Φ(B)和移動(dòng)平均參數(shù)θ(B)、Θ(B)進(jìn)行估計(jì)。模型ARIMA(0,1,2)(0,1,1)69的線性回歸參數(shù)的極大似然估計(jì)如表2。通過代入估計(jì)參數(shù),建立該模型的表達(dá),如式(7)。計(jì)算該模型理論自相關(guān)函數(shù),如圖7。

圖7 模型ARIMA(0, 1, 2)(0, 1, 1)69自相關(guān)函數(shù)

表2 模型ARIMA(0, 1, 2)(0, 1, 1)69的參數(shù)估計(jì)
Yt=Yt-1+Yt-69+Yt-70+et+0.843et-1-0.0647et-2+0.725 4et-69+0.611 5et-70-0.046 9et-71
(7)
通過殘差分析對模型進(jìn)行診斷。圖8為ARIMA(0,1,2)(0,1,1)69模型的殘差圖。模型殘差已是隨機(jī)噪聲,由于9月30日為國慶調(diào)休,故殘差波動(dòng)性較大。采用Box-Ljung檢驗(yàn)對殘差進(jìn)行檢驗(yàn),設(shè)置滯后為138(周期的2倍),得到pvalue=0.853 5,表明該模型已捕獲時(shí)間序列的依賴關(guān)系。使用以上方法對該站點(diǎn)其他日期類型建立特征模板模型,如表3。

圖8 模型ARIMA(0,1,2)(0,1,1)69殘差

表3 2018年9月茶園站的時(shí)間序列季節(jié)特征模型
筆者設(shè)計(jì)了3組實(shí)驗(yàn)對2018年10月第2周的客流進(jìn)行預(yù)測,以此來說明季節(jié)分類模型有效性。
3.2.1 實(shí)驗(yàn)1
采用星期五模型預(yù)測10月12日的客流,預(yù)測值與實(shí)際值對比情況如圖9(a),客流預(yù)測殘差如圖9(b)。圖9(a)中:星期五模型預(yù)測值緊密貼合實(shí)際值;圖9(b)中:預(yù)測殘差圍繞均值(大約等于0)上下波動(dòng),該殘差圖平均絕對誤差為26,亦即每15 min的客流預(yù)測,平均存在26人誤差。由圖12也可看出:最大誤差為每天開始的兩個(gè)數(shù)據(jù),故在對數(shù)據(jù)預(yù)處理過程中,忽略序列的前后2個(gè)數(shù)據(jù)點(diǎn),對建模和預(yù)測更為有利。星期五模型較好地預(yù)測了星期五的客流。

圖9 2018年10月茶園站星期五日期類型的預(yù)測客流與實(shí)際客流及殘差
3.2.2 實(shí)驗(yàn)2
采用星期六模型預(yù)測10月12日的客流,預(yù)測值與實(shí)際值對比情況如圖10(a),客流預(yù)測殘差如圖10(b)。在圖10(a)中:預(yù)測值曲線很好地體現(xiàn)出了星期六數(shù)據(jù)特征,但無法貼合實(shí)際數(shù)據(jù)曲線;在圖10(b)中,預(yù)測殘差存在諸多高峰,星期六模型無法擬合這些特征,該殘差圖的平均絕對誤差為74。星期六模型雖擬合了星期六的平坦曲線季節(jié)特征,但無法有效預(yù)測星期五客流。

圖10 2018年10月茶園站星期六日期類型的預(yù)測客流與實(shí)際客流及殘差
實(shí)驗(yàn)1、2表明:星期五模型能很好預(yù)測星期五客流,而星期六模型無法有效預(yù)測星期五客流。進(jìn)一步檢查其他模型對星期五的預(yù)測情況發(fā)現(xiàn):星期一至星期五模型能有效預(yù)測10月12日客流,而星期六和星期天模型無法有效預(yù)測10月12日客流。回顧圖2,星期一至星期五曲線基本屬于同一種季節(jié)性特征,而星期六和星期天曲線屬于另一種季節(jié)特征。故星期一至星期五模型能較好預(yù)測星期一至星期五客流,星期六和星期天模型能較好預(yù)測星期六和星期天模型。根據(jù)兩組實(shí)驗(yàn),在預(yù)測要求不高情況下,可劃分為周日和周末兩個(gè)特征模板,以減少模型數(shù)量。
3.2.3 實(shí)驗(yàn)3
實(shí)驗(yàn)3是采用連續(xù)通用模型和上述季節(jié)分類模型預(yù)測10月8—14日客流。圖11顯示了兩種預(yù)測方式的平均絕對誤差。連續(xù)性通用乘法季節(jié)自回歸差分滑動(dòng)平均模型的建立方法為:采用9月1日—10月7日真實(shí)數(shù)據(jù)建立10月8日連續(xù)預(yù)測模型;采用9月1日—10月8日真實(shí)數(shù)據(jù)建立10月9日連續(xù)預(yù)測模型;以此類推,為10月8—14日每天建立一個(gè)連續(xù)預(yù)測模型。季節(jié)分類預(yù)測方法為:采用星期一模型預(yù)測10月8日(星期一)客流,采用星期二模型預(yù)測10月9日(星期二)客流;以此類推,最終預(yù)測10月8—14日每天客流。圖11中:方塊點(diǎn)劃線和圓點(diǎn)劃線分別表示每天連續(xù)預(yù)測和季節(jié)分類模型的平均絕對誤差。

圖11 2018年10月第二周分類預(yù)測與連續(xù)預(yù)測平均絕對誤差對比
從圖11可看出:連續(xù)預(yù)測平均絕對誤差波動(dòng)顯著,在10月8—9日(星期一、二)和10月13—14日(星期六、星期天)波動(dòng)達(dá)最大值,而季節(jié)分類模型平均絕對誤差較低且無波動(dòng)。回顧圖2,星期一至星期五曲線基本屬于同一種季節(jié)性特征,而星期六和星期天曲線屬于另一種季節(jié)特征,在季節(jié)特征交界處,連續(xù)客流預(yù)測以最近特征推斷將來特征,導(dǎo)致了巨大的誤差和誤差波動(dòng);而季節(jié)分類模型不存在特征過渡,也就不會(huì)產(chǎn)生誤差波動(dòng)。
連續(xù)預(yù)測和季節(jié)分類模型在10月10—12日誤差對比不顯著,連續(xù)預(yù)測有可能比季節(jié)分類模型預(yù)測更好。出現(xiàn)這種情況主要原因?yàn)椋?0月8—12日基本屬于同一種季節(jié)性特征,連續(xù)預(yù)測恰好利用了10月8—9日的相似客流,對10月10—12日客流進(jìn)行了合理推斷。基于這一特點(diǎn),季節(jié)分類模型可利用當(dāng)天采集的客流數(shù)據(jù)建立更加精準(zhǔn)的客流模型來推斷未來部分時(shí)間客流。例如:假設(shè)10月12日已經(jīng)獲得當(dāng)天06:00—11:00點(diǎn)的24個(gè)數(shù)據(jù),可將9月星期五數(shù)據(jù)和這24個(gè)數(shù)據(jù)構(gòu)成星期五子序列,實(shí)時(shí)重構(gòu)星期五季節(jié)分類模型,通過實(shí)時(shí)模型來預(yù)測10月12日接下來時(shí)間段客流。
針對軌道交通客流強(qiáng)烈的季節(jié)性特征,筆者提出基于時(shí)間序列季節(jié)分類模型的短期客流預(yù)測方法。將預(yù)測時(shí)間以天為單位建立日歷模板,采用乘法季節(jié)自回歸差分滑動(dòng)平均方法建立各個(gè)模板的季節(jié)分類模型,根據(jù)預(yù)測時(shí)間匹配的季節(jié)模型進(jìn)行短期客流預(yù)測。
以重慶軌道交通6號(hào)線2018年9月的完整客流數(shù)據(jù)為例,建立了日歷模板和季節(jié)分類模型,并對2018年10月第2周客流進(jìn)行了預(yù)測。筆者設(shè)計(jì)了3組實(shí)驗(yàn),在第1、2組實(shí)驗(yàn)中,星期五模型預(yù)測星期五客流誤差為26人,而星期六模型預(yù)測星期五客流誤差為74人,表明預(yù)測算法和數(shù)據(jù)特征對客流預(yù)測都有較大影響,而數(shù)據(jù)特征影響更為明顯;在第3組實(shí)驗(yàn)中,連續(xù)預(yù)測誤差為21~84人,季節(jié)分類模型誤差為21~24人,表明季節(jié)性分類模型能有效預(yù)測客流,誤差較小,避免了誤差波動(dòng)性問題。