武騰飛 徐慧智 盧 俊
(東北林業大學交通學院 哈爾濱 150040)

目前國內外對客流預測研究取得了一定的研究成果,但多未考慮到站間隔的影響,基于此,文中提出了一種考慮到站間隔的公交上下客流短時預測方法,并利用采集的公交數據進行了驗證.
通過人工調查法以5 min為間隔連續式采集101路公交車在博物館站點公交車站上下客流量、到站時間、離站時間.調查時間為上午07:00—11:00,下午14:00—18:00,共計2 d.
共計采集數據5 min時間段為192條,其中58個時間段沒有公交車.上下客流總人數為3 325人,其中上客量為703人,下客量為2 622人,各時段的上下客流量分別見圖1.

圖1 上、下客流量
由圖1a)可知,2 d的上客人數的波動曲線一致,說明在人們的乘車行為受到時間的影響較小,不會因為時間的變化而導致出行行為的改變,在此階段人們的必要出行占比很大.
根據圖中的時間軸線推斷,居民出行乘車的高峰期在早晨的07:50—08:40與16:40—18:30.且在10:00—16:00期間出行波動不大,也即必要出行相對減少.2 d客流量的平均值分別為3.52,3.80人/5 min.
由圖1b)可知,2 d的下客折線圖變化趨勢大致,而上午的下客流量明顯高于下午的下客流量,說明在人們多數在博物館周圍活動,也從側面反映了博物館站作為公交換乘樞紐站的作用.2 d下客流量的平均值分別為13.17,14.15人/5 min.
具體數據見表1.

表1 數據統計
由表1可知,每天07:00—08:00上下客的總人數最高,而此時的車輛數均為9輛,車輛的總的上下客輛卻最低.因此車輛發車間隔相對不合適,需要重新設置發車間隔.
ARIMA模型稱為自回歸移動平均結合模型.當序列中存在非穩定趨勢時,可采用差分化方法將非平穩的序列化成平穩序列,一般記為ARIMA(p,q,d).其中:p為自回歸階數;d為差分階數;q為移動平均階數.
為保障行文過程的準確性與可操作性,確定了模型建立流程,見圖2.

圖2 流程圖
為使預測數據更加準確,對每5 min的數據進行一次編號,則每小時可編號為12.擬采用2 d的07:00—09:00的下客流量作為基礎數據,采用編號1~45數據作為模型探究數據,編號46~48的數據作為預測數據.
1) 模型基本形式
①2 d 07:00—11:00下客流量時間序列見圖3a),易知該序列為非平穩序列.
②經過一階差分處理后的序列見圖3b).由圖3b)可知,經過差分的序列在水平線上下波動,具有良好的平穩性.

圖3 07:00—09:00序列圖
③利用博克斯-詹金斯模型對平穩的一階差分序列進行純隨機性檢驗,見表2.


表2 分析統計
2) 模型識別
①作序列的自相關函數和偏相關函數見圖5,一階差分之后的時間序列的自相關函數呈現一階“拖尾”狀,偏相關函數圖呈“拖尾”狀,可初步確定序列為ARIMA序列.

圖5 自相關函數和偏相關函數圖
②確定具體q的值.由BIC準則,通過比較表3中模型可確定ARIMA(0,1,1) 表3 BIC信息表 ③對各個模型的參數及殘差白噪聲進行檢驗.各模型檢驗結果見表4. 由表4可知,模型ARIMA(1,1,1),ARIMA(1,1,0),ARIMA(2,1,1)參數顯著且已通過白噪聲檢驗,再結合表3可知ARIMA(1,1,1)正態BIC最小,所以選擇ARIMA(1,1,1)模型作為07:00—09:00綜合預測模型,即p=1,d=1,q=1. 表4 各模型檢驗結果 將2 d的調查數據,按照2 h作為一個時段,建立不同時段預測模型;對同一時段連續2 d的歷史數據進行分析,建立綜合預測模型. 1) 不同時段預測模型見表5. 表5 不同時段預測模型 2) 同一時段連續2 d歷史數據綜合預測模型,模型結果見表6. 表6 綜合預測模型 綜合表5~6可知,2 d不同時段模型僅有09:00—11:00下客流量模型一致.兩天不同時段模型與同一時段連續兩天歷史數據綜合預測模型結果不同,這說明短時客流預測模型隨客流量的數據量變化而變化.而預測模型需要根據實時獲取到的客流進行修正,以保證預測模型的準確性與可靠度,從而精準地反映未來客流量大小及其發展趨勢,方便調度員及時安排調度車輛用以滿足某公交線路需求量,提高公交線路的使用率,將車輛的滿載率控制在合理的范圍內.由于客流總是受到多方面因素的影響在不斷地發生著變化,因此模型的各個參數也隨之不斷地發生著改變,因此模型的標定并不固定. 得到預測模型誤差表,限于篇幅,表略.平穩R2大于0.5為模型的擬合程度好,第一天、第二天與2 d累積數據各模型的平穩R2除了14:00—16:00預測模型不符合要求,剩下的模型均符合要求.主要因為14:00—16:00上下車客流數據里存在無效值,需剔除無效值再建立ARIMA模型;均方根誤差與平均絕對誤差均維持在個位數,符合誤差范圍要求;不同時段預測模型與綜合預測模型的平均絕對百分誤差除了07:00—09:00上車客流量的實際數值偏小外,其他時間段內平均絕對百分誤差都在可接受的范圍之內. 為保障預測模型的精度,對3.1中的模型進行修正.首先剔除數據中的無效值,也即剔除沒有車輛到達的分割段,而后重新建立了剔除無效值ARIMA模型.得到實際值與預測值的誤差表,限于篇幅,表略.預測誤差百分率為正,則說明預測值小于實際值;若為負,說明預測值大于實際值.預測數據中誤差絕對值的最大值為42,最小值為1;預測誤差百分率絕對值最小值為9.10%,最大為266.70%,由于實際值過小或偏大,導致部分預測誤差百分率大于100%. 模型數據擬合精度后的預測偏度與峰度,見表7. 表7 預測偏度與峰度 由表7可知,剔除無效值后的預測模型的偏度、峰度更接近0,說明剔除無效值的預測模型擬合精度更高,即考慮車輛到達間隔短時客流預測擬合精度更好. 為對預測模型有更加直觀的感受,對3.2中模型(部分)做出擬合圖,見圖6.由圖6可知,剔除無效值的擬合圖與未剔除無效值的擬合圖相比,其整體走勢更加與實際值相契合. 圖6 09:00—11:00下客流量綜合預測模型ARIMA(4,1,1) 基于調查數據,對所調查站點的短時客流特征進行了分析,確定了不同時段預測模型與綜合預測模型.通過對預測模型的誤差探究,建立了剔除無效值ARIMA模型.通過對剔除無效值與不剔除無效值兩種情況下模型的擬合預測結果進行比較分析,證明剔除無效值的模型預測誤差更小,預測精度更好.因此考慮車輛到達時間間隔對公交車的客流量預測、動態調度等具有重要意義.在本次研究中,未就多個站點的聯動進行考慮,未來將進一步的將多個站點的到站間隔進行考慮在內,以形成線性的預測,從而進一步提升公交站點的動態調度的時效性、準確性.

2.3 預測建模


3 短時預測結果
3.1 預測誤差
3.2 擬合精度


4 結 束 語