姜 梅 牛琳博
(1. 中鐵二院工程集團有限責任公司科學技術研究院 成都 610031;2. 西南交通大學交通運輸與物流學院 成都 610031)
?
基于統計特征的軌道交通站點乘降量預測算法研究
姜 梅1牛琳博2
(1. 中鐵二院工程集團有限責任公司科學技術研究院 成都 610031;2. 西南交通大學交通運輸與物流學院 成都 610031)
針對現有預測方法因未考慮城市軌道交通站點乘客的隨機性,致使乘降量預測精度不高的問題,提出一種基于統計特征的客流量預測方法。依據日期、時段、天氣、突發事件等因素將歷史數據進行分類。建立基于乘降量統計特征的分布模型,根據其預測客流的統計特征,結合隨機數產生算法,產生的隨機數即為客流乘降量預測值,最后結合算例予以說明,證明該模型的可行性。
軌道交通;乘降量;預測算法;統計特征;隨機數產生算法
乘降量預測是確定軌道交通發車間隔、合理分配車底的前提,預測結果是制定軌道交通系統調度計劃的依據。因此,乘降量預測對軌道交通的運營效能具有重要意義。
目前,對于城市內公共交通車站的乘降量預測方法很多,主要有以下兩種:一類研究是基于時間序列對乘降量進行短期預測,其代表性成果有張世英[1-2]等人通過時間序列、沈家軍[3]等人結合灰色預測模型預測公交站點短時乘降量;另一類研究是利用相關智能算法進行預測,代表性研究有Zijpp Van der[4]等人利用人工神經網絡、張春輝[5]等人利用卡爾曼濾波法、郭士永[6]等人利用最小二乘支持向量機回歸算法、劉凱[7]等人利用小波預測方法等建立的乘降量預測模型。
上述方法從不同層面完善了站點乘降量的預測研究,但仍存在一定的不足之處:1)短期客流預測模型很難建立精確的輸入-輸出模型;2) 對節假日等特殊客流波動規律反映不充分;3) 相關智能算法求解困難。鑒于這些不足,筆者提出一種基于統計特征的短期站點乘降量預測方法,以歷史乘降量數據作為預測依據,以期達到較高的預測精度。
軌道交通線路上每個站點乘客的到達是隨機的。乘客的乘降量會受到日期(工作日、節假日)、時段(高峰、平峰)、天氣(非雨天、雨天)、客流敏感點事件(交通事故、大型集會)等因素影響。因此,為了構建統計分布模型,保證客流構建具有一致性,依據歷史數據,構建統計數據集。
依據上述條件,將歷史客流數據中的某一天某一時段乘降量數據進行參數化分類表達,如圖1所示。

圖1 歷史客流數據參數化分類表達
通過上述客流分類,對所搜集的客流數據進行數據庫編碼存儲(見圖2),整理成為歷史客流數據庫,為本客流預測方法提供依據。
考慮到一天內不同時段乘降量的變化,對于第i站,將某一軌道交通線路在第p周中第q天客流數據的運營時間[ts,te]劃分為k個等間距區間,每個區間為一個統計時段,即
[tb,te]=[ts,ts+Δt)+[ts+Δt,ts+2Δt)+
…+(ts+(k-1)Δt,te]
(1)
(2)
(3)
其中,ts為軌道交通運營開始時刻,te為軌道交通運營結束時刻,Δt為一天內統計時段長度,datap,q,Δt為某一年第p周中第q天的乘降量。
由于受經濟發展的影響,客流具有動態變化性,因此,早期的數據會對短期預測的精度產生影響。為提高預測的精度,必須實現客流數據集的實時更新。將當天該站點不同時段、不同因素條件下的實時數據按不同類別存儲到相應的客流數據集合,替換同類型的早期數據,完成對數據集的更新,從而為準確的預測提供數據支持。
在統計乘降量分布函數之前,需要調用歷史乘降量數據。依據對已有數據的劃分,判斷當前的日期、天氣情況、站點的預測時段、線路環境情況,對應數據的分類情況,調用已經存儲的該類數據。
建立精確的短期客流預測模型,必須首先明確客流數據的統計特征,為此應采取統計學的手段對客流數據進行系統分析。
2.1 基于客流數據集的客流分布類型檢驗
在未受到隨機因素干擾的情況下,客流服從正態分布。在實際過程中,由于受到天氣、假期等隨機因素的干擾,造成客流波動較大,有可能服從非正態分布。因此,引入統計學中參數與非參數檢驗方法。首先對客流數據采用參數檢驗的方法,若其檢驗結果不服從正態分布,采用非參數檢驗的方法,得出其統計特征。
2.2 基于參數統計的車站乘降量分布模型
在參數檢驗方法中,分布擬合χ2檢驗通過比較總體客流樣本的實際值與理想期望的差異,判斷是否服從正態分布。現對其檢驗過程進行詳細闡述。

2) 再統計出總體樣本X的數值出現在各個Ai(i=1,2,…,r)中的實際頻數ni。
3) 在假定所選用的客流歷史數據服從正態分布的前提下,總體客流樣本X~N(μ,σ2),其中μ、σ2未知,用極大似然法估計確定兩個未知參數。
(4)

4) 考慮統計量。
(5)
式中,χ2表示實際客流乘降量結果與理想期望結果的相對差異的總和。m為被估計的分布參數的個數,其中正態分布含有2個參數,m=2。

(6)
2.3 基于非參數統計的車站乘降量分布模型
客流在受到隨機因素干擾的情況下,服從非正態分布,由于其分布未知,引入非參數檢驗方法??茽柲衤宸蛱岢龅腒olmogonov檢驗適用于除正態分布之外的其他分布,現對其進行詳細闡述。
1) 客流數據樣本的經驗分布函數Fn(x),其假設分布函數為F(x),根據Kolmogonv定理,可得到
(7)

(8)
式中,k為客流數據樣本X的秩。
提出假設問題H0:客流數據樣本X服從非正態分布,即F(x)=F(x0),做顯著性檢驗。
3) 給出顯著性水平α,客流數據樣本個數n,查Kolmogonov表得出
(9)



(10)
其中,xm為客流乘降量數據的中位數。
短期客流乘降量的預測結果具有隨機性,結合隨機數產生算法,依據其分布產生的隨機數即為預測結果。對于預測服從正態分布的客流乘降量,選用線性同余法進行預測的模型如下。
采用線性遞推公式[9],有
xn+1=ξxn+c(modM)
(11)
0≤xn+1 其中,ξ為乘子,c為增量,M為模。 產生客流乘降量預測隨機數列 ln=xn/M (12) 其中,ln為第n個客流乘降量預測隨機值,0≤ln<1。 根據上述方法得出一組服從正態分布的客流隨機數:l1,l2,…,ln,將其帶入下式 (13) 根據中心極限定理可知,隨機變量X~N(0,1),由Y=σX+μ~N(μ,σ2),得出服從正態分布的短期客流乘降量預測結果。 假設某軌道交通線路運營時間為8:00—20:00,選取統計時段Δt=15 min,站點總數為30個。根據已知數據進行短期站點客流預測,以預測第2天的客流乘降量為例,假設其為周一并且為非節假日,由于無法預知次日運行線上是否發生突發事故,考慮其未發生敏感事故。 首先預測第1個統計時段8:00—8:15的上車人數,假設在該時段為晴天,調用數據存儲中與其性質相同的數據。其結果為:90,103,62,93,88,72,81,88,121,113,72,115,92,84,92,83,84,100,99,99,91,73,92,101,90,95,92,82,88,77。應用分布擬合檢驗,檢驗上述結果是否為正態分布。將以上客流總體樣本劃分成6個子區間,分別為:(-∞,70],(70,80],(80,90],(90,100],(100,110],(110,+∞)。 假定客流總體樣本為正態分布,其均值μ=85,方差σ2=3.22。計算過程如表1所示。 表1 樣本正態分布檢驗過程 本文針對目前客流預測方法的不足,提出了一種基于統計特征的軌道交通站點乘降量預測方法,綜合考慮日期、天氣、突發事件等因素,將采集的全年歷史數據進行劃分并存儲,引入統計分布思想,預測各個站點在相應統計時段的乘降量。其主要研究成果有:基于線路的歷史乘降量數據,按照不同影響因素進行詳細劃分;在進行特定時段乘降量預測時,調用對應的歷史乘降量數據;為了驗證所調用的各組數據的統計特征,建立基于客流乘降量統計特征的分布模型,結合隨機數產生算法,得出客流預測結果。本文所提出的預測方法能夠克服節假日等特殊客流波動對預測結果的影響,隨著軌道交通線路客流數據的累計,預測精度將得到進一步提升。針對本文成果的工程應用,統計時間間隔的劃分將是下一步研究的重點。 [1] 張世英,陸曉春,李勝朋.時間序列在城市交通預測中的應用[J].天津大學學報(社會科學版),2006(5):370-372. [2] VAN D V,DOUGHERTY M,WATSON S.Combining kohonen maps with ARIMA time series models to forecast traffic flow[J].Transportation Research Part C,1996,4(5):307-318. [3] 沈家軍,王煒,陳峻.基于灰色馬爾可夫模型的近期公交客流量預測[J].公路交通科技,2007,24(9):120-123. [4] VAN DER ZIJPP N J,DE ROMPH E D.A dynamic traffic forecasting application on the amsterdam beltway[J].International Journal of Forecasting,1977 (13) : 87-103. [5] 張春輝,宋瑞,孫楊.基于卡爾曼濾波的公交站點短時客流預測[J].交通運輸系統工程與信息,2011(4):154-159. [6] 郭士永,李文權,白薇,等.基于最小二乘向量機的公交站點短時客流預測[J].武漢理工大學學報(交通科學與工程版),2013(3):603-607. [7] 劉凱,李文權,趙錦煥.短時公交客流小波預測方法研究[J].交通運輸工程與信息學報,2010,8 (2):111-117. [8] 李裕奇,趙聯文,王泌,等.非參數統計方法[M].成都:西南交通大學出版社,2010. [9] 鄭列,宋正義.偽隨機數生成算法及比較[J].湖北工業大學學報,2008(5):65-68. (編輯:郝京紅) Prediction Algorithm of the Passengers on and off at Tram Stations Based on Statistical Characteristics Jiang Mei1Niu Linbo2 (1. Research Institute of Science and Technology China Railway Eryuan Engineering Group Co., Ltd., Chengdu 610031;2. School of Transportation and Logistics, Southwest Jiaotong University, Chengdu 610031) This paper proposes a statistical characteristics-based ridership predicting method to solve the low predication accuracy of the number of passengers on and off as the current prediction method does not consider passenger randomness of urban rail stations. The method covers the following steps: divide and classify historical data according to such factors as dates, time intervals, weather and emergencies; create a distribution model based on the statistical characteristics of the number of passengers on and off; and calculate random numbers in accordance with the statistical characteristics of the predicted passenger flow and the random number generation algorithm. The random number is the predicted number of passengers on and off, which along with the example demonstrates that the distribution model is workable. urban rail; the number of passengers on and off; prediction algorithm; statistical characteristics; random number generation 10.3969/j.issn.1672-6073.2016.04.018 2015-09-14 2015-11-03 姜梅,女,碩士研究生,工程師,從事新型軌道交通規劃與線路設計,jiangmei@vip.126.com 四川省科技計劃項目(2014GZ0081) U231 A 1672-6073(2016)04-0081-044 算例



5 結語