陳 紅,韋凌翔,李高峰,蔡志理,邵海鵬
(1. 長安大學 公路學院,陜西 西安 710064;2.鹽城工學院 材料工程學院,江蘇 鹽城 224051;3. 山東交通學院 交通與物流工程學院,山東 濟南 250023)
城市軌道交通行人通道交通狀態識別研究
陳 紅1,韋凌翔2,李高峰1,蔡志理3,邵海鵬1
(1. 長安大學 公路學院,陜西 西安 710064;2.鹽城工學院 材料工程學院,江蘇 鹽城 224051;3. 山東交通學院 交通與物流工程學院,山東 濟南 250023)
提出了一種基于支持向量機,利用行人交通流參數,實現城市軌道交通人行通道處交通狀態識別的方法。采用FCM算法實現了4種行人交通狀態的聚類分析與定義;建立SVM多類分類器模型。并分別采用線性可分和非線性兩種SVM分類器以及多項式、高斯徑向基、sigmoid等3種核函數,應用于行人通道交通狀態識別中,進而通過實際采集數據集合,對其有效性進行對比分析。研究表明:設計的算法具有良好的識別性能,RBF核函數SVM模型的總體識別效果相比最好,正確率均在85%以上,說明行人交通參數在該核函數轉化的高維空間具備良好的線性可分;線性可分對暢通狀態識別效果相對最好,正確率為98%;多項式核函數對穩定狀態識別效果相對最好,正確率為93%;sigmoid核函數的總體識別效果相比最穩定,正確率均在85%~92%。
交通運輸工程;軌道交通;狀態識別;支持向量機
隨著經濟的快速發展以及城市化進程的不斷加快,城市軌道交通系統在我國很多城市逐步建設運營[1]。由于城市軌道交通系統具有運量大、速度快、準點性高等其他交通方式無法替代的優勢,使其成為了城市公共交通系統的重要組成部分[2]。
自1969年到2014年初,城市軌道交通系統在我國的北京、上海、廣州、南京、西安等20余個城市已經建成運行。《2012年—2013年中國城市軌道交通發展報告》中指出:截至2013年5月,全國運營的城市軌道交通總里程達2 518.6 km,在建城市軌道交通里程有2 975.58 km。通過在長期與大規模的軌道交通建設中的不斷摸索以及其技術的不斷進步,我國城市軌道交通在投資、建設、運營和管理等方面不斷發展并走向成熟和完善。開展城市軌道交通站點行人通道處交通狀態分級與識別的相關研究有助于建立應急處置、信息發布等應急運行機制,進而提高地鐵線路行人疏散能力以及為乘客提供更為舒適的乘車環境,從而達到提升城市公共交通系統服務水平的目的[3-4]。
國內外學者以及研究機構,在城市軌道交通站點等人流集散區通道處的行人交通特性等方面,取得一定的研究成果,如美國《道路通行能力手冊》(Highway Capacity Manual,HCM,2010)中提出的行人道平均人流服務水平標準(lever of service, LOS);LI Yifan等[1]借助仿真軟件對行人通行設施的瓶頸處的擁堵-疏散過程進行了建模,并據此評估了行人通行設施的交通擁堵狀態和服務水平;XU Xinyue等[4]基于馬爾科夫鏈以及排隊論的相關理論,對軌道交通站點的乘客交通狀態特性進行了研究分析,并且輔以實例驗證;CHENG Huan等[5]基于行人流理論,對地鐵站疏散設施(出口、樓梯、通道等)建立與交通狀態相關的緊急疏散能力評估模型;NAI Wei等[6]對軌道交通站點不同通行設施的行人的步行特性以及步行交通狀態進行了對比分析;J.SHAH等[7]對行人通行設施緊急狀態下的乘客服務水平以及所處的交通狀態進行了調查分析。以上研究的重點主要集中在行人交通狀態特性以及行人服務水平分級等,并未對行人交通狀態分類與識別算法實現方面進行深入研究。如何對依據行人交通參數數據對行人交通狀態進行分類和識別是亟待解決的問題。
在現代智能交通管理系統中,各種判別算法經常被用來進行交通狀態實時判斷。現有的檢測分類算法主要有4類,包括直接比較算法、時空預測算法、模式識別算法、人工智能算法等[8-9]。支持向量機(人工智能算法)是Vapnik等人根據統計學理論提出的一種新的通用學習方法,它是建立在統計學理論的VC維理論和結構風險最小原理的基礎上,根據有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折衷,以期獲得最好的推廣能力。與其他傳統方法相比,能夠較好地解決小樣本、非線性、高維數和局部極小點等實際問題[10]。SVM框架是當前最流行的監督學習分類器之一[11]。
筆者在相關研究的基礎上,提出一種基于支持向量機的利用行人交通參數實現行人交通狀態識別的方法。該方法首先采用FCM算法實現4種行人交通狀態的聚類分析,得到交通狀態數據集;然后建立SVM多類分類器模型,并分別采用線性可分和非線性兩種SVM分類器以及多項式、高斯徑向基、sigmoid等3種核函數,應用于行人通道交通狀態識別中,進而通過實際采集數據集合對其有效性進行對比分析。
1.1 交通狀態特征參數提取
在交通工程學以及行人交通特性的研究中,行人步行速度、行人密度以及行人流量是反映行人流特征的重要參數[12]。城市軌道交通通道、公交站臺等待區域、城市交叉口行人過街設施以及大型活動的行人集散區等不同區域內,特定時段行人流在這些參數方面表現出不同的特性[10,13]。因此,筆者選取單位時間內進入觀測區域的行人平均步行速度、行人平均密度以及行人平均流量3個特征參數,對相應計算公式進行適當修訂,以符合調查方案的實際可操作性。據此構建三維樣本的空間,相關指標定義如下,具體行人參數觀測區域示意如圖1。

圖1 行人參數觀測區域示意Fig.1 Observation area schematic of pedestrian parameters
1.1.1 平均步行速度
平均步行速度為單位時間(min)內,行人通過觀測區域的平均速度計算如式(1):
(1)

1.1.2 平均密度
行人平均密度為在單位時間內,單位面積的行人數量,人/m2,計算如式(2):
(2)

1.1.3 平均流量
行人平均流量為在單位時間(min)單位通道寬度(m),通過檢測線A和B的平均人數計算如式(3):
(3)

1.2 交通狀態聚類分析方法
根據選取的行人平均步行速度、行人平均密度以及行人平均流量3個基本特征參數,得到行人交通狀態三維空間。行人交通狀態聚類分析就是根據空間中樣本分布,將距離相近的樣本劃歸成一類。其原則是使得類間距離盡可能大,而類內樣本間距離盡可能小,從而得到暢通狀態、穩定狀態、擁擠狀態和阻塞狀態4種行人交通狀態的劃分方法。模糊C-均值算法[14-16](fuzzy C-means, FCM)是一種泛化的分區聚類方法模糊C-均值聚類算法。其通過優化目標函數得到每個樣本點對所有類中心的隸屬度,從而決定樣本點的類屬以達到自動對樣本數據進行分類的目的。
對筆者選取的行人交通狀態三維空間,假設第i個三維觀測值為xi=(xi1,xi2,xi3),分別表示行人平均步行速度、行人平均密度以及行人平均流量,N個行人流參數觀測值的集合記作X,X表示一個N×3的矩陣:
(4)
FCM 算法基于最小化如下目標函數[14]:
(5)

(6)
SVM分類器的工作原理如下[10-11]:對于線性可分的問題,設定劃分訓練集的初始超平面,并根據最大間隔原則對其進行優化,確定最終的決策超平面(決策函數),從而使得訓練集中的樣本能夠正確分類。對于近似線性可分問題,可通過引入松弛變量,來“軟化”線性可分問題對優化間隔的要求,即允許有不滿足約束條件的樣本點存在,并引入一個懲罰參數加以適當限制,從而將近似線性可分問題轉化為線性可分問題進行求解。對于非線性可分問題,可通過一個非線性核函數將輸入向量映射到高維線性特征空間,將非線性可分問題轉換為線性可分問題進行求解。
2.1 SVM多類分類器模型的構建
行人交通狀態識別是一個多類分類問題,由于傳統的支持向量機方法在分類問題上只考慮了二值分類的問題,所以需要擴展SVM建立多個支持向量機分類器。運用間接法構造SVM多類分類器,通過組合多個二分類器來實現多分類器的構造,即在k個樣本中,分別選取2個不同類別構成一個SVM子分類器,相當于將4個擁堵的多類問題轉化為多個兩類問題來求解。據此構建3個SVM二分類器為:{暢通狀態,穩定狀態},{穩定狀態,擁擠狀態},{擁擠狀態,阻塞狀態}。
構建訓練樣本集為

(7)

(8)

(9)


(10)
(11)
定義Lagrange函數[L(w,b,a)]為
(12)

(13)
(14)

這樣,式(10)的優化問題轉化為對偶問題:
(15)
(16)
0≤αi≤C,i=1,2,…,l
(17)
通過對式(16)求解,其中C為懲罰參數,得到最優分類函數為
(18)
b*的求解可通過任選一個支持向量,由式(11)約束方程(此時去等號)求出。
2.2 SVM多類分類器模型計算步驟設計
1)選取行人交通狀態參數的訓練樣本集


5)對于非線性可分的行人通道交通狀態,需要在式(15)中引入一個實現線性映射的核函數K(xi,xj):
6)選擇不同的核函數K(xi,xj),可構成不同的行人通道交通狀態分類SVM,將K(xi,xj)代入式(18),得到行人交通狀態分類SVM決策函數形式為

7)分別構造線性可分和非線性可分的行人通道交通狀態的決策函數f(x),推斷任一輸入行人交通狀態X3對應的輸出狀態Y。
2.3 SVM分類器核函數的選擇
對于近似線性可分和線性不可分問題,可采用增加松弛變量或采用合適的核函數,通過非線性變換將低維的輸入空間映射到高維的特征空間,從而將非線性可分問題轉換為線性可分問題進行求解[10,17]。目前,在分類問題方面常用的核函數主要包括多項式核函數、徑向基( RBF)核函數、sigmoid核函數3種[17]。因此,筆者分別采用線性可分和非線性2種SVM分類器以及多項式、高斯徑向基、sigmoid這3種核函數應用于行人通道交通狀態識別中,并對其有效性進行對比分析。具體核函數計算公式如下。
1)多項式核函數
K(xi,x)=[q(xi,x)+1]d
(19)
2)徑向基( RBF)核函數
(20)
3)sigmoid核函數
K(xi,x)=tanh[v(xi·x)+c]
(21)
式中:x為目標輸入向量;xi為訓練樣本集中第i維的輸入向量;q,d,c,g,v均為對應核函數的參數。
3.1 參數采集方案
為了準確獲取行人交通參數的時空特性數據,筆者采用錄像機記錄的視頻信息進行數據采集的方法,即錄像采集法。錄像采集法是目前行人調查中廣泛采用的調查方法,具備存儲便捷,可以重訪獲取細節信息的優點[18-19]。為保證調查位置全面覆蓋不同擁擠度的通道行人特性,選取西安市軌道交通2號線的換乘站點(北大街站)、客流集散較大站點(鐘樓站、小寨站)共計3個站點的行人通道為調查對象。為了得到調查行人通道在運行時段的交通參數的時空分布數據,并考慮其參數的調查需要確定一個連續漸變的時段,因此,行人密度觀測的時間為工作日(周三)和非工作日(周六)晚高峰17:00—19:00。確定目標車站的行人通道后,選取行人通道內一段寬W(以通道寬度作為觀測區域的寬度),長L的區域作為拍攝區域,為便于在視頻數據提取時更準確判斷出行人是否處于該區域,邊界盡量選擇有明顯標識的邊線。
3.2 數據歸一化處理
對調查得到的原始數據按照式(1)~式(3)計算出相應的行人交通參數,提取有效數據286條,為避免樣本數據存在量綱或某一維數據值過大而導致SVM訓練錯誤,用式(22)將三維的行人交通數據進行歸一化到[-1,1]區間:
(22)

參數原始值;ti,min,ti,max分別為第i(i=1,2,3)維行人交通參數原始值的最小值和最大值。
3.3 行人交通狀態的劃分
根據式(5)、式(6)中FCM算法,對歸一化后的286條有效數據進行多次迭代,得到4種交通狀態的聚類中心如式(23),各類樣本在狀態空間中的分布情況如圖2。


圖2 4種行人交通狀態數據樣本的分布Fig.2 Data sample distribution of four kinds of pedestrian’s traffic status
(23)
式中:m1,m2,m3,m4分別為暢通、穩定、擁擠和阻塞狀態聚類中心;mvf與式(6)含義相同。
矩陣中每一行分別對應4種交通狀態聚類中心的行人平均步行速度、行人平均密度以及行人平均流量。
3.4 有效性檢驗與分析
為了更好地考察算法的總體分類識別效果,對有效性檢驗步驟設計如下:①對歸一化后的286條有效數據樣本按照行人交通狀態的劃分得到暢通、穩定、擁擠和阻塞4種狀態的樣本數分別為:50,65,78,90;②為了有效對比4種狀態的分類的正確率,隨機從4種狀態中各選取50個數據樣本作為有效性檢驗數據樣本;③分別隨機從4類狀態有效性檢驗數據樣本各選出20個樣本作為訓練集合,其未選中的樣本作為測試集合;④按照SVM多類分類器模型計算步驟對SVM模型進行訓練,然后用測試集合對已訓練完成的模型進行測試,得到不同分離器下4種行人交通狀態分類的正確率(其中,穩定狀態和擁堵狀態的正確率為其與相鄰狀態分類結果正確率的均值),如圖3。

圖3 4種行人交通狀態不同SVM分類器的正確率Fig.3 Accuracy of different SVM classifiers of four kinds of pedestrian’s traffic status
由圖3可以看出:①整體上看,所設計的算法具有良好的識別性能,RBF核函數SVM模型的總體識別效果相對最好;線性可分對暢通狀態識別效果相對最好;多項式核函數對穩定狀態識別效果相對最好;sigmoid核函數的總體識別效果相對最穩定。②從4種狀態的正確率上看,暢通狀態線性可分的分類識別正確率(98%)明顯高于其他分類器;穩定狀態多項式核函數、RBF核函數SVM分類器的分類識別正確率(93%,91%)高于另外兩種SVM分類器;擁擠狀態RBF核函數、sigmoid核函數SVM分類器的分類識別正確率(94%,92%)高于另外兩種SVM分類器;堵塞狀態RBF核函數SVM分類器的分類識別正確率(96%)高于另外3種SVM分類器。③從4種SVM分類器的正確率上看,線性可分核函數可以較好地識別暢通狀態,其識別正確率為98%;多項式核函數對穩定狀態的識別效果最好,正確率高達93%;RBF核函數對4種狀態的整體識別效果最好,正確率分別為85%,91%,94%,96%,說明行人交通參數在RBF核函數轉化的高維空間具備良好的線性可分;sigmoid核函數對4種狀態識別效果穩定,正確率在85%~92%,對擁擠狀態的識別正確率最高為92%。
1)選取行人平均步行速度、行人平均密度以及行人平均流量反映行人步行狀態,并根據該指標以及結合FCM算法將通道處行人擁擠度劃分為暢通、穩定、擁擠和阻塞4種狀態,不僅反映了行人流中的重要參數,同時可以作為行人交通狀態有效識別的特征參數。
2)通過對比不同SVM分類器的分類識別效果,證明所設計的算法具有良好的識別性能,RBF核函數SVM模型的總體識別效果相比最好,正確率均在85%以上,說明行人交通參數該核函數轉化的高維空間具備良好的線性可分;線性可分對暢通狀態識別效果相對最好,正確率為98%;多項式核函數對穩定狀態識別效果相對最好正確率為93%;sigmoid核函數的總體識別效果相比最穩定,正確率均在85%~92%。
3)筆者研究成果為城市軌道交通系統建立行人擁堵預警、應急處置和信息發布等應急運行機制提供了科學方法和數據支撐。
[1] LI Yifan,CHEN Junmin,JI Jie,et al. Analysis of crowded degree of emergency evacuation at “bottleneck” position in subway station based on stairway level of service[J].ProcediaEngineering,2011,11: 242-251.
[2] WAN Jiahui,SUI Jie,YU Hua. Research on evacuation in the subway station in China based on the combined social force model[J].PhysicaA:StatisticalMechanicsandItsApplications,2014,394: 33-46.
[3] 劉小明,胡紅.應急交通疏散研究現狀與展望[J].交通運輸工程學報,2008,8(3):108-115. LIU Xiaoming,HU Hong. Research status and prospect of emergency transportation evacuation[J].JournalofTrafficandTransportationEngineering,2008,8(3): 108-115.
[4] XU Xinyue,LIU Jun,LI Haiying,et al. Analysis of subway station capacity with the use of queueing theory[J].TransportationResearchPartC:EmergingTechnologies,2014,38: 28-43.
[5] CHENG Huan,YANG Xiaohuan. Emergency evacuation capacity of subway stations[C]// 8thInternational Conference on Traffic and Transportation Studies(ICTTS),Changsha,China,2012. London: Elsevier,2012: 339-348.
[6] NAI Wei,DONG Decun,CHEN Shuai,et al. Optimizing the usage of walking facilities between platform and concourse layer in L-shaped interchange metro station[J].Procedia-SocialandBehavioralSciences,2012,43: 748-757.
[7] SHAH J,JOSHI G J,PARIDA P. Behavioral characteristics of pedestrian flow on stairway at railway station[J].Procedia-SocialandBehavioralSciences,2013,104: 688-697.
[8] 劉妍.短時路段行程時間分布預測方法研究[J].重慶交通大學學報(自然科學版),2015,34(2): 108-111. LIU Yan. Prediction research on travel-time distribution of short-term path[J].JournalofChongqingJiaotongUniversity(NaturalScience),2015,34(2): 108-111.
[9] 黃艷國,許倫輝,鄺先驗. 基于模糊 C 均值聚類的城市道路交通狀態判別[J]. 重慶交通大學學報(自然科學版),2015,34(2): 102-107. HUANG Yanguo,XU Lunhui,KUANG Xianyan. Urban road traffic state identification based on fuzzy C-mean clustering[J].JournalofChongqingJiaotongUniversity(NaturalScience),2015,34(2): 102-107.
[10] WANG Jin,SHI Qixin. Short-term traffic speed forecasting hybrid model based on chaos-wavelet analysis-support vector machine theory[J].TransportationResearchPartC:EmergingTechnologies,2013,27: 219-232.
[11] MIYAMOTO S,ICHIHASHI H,HONDA K.AlgorithmsforFuzzyClustering:MethodsinC-MeansClusteringwithApplications[M]. Berlin: Springer,2008.
[12] SHAH J,JOSHI G J,PARIDA P. Behavioral characteristics of pedestrian flow on stairway at railway station[J].Procedia-SocialandBehavioralSciences,2013,104: 688-697.
[13] 武小康,周利鋒. 行人仿真在輕軌車站應急疏散領域的應用[J]. 重慶交通大學學報(自然科學版),2012,31(4): 772-776. WU Xiaokang,ZHOU Lifeng. Application of pedestrian simulation software on the emergency evacuation at light rail station[J].JournalofChongqingJiaotongUniversity(NaturalScience),2012,31(4): 772-776.
[14] KANZAWA Y,ENDO Y,MIYAMOTO S. Indefinite kernel fuzzy c-means clustering algorithms[M]//ModelingDecisionsforArtificialIntelligence. Berlin: Springer,2010: 116-128.
[15] COLETTA L F S,VENDRAMIN L,HRUSCHKA E R,et al. Collaborative fuzzy clustering algorithms: some refinements and design guidelines[J].IEEETransactionsonFuzzySystems,2012,20(3): 444-462.
[16] MIYAMOTO S,ICHIHASHI H,HONDA K.AlgorithmsforFuzzyClustering:MethodsinC-MeansClusteringwithApplications[M]. Berlin: Springer,2008.
[17] ESTE A,GRINGOLI F,SALGARELLI L. Support vector machines for TCP traffic classification[J].ComputerNetworks,2009,53(14): 2476-2490.
[18] RUSH T,PRZYBYLA J,MELCHER D,et al.VideoAnalysisandAnalyticalModelingofActualVehicle/PedestrianCollisions[R].[S.l.]:SAE Technical Paper,2014.
[19] CORREIA A R,WIRASINGHE S C,DE BARROS A G. Overall level of service measures for airport passenger terminals[J].TransportationResearchPartA:PolicyandPractice,2008,42(2): 330-346.
Pattern Recognition of Traffic Condition of Urban Rail Transit Pedestrian Passage
CHEN Hong1, WEI Lingxiang2, LI Gaofeng1, CAI Zhili3, SHAO Haipeng1
(1. School of Highway, Chang’an University, Xi’an 710064, Shaanxi, P.R.China;2.School of Material Engineering, Yancheng Institute of Technology, Yancheng 224051, Jiangsu, P.R.China; 3. School of Traffic & Logistics Engineering, Shandong Jiaotong University, Ji’nan 250023, Shandong, P.R.China)
A method based on support vector machine (SVM) was proposed, which used the pedestrian’s traffic flow parameters to realize the pattern recognition of traffic condition of urban rail transit pedestrian passage. Clustering analysis and definition of four kinds of pedestrian traffic status was realized by FCM algorithm, and multiple SVM traffic status identification model was established. Linear and nonlinear SVM classifiers were adopted respectively, and polynomial kernel function, radically Gaussian kernel function and sigmoid kernel function were also adopted in the pattern recognition of pedestrian passage traffic condition. Furthermore, the comparison analysis on the effectiveness was carried out through the actually collected data collection. The results indicate that the proposed algorithm has good recognition performance. With the comparison of overall recognition performance, RBF kernel function SVM model is the best one and its correct rate is over 85%, which indicates that the pedestrian traffic parameters are well linearly separable in the high-dimensional space of the kernel function conversion. Linear separability has relatively best performance in smooth state recognition, and the correct rate is 98%. Polynomial kernel function has relatively best performance in steady state recognition, and the correct rate is 93%. With the comparison of overall recognition performance, sigmoid kernel function is relatively most stable one, and the correct rate ranges from 85% to 92%.
traffic and transportation engineering; rail transit; pattern recognition; support vector machine (SVM)
10.3969/j.issn.1674-0696.2016.03.28
2015-03-18;
2015-04-13
國家自然科學基金項目(50808021);陜西省交通運輸廳科技項目(10-07R)
陳 紅(1963—),女,湖南湘潭人,教授,博士,主要從事交通運輸規劃與管理方面的研究。E-mail:hongchen82@126.com。
韋凌翔(1991—),男,山東曲阜人,碩士,主要從事交通數據挖掘與建模分析方面的研究。E-mail:sdjtwlx@126.com。
U491
A
1674-0696(2016)03-134-07