王錦玉 王齊榮





【摘 要】?目前我國鐵路客運車站通過靜態的方法設計車站內各種設施的規模和布局來實現車站總體服務能力的最大化,車站運營管理部門缺少能夠動態評估車站設施服務能力與客流不確定需求之間匹配程度的手段。文章基于深度學習理論,提出了一種車站設施服務能力與客流不確定需求適應性評估的視頻圖像檢測方法,通過視頻圖像檢測出車站重要設施范圍內乘客排隊的人數,結合制定的適應性分級標準對車站設施服務能力與客流需求進行適應性評估。實驗結果表明,所提出的方法檢測速度快,能夠滿足實際應用中實時性的要求,而且對人群目標檢測的平均準確率為81.25 %。其檢測結果可以輔助管理者評估車站設施在動態客流需求下的運營情況。
【關鍵詞】車站; 深度學習; 人群目標檢測; 適應性評估
近年來,我國鐵路旅客出行人數與日俱增,特別是客流高峰期,車站面臨重要設施服務能力與客流需求嚴重不匹配的情況,運營管理部門也缺少能夠準確把握客流需求的技術手段。利用城市軌道交通自動售檢票系統[1]和手機信令數據[2]進行客流監測是近些年主要的研究方向,但是檢票閘機只能檢測進出站乘客的出行信息和數量,時效性不高,手機信令數據無法采集車站內局部區域擁堵點的數據[3]。隨著智能視頻監控系統和計算機視覺技術的發展,基于視頻圖像的行人檢測技術廣泛應用于公共場所,也為公共交通領域的客流檢測提供了借鑒。
國外的圖像研究較早,已經形成了大量成熟的技術,ObjectVideo、Visio Wave、Citi Log等軟件都能夠實現對視頻的智能分析和圖像識別。Object Video軟件能夠對視頻中行人的人數進行識別,準確率已經能達到80 %~90 %[4]。目前廣泛應用的方法有背景差分法、光流場法、幀間差分法[5-8]等。近些年,國內學者研究人群目標檢測技術實現對城市軌道交通客流的實時檢測,采用深度卷積神經網絡(Convolution Neural Network ,CNN)大幅度的提高了客流檢測的準確率,具有較高的研究價值和廣闊的應用前景[9-11]。這些相關研究表明,深度學習在軌道交通客流檢測的性能和準確度方面表現都較為出色,而YOLO v3 又是目前速度和精度都很高的一個網絡模型,在CPU計算下可以獲得45 幀/s圖片處理的效率,完全可以應用于視頻圖像的檢測任務[12]。因此本文提出了一種基于YOLOv3算法檢測車站設施服務能力與客流需求適應性評估的方法,該方法能夠輔助管理者評估車站設施在動態客流需求下的運營情況。
1 適應性評估檢測流程
本文提出的客流需求與設施服務能力適應性評估的視頻檢測算法流程如圖1所示。該算法的完整流程分為三個模塊:預處理模塊、核心檢測模塊以及輸出模塊。
1.1 預處理模塊
對輸入的視頻圖像進行預處理工作,可以使檢測網絡更好地完成學習任務。
1.1.1 視頻圖像處理。
本文中視頻圖像檢測的輸入數據為車站的監控視頻,抽取視頻中的圖片,通過抽取的部分視頻畫面完成檢測任務。
1.1.2 檢測區域選擇。
根據運營管理的需求,利用視頻監控來掌握乘客的數量和空間分布,本文將車站范圍內的重點設施:進出站口、安檢處、自動扶梯、檢票口作為重點監控區域,事先圈定視頻畫面中的檢測區域,可以提高檢測的效率[13]。
1.2 核心檢測模塊
1.2.1 YOLO v3模型框架
YOLO v3網絡結構包括Darknet-53和YOLO層,Darknet-53的作用是特征提取,YOLO的作用是多尺度預測。Darknet-53直接舍棄池化操作,大大降低了池化帶來的梯度負面效果,用卷積層中的步長來實現降采樣,作為YOLO v3的特征提取網絡具有魯棒性更好的優點。YOLOv3的檢測網絡引入多尺度預測的概念,即將檢測層數量由原來的1層增加到3層,3層對應 13×13,26×26及52×52三個不同尺度的特征圖,作者用K-means聚類出錨框的尺寸,并將錨框個數由5個提高到9個,按錨框尺寸大小分到三個檢測層級,YOLOv3多尺度檢測的方法很好的融合了上下文特征信息,可以應用于不同尺度目標的模型預測。YOLO v3犧牲了網絡速度但是提升了準確度并且提高了網絡結構的深度。YOLO在GPU中速度達到了45fps,也就是說每秒能夠檢測45張圖片,檢測速度比Fast-R-CNN快了300倍,完全能夠達到實時檢測的目的,而且在實時檢測中,也比其他實時檢測算法的精度都要高[14]。YOLO v3的網絡框架如圖2所示。
1.3 輸出模塊
本文所研究的視頻檢測模型的重要輸出內容之一就是車站重要設施范圍內乘客的實時數量,但是僅僅獲取到實時的乘客數量對運營指導意義不大。所以在得到乘客數量的基礎上,本文希望通過設置合理的人數閾值對車站設施的服務能力適應性做出評估。決定車站設施服務能力與客流需求適應性的三個主要因素:車站設施服務能力,應急資源配置以及客流組織策略。在現實場景下,將得到的客流需求與車站設施服務能力適應性評估與運營組織工作結合起來,意義重大。本文的輸出模塊將適應性劃分為三個等級,依次是良好,差,極差。適應性評估的分級以乘客在車站設施范圍內排隊的數量與其通行能力之間的匹配程度為標準。具體的分級方法本文將在第二部分重點介紹。
2 適應性評估分級
車站設施服務能力不足的主要表現為客流的擁堵和排隊現象,但是擁堵和排隊不代表車站設施的服務能力不足,在客流高峰期影響不大的擁堵排隊現象是合理的[15]。因此選擇一種直觀、易于獲取和理解的識別指標來評估車站設施服務能力與客流需求適應性非常重要。目前常用的識別指標主要有兩類,第一類是基于系統仿真[16]的行人宏觀交通流參數,包括客流平均移動速度、客流密度、客流量;第二類是基于排隊理論[17]的排隊理論性能指標包括平均排隊時間和平均排隊長度。行人宏觀交通流參數可以直接用視頻監控圖像處理技術獲取,但是將其作為識別指標忽略了乘客的感知,而且不夠直觀。將排隊長度作為識別指標不僅在視頻監控中更加直觀,而且可以結合客流的時空分布特征,反映出車站各類設施擁堵的嚴重程度。因此本文采用排隊長度即排隊人數作為識別指標。
由于乘客出行特征多樣,所以本文并沒有采用《地鐵設計規范》中各種設施的最大通行能力。通過對成都東站,武漢站客流高峰時段的現場調查發現,大型鐵路客運車站內乘客攜帶的行李較多,影響了車站設施的通行能力。所以本文采用現場調研的形式獲取客流高峰期各類服務設施的實際最大通行能力和乘客感受更加直觀的最大,最小排隊容忍時間等數據。而乘客所能容忍的最大,最小排隊人數為實際通行能力與最大,最小排隊容忍時間的乘積。現場調研獲取的數據如表1所示。
分析現場調研的數據發現,面對不同設施的乘客最小、最大容忍時間差別較大,分析原因在于進站口作為領近車次所有乘客進入車站的通行設備,排隊擁堵現象更普遍,所以乘客忍耐程度較高,而自動扶梯處由于旁邊有樓梯的存在,當排隊人數較多時,未攜帶行李或攜帶較少行李的乘客會選擇走樓梯,因此乘客的容忍程度較低。通過分析調研數據,本文建立的客流需求與車站設施服務能力適應性評估的等級劃分如表2所示。
3 案例分析
3.1 網絡模型訓練
為了提高訓練的效果,本文使用的數據集應該滿足:①數據集為密集的頭部目標;②目標框標注類型。SCUT-HEAD作為一個規模特別大的頭部檢測數據集,包含4 405張圖片,共計包含111 251個頭部目標,平均每張圖片含有25.3個頭部目標,部分圖片超過100個頭部目標,因此本文選擇SCUT-HEAD數據集作為實驗數據集。參照YOLO v3原作者主干網絡配置文件和訓練權重文件,將神經網絡訓練類別改為單一類別,類別名稱改為person,并且在編程中添加了一個計數器用于統計人數。本文使用SCUT-HEAD數據集訓練了YOLOv3網絡。在它的訓練階段,使用了動量項為0.9的異步隨機梯度下降。權重衰減設置為0.000 5,最大的迭代次數設置是100 000,學習速率初始值設置為0.000 1,50 000次迭代后改成0.001,訓練到70 000次后改成0.000 1,迭代到90 000次后改成0.000 01。
本實驗的軟硬件平臺:CPU:Intel(R) Core(TM) i7-7700 CPU @ 3.20GHz * 12;GPU為:NVIDIA GeForce GTX 1080Ti;
操作系統:ubuntu 16.04LTS;深度學習框架為:darknet。
3.2 實驗結果分析
通過大量的實驗,YOLOv3算法在人群目標數據集SCUT-HEAD上成功訓練,得到人群目標檢測模型后進行訓練實驗,將三次實驗的平均值作為最終實驗檢測結果(表3)。
表中AP表示人群目標檢測精確率,81.25 %的精確率表明了YOLOv3具有良好的檢測效果。FPS表示每秒檢測的速度,在本文實驗軟硬件平臺下每秒可以檢測43張人群目標圖片。整個網絡模型從開始訓練到模型收斂大約用時7 h 36 min。
3.3 案例
本文將采集到的150張車站安檢處乘客排隊圖像處理作為YOLO v3模型的輸入向量,對客流需求和安檢設備服務能力的適應性進行評估,從準確率和速度兩方面來分析識別結果,每副圖像的平均檢測時間為0.023 s,而平均誤檢為19.75 %,可以實現對車站設施服務能力與客流需求進行適應性評估實時檢測。并以圖3、圖4作為實際場景下檢測的效果展示。
通過檢測,圖3中安檢處前乘客排隊人數為13人,小于分級閾值18人,所以識別適應狀態為良好,圖4中安檢處前乘客排隊人數為33人,大于閾值30人,所以識別適應狀態為極差。當識別出安檢處前排隊乘客人數大于最大閾值30人時,建議運營者再開一條安檢通道,或者是增加經驗豐富的工作人員,加快乘客安檢速度。
4 結論
鐵路客運車站已經進入網絡化運營階段,為了提高車站設施服務水平,本文提出了一種基于視頻圖像檢測客流需求與車站設施服務能力適應性評估的方法。并且對多個實際場景圖像進行案例分析,實驗結果表明該方法能夠較好的檢測出車站重點設施范圍內的乘客數量,結合分級規則,可以為運營管理者提供可靠的排隊乘客數量和適應性評估。
參考文獻
[1] 李臣,汪波,白云云,等.基于AFC數據的城市軌道交通突發事件客流影響分析[J].鐵道科學與工程學報,2019,16(10):2620-2627.
[2] 丁敬安,張欣海.基于手機信令數據的地鐵乘客路徑識別研究[J].中國電子科學研究院學報,2019,14(11):1194-1201.
[3] 王嬋嬋,張琦.上海城市軌道交通日常大客流檢測及預警需求研究[J].城市軌道交通研究,2018,21(10):11-15.
[4] 夏令.鐵路客運樞紐客流人數自動識別系統研究與實現[D].北京:北京交通大學,2011.
[5] Shao L, YangZ, ZhangW. The Application of Intelligent Device and Method for Detecting Dynamic and Static Human Body in Energy-Saving Control of Schools[J].Procedia Engineering ,2017, 205:4017-4021.
[6] Tong Li, Bo Jiang, Dihua Wu, et al.Tracking multiple target cows'ruminant mouth areas using optical flow andinter-frame difference methods [J].IEEE Access,2019(7):185520-185531
[7] Marcin M, Olszewski P, Nowosielski A, et al. Pedestrian Traffic Distribution Analysis Using Face Recognition Technology[C]. In: Mikulski J. (eds) Activities of Transport Telematics. Berlin, Heidelberg: Springer,2013.
[8] Guo D,Van d V A L,Zhou X.Red blood cell tracking usingoptical flow methods [J].IEEE Journal of Biomedical &Health Informatics, 2014,18(3):991-998
[9] 龐夢圓,杜彥君,厲超吉,等.基于圖像采集技術的地鐵站臺客流引導系統研究[J].都市快軌交通,2017,30(2):37-41.
[10] 彭博,蔣陽升.城市軌道交通車站擁擠踩踏預警技術探討[J].公路交通科技,2016,33(7):108-113.
[11] 何文玉. 基于深度學習的地鐵客流檢測與跟蹤算法研究[D].江西:江西理工大學,2020.
[12] 徐暢,程文軒,楊遠舟.關于Yolo目標檢測算法的基礎研究[J].電腦與信息技術,2020,28(4):45-47.
[13] 陳毓偉. 基于深度學習理論的軌道交通乘客擁擠程度視頻檢測算法研究[D].南京:東南大學,2019.
[14] 盛蕊. 基于視頻圖像的地鐵車站客流安全狀態識別[D].南京:南京理工大學,2018.
[15] 單征. 地鐵車站集散能力瓶頸識別方法研究[D].北京:北京交通大學,2015.
[16] 陳慧,汪波,朱江斌.基于系統動力學的城市軌道交通車站客流控制仿真與優化[J].大連交通大學學報,2020,41(5):1-7.
[17] 單征,宋瑞,李婷婷,等.城市軌道交通車站集散能力瓶頸識別方法研究[J].交通信息與安全,2014,32(1):117-121.
3057501908234