文/田久鵾,天津通卡智能網絡科技股份有限公司
交通一卡通大數據的公交客流分析與預測
文/田久鵾,天津通卡智能網絡科技股份有限公司
近年來,我國交通行業在智能領域的快速發展,已受到世界范圍的關注,交通一卡通作為現階段一種新興的支付工具,其安全性、便捷性以及跨區性等優勢對傳統公共交通組織模式以及支付模式產生了前所未有的沖擊。隨著公交系統的不斷升級與創新,以及智能公交概念的提出為構建智慧城市提供了動力,而城市智能化公交系統的實現需精準預測和把握當前城市公交客流。本文以交通一卡通大數據為基礎,對公交客流的分布特征進行分析,旨在能夠快速準確的預測出線路時段客流。
交通一卡通;大數據;公交客流;分析預測
對于西方較為先進的發達國家而言,公共交通系統的建設在整個城市建設中占據較大比例。大部分西方國家普遍重視公共交通事業的發展,且隨著城市日客運量的增加,公共交通出行比例不斷增加,對公共交通的完善與優化便顯得尤為重要,交通一卡通系統在國外的研究和應用,已相對成熟完善,尤其是在公交客流的分析及預測方面,由初級研究層次逐漸發展到新一輪的模型方法的研究,在新的客流基礎之上,極大的提高了西方國家在公交客流分析與預測方面的精準性以及廣泛性。而縱觀國內在公交客流分析與預測方面的研究,仍舊停留在簡單的客流層面,未能與西方國家一樣,對線路類型、時段、天氣狀況、日期類型、全天內的溫度變化以及風力等一系列不確定因素的影響,在一定程度上使得對公交客流的分析與預測,與實際公交客流存在較大的差異。
2.1 公交IC卡數據
交通一卡通之所以能夠在公共交通中被廣泛運用,主要是由于交通一卡通能夠幫助乘客節省大量的時間,也可在一定程度上降低因現金丟失所帶來的不必要麻煩。根據公交IC卡對當地某一城市中全天的刷卡數據進行記錄,如刷卡時間、刷卡次數、刷卡地點、刷卡線路、刷卡終端ID、發卡地以及交通一卡通類型等數據進行采集,確保所采集數據的準確度,并將整合后的數據信息嚴格按照采集流程進行收錄,便于運營單位的結算工作。具體公交IC卡數據采集流程如圖1所示。

圖1 公交IC卡數據采集流程
2.2 天氣狀況數據
當前階段,城市的整體經濟發展態勢以及城市公共基礎設施的建設水平,不僅是衡量其公共服務水平的重要指標,同時也是對公交客流影響因素的重要研究依據,這種客觀性的影響因素,往往也是公交客流研究中的確定性因素,對整體公交客流的大小變化形成了一定的影響。但是通過不斷的深入研究發現,其中也存在大量不確定因素,影響著公交客流的波動,例如,天氣的變幻莫測、節假日人流量的變化、重大活動的開展、突發性的交通事故以及路段的維修等,均會對公交客流數據的采集產生不同程度的影響。
2.3 公交線路及站點數據
通過對城市公交線路的總體規劃原則的分析得知,能夠得到精準公交路線信息以及公交站點信息的公交線路以及公交站點,可根據該公交線路的具體長度以及公交站點的具體停站總數進行客流量大小的判斷。通過向相關公交管理系統中一些資料數據的調查分析得知,公交線路信息主要有線路號、站點數、起點站名、終點站名、以及中間站名,而公交站點信息有站點位置、站點編號、相鄰兩個站點之間的距離等,可以在公交線路與公交站點的信息中挖掘客流數據。
3.1 公交客流的時間分布特征
交通一卡通工程是一項惠民利民的事業,受到當地廣大群眾的歡迎,且由于政府等相關部門在交通一卡通的推廣與應用方面采取了積極的優惠減免政策,增加了公交一卡通的用戶數量,其中出行次數較多且出行較為固定的人群大多為上班族,因此在時間上也形成了較為規律性的客流分布。從整體客流分布角度出發,就可以將客流量從工作日以及非工作日兩方面進行劃分。工作日的客流量比較有規律,全天之內出現兩次高峰階段,即早高峰(7:00-10:00)與晚高峰(16:00-19:00),兩者在客流量變化上具有較大的差異性,首先早高峰客流大且集中,客流減少較為急劇,而晚高峰在客流量的高低變化上較為緩和,無較大的上下波動。非工作日主要泛指國家法定節假日,如中秋節、國慶節、勞動節以及周末等,每個節日由于休假天數的不同,其產生的客流量變化數據也不盡相同,通過對非工作日的客流量變化分析發現,周末的客流變化有一個明顯的高峰期,主要分布在下午1點——3點之間,而其他重大節假日的客流量變化較為混亂,但總體呈現出一種中間少兩頭大的趨勢。
3.2 公交客流的人群分布特性分析
從現階段公交客流的分布特征來看,不同的客流人群對客流量的變化同樣具有一定的影響。根據卡的類型通常可分為普通卡、學生卡以及老年卡三種類型,其中學生卡與老年卡群體的出行比較有規律,而普通卡則分為工作日與非工作日兩種。學生卡工作日有早、晚兩個出行高峰,非工作日只有晚高峰;老年卡通常只有一個高峰時段,主要集中在9:00-10:00區間,其他時間段的客流分布較為平均,無明顯的高低起伏;普通卡無論是工作日還是非工作日,在客流量的分布上都呈現出兩個高峰時段,通常工作如的高峰時段分布在7:00-8:00,晚高峰分布在17:00-18:00,而非工作日的出行早高峰主要集中在8:00,晚高峰為18:00。
綜上所述,隨著交通卡互聯互通項目在全國范圍內的推廣與普及,多元化的數據來源以及信息數據的不斷變化,交通一卡通大數據便在此背景之下應運而生,并受到廣大學者及各大研究機構的關注。但是我國在現代智能化系統的建設與應用方面尚處于發展階段,其實際應用過程中仍存在諸多矛盾與問題,尤其是在公交客流分析預測方面,缺乏綜合性考慮是其中較為突出的問題之一。因此為進一步提高交通一卡通大數據中公交客流分析與預測的準確度,在未來研究中需對具體公交線路、時間段、溫度變化以及天氣狀況等不確定性因素納入研究范圍之內,進而完善研究結構與研究模式,從根本上保證客流量分析的準確度。
[1]羅強,何利力,王曉菲.數據倉庫中數據清洗技術分析[J].電腦編程技巧與維護,2015(2):161-162.
[2]鄒巍,陸百川,鄧捷等.基于遺傳算法與小波神經網絡的客流預測研究[J].武漢理工大學學報:交通科學與工程版,2014,38(5):1148-1151.
[3]高詠玲,楊浩.城市公交客流影響因素的改進灰色一致關聯分析[J].交通運輸系統工程與信息,2011,7(6):102-108.