摘要:獲取公交客流信息是公交運行工作中的基礎,不僅為公交的日常調節提供了可靠的依據,也為公交的線路網優化提供了一定的參考。公交管理部門應當深入了解居民乘坐公交車出行的交通特點,及時準確的掌握出行數據,才能正確的對公交的運營線路和運營規劃做出正確的調整。因此,合理的公交IC卡的數據分析處理方法,是建立高效的城市交通系統的一條重要途徑。那么面對這些海量的公交數據,如何進行有效的處理和分析正是本文研究的目的。
關鍵詞:公交;IC數據;分析處理
隨著信息技術的飛速發展,智能交通系統在解決交通問題中顯示著它越來越重要的地位,公交系統也漸漸開始向信息化的方向發展,IC卡、GPS定位技術的提出正是信息化發展的基礎。將IC卡與GPS結合起來,通過對公交數據的分析和處理合理運用城市道路等固有配置,為公交日常調度提供切實有效的依據,并以此為基礎運用先進的管理手段和技術,來保證城市交通系統的高效運行。
一、公交IC卡概述
公交IC卡已經在我國越來越多的城市被應用,已經成為公交收費的一種大勢,這種方式不僅僅給乘客的付款方式提供了新的選擇,也為公交數據調查提供了一種先進的調查手段,通過IC卡我們可以獲得居民的IC卡號、刷卡路線、上車地點和乘客的上下車時間等,也可以得到乘客的基本出行信息。對這些基礎數據進行分析和處理就可以得到該路線的基本客流量信息。IC卡統計出行數據具有高效、便捷、快速、低成本的特點。根據IC卡提供的信息可以跟蹤了解乘客的出行習慣,但他的缺點是對使用現金的乘客無法統計。它的系統組成一般包括以下幾個部分:IC卡、車載收費機、數據采集機、數據采集站、客運分公司、IC卡管理中心、IC卡充值點。
二、公交IC卡數據倉庫建立及數據分析
2.1建設數據基礎倉庫
構建公交IC卡數據倉庫之前,首先要確定信息體系構成,根據公交IC卡數據分析目標和數據分析過程,可以建立IC卡的數據分析系統,IC卡數據分析系統分為以下四個過程:數據采集、數據預處理、數據分析、數據解釋。它又由三個數據模塊構成,數據倉庫模塊、數據分析模塊、分析結果顯示模塊。三個模塊各自承擔自數據采集、分析和處理職能,從而構成了完整的公交IC卡數據分析系統。數據倉庫模塊執行數據采集和數據的預處理職能,用于結合通過各個數據源獲得的城市公交數據,并對數據進行降噪,轉化和整合,處理過后的數據按主題儲存到不同的表中,數據分析模塊是通過計算機來完成庫中的數據進行自動分析,分析結果顯示模塊可根據用戶指定的運算規則和算法模型,給出報表或其他形式顯示數據分析的結果,從而幫助運營者做出對城市公交運營的決策。
2.2數據倉庫及數據分析工具選擇
建立數據分析倉庫的目的是對城市公交進行分析處理和決策支持,因此選擇數據分析倉庫也可是說是選擇數據分析的工具,以便于后期數據分析。不同的數據分析工具有不同的優缺點,因此選擇數據分析工具時應當趨合高效的理念。公交IC卡數據分析需要運用到多種數據來源,因此我們應當選擇支持不同數據分析的數據平臺倉庫。大數據處理能力,公交IC卡的信息數據倉庫數量相當大,分析工具必須具備大數據的處理能力,要求數據分析工具一定要有較快的數據處理速度,數據處理能力要和數據處理速度相等。分析工具的用戶界面要快捷,讓用戶可自己選擇算法,連接數據,開始任務,降低人為錯誤發生率,處理結果要具備可視化,能通過報表和圖表等方式直面的呈現給用戶。
2.3公交數據預處理
構建一個數據倉庫,最基礎的就是要有充足的數據來源,不僅僅只是傳統的數據倉庫,也可以是非結構化的信息,如文本文件,也可以從網絡上獲得資源,要保證能得出對決策者有用的信息就要保證外部數據的完整性、質量性。數據預處理是從海量的基礎數據中提出有價值的信息或是清理一些雜亂的無效信息,從而避免被錯誤信息誤導,改善數據質量和數據分析的速度。
三、基于公交IC卡數據采集改進
3.1基于系統聚類法的乘客上車點判斷
系統聚類法是最常見的聚類分析方法,但也是最有效的聚類分析方法。它將需要類聚的n個樣本各自看成一個整體,按照事先設定好的計算方法計各個樣本之間的聚類指數,根據指數的大小將分析各個樣本之間的密切指數,將關系最密切的兩類并成一類,其余樣本不變,在按上述方法重新進行計算和歸類,循環進行下去,直到最后n個變量都歸為一類。通過這種方法可以通過最短距離法對IC卡數據進行聚類和分組,得到樣本數據,然后進行各站到各站的到站時間預測,將聚類分組中每組第一個樣本刷卡時間與推算的時間進行比較,確定各組乘客的上車站點。具體流程如下:公交站IC刷卡信息——最短距離類聚分析——聚類分類——分組中第一個樣本的刷卡時間——與人工預測時間相比——得到乘客上車地點。
3.2單個乘客刷卡數據的下車點判斷
雖然因為公交單一的運行線路,以及下車不用刷卡等因素,無法對乘客的下車地點進行判斷,但是居民的每日出行都具有一定的規律性。我們可以通過長期的歸納集合和短期乘客下車點的規律性,來進行乘客下車點的判斷。例如拿工作來說:居民由居住地刷卡上車到達工作地上下車,完成第一次出行,工作結束后,該居民從工作地上車回到居住地,完成第二次出行,由此第二次出行的終點就可以認為是第一次出行的終點下車點。總而言之,在相當一段時間內乘客的乘車路線是保持不變的有一定的規律性,應當利用乘客多日的出行數據來進行分析從而判斷乘客的下車地點。
四、結語
綜上所述,通過對公交IC流量卡的數據分析得知,目前我國對于公交數據挖掘技術和公交數據庫的建設還不夠成熟。公交IC是城市交通運營中的重要一環,只有做好這一環的工作,完善公交系統的信息化程度,才能有效幫助公交系統運營者做出正確的決斷。交通信息智能化的發展,可得到的城市交通信息和基礎數據將更加豐富,根據海量的信息我們應當不斷研究新的算法,從而得到更多,準確反映城市交通情況的信息,幫助完善城市交通線路規劃。
參考文獻:
[1]陳孟柯.基于公交IC卡數據的公共交通客流分析——以南京為例[J].科技視界,2016(22):157-158.
[2]宋竹,秦志光,徐進,吳斗.基于公交IC卡數據的大規模OD矩陣推導算法研究[J].計算機應用研究,2016,33(07):2007-2013.
[3]馬曉磊,劉從從,劉劍鋒,陳鋒,于海洋.基于公交IC卡數據的上車站點推算研究[J].交通運輸系統工程與信息,2015,15(04):78-84.
[4]陳君,楊東援.基于智能調度數據的公交IC卡乘客上車站點判斷方法[J].交通運輸系統工程與信息,2013,13(01):76-80.
作者簡介:劉姣姣,出生年月:19890515,性別:女,民族:漢,籍貫(精確到市):天津市,當前職務:工程師,當前職稱:助理工程師,學歷:本科,研究方向:智能卡.