谷鳳瑞
1 發展背景
大數據是以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合,正快速發展為對數量巨大、來源分散、格式多樣的數據進行采集、存儲和關聯分析,從中發現新知識、創造新價值、提升新能力的新一代信息技術和服務業態。
《華爾街日報》將大數據時代、智能化生產和無線網絡革命稱為引領未來繁榮的三大技術變革。2011年以來,各國紛紛將“大數據”的開發利用作為奪取新一輪競爭制高點的重要抓手。國務院于2015年8月發文《國務院關于印發促進大數據發展行動綱要的通知》(國發〔2015〕50號),標志著大數據發展已上升為國家意志。
交通行業是天然的大數據行業。交通的規劃、管理、決策等各方面都要以大量交通數據的分析和預測為支撐。而今,隨著全國智能城市、感知公路等信息化建設的推進,以物聯網為方向的信息采集技術逐漸普及,3G/4G網絡傳輸技術迅猛發展,交通海量數據正在通過不同的途徑成級數增長。這為交通大數據的發展提供了條件。
2 交通大數據的構成
如今,隨著信息采集、信息傳輸技術的發展普及,交通數據的類型、數量正在飛速增長。但這些數據往往各成系統,各自孤立,還未能得到有效的整合和充分利用。對這些數據進行梳理,按照數據所有者類型進行分類,主要分布在以下方面:
2.1 鐵路系統
鐵路售票系統數據。
2.2 公路系統
道路收費系統、道路流量檢測系統、電子監控系統、車牌識別系統、路上稱重系統、信息服務平臺數據等。
2.3 城市交通管理系統
道路監控數據、出租車調度系統、公交運營系統、地鐵售票檢票系統、停車管理系統、公共自行車運營系統、公交一卡通統計數據、長途客運售票系統數據。
2.4 規劃部門
城市居民出行調查數據(抽樣調查數據)、歷年城市交通年報等。
2.5 公安交警系統
天網工程治安卡口數據、交警電子眼數據、交通事故統計數據等。
2.6 移動運營商
手機指令數據。
2.7 互聯網數據
網購物流數據、大眾點評網等網絡數據。
2.8 企業
專車運營數據、滴滴打車數據、車輛導航信息、郵政包裹數據、快遞包裹數據、港口碼頭集疏運數據等。
3 交通大數據的應用情況
目前,交通大數據的發展氛圍已經形成,無論是政府部門,還是企業單位,都認識到了其發展必然性和巨大價值潛力。但從全國來看,交通大數據的應用尚處于探索、小范圍嘗試階段,研究應用所采用的數據較為單一。例如,交警部門利用系統內部數據對事故易發點進行分析和治理;交通研究機構采用利用手機指令數據提供的個體活動鏈特征,將其與居民出行調查數據庫等傳統數據相結合,建立模型,從而提高模型的校驗、預測精度及動態特征;土地評估咨詢單位基于大眾點評網等網絡數據,對火車站周邊商圈貨物的OD進行分析,從而對火車站周邊度用地進行評估等等。可見,規模化的大數據應用態勢尚未形成,交通大數據發展發展潛力巨大(圖1)。
4 大數據發展面臨的挑戰
交通大數據時代來臨,對傳統的交通數據管理方式提出了巨大挑戰,體現在數據存儲、數據的開工共享、數據分析挖掘以及大數據的應用轉化等多個方面。
4.1 數據的儲存
現代交通大數據的儲存面臨難題,主要在于兩個方面:一是,數據規模龐大,且以分秒的速度成級數增長;二是,數據類型多,不僅包含非結構化的數據,還包含語音、視頻等數據類型。另外,由于歷史數據極具價值,通常需要長時間保存,大規模、多類型數據的長期儲存給交通大數據的發展提出了前所未有的挑戰。
4.2 數據的共享
交通大數據的基礎數據分散在多個政府部門、咨詢單位,不面向公眾公開,且彼此孤立,難以實現共享,給交通大數據的發展造成了很大阻力。且不提交通部門、交警部門、規劃部門等跨部門的數據共享,單單從交通部門內部來看,數據的共享利用也困難重重。以江蘇省為例,高速公路收費數據、流量觀測數據多年來由省交通廳委直接托蘇交科進行保存、分析和統計;全省普通國省干線的流量觀測數據由省廳公路局委托江蘇緯信公司進行分析統計;各地市地方公路流量觀測數據多由公路處下屬養護部門進行搜集;全省公路OD調查數據由省廳公路局分別于2003年、2007年委托江蘇緯信公司進行調查和統計分析;近幾年不少地市也單獨進行過本地區范圍內的OD調查……這些數據沒有得到公開共享,其他咨詢單位要進行交通分析和需求預測,搜集基礎數據時困難重重。
4.3 數據的分析、挖掘
數據的分挖掘面臨的挑戰,主要在于兩個方面:一是,對有效數據的篩選。面對如此龐大的基礎數據,如何根據實際需要,篩選有效數據是進行數據分析的第一步。例如,分析機動車對外出行OD,可選用“RFID+治安卡口+高速公路收費站數據+往年公路OD調查數據”;分析城市居民的活動分布,可選用“手機移動信令數據+公交IC卡+地鐵AFC數據+車輛GPS數據”;分析城市路網擁堵狀況,可選用“出租車GPS數據+公安320治安卡口數據”等等。二是,對數據分析模型的建立。在數據篩選的基礎上,根據不同需要,創建不同的模型,實現對有效數據的深入分析,挖掘數據價值。例如,建立更完善的交通需求預測模型、路網容量分析模型、路網運行時空特征分析模型等。有些模型的建立不僅需要交通方面的人才,還需要計算機編程、模型算法研究、GIS等多專業的人才共同努力才能實現。三是,對有效數據的快速處理實時分析。海量的實時數據使得大數據與傳統數據相比具有突出的實時性優勢。大數據“4V”特征之Velocity,就是指大數據處理速度快,要求實時處理而非傳統的處理方式。如何對海量實時數據進行實時動態的計算、分析,也是未來面臨的挑戰之一。
4.4 數據的應用
大數據的應用需面向不同群體,涵蓋交通管理部門、交通規劃部門、數據中心、咨詢研究機構、普通出行者等等多種使用主體。如何實現針對不同用戶主體,開發個性化的應用系統,也是未來發展需要關注的問題。
5 發展建議
5.1 頂層設計
交通大數據分散于多個部分、咨詢研究單位、企業,數據相互孤立,難以發揮大數據整體優勢。因此,需要國家層面、省級層面、市級層面分別進行頂層設計,統籌規劃、合理安排,并制定詳細的行動計劃,從而避免重復建設、各行其是、互不兼容,推動交通大數據抱團發展。
5.2 數據的開放共享
數據的開放共享需要政府的推動,逐步實施。建議先嘗試在各系統內部實現數據共享,例如,在城市交通系統內部,從城市運輸系統、城市道路系統、城市交通管理系統三個維度,實現交警、交委、建委、規劃的相關數據共享,共享者之間,以協議的形式明確數據格式、數據安全、數據使用等細節。在此上,在逐步實現跨部門共享,最終實現面向全社會的共享。
5.3 新技術的引進
交通大數據時代來臨,對于大數據的采集、儲存、分析挖掘和應用等各方面都提出了新的要求,需要積極探索引進新技術、新方法,例如,云數據平臺的建立、實時算法的改進、交通數據可視化技術的研究等等,并要加強從基礎研究到實際應用的轉化研究,充分挖掘交通大數據的應用價值,從而推動大數據健康快速發展。
5.4 人才結構的完善
交通大數據作為一個綜合性強、涉及面廣、技術要求高的新領域,需要更完整、更專業的人才結構。不僅需要交通規劃及模型研究方面的人才,還需要信息體系構建、數據分析、通信技術研究等專業的人才。
6 結語
交通大數據發展的必然性和蘊藏的巨大價值已經得到業內的共識,但是其規模化發展仍然面臨諸多挑戰。本文對交通大數據涉及的范圍進行了詳細梳理,對大數據發展面臨的挑戰進行深入分析,并針對這些挑戰提出了切實可行的建議。
【參考文獻】
[1]葉亮.“大數據”背景下我國交通數據管理應用的轉型與發展[J].交通與運輸,2013.12:65-67.
[2]馬英杰.交通大數據的發展現狀及思路[J].道路交通與安全,2014.8,第14卷第4期:55-59.
[3]錢喆.廣州交通大數據實踐與思考[R/D].2015.10,會議論文.
[4]楊濤,程曉明,等.交通大數據的辯證法——交通大數據發展的制度建設和未來方向[R/D].2015.10,會議論文.
[5]溫慧敏.北京交通大數據應用與展望[R/D].2015.10,會議論文.
[責任編輯:王楠]