候志峰,靳燦章
(天津市市政工程設計研究院,天津市 300392)
在當前信息化的發展背景下,各行業各領域產生的數據激增,對海量數據進行存儲、分析與處理的要求也越來越高。因此,“大數據”理念應運而生,并成為各行各業研究的重點。在道路交通領域,信息技術和互聯網技術的應用和推動使得相關數據呈現幾何級增長,如何充分有效地利用好這些海量數據,成為新時代道路交通行業的巨大挑戰。
大數據(Big Data)尚未有統一和明確的定義。一般而言,其包含兩方面的含義:首先是指海量數據本身;另外,其也指能夠存儲、分析、處理海量數據的新技術。互聯網+、云計算等各種新技術的爆發式發展極大地提升了數據量的積累,數據量級已從傳統的GB、TB級逐步上升至PB、EB級甚至ZB級(其 中 1PB=1024TB,1EB=1024PB,1ZB=1024EB);面對如此海量的數據,傳統的數據儲存、分析和處理技術已難以有效應對。
基于對大數據含義的分析并結合其時代背景,大數據具有四個特點(4V):體量大(Volume)、多樣化(Variety)、變化快(Velocity)、真實性(Veracity)。體量大是大數據最顯著的特點,在道路交通行業,現有的體系本身已經積累了大體量的數據資源,而在信息技術的應用和推動下,數據量進一步提升;體量大奠定了數據多樣化的基礎,數據來源和獲取方式不同,數據類型也不一樣,包括文本類、圖片、音頻、視頻等結構化數據,以及非結構化數據,如何有效處理半結構化和非結構化數據是目前大數據應用的關鍵;變化快是大數據一個很重要的特點,有利用價值的信息數據往往轉瞬即逝,為獲取相關價值數據,一方面要采取有效的技術方案對目標數據進行實時動態的采集,另一方面對存儲設備的存儲能力也提出了很高的要求;大數據的真實性指的是數據的挖掘和處理必須基于采集到的真實數據。
狹義而言,道路數據指的是道路本身從設計、施工建設到運營、檢測、養護全壽命周期內涉及的所有數據,包括勘察設計資料、建設施工過程、運營期間道路狀況、道路檢測結果、養護過程中產生的視頻、圖表、文本文件及其它形式記錄的數據。其中,包括能用已知手段處理的和暫時還有待挖掘的數據,均包含在道路大數據的范圍內。對道路交通數據而言,其數據范圍還包括與道路本身相關的其它數據,包括氣候資料、環境信息、道路使用者駕駛體驗、行駛車輛運行狀況、道路擁堵和事故信息等。可見,道路交通數據體量巨大、來源廣泛、種類繁多,部分數據需要進行實時動態地采集,道路交通數據呈現出明顯的大數據特征。
由于大數據理論起步不久,其在道路交通行業的應用也處于探索階段。目前,工程學者在道路養護、道路施工、交通管理、道路交通安全方向進行了相對較多的研究和應用。
美國的路面長期使用性能研究計劃(LTPP)[1]是世界上影響極為深遠的路面性能研究項目。該計劃在美國建立了一個全國性的公路數據采集系統,以獲取各個試驗段的路面結構、材料特性、氣候環境、交通量等海量數據信息。建立基于大數據的路面性能預測模型,并對其進行全面精準的評價,掌握各種路面性能產生變化的規律和機理,繼而將研究成果應用到路面的養護、維修和管理當中。美國德克薩斯大學運用系統工程和運籌學大數據理論研發了旨在提升高速公路養護管理水平的PMS系統,并逐步發展為網級路面管理系統,有效提升了高速公路養護水平。2014年,日本研究人員開發利用智能手機小程序,并基于重力感應的垂直加速度變化測量評估道路的平整度,繼而提供了快速而便捷的路面檢測和養護新途徑[2]。2016年,東南大學胡晨媛[3]基于LTPP海量數據資源,對瀝青路面車轍進行預測研究。基于大數據管理技術完成了對對象數據的分布式管理,探索出了車轍變化與不同影響因素分布規律,建立了車轍隨時間變化的預測模型,并根據大數據優化算法技術實現了對模型參數的擬合與性能評價,為指導瀝青路面車轍病害的養護提供了有益參考。
施工質量控制是道路質量的重要保證,關系到道路使用者的生命和財產安全,并對后期的道路運營、養護管理產生極大的影響。隨著各類先進技術應用于道路施工過程,道路施工質量控制精細化程度越來越高,并產生了大量數據。長安大學韓立志等[4]研發了瀝青路面碾壓質量過程控制平臺,通過安置于碾壓機的GPS組件、各種監測傳感器監測路面碾壓過程中的時間、溫度、振動加速度等參數,并通過遠程數據傳輸裝置傳輸至服務器,服務器通過既定算法將測量參數轉換為實時參量,用以動態指導現場質量控制,并能實現施工完成后對碾壓過程的質量追溯。
大數據在交通管理領域具有極為廣闊的應用前景,更是當前智能交通建設的重要基礎。當前,世界諸多國家均投入巨資建立服務交通管理的大數據平臺或系統。英國在多個城區建設了超高速網絡系統以推動交通大數據的高度共享,實現不同城市、不同管理部門的高效合作,以減少交通擁堵狀況[5]。美國“智慧駕駛”計劃整合在本國生產的所有車輛的通訊設備和定位系統產生的海量數據,繼而實現全國范圍內路網的數據交換,有效提升交通誘導和管理水平[6]。日本通過在高速公路上設置的諸多交通檢測和監控設備動態掌握交通擁堵、交通事故等狀況[7]。
我國交通大數據管理系統的建設也在有條不紊地推進當中。深圳市經過多年的發展和完善,依托閉路電視監控、違章管理系統、停車誘導等多個系統的協同整合,建立了包括信息采集、動態監控、高效指揮于一體的交通管理指揮中樞,大幅提升了城市交通管理水平,保障了交通系統的安全快速運轉[6]。北京市建立的交通管理指揮系統全天候自動采集全市主要道路的實時交通流量、運行速度等數據,將整合、處理后的交通信息進行動態發布,實現對全市交通狀況的實時誘導和有效控制。
隨著我國道路里程和機動車保有量的高速增長,道路交通事故日益增多。通過對道路交通事故進行統計分析繼而指導交通管理部門采取相應措施,對預防同類事故的發生具有重要意義。過去由于數據采集和處理技術上的不足,傳統的交通事故統計分析手段通常也只是描述性的定性分析,存在事故分析深度不足、事故誘導因子甄別不清等問題,往往導致統計分析結果缺乏針對性,結果不夠實用。將大數據應用于道路交通事故分析中,將能有效提高事故分析準確性和實用性。
日本的交通事故研究分析中心,將大數據采集和處理技術應用于事故統計分析中,基于大數據定量分析交通事故的深層次誘因,并據此建立了交通安全預防和預警體系[8]。美國加利福尼亞州通過整合高速公路多年的事故數據,并采用大數據方法對其進行處理分析,預測未來交通事故狀況,以指導采取相應預防措施[9]。支野等[10]基于深圳市2014-2016年交通事故數據,采用模糊聚類等多種大數據挖掘方法,提出了道路事故數據缺失項填補和事故誘因甄別方法,并量化了交通事故危險度,對輔助交管部門進行事故預防和交通安全管理具有積極意義。
大數據在道路交通領域的應用是大勢所趨,具有重要的社會效益和經濟效益。盡管將大數據應用于道路交通領域取得了一些進展,但依然存在個別突出問題。數據源廣泛,意味著數據擁有權分散,不同階段、不同類型的道路交通數據被不同相關單位掌握,由于職能差異、利益訴求不同、數據管理水平參差不齊,導致一些相關單位不愿意進行數據共享,或者共享數據(通常為紙質版數據)采集的時間、人力成本過高。為應對這些問題,建議道路交通行業管理部門進一步推進各相關單位的數據電子化水平,降低數據采集和處理成本;同時,建立道路交通信息共享平臺,各相關單位將電子化的數據均上傳到共享平臺。另一方面,應當加大對數據人才的引進和培養,并重視各類新技術的融合與應用,繼而充分挖掘利用有價值的數據。