孫偉軍
【摘 要】“十三五”期間,大數據寫入《交通運輸信息化規劃》,得到了有關部門的大力推廣。同時,公路養護行業面對新形勢和新挑戰,需要推進養護轉型和決策科學化,大數據是實現這兩個目標的有力工具。目前,公路養護行業響應國家和部委的號召,對大數據在本行業的應用做了積極探索,但是筆者工作中發現這些嘗試不符合大數據本身的特點。本文闡述部分大數據應用的成功案例和公路養護面對的現狀,通過對成功案例的分析,探討“大數據”這一理念如何與公路養護有機結合。
【關鍵詞】大數據;公路養護管理;預防性養護;全樣本分析
0 引言
隨著大數據進入公眾視野,引起了媒體的熱議,各行業均在探討大數據的應用,部分行業因為先天優勢和行業特點,已經開始嘗試使用大數據。公路養護行業作為一個傳統行業,如何利用大數據這一新興的理念為公路養護事業服務是即將面對的難題。
1 大數據的概念
“Big Data”即大數據,是指海量數據,這里的大是相對概念,不是絕對概念,并沒有明確定義數據量達到某一量級才能稱為大數據,大數據是相對過去隨機抽樣所取得的小樣本而言。通常來講,大數據指數據量大到傳統的分析手段無法應對的復雜數據集合。
2 大數據現階段的應用
大數據的先行者是在前二十年的互聯網浪潮中崛起的互聯網公司,國外的有谷歌、臉書、亞馬遜等,國內的有百度、阿里巴巴、騰訊、京東等,這些互聯網公司能夠比其他行業更早的應用大數據,不是因為他們對新概念新技術更敏感,而是因為互聯網公司擁有更低成本的數據。
互聯網公司普遍的特點是面對公眾免費開放、每天巨大的訪問量、核心業務都在線上完成,互聯網公司普遍擁有以億為單位計算的用戶,這些用戶在互聯網上購物、搜索、發布信息的同時,海量的數據就已經通過高速寬帶網絡進入各大互聯網公司的服務器,而這一過程的成本是由核心業務承擔的,阿里巴巴為了開展網上購物業務搭建了淘寶網、購置了服務器、向網絡運營商購買高速寬帶、還擁有上萬人的工程師團隊,巨額成本已經由淘寶網的營收承擔,海量的數據只是額外驚喜。
信息的流動可以分為四個階段:信息的采集、信息的傳輸、信息的存儲、信息的處理,而互聯網公司前三個階段的成本近乎為零。正是這種巨大的成本優勢才使得互聯網公司成為大數據的先行者。
而在第四個階段——數據處理階段,全世界的互聯網公司也在引入相關人才,構建各自的技術平臺。以亞馬遜為例,利用收集到的用戶數據,使用“商品到商品的協同過濾”算法構建的個性化推薦系統。該系統提供了一種精準有效的定向營銷模式,支撐了亞馬遜三分之一的銷售額。國內方面,以京東為例,內部代號為青龍的物流系統可以做到預測業務量來提升資源調度的效率,通過對海量的交易數據分析,描繪出用戶畫像,實現未買先送的庫存前置,用戶在瀏覽某一類商品時,該商品已經向用戶最近的倉儲中心前置配送,下單時,商品已經到達距離用戶很近的地方。這種模式超越了傳統被動等待的物流模式,打造了配送速度遠超過其他物流公司的京東211、次日達等新的物流理念。
亞馬遜的推薦系統和京東的青龍系統都體現了大數據最核心的應用,那就是預測,通過預測來調度資源和做出合理決策從而創造價值。
需要注意的是,大數據分析不是算命占卜,這里的預測不是我們通常意義的精準預測,而是通過數據的相關性分析對各種可能性的預測。這種誤解導致大數據遭到很多人的批判。
3 公路養護管理面對的現狀
根據國務院頒布的《“十三五”現代綜合交通運輸體系發展規劃》,在“十三五”期間,高速公路網絡覆蓋常住人口20萬以上城市,公路通車里程達到500萬公里,其中高速公路通車里程15萬公里,農村道路硬化率達到99%。至2020年,中國將要基本建成安全、便捷、高效、綠色的現代綜合交通運輸體系,部分地區和領域率先實現交通運輸現代化。
隨著國家行政體制改革、財稅體制改革進一步深化,面對發展新形勢和公眾出行的新需求,公路養護管理還存在一些短板和問題。隨著通路通車里程的急劇增長,養護管理壓力快速上升。根據交通部2016年公布的數據,十三五期間預計公路通車里程增加42萬公里,高速公路通車里程增加3萬公里。2016年度,全國收費公路通行費總收入為4548.5億元。全國收費公路支出總額為8691.7 億元。其中,養護支出476.3億元,收支缺口進一步拉大。公路養護行業面對任務加重和資金緊張的雙重難題。
4 大數據帶給公路養護管理的變革
以往的養護管理決策,所使用的數據都是自身收集自身使用,而且數據采集成本高,也得不到充分的挖掘利用。管理決策嚴重依賴領導干部的個人經驗,沒有科學依據。
公路養護管理面對新形勢和新挑戰,需有推動養護轉型和科學決策。公路養護需要從發生病害后修補的被動模式,轉變為預防性養護的主動模式,從個人經驗指導轉變為數據分析指導。
大數據,就是在新技術的支撐下,從傳統的隨機抽樣變為全樣本分析。數據不再是精確統一,而是紛繁復雜。數據分析也不再追求因果關系,而是相關關系。數據來源由傳統的本行業本部門采集變為各行業各領域的數據開放共享,數據像商品一樣自由流動,從而打破數據的封閉和碎片化,降低數據采集的成本,使全樣本分析成為可能。
根據國外的研究結果,當公路處于健康狀態時,延長其使用壽命的費用,要遠低于公路技術狀況惡化后修復或重建的費用。執行路面預防性養護策略的關鍵,是在適當的時間、應用適用的技術,在適宜的路面上進行養護作業。要完成這些精準的任務,必須要進行大量的前期工作,對路況進行診斷,要識別出隱性病害。但是在以往的技術條件下,使用傳統的分析手段,想要做出準確的判斷難度非常高,這也是交通部門大力推廣預防養護多年,卻收效甚微的原因。
通過海量數據的全樣本分析,我們可以得出公路(下轉第193頁)(上接第228頁)病害災害和各種影響因素的相關關系,從而預測病害災害發生的可能性,做到提前養護、精準養護和搶險快速響應,有效的降低養護成本和災害損失。endprint
5 目前大數據在公路養護行業的應用情況
最近幾年,大數據得到了極高的關注度,公路養護行業也在積極探索大數據和自身業務的結合。但目前來看,這些探索并不成功,主要原因有以下幾個方面:
5.1 對“大數據”沒有真正了解
對其特點一無所知,思維沒有從過去的小樣本轉變到全樣本,沿用傳統的結構性數據庫,錄入的數據要求規范統一,排除了大量不規則不規范的數據信息,與大數據的根本理念——全樣本分析背道而馳。這種思維變革需要時間,畢竟對于多數IT行業從業者,大數據都是一個新鮮事物。
5.2 對大數據應用的成功案例沒有詳細研究
這些成功案例的公司如亞馬遜和京東都集中在互聯網領域,根本原因在于這一領域的信息流動成本更低。公路養護行業在推動大數據應用的過程中,完全忽略了成本因素,成本因素對新技術、新理念的推廣普及有至關重要的作用。在現階段,如何降低大數據應用的成本和利用大數據降低自身業務的成本,這兩點是需要首先考慮的。
5.3 缺乏數據挖掘分析的人才
即便是互聯網公司,如果只收集海量的數據,而沒有有效的挖掘利用,不能對自身業務有所幫助,就無法產生價值。目前,這種人才奇缺,是互聯網巨頭們爭搶的目標。公路養護行業中,幾乎沒有懂得數據挖掘的人員,更缺乏能對公路養護管理和數據挖掘兼顧的人才。需要外部引入的同時,注重培養適應自身行業特點的人才。
6 結語
大數據不是孤立的,它是下一次信息浪潮的一部分,只有得到5G網絡、物聯網、數據產業鏈、云計算等技術和基礎設施的支撐,以遠低于傳統手段的成本采集海量的數據,大數據分析才有數據可分析,才能稱之為大。大數據不是一種技術,而是技術進步后新的數據分析理念、方法,它所對應的是使用了幾百年的隨機抽樣分析。這種方法在公路養護行業的實現,需要等待上述各種技術和基礎設施的完善。
【參考文獻】
[1]李亞曼,崔樂樂.基于精準畫像的京東1小時達——“大數據與智慧物流”連載之四[J].物流技術與應用,2017,22(04):148-150.[2017-08-02].
[2]李鵬濤.大數據與智慧物流概述——“大數據與智慧物流”連載之一[J].物流技術與應用,2017,22(01):133-135.[2017-08-02].
[3]Linden G, Smith B, York J. Amazon.com Recommendations: Item-to-Item Collaborative Filtering[J].IEEE Internet Computing,2003,7(1):76-80.
[4]姚輝寧.基于預防性養護的高速公路路面管理系統研究[D].長安大學,2008.
[5]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數據時代[M].杭州:浙江人民出版社,2012.
[6]Jiawei Han,Micheline Kamber等.數據挖掘[M].北京:機械工業出版社,2012.
[責任編輯:朱麗娜]endprint