趙小潔,黃 林,田智雁,嚴世祥
(1.云南省公路科學技術研究院,云南 昆明 650051;2.云南省公路信息中心,云南 昆明 650051)
“十三五”以來,云南省公路建設取得突飛猛進的發展,截至2020年底,全省高速公路總里程近9 000 km,普通干線公路總里程達2.7萬km[1]。隨著普通國省干線里程的不斷增加,公路養護信息化、智能化要求不斷提高,公路基礎數據庫的建設就顯得尤為重要,然則信息化建設的關鍵在于如何搭建基礎數據庫,并管理好數據、應用好數據,數據采集是獲得基礎數據的重要途徑。交通運輸部印發的《數字交通發展規劃綱要》中提出,要加快完善面向數據交通應用交通基礎設施工程建設標準[2];交通運輸部印發的《推進綜合交通運輸大數據發展行動綱要(2020-2025年)》[3]明確“夯實大數據發展基礎”是主要任務之一,同時提出完善標準規范,強化數據采集。交通運輸部文件的出臺也在進一步強化數據采集的重要性。
為進一步做好云南省普通干線公路基礎數據庫建立工作,筆者作為項目組主要成員依托世行云南公路資產管理系統的子項目之一——公路基礎數據采集,研究修編了《云南公路數據采集標準》,并先后3次參與了云南省普通干線公路的數據采集及更新工作和公路基礎數據庫的建設,目前云南公路數據采集標準已上升為云南省地方標準,依托數據采集成果搭建完成了基礎數據庫,并已廣泛應用于云南省普通干線公路的養護管理工作中。筆者在此簡述公路數據采集標準的框架結構、數據采集流程、基礎數據庫搭建及數據成果的初步應用,以期給全國其他省份的公路數據采集提供一定的參考借鑒意義。
筆者參考行業標準《公路數據庫編目編碼規則》從指標分類、指標設置和采集方法3個方面考慮編制了《云南公路數據采集標準》,并在標準后面附了每個表格的填寫示例,以供填寫者參考。
公路屬于線性構造物,為達到數據采集標準指標覆蓋全面、指標描述準確的目的,項目組通過大量的調研,結合建筑安裝工程費的劃分科目,該標準將公路分成了路線集、路基集、路面集、主要構造物集、交通量集、沿線設施集和沿線環境集7個數據集,從7個維度對公路數據分別進行采集。
路線集主要從路線的走向、管養單位、技術等級、行政區劃、重復路段、交叉口、匝道、橫斷面、公路用地、養護及改擴建信息等11個方面分別進行了相關指標的設置,目的是通過路線概況類表大致了解路線的基本情況。
路基集主要采集路基的填挖類型和坡度、填料形式、排水設施和路基防護設施等方面,全面掌握路基的基本情況,同時結合公路技術狀況標準增加了路基損害調查表。
路面集主要從路面的結構類型、各結構層材料及厚度、控制指標(彎沉或彎拉強度)等方面全面采集路面基本情況,同時結合公路技術狀況標準增加了路面快速采集的彎沉、平整度、破損率、磨耗和抗滑等指標,用于采集設備與計算機快速對接,及時計算路面技術狀況指數PQI。
主要構造物集采集公路的橋梁、隧道及涵洞3類構筑物,并增加了橋隧構筑物損害調查表。
交通量集主要以交通量觀測站點為采集單位,詳細采集了每個交通量站點的代表里程、經緯度、高程和交通量車型分布情況等數據。
沿線設施集著眼于公路路線外的附屬設施,主要從養護管理設施、停車區、服務區、收費站、超限檢測站、綠化信息、輪廓標、交通標志、交通標線、警示設施和自救設施等18個方面采集了公路附屬設施,并增加了沿線設施損害調查表。
沿線環境集主要從公路的主要定位控制點、沿線鄉鎮及沿線地貌3個方面進行了信息的采集。
通過7個維度的公路數據表格分類,共設置了52張業務表格,859個指標項。
在確定了指標集后,每個指標項的設置就顯得尤為重要,既要突出量的指標,如路段長度、橋隧長度,也要突出質的指標,如按跨徑分類、技術等級;既要采集公路靜態數據,如行政區劃、橫斷面,也要采集公路動態數據,如路面技術狀況;既要反映歷史數據,如路基填料類型、交通量站點經緯度,也要反映養護情況,如路改擴建信息;既要考慮公路上相關信息,如防護設施,也要考慮與公路養護運營密切關聯的公路沿線設施,如養護管理設施。
通過研究分析,項目在反復多次征求各州市交通運輸主管部門意見及高校、信息化專業人士的意見后確定各表格指標項的設置內容。
為了便于信息化系統之間數據的互相調用,在采集標準制定時,對各指標項的數據從信息化的角度進行了設置,分別設置了數值型、字符型和日期型3種。數值型數據以N(n,m)或N(n)方式記錄,其中n為總位數(含小數點位),m表示小數點后的位數;字符型數據以VC(n)方式記錄,用數字、符號或漢字表示,其中n為字符長度;日期型數據以D(n)方式記錄,其中n為總位數(含分隔符)。
在采集標準中對數據的采集方式和方法進行了要求。
數據采集方式分為:現場調查、實地測量以及檔案資料查詢3種。當檔案資料與現場調查或實地測量結果有差別時,以實地調查或測量結果為準。公路內業數據項(如路面等級、技術等級等)通常以查詢檔案資料為主,現場調查核實為輔的方式采集;若檔案資料散失,則必須采用現場調查或實地測量方法采集數據項。公路外業數據項(如病害)采用現場調查的方法直接獲取。公路外業參數項(如路面寬度、行車道寬度等)采用實地測量的方法直接獲取。
采集方法中規定了每個指標項的定義,根據定義按照不同的采集方式進行采集,并按照采集方法中要求的數據類型保證精確要求。如路基寬度為在一個橫斷面上兩路肩外緣之間的寬度,一般采用實地測量;數據類型:N(3,2),單位為m,表示路基寬度采集實地測量的方式,要求填寫小數點后保留2位小數,最大不得超過100 m的限制。
公路數據采集標準通過世行專家的審核認定后,項目組編制了數據采集實施方案,在該方案中對數據采集的技術要求、流程、時間節點和考核措施等進行了規定,同時對參與數據采集的人員進行了技術培訓、指導各采集單位現場采集、外業復核及內業邏輯性審核等環節,從源頭切實保證了數據采集的質量。
項目組對參與數據采集的全部人員進行了現場培訓、QQ答疑和電話答疑等方式的技術培訓,通過多輪培訓答疑,使所有參與采集的人員對采集要求爛熟于心;同時項目組根據提問頻次在開始采集的10天內整理出常見問題答疑題,便于后續現場采集人員遇到問題時及時翻閱查看。
現場采集結束后,為進一步確保采集數據與現場實際相符,項目組派出外業復核小組,按一定比例對各采集單位的外業采集成果進行了現場復核。外業復核采用不符合率對采集成果進行考核,不符合率≤5%,則認為采集單位的外業采集成果通過;不符合率>5%,則需要采集單位重新進行外業采集,直至外業復核通過。不符合率計算公式如下;

其中:漏項率是指在復核路段內實際存在的構筑物但未采集,具體計算方法為未采集構筑物個數占全部采集構筑物(含未采集構筑物)個數的比例;錯誤率按照全部復核路段計算,具體計算方法為與現場實際不符合的錯誤單元格數量占總單元格數量的比例。
外業采集不符合率≤5%的采集單位按照要求對不符合的數據進行修改完善后即可通過“公路數據采集平臺”進行數據上報,上報數據后,項目組以管養單位為統領,對各采集單位的數據進行了邏輯性審核。
邏輯性審核主要有:
(1)里程錯誤。如實際管養里程與采集里程不對應等。
(2)樁號錯誤。如表格填寫“止點樁號>起點樁號”等。
(3)邏輯性錯誤。如同一構筑物的兩行采集信息樁號存在搭接關系、路基寬度與行車道的關系等。
對內業審核出來的錯誤,項目組通過“公路數據采集平臺”將數據退回采集單位,采集單位核實后二次上報再進行內業審核,直到全部采集數據通過內業審核。
為規范業務數據、合并重復屬性、降低填寫難度和減輕填報工作量,同時便于對公路基礎數據進行有效、方便的管理,實現與普通干線公路基礎數據有關的系統開發時都能快速便捷地從該數據庫平臺獲取數據,項目組歸納總結了3個年度的公路數據采集指標項目和實際情況,搭建了云南省普通干線公路基礎數據庫平臺。
考慮到云南省普通干線公路基礎數據庫平臺作為一個開放性、標準化及可兼容性的基礎數據庫,在搭建底層數據庫時,盡可能地將指標項有多重選項的內容做成固定選項值,并通過字典信息表對固定選項值進行管理,比如技術等級分為高速公路和一級公路、二級公路、三級公路、四級公路和等外公路;行政區劃包括昆明市五華區、昆明市官渡區及曲靖市麒麟區等;同時按照數據采集標準的要求,對所有字段進行了數據類型設置。
為增強業務數據的關聯性、降低填寫的重復性,項目組將路線基本信息表、管養單位信息表、行政區劃信息表、路線技術等級信息表及路面基本信息表合計5張表作為整個業務的基礎信息表,其他表格均依托業務基礎信息表進行關聯及校核,具體業務信息表ER圖如圖1所示。

圖1 業務基礎信息表ER圖
云南省普通干線公路數據采集標準共有52張業務數據表,其中22張數據表有圖片數據,除橋梁(包含各類文件附件)、隧道及涵洞每條記錄對應兩張圖片外,其他業務數據表格中均為一條記錄對應一張圖片。在公路數據采集過程中,采集了大量的圖片數據(據2020年公路數據采集更新統計分析,數據量約為2.7 TB,合計57萬張圖片數據)。為增強與其他相關業務平臺的兼容性以及方便用戶直接通過路徑找到指定圖片數據,圖片數據采用線下處理方式,即圖片文件采用一定的命名規則及保存路徑,用移動存儲設置拷貝至服務器,并通過校驗程序對圖片及文件數據進行校驗。
云南省普通干線公路數據采集平臺的搭建采用了便捷的B/S架構、服務端使用了Pivotal團隊提供的全新Java開源框架Spring Boot[4],前端采用輕量級的漸進式開源框架VUE,數據存儲則使用甲骨文公司的關系型數據庫管理系統ORACLE數據庫,通過Mybatis[5]中間件來實現服務端與數據庫進行數據交互,前端通過輕量級的數據交換格式JSON[6](JavaScript Object Notation,JS對象簡譜)與服務端進行數據交互,用戶登陸信息及部分業務數據的緩存則使用高性能key-value內存數據庫Redis[7]來存儲。
平臺可以很便捷地對云南省普通干線公路數據采集共有52張業務數據表進行有效管理,同時還具備用戶權限設置,不同的用戶可設置不同的權限,并提供數據接口,以便于基于普通國省干線基礎數據的多個系統通過接口和權限與云南省普通干線公路基礎數據庫獲取公路基礎數據。
目前,經過了3個年度的云南省國省干線數據采集更新成果具有數據格式統一、信息代碼完善、數據信息量全面和數據準確可靠等特點,通過普通干線公路數據庫平臺的搭設,將52張數據表格轉化為計算機語言,并實現了多系統之間的無縫對接,目前已為智慧養護巡查APP、云GIS公路大數據管理平臺和云路通APP等多個系統的運行維護提供了技術數據;同時該數據采集成果也為省公路局“十四五”國省道改造項目庫編制、國省道路網優化調整等相關規劃編制提供了基礎數據,今后該數據采集成果也將為云南省交通強國試點省份的建設提供更有利的支撐。
筆者從云南省公路數據采集標準的制定到云南省普通干線公路數據采集質量保證措施等方面對云南省普通國省干線公路的采集全流程進行了闡述,同時對普通干線公路基礎數據庫的搭建思路及方法進行了簡述,并介紹了數據采集更新成果的初步應用,從中可以看出:(1)云南省公路數據采集標準從工程技術的角度將信息化技術融入其中,為各類公路信息化平臺的研發及互通設立了信息化標準;(2)公路數據采集在數據采集標準的指導下,從技術指導、外業復核和內業邏輯性審核等方面進行了技術把關,數據質量較高,為今后各類公路信息化平臺的研發奠定了基礎數據;(3)以數據采集成果為基礎,搭建了普通國省干線公路基礎數據庫,為后續普通國省干線公路的養護管理預留了數據調用的開放性接口,可實現多系統的融合統一;(4)公路數據采集成果是對普通國省干線公路的一次普查,數據成果應用面廣、應用效果顯著;(5)對數據采集標準內容和數據采集流程的闡述,可為后續其他省份進行公路數據采集提供參考指導意義。