鄭 燁
(中國交通通信信息中心,北京 100011)
道路運政管理信息系統(簡稱運政系統)數據是道路運輸行業行政管理和構建綜合運輸體系的主要的信息資源。運政管理系統,是各級道路運輸行業管理部門服務行業、規范行業、指導行業的重要信息化工具,是交通運輸“供給側”服務和行業管理現代化、科學化、規范化、高效化的重要體現。 運政系統是我國各級道路運輸主管部門在開展行業日常管理、監督、服務等工作中頻繁使用的電子政務信息系統, 是交通運輸領域極為重要的電子政務信息系統之一。 近年來,隨著“放管服”改革的不斷深入,在交通運輸部相關司局和各級交通運輸部門的不懈努力下,終于實現了全國31 個省級道路運政管理信息系統的互聯互通。 截至2018 年底,全國運政系統互聯互通工作已初步實現了大多數省級的運政系統聯網, 至此全國道路運政信息化水平邁向了一個新的階段。 根據首次聯網的運政系統統計,2018 年底全國約有800 多萬經營業戶、1500 多萬營運車輛、2700 多萬行業從業人員,信息總量達到上億條, 高效的系統填補了行業數據信息化運行的空白。 但從數據化質量來看, 全國數據呈現時效性較差、 質量普遍偏低的特點, 有部分省存在關鍵數據不完整、數據格式不規范、數據關聯性差等問題,很大程度上影響了行業數據統計分析、系統聯網交換應用,以及影響到行業發展趨勢的判定。因此,在穩步推進聯網工作的同時,道路運政數據清理工作也勢在必行。
運政系統在現代道路運輸行業管理和服務中起到了至關重要的作用, 運政系統的數據記錄著全國范圍內道路運輸行業數千萬從業企業、人員、車輛的資質信息、許可記錄、信用記錄、年審記錄等重要信息。 沒有數據化的運政系統,就好像是沒有水的大壩,運政數據質量直接影響著各地運政管理和行業服務水平的提升, 也有礙于加快推進深化改革和加快綜合運輸體系建設步伐。
開展運政數據清理工作, 可以幫助行業管理部門了解當前全國運輸行業內部結構和運行質量情況, 并以查缺補漏的方式改進系統功能,優化業務流程辦理設計,更好的服務于全行業從業者; 通過對運政數據質量的分析應用,指導優化許可業務的批復時限、質量信譽考核、車輛年度審驗、營運線路牌照的核發管理;通過數據清理工作還可以有效的清查歷史無效的數據, 提高運政系統的工作效能, 幫助行業管理部門準確掌握行業從業人員和企業的數量和分布情況, 為未來綜合運輸體系建設提供有效的數據支撐。
全國道路運政管理信息系統始建于2015 年,在交通運輸部相關司局的大力推動下開始開展運政系統部省聯網工作。經2 年時間推進,目前全國初步實現聯網工作目標,運政系統聯網趨勢已經基本形成。但當前全國運政數據質量總體偏低, 根據中國交通通信信息中心相關部門對目前數據總體質量分析, 目前運政數據主要存在的以下幾個情況(見表1):

表1 運政數據主要問題情況表
(1)關鍵數據項不完整情況
關鍵數據項是指在道路運政管理信息系統存儲的數據中能夠成功描述業務對象的基本信息情況的數據,被定義為關鍵性的數據項。 關鍵數據項不完整則會導致該項數據缺乏對業務對象的基本描述信息, 運政系統在使用該類數據時將不能成功區分唯一的業務對象, 不能夠確定各項基本業務對象, 也不能適應全國聯網的跨區域業務辦理的基本需要,屬于需要信息補全的數據信息。從各地系統提取至交通運輸部部級系統的數據內容上來看,部分地區數據存在關鍵性的數據項不完整情況。如營運車輛基本信息中存在車輛車牌號、車輛車牌顏色、車輛識別碼等基本屬性類數據的不完整情況; 道路運政執法信息中存在執法案件號、 執法人員信息等信息不完整情況;從業人員誠信考核信息中存在從業人員資格號、誠信考核結果等核心數據信息不完整情況。
(2)數據填報不規范情況
數據填報不規范是指一條業務數據中所填數據值域或者信息格式, 超出了行業標準要求的規格或者信息格式錯誤。 數據填報不規范的情況將導致數據的真實度和準確度大受影響,在相關的運政業務辦理、行業監管、數據統計等工作開展時, 不規范的數據將導致正常業務無法辦理,數據被要求重新采集。 統計數據不準確,嚴重的還可能影響管理部門對真實情況的掌握并影響決策。 通過對全國運政數據質量的分析, 多數省份的運政數據都存在不同程度的數據值域超出JT/T 697.7-2014 行業標準要求的范圍、機械的填報字段值為“其它”等問題。其中出現問題較多的數據字段主要為“車輛類型代碼”、“車輛識別VIN 碼”、道路運輸證“經營范圍”、道路運輸證“有效期”和車輛“運營狀態”。
(3)數據關聯性差情況
數據關聯性是指在系統中不同的業務數據以關系數據庫表的形式分類存放的, 通過事先設計好的業務邏輯關系將已經分類好的數據表進行有效關聯, 形成我們能在系統中掌握企業和其下所屬車輛、車輛駕駛員、車輛營運資質、 人員從業資格等動態信息。 數據關聯關系的形成, 需要在各個數據表中設定一個或者多個字段與其它數據表有對應關系的規則。 而數據關聯性差的情況特點即是在關聯性差的數據項中, 數據表中負責與其它數據表有對應關系的字段存在無關聯、缺失、不規范等多種情況,導致各數據無法合理地關聯在一起。甚至有的是沒有所屬車輛和從業人員的信息, 有人員的信息卻找不到從業資格的信息。從全國運政數據關聯情況來看,部分地區的運政數據存在無法關聯的情況, 普遍存在有車輛與業戶、證件與證件的發證機構、線路與線路標志牌等信息無法合理關聯。 以上情況可以導致部分營運車輛關聯不到歸屬的業戶,從業人員證件的發證單位無法查詢,線路運營資質也無法確定等后果; 而部分地區的運政數據存在無法關聯,勢必影響到整個系統的數據質量。
在分析存在的問題和原因的同時, 還應進一步掌握數據清理中的難點,以便積極應對,整體推進加快進度和提升質量。
運政數據清理工作涉及數據信息項目多、范圍廣,需要部、省、市、縣各級道路運輸管理部門統一行動、合理組織才能解決長期存在于行業的數據問題。 如亟須解決長期未更新人、車、戶、線路的資質數據,錄入錯誤的業務數據、系統中的測試數據等問題。根據對全國運政數據質量的綜合分析,清理工作的難點主要存在于以下幾個方面:
一是清理工作涉及數據信息量龐大, 數據信息散布在各省市運政系統中, 也由于日常的運政管理屬于屬地化管理業務, 業務數據的產生和修改需要依靠管理對象所屬的業務部門進行處理和核查, 給眾多待清理數據和信息核查,及清理補錄數據帶來了難度。
二是歷史數據不易核查和補入, 待注銷數據較多且缺乏退出機制。因為信息登記時間較長,對于數據的核查和信息的補錄工作都有很大的難度, 需要動用大量的人力參與、人工核實數據和注銷工作。
三是數據質量問題原因復雜, 通過調研發現許多地方的管理部門認為運政數據的質量屬于信息化技術問題和業務沒有關系,還未與業務部門形成良好的配合機制,導致數據清理工作難度增大。數據質量問題只是表象,往往是因為管理機制或業務系統存在漏洞或不合理導致,導致多地在清理工作開始時聲勢浩大卻收效甚微。
運政系統數據清理應建立以縱向網絡化和橫向網格化相結合的清理責任區。 運政系統數據清理中主要是針對各地運政系統中人、車、戶、線核心的運政信息,進行科學的質量分析和問題數據整理統計,以“誰產生、誰負責,誰經手、誰管理”的原則,以數據責任區域進行分類匯總統計。建議以目前道路運輸主管部門管理體系為原則,縱向形成省、市、縣三級責任區域網絡,橫向建立以屬地清理為主的網格化數據清理責任區。 通過逐級建立運政數據清理專項小組開展定期、限期集中清理工作,同時鼓勵開展自查工作。在清理工作開展的同時,建議各級數據清理責任單位的上級單位通過逐級督促的方式, 加強各自轄區內運政信息處理的全過程的閉環管理, 及時把握和掌握數據清理工作的實施, 方便及時調整清理工作投入的人力、物力,避免造成不必要的浪費。
數據清理的步驟主要應以目標為導向進行數據清理。 首先要將數據清理工作的目標和負責區域做事先劃分,確保數據清理工作不重復;然后通過信息化技術手段將龐大的現有運政數據, 按問題數據的特征進行分析統計整理。各責任區域和網格化單位應通過問題數據清單,開展數據清理的相關工作(見圖1)。

圖1 數據清理工作的典型步驟
建立多角度分析,采取追根溯源解決數據質量問題。在數據清理工作完成階段性目標的時候, 將當前問題數據清單與建立的清理目標進行核對, 如果清理效果有所偏差,則應修正目前清理工作的重點和方向,確保如期實現清理工作目標要求。 數據清理的對象至少應該包括道路運政管理信息系統中人、車、戶、線基本信息和證件、資質數據,對清理對象應進行合理的分析并分類,進一步明確問題數據的特征,明確數據的責任單位和存儲地點。由于問題數據數量龐大,可以電子表格形式、數據庫等等形式收集、整理、存放,以方便數據責任單位訪問和下載問題清單。同時定期更新問題數據清單,引導數據責任單位應用目前的數據清理方法, 及時掌握清理的進展和當前問題數據特征,有利于各地數據清理資源的調配,達到數據清理的預期效果。
全國道路運政數據質量的提升, 需要集中全國各級道路運輸管理機構、行業企業、從業人員等多方力量,緊密合作、多級聯動、層層把關,以技術手段輔助管理手段,加快落實數據清理工作,從制度、業務規范、信息化管理、系統功能優化改造等方面全面加快全國數據質量提升工作的推進。
一是通過對目前問題的分析,進一步細化工作目標、明確分工、層層落實、責任到人,定期總結工作經驗,以周為單位定期通報進展,增強工作目標及進度考核,從管理和技術兩個層面加大溝通協調力度, 及時研究解決存在的問題,做到清理目標和清理成果相匹配,以結果為導向穩步推動清理工作。
二是追根溯源加強對數據質量問題分析和補錄。 針對發現的數據質量問題進一步組織分析研究, 通過對數據問題的核查追根溯源,找到運政系統建設、業務流程、行業管理、數據標準等方面設置不合理的問題。通過優化業務規范、改造系統,提出合理的解決方案,從而提升數據質量,提高行業服務和管理水平。
三是數據清理的目的是為了數據的應用, 增強數據的多系統交換使用,擴展數據的應用服務,可以有效幫助各部門快速發現和找到數據質量方面存在的問題, 可以加速問題數據的清理和更正。 廣泛的應用數據可以促進應用大數據分析、互聯網、云計算等信息化方式,優化升級傳統的服務模式,進一步深入實踐“供給側”改革要求,有效提升行業的服務質量和管理水平, 為加快推進我國綜合運輸體系建設提供及時、準確、可靠的數據支撐。