劉秀紅,曾 理,郭建華
(1.江蘇省交通運輸廳公路事業發展中心,江蘇 南京 210004;2.東南大學智能運輸系統研究中心,江蘇 南京 211189)
道路交通數據資源是道路管理者和使用者進行管理與決策的基礎,研究交通數據資源可用性對挖掘公路數據資源價值具有重要意義。隨著普通國省道數據資源的數量和種類不斷增多、道路交通業務需求和要求不斷提高,快速并準確地找到可用的交通數據資源成為交通行業日常業務之一。因此,本文從交通業務與數據的角度出發,建立普通國省道數據資源可用性框架,充分挖掘公路數據資源價值,以提高交通數據資源可用性。
交通數據資源的可用性是指針對特定需求,能快速并準確地找到有用的交通數據資源。提高交通數據資源可用性不是簡單的數據處理,它涉及對道路交通數據資源的采集、處理、集成和搜索。更重要的是,需要搭建業務與數據間的關聯關系。通過分析路網業務需求、梳理交通數據類別,搭建業務與數據間的關聯關系,建立普通國省道數據資源可用性框架,在提高交通數據資源可用性方面發揮重要作用。
普通國省道數據資源可用性框架的提出,為道路管理者和使用者進行管理與決策提供了指導。本文采用元數據分析法進行可用性分析,建立的可用性框架由物理層、服務層、元數據層和工具層4部分組成。首先,可用性框架可以分析路網業務需求,根據運行監測、協調調度、事件處置和出行服務等業務衍生出的不同業務功能點,構建典型業務元數據庫。其次,可用性框架可以梳理交通數據類別,從采集數據,到質量控制及融合處理,再到構建數據元數據庫,完成交通數據資源的梳理和處理,便于其儲存與查詢。再次,可用性框架可以連接業務與數據,通過搭建業務功能點與交通數據類之間的關聯關系,構建數據集成元數據庫。最后,可用性框架還可以提供工具,指南文檔、搜索工具、可視化分析,能提高交通數據資源的搜索效率與展示效果。此外,以路網平均速度為例,對數據資源可用性框架進行展示。
數據資源主要以數據的形式呈現,而元數據作為描述數據屬性的信息,可揭示數據資源的內容、特征和屬性,具有體量小、格式簡單、易被計算機讀取和識別等優點。元數據的目的是識別、評價、追蹤資源信息以達到有效管理,有助于數據資源可用性的實現,即快速并準確地找到有用的數據資源。根據用途,元數據可以分為數據元數據和業務元數據。數據元數據在數據存儲、開發和管理過程中為系統設計者、開發者和管理者提供支持,有助于管理人員理解數據。業務元數據將業務梳理為多個業務需求點,有助于用戶理解業務中的信息需求。因此,可以用元數據進行業務與數據的標準化,建立兩者間的可用性聯系。
元數據分析法通過搭建業務元數據與數據元數據間的關聯關系,推動普通國省道數據資源可用性框架的建立。在交通中,主要有業務與數據兩種信息資源。業務元數據將交通中的業務梳理為多個業務需求點,便于人們更好地理解交通業務,如評價路網運行狀態的一個業務元數據是速度指標的計算,評價路網安全的一個業務元數據是事故率指標的計算。數據元數據是描述關于道路交通的數據類,其具體數值通過一定的采集技術收集并經過質量控制及融合處理得到,如流量數據作為一類數據元數據,具體的流量數值可通過感應線圈收集并經過質量控制及融合處理得到。本文在元數據分析法的基礎上,建立普通國省道數據資源可用性框架,實現數據元數據與業務元數據間的可用性分析,以此提高數據資源可用性。
本文基于元數據分析法,通過對普通國省道業務及數據資源的梳理,搭建業務與數據間的關聯關系,建立普通國省道數據資源可用性框架,如圖1所示。

圖1 普通國省道數據資源可用性框架
物理層提供道路數據資源,執行路網業務,是可用性框架的基礎。為獲取全面、準確、一致的道路交通信息,首先要了解交通數據如何獲取。當前主要的交通數據采集方法有:感應線圈、微波、聲波、視頻、雷達、GPS、橋梁動態稱重系統、ETC和治超檢測站等,以上交通數據采集方法采集的主要數據項及其特點,如表1所示。

表1 物理層交通數據采集方法
服務層主要進行路網業務分析及數據質量控制及融合處理。一方面,服務層解決了為什么要獲取、如何處理交通數據資源等問題。另一方面,服務層連接物理層與元數據層,實現了交通數據的處理與傳輸,推動了路網業務的分析與執行。可用的交通數據資源是道路管理者和使用者進行管理與決策的基礎,對提高路網運行效率和服務水平至關重要。為此,服務層需要進行路網業務分析,典型的路網業務包括運行監測、協調調度、事件處置與出行服務等。在服務層需要對從物理層采集到的交通數據進行質量控制及融合處理,包括異常數據檢測、錯誤數據處理、缺失數據補齊、多源數據融合等,經過以上一系列處理后的數據作為各個交通元數據的具體取值,以確保交通數據的正確性。
元數據層通過元數據分析法構建元數據庫,實現業務與數據間的可用性連接,是可用性框架的核心。同時,元數據層還連接服務層與工具層。(1)在服務層進行路網業務分析的基礎上,在元數據層構建典型業務元數據庫,分析業務需求點,主要包括指標模型、預測模型、事件模型、應急模型和年報分析等。(2)在服務層進行數據質量控制及融合處理的基礎上,在元數據層根據采集的數據類,構建數據元數據庫,主要包括兩類,即以流量、速度等為代表的動態數據,和以路、橋、隧等為代表的靜態數據。在形成業務元數據庫和數據元數據庫的基礎上,在元數據層構造數據集成元數據庫,根據業務功能對數據的需求,建立業務元數據與數據元數據的相關關系,并放入同一數據表中供查詢,以提高業務功能的可用性,如為了完成某一典型業務的某一功能點,可以根據業務元數據和數據元數據之間的關系,迅速查找到所需要的靜態和動態數據,借此提高面向業務的數據資源可用性。
工具層為實現可用性提供工具,包括指南文檔、搜索工具和可視化分析等。指南文檔根據業務及其功能點和數據項及其來源,展示業務與數據間的關聯關系。搜索工具通過在數據集成元數據庫中進行搜索,直接給出業務與數據間的關系,例如輸入某一業務功能點,搜索工具輸出其所需數據類,或輸入某一數據類,搜索工具輸出其可支持的業務功能。可視化分析在搜索工具的基礎上,實現業務功能點與數據間以圖形和表格為主的視覺展示。
本節采用路段平均速度展示普通國省道數據資源可用性框架。路段平均速度是某一時間段、某一路段內所有車輛行程速度的平均值。在物理層中,速度數據可來源于交調站,通過感應線圈采集。在服務層中,計算路段平均速度是運行監測業務中一個重要功能點。同時,速度數據需要進行質量控制及融合處理,可通過閾值判別法進行異常數據檢測,剔除法進行錯誤數據處理,插值補齊法進行缺失數據補齊,加權平均法進行多源數據融合。在元數據層中,路段平均速度數據是指標模型中的一個重要指標,為計算路段平均速度,需從數據元數據庫中獲取路段數據和速度數據。其中,路段數據是靜態數據,來源于靜態基礎數據庫,速度數據是動態數據,來源于交調站,如表2所示。在工具層中,則可以針對計算路段平均速度的功能點,展示所需要的靜態和動態交通數據。通過以上步驟,實現了計算路段平均速度業務功能點與數據間的可用性連接。

表2 路段平均速度可用性展示
本文在元數據分析法的基礎上,建立了普通國省道數據資源可用性框架,以提高交通數據資源的可用性。可用性框架由物理層、服務層、元數據層和工具層4個部分組成,物理層包括主要的道路及交通數據采集方法;服務層分析路網業務,對交通數據進行質量控制及融合處理;元數據層通過數據集成元數據庫的構建,實現業務與數據間的連接;工具層提供實現可用性的工具。最后,應用路段平均速度對可用性框架進行了展示。