楊 婷,洪匯隆
(國家知識產權局專利局專利審查協作廣東中心,廣州 510000)
城市道路交通問題是我國大中城市目前普遍面臨的社會問題之一。隨著社會經濟的發展,現代化進程的加快,城市人口和交通流量急劇增加,城市道路交通擁堵現象也越來越嚴重,極大地制約了城市的發展[1]。雖然我國在交通建設方面投入大量人力和資金,仍難以全面解決交通問題。如何全方位地實時監控交通路況,科學分析交通數據,有效地管理城市交通,緩解交通壓力是當代社會一個值得研究的課題[2]。
關系數據庫之父E.F.codd 在20 世紀90 年代初提出了聯機分析處理(Online Analytical Processing,OLAP)的概念。OLAP 是在數據倉庫的基礎上實現快速多維分析的商務智能技術,是一種為數據分析、管理或者執行人員提供多角度、快速、一致和交互地存取信息的軟件技術。聯機分析處理可以輔助決策者作出正確的決策,分析人員和管理人員通過OLAP 從多角度觀察數據并獲取信息,并能夠支持各級管理決策人員從不同的角度、快速地對數據倉庫中海量的數據進行多種組合的查詢和多維的分析。OLAP 的主要基本操作包括:①切片(Slice)和切塊(Dice);②鉆取(Drill):上卷(Roll-up)和下鉆(Drill-down);③旋轉(Rotate);④其他操作[3]。
OLAP 作為數據倉庫中數據分析的一個主要手段,可以對屬性數據進行有效的多維分析和查詢。但是,城市交通的運行往往還伴隨著地理空間特征,為了增強地理空間信息對城市交通運行的決策支持,空間維度已經成為利用數據倉庫的OALP 對城市交通數據進行多維分析時的必不可少的維度。空間聯機分析處理技術(Spatial OLAP,SOLAP)將GIS 與OLAP 相結合,提供一個在空間維度上不同尺度進行自動鉆取的解決方案,實現各類空間聯機分析,為用戶提供更加全面靈活的空間決策支持[4-6]。空間聯機分析處理技術與傳統意義上的聯機分析處理技術的基本操作一樣,只是將操作對象換為空間數據立方體,空間聯機分析處理包括了局部分析、全局分析、概括分析和旋轉分析等操作。
本文基于空間數據倉庫的SOLAP 技術,設計適合交通綜合管理的系統架構和主要系統功能模塊,利用針對以交通為主題的空間數據立方體切片、旋轉、鉆取等OLAP 操作從多視角分析交通流信息,并在電子地圖上進行展示,以直觀的形式為交通管理者進行決策提供技術支持。
城市交通基礎數據主要包括空間數據和屬性數據。城市交通基礎空間數據指的是基于地理位置的相關數據,主要為城市基礎地圖庫(行政區劃圖、道路交通圖、地址信息等) 和各類車輛的全球定位系統(Global Positioning System,GPS)數據。城市交通基礎屬性數據主要包括路口路段類型、道路安全屬性、交通小區、交通方式、交通設施、交通檢測點及車輛的相關信息(包括機動車相關信息以及駕駛人相關信息)等。利用數據倉庫管理工具對城市交通原始數據進行清洗得到有效數據,并經過數據抽取、轉換、裝載(Extract-Transform-Load,ETL)等操作裝載到交通數據倉庫中,在數據倉庫的基礎上構建出與城市交通相關的不同主題的多維數據立方體。在城市交通相關的多維數據立方體上可以進行切片、切塊、上卷、下鉆和旋轉等OLAP 操作。最后,將得到的OLAP 分析結果用亮度圖、顏色圖、專題地圖和空間三維圖等不同手段展示出來。系統的總體框架圖如圖1 所示,系統包括了3 層:數據源層、數據倉庫層、OLAP 層。數據源層為系統的基礎層,包括了空間數據、監控數據、GPS 數據及其他數據。數據倉庫層為數據存儲中間層,利用從數據源層獲取的處理后的城市交通基礎數據以及中央元數據構建交通數據倉庫。OLAP 層為應用層,將交通數據倉庫中的數據構建多個空間數據立方體,并對空間數據立方體進行OALP 分析操作獲得空間聯機分析結果,并對分析結果進行可視化的表達。

圖1 系統總體框架
城市交通綜合管理系統綜合了各個數據源系統中的各種數據,數據之間的層級結構復雜,數據量很大,為了最大限度地集成數據,提高執行的效率,并為交通管理決策者提供決策支持,需要構建一個在時態地理信息系統(Temporal GIS,TGIS)的基礎上融合了數據倉庫技術的空間數據倉庫,以便從大量靜態基礎數據庫中提取城市交通數據,并對這些數據進行綜合管理。
將數據從基礎數據層提取到一個獨立的數據倉庫數據環境中,依次需要進行數據抽取(Extract)、清洗(Cleaning)、轉換(Transform)、裝載(Load)操作,這幾個操作叫做ETL,數據ETL 是構建數據倉庫的重要環節。
城市交通綜合管理系統空間數據倉庫的ETL 過程如下。
1)數據抽取。數據抽取主要是確定構建系統所涉及的數據源并從源數據庫中提取數據。城市交通涉及的源數據庫包括了人口庫、城市交通監控數據庫、城市道路交通數據庫和空間數據庫等。
??OECD,Competitive Neutrality:A Compendium of OECD Recommendations,Guidelines and Best Practices,OECD Publishing,2012,pp.5 ~9,pp.15 ~69.
2)數據清洗和轉換。數據清洗主要是對抽取數據的有效性進行檢查,剔除無效、相似重復以及數據項空白的數據。由于不同數據庫中數據類型不一致,存在同義不同名、數據格式不規范等問題,需要進行數據轉換。通過數據轉換匯總提取的數據,將其轉換成目標數據結構。
3)數據裝載。最后,直接運用SQL 語句或者用批量加載的方法把轉換后的數據進行匯總,加載到城市交通空間數據倉庫中。
經過ETL 的交通數據需要按照多維數據模型加載到數據倉庫中。多維數據模型是數據倉庫的核心。多維數據模型是為了滿足用戶的查詢和從多個角度進行數據分析的需求,建立的一個基于事實表和維度的數據倉庫模型。建立多維數據模型,需要進行維度和度量的設計。維度指觀察對象的角度,比如地理空間維、時間維、車輛維等,度量是與多個維度交叉的測度,如交通流車輛數量。
常見的多維數據模型有星形模型和雪花模型。星形模型的維表是非標準化的,容易導致數據冗余,讓事實表變得臃腫。通過對星型模型的進一步層次化可以得到雪花模型。交通數據的層級結構比較復雜,屬性數據間存在較多的多對多關系。為了減少數據冗余,提高查詢性能,本文選擇雪花模型來組織系統中的數據,如圖2 所示。

圖2 交通空間數據雪花模型
該多維數據模型以城市交通事實表為中心,構建出“交叉口”“交通路段”“交通小區”“車輛”“時間”這5個與城市交通相關的維,其中,“交叉口”維又包含“交叉口等級”維,“交通路段”維又包含“路段等級”維,“車輛”維又包含“車輛類型”維和“車主”維。“交叉口”維包含了交叉口ID、地理坐標(X,Y)、日均交通流和交叉口等級等信息。“交通路段”維包含了ID、路段長度、車道、自由流速度、日均交通量、車公里數和路段等級等信息。“交通小區”維包含了ID、交通小區的面積和名稱等信息。“車輛維”包含了車輛ID、GPS 坐標、車輛類型及車主等信息。“時間”維包含了年、季度、月、日、星期幾、時、分和秒等信息。
城市交通的綜合管理系統主要包括5 大功能模塊:系統登錄與后臺管理、數據采集與更新模塊、OLAP分析模塊、電子地圖展示模塊和數據輸出模塊。如圖3所示。

圖3 系統主要功能模塊
3.1.1 系統登錄與后臺管理模塊
系統登錄與后臺管理模塊應該包括用戶角色的定義、角色權限賦予、結果發布審核和用戶添加等功能。
3.1.2 數據采集與更新模塊
每天都有新的交通情況,所以城市交通綜合管理系統中的數據是需要不斷更新的。數據采集與更新模塊主要是采集每天不同車輛的GPS 信息,以及更新城市交通道路或者其他空間信息變化的情況。
3.1.3 數據輸出模塊
數據輸出模塊主要是為了輸出由OLAP 分析的結果制作而成的報表和專題地圖等。
OLAP 分析模板包括了OLAP 的基本分析、車輛軌跡查詢、綜合查詢等功能。
3.2.1 OLAP 基本分析
OLAP 基本分析包括了切片、切塊、上卷、下鉆和旋轉等功能。
當數據立方體的維數過多時,人們往往很難觀察出度量隨維的變化規律,可以將其中一部分維(一個或多個)固定住,只觀察其他維上度量數據的分布情況。切片是只固定一個維來降低數據立方體的維度。例如,在交通空間立方體中的“路段等級”維上切片,并選擇路段等級等于“高速公路”,就可以得到高速公路上車輛的詳細情況。切塊是固定2 個或者2 個以上的維。例如,在交通空間立方體中的“路段等級”維和“時間”維上切塊,并選擇路段等級等于“高速公路”,時間等于“2022 年10 月10 日”,就可以得到在2022 年10 月10日高速公路上車輛的詳細情況。
空間上卷、下鉆是改變空間數據立方體的維的數量,或者改變維的層次,變換聯機分析的概括度和粒度。空間上卷就是實現空間地理要素聚集的過程,把符合條件的較小地理要素(線、面)進行疊加、合并等操作,得到一個聚集后的地理要素。例如,可以在地圖上合并某時行駛某類車輛大于100 輛的路段集合。空間下鉆是空間上卷的逆操作,其結果是得到空間上卷前的更加詳細的地理要素,即合并前的較小地理要素集合。例如,在福州市交通地圖上進行下鉆,得到福州市各區域詳細交通信息。
空間旋轉分析是變換觀察維的角度,從不同的方向來觀察度量在各個維上的分布情況。將每個維彼此在垂直方向上固定,并改變空間數據立方體維的方向,對整個空間數據立方體進行方向上的變換。
3.2.2 車輛軌跡查詢
車輛軌跡查詢是通過車牌號及相應時間段來查詢車輛的行駛軌跡,車牌號可以是車牌號的前幾位或是全部,在車牌號碼的輸入框中輸入相關的車牌號,會有相關的智能提示。可以選擇智能提示中的車牌號或車牌的前幾位,然后再設定好相應的時間段即可查詢,如查詢車牌號前幾位為“粵A00”且時間段為2011-05-01 11:00:37 到2011-05-01 17:00:37。
查詢到的結果可能是一項也可能是很多項,找到要查詢的車輛后單擊其車牌號,就會在地圖上播放該車的軌跡,可以通過查詢結果中的暫停播放及繼續按播放按鈕對軌跡播放進行相關操作,該軌跡的記錄也在網頁左邊欄中顯示具體的記錄,單擊左邊欄的結果記錄會在地圖上定位到該記錄的位置,并顯示該記錄的相關信息,單擊地圖上的軌跡點也會顯示該點的相關信息。
地圖基本操作功能主要包括地圖的放大、縮小、漫游、全圖、測距、測面積、鷹眼、清除、地圖顯示級數控制和地圖轉換等功能。通過地圖操作功能幫助用戶熟練操作地圖,使用戶更加方便地查看地圖信息。
以GIS 工具作為分析平臺得到的分析結果可以展示在電子地圖上,并制作成專題地圖的形式供決策人員參考。
由于數據來源多,數據量大,很難用純手工方式或基于傳統數據庫查詢的方式來管理與分析海量的城市交通數據,本文提出使用空間數據倉庫的Spatial OLAP 技術對城市交通數據進行分析與管理,可以從時間、空間等多維角度對城市交通數據進行查詢分析,并以地圖和圖表的形式對分析結果進行可視化展現,可大大提高城市交通管理效率,為決策者提供決策支持。