龐美嚴 張 何
(廊坊燕京職業技術學院,河北 三河 065200)
隨著我國車輛的增加,高速公路給人們帶來許多方便,但同時也引發了許多新問題,超速、超載等違章現象以及汽車犯罪現象等加劇,傷亡事故不斷發生。高速公路上一旦發生交通事故,大多都是重大和特大交通事故。所以,智能車輛監控系統具有一定的威懾效果,減少違法違章行為,促進交通安全[1]。智能車輛監控系統要每時每刻監視車輛的運行并搜集和處理大量的信息,比如:車輛通過率,車輛報警,天氣狀況,用戶反映,事故處理等。數據倉庫及相關技術就能夠處理海量信息,它對所采集的大量交通數據及時進行快速、有效、深入的分析,實現實時數據處理,為智能車輛監控系統提供所提供準確的,有效的分析型數據平臺,并能夠支持管理層的決策。
數據倉庫的發展在國外已經非常成熟,而在我國21世紀才剛剛起步。數據倉庫的定義最早由W.H.inmon提出的:數據倉庫是一個面向主題的、集成的、相對穩定的、反應歷史變化的數據集合,用于支持管理決策[2]。對于數據倉庫的概念我們可以從兩個層次予以理解,首先,數據倉庫用于支持決策,面向分析型數據處理,它不同于企業現有的操作型數據庫;其次,數據倉庫是對多個異構的數據源有效集成,集成后按照主題進行了重組,并包含歷史數據,而且存放在數據倉庫中的數據一般不再修改。
車輛監控系統數據倉庫的體系結構主要分為4部分:數據源、數據存儲與管理、聯機分析處理(On-Line Analysis Processing,OLAP)引擎和前端應用[3]。(如圖 1所示)。
系統中數據處理流程為:
系統從車載終端采集到數據,把采集到的數據導入數據庫,以數據庫作為數據源,對數據進行抽取、轉換和加載(Extract,Transformation,Loading,ETL),但由于本系統采集到的數據只是單純的車輛定位信息,所以只需要對數據進行抽取、轉換操作即可,然后把處理后的數據存到數據倉庫中,通過OLAP服務器對分析需要的數據進行有效集成,按多維模型予以組織,以便進行多角度、多層次的分析,并發現趨勢。前端應用中數據分析主要針對OLAP服務器,數據挖掘、報表和地理信息系統(Geographic Information System,GIS)顯示主要針對數據倉庫。
系統數據倉庫的開發策略:
系統數據倉庫的開發策略主要有自頂向下,自底向上以及兩種策略的混合使用。由于該系統所涉及的范圍是高速公路的車輛監控信息,范圍不是很大,信息內容不是很雜,資金投入比較有限,也容易獲得成效,所以本系統采用自底向上策略。
系統數據倉庫的主題根據需求分析和決策支持來設計。例如在車輛監控系統中把車輛作為一個主題域,下面包含車流量、車擁塞、車事故等子主題。根據以上的分析監控系統決策主題的思想是先確定與監控系統決策相關的大的方面——主題域,然后在主題域中找出子主題域,子主題域中可能包含若干主題或下一級的主題域這樣逐層細分,最后形成樹狀結構。根結點是監控系統決策這個大的主題域,葉結點是具體的主題。每個主題所包含的數據的個體就是監控系統決策所需要的數據。
維表是通過記錄因素的屬性來描述事件中包含的諸多因素,是多維分析空間在某個角度上的投影。例如:監控系統數據倉庫各主題幾乎與車流量,地理位置,天氣狀況,主觀因素等有關,所以將這些實體作為維表來處理。監控系統中的維表有車輛定位維表,天氣狀況維表,路況維表,駕駛員維表等。
2.3.1 交通擁塞分析模型
交通擁塞分析模型由路線維表、天氣維表、出警維表構成星型模型結構(如圖2所示)。該分析模型主要是對高速公路的速率作分析,為保證車輛高速而提供決策支持。
2.3.2 交通事故分析模型
交通事故分析模型是由車輛定位維表、天氣維表、駕駛證維表、車牌維表及出警維表等事實表構成雪花型結構(如圖3所示)。該模型主要對高速公路的交通事故做分析處理,為保證駛進公路人員的安全提供決策支持,并及時作出預警措施。
所謂數據倉庫的物理設計就是將邏輯模型轉化成物理實現,如物理存取方式、數據存儲結構、數據存放位置以及存儲分配等等。數據倉庫的物理模型設計中首先要定義數據存儲結構,對大量數據存儲采用并行存儲結構——RAID。其次確定索引策略,為事實表和維度表的主鍵和外鍵建立索引。然后確定數據存儲策略,將事實數據和高速公路基本信息數據存放在硬盤上,而其他數據存放在磁盤上[4]。
系統開發平臺選擇C#和SQL Server 2000。建立了數據倉庫模型后,基本確定了數據倉庫中事實表和維表的結構。然后將相關數據轉移到數據倉庫的事實表和維表中。將系統中的數據進行一定的轉換和合法性檢查,通過SQL Server提供的數據轉換服務(Data Transformation Service,DTS)工具將系統數據庫中的數據裝載到數據倉庫,然后通過OLAP服務器向客戶機提供多層次、多角度的數據分析服務。數據倉庫體系中前臺是網絡服務器,后臺是數據倉庫系統,數據倉庫的信息及統計分析是以網絡的形式表現的。利用Microsoft的數據透視表服務作為客戶端組件,建立與OLAP服務器通訊,并為客戶端應用程序取得OLAP服務器數據提供接口。在數據透視表服務應用中,可以使用Excel 2000應用程序訪問立方體中的數據,靈活快速生成各種報表和圖表。通過數據分析和展現工具對數據倉庫中的數據進行多維分析、匯總,形成圖表或報表的形式,使決策者可以清晰、直觀地看到分析結果,為我國交通的發展提供決策依據[5]。
本文首先根據需求分析確立主題,然后建立基于車輛分析系統的數據倉庫模型,解決了在數據倉庫建設過程中的幾個關鍵問題,為高速公路車輛監控系統進行決策分析提供了有效的途徑。并且,系統數據倉庫的建立,能夠為數據挖掘及地理信息模塊提供數據依據和數據參考,通過對歷史數據的分析,可為路政、公安部門等提供決策參考,并提高高速公路的安全性和交通部門的管理水平。所以這對我國交通管理有實際應用意義和發展前景。
[1]齊曉杰,等.公路智能交通監控系統的發展現狀及趨勢[J].黑龍江交通科技,2009(4).
[2]梁柳瑩.論數據倉庫和數據挖掘[J].現代企業文化,2009(3).
[3]曹永生.數據倉庫在條碼系統中的應用探討[J].條碼與信息系統,2009,4.
[4]賀向敏,周根寶.數據倉庫技術在旅游業中的應用[J].內蒙古農業大學學報,2009,6.
[5]羅躍國.高校教務系統數據倉庫的建模及應用[J].長江大學學報,2009,3.
[6]王元春,員建廈,王岳盟.面向對象的數據倉庫設計[J].計算機與網絡,2011(07):46-48.
[7]梁大圣.空間數據倉庫的設計與構建——以東南亞森林資源為例[D].山東農業大學,2010,06:8.