(1.華中科技大學 系統工程研究所,武漢430074; 2.武漢理工大學 湖北省數字制造重點實驗室,武漢 430070)
摘 要:
交通信息資源的合理集成是提高智能交通系統性能的有效手段。為集成交通網格上異構信息與不同領域本體,利用網格作為智能交通系統的信息資源存儲與協同工作平臺,利用本體作為智能交通系統資源表示和信息描述的基礎,提出了基于SUMO的交通網格決策本體層次結構,論述了異構信息獲取機理。實例證明此模型有利于交通信息資源的整合利用,并為基于網格的智能交通系統的決策支持及與網格上其他系統之間的開放式協作奠定了語義基礎。
關鍵詞:智能交通系統; 交通網格; 決策本體; 層次模型; 推薦高層合并本體
中圖分類號:TP31; TP393文獻標志碼:A
文章編號:1001-3695(2009)04-1373-04
Design of SUMO-based ontology layered model for transportation grid resource
WANG Yu1, CHEN Xue-guang1, HONG Liu1, GONG Jing-wen1,2
(1.Institute of Systems Engineering, Huazhong University of Science Technology, Wuhan 430074, China; 2. Hubei Digital Manufacturing Key Laboratory,Wuhan University of Technology, Wuhan 430070, China)
Abstract:Reasonable integration of transportation information resources can effectively improve the performance of ITS.In order to achieve the integration goal of ITS, this paper proposeda novel SUMO-based four-layer ITS decision ontology by using grid as resource storage and cooperation platform,and utilizing ontology as resource expression base. Based on the model, this paper discussed amechanismof heterogeneous information access and demonstrated it by a traffic accident scenario. The result shows that this model availably integratesthe heterogeneous resources and different domain-ontology by mapping their semantic to SUMO and promotesthe decision support and open collaboration capacities of ITS.
Key words:ITS; transportationgrid; decisionontology; layered model; SUMO(suggested upper merged ontology)
0 引言
智能交通系統[1](ITS)是由一系列既相對獨立又協同工作的子系統組成,其運行效率很大程度上依賴于這些子系統的資源共享與協同工作能力。由于城市交通信息瞬息萬變,同時不同來源的各類信息其表現形式不盡相同,使交通信息具有容量的海量性和內容的異構性[2]等特點,這就造成了不同區域、不同部門之間的交通決策信息難以有效地共享與使用,限制了交通決策支持能力的提供。因此,要解決ITS系統的協同工作與資源調度問題,必須從資源整合入手,解決交通信息的海量性存儲與基于知識的交通決策信息資源的集成問題。
為解決ITS資源共享與信息集成的問題,很多研究者在交通本體構建及應用上作了嘗試。黃珂萍等人[2]面向公交系統建立了市內交通本體,并定義了類內公理及實例的基本規則;劉衛寧等人[3]從實際遺留系統的集成出發,采用虛擬集成法將異地數據通過元數據及元屬性進行整合,以構建ITS虛擬共用信息平臺;李陽等人[4]面向中國智能交通系統的語義集成問題,提出了概念化的三層本體體系結構,并給出了系統的本體分類方法;馬金素等人[5]構造了交通問題求解本體,并論述了基于本體的類比匹配機制和匹配算法。
以上的方法解決了ITS信息集成及交通本體構建的一些問題,但仍存在著以下不足:
a)交通領域內本體多為個人自發構建,缺乏一致的概念基礎與表示形式,易出現系統問題定義不清、本體邊界模糊、概念粒度不當、公理規則缺乏針對性等問題,造成已建本體難以識別與重用。
b)目前的交通本體構建多以單一應用為導向,僅僅注重ITS某個側面的應用實際而未提供滿足ITS框架的本體層次模型。
c)ITS系統是整個城市信息系統的組成部分,其本體構建需考慮到開放性與擴展性要求。而目前交通本體構建并未考慮跨領域的信息共享和知識集成,因此在系統集成時各領域的本體需要相互翻譯與理解。由于缺乏一致的建模基礎及設計模式,隨著系統的增長和發展,交通本體通常必須進行重新設計以排除那些導致系統不能適應新需求的底層假設。
d)目前的交通本體均采用英文詞匯庫作為本體概念與屬性的詞匯基礎,難以適應我國以中文為核心的交通信息的分解與重構需求。
本文從ITS數據集成、信息集成、應用集成與系統擴展的整體性出發,利用推薦高層合并本體SUMO作為核心本體,提出并論述了交通網格決策本體的層次模型,為基于網格的ITS的決策支持及跨系統之間的開放式協作奠定語義基礎。
1 基于SUMO的交通網格決策本體層次模型
1.1 推薦高層合并本體SUMO
推薦高層合并本體[6](SUMO)是通用上層本體的一種,最初由Lan Niles和Adam Pease開發,后提交給IEEE Standard Upper Ontology (SUO) Working Group作為推薦標準,包含1 770個概念、7 278條斷言和1 240條規則。作為輕量級本體的SUMO合并了一系列現有的高層本體,試圖通過整合不同上層本體的關系和分類來改善語義Web的搜索、交流與互操作。SUMO包括三個基本層次:核心層由11個子集組成,包括結構本體(structural ontology)、基礎本體(base ontology)、集合/類型理論(set/class theory)、數學部分(numeric)、基于Allen的現實關系構建部分(temporal)、拓撲部分(mereotopology)、圖論部分(graph)、計量單位 (measure)及局部過程、對象和屬性的子結構與公理部分;第二層為中間層本體(mid-lever ontology);最下層為基于上兩層的領域本體部分。
SUMO適合于交通網格決策本體的構造,具體表現在:
a)統一的建模基礎。SUMO整合了目前存在的多數高層本體,其上層知識本體以一般、抽象、哲學的元概念為基礎,足夠涵蓋廣闊范圍的領域區域。不同于從敘詞表或網絡信息抓取領域本體的概念關系, SUMO提供了一個預先定義好的上層通用本體概念基礎,適合于領域本體在其上的擴展。SUMO已經實現了領域本體與其核心層之間的映射,包括政府、財政、運輸、地理、軍事等領域本體,這使得SUMO能提供超過20 000個概念與6 000條公理,為這些領域內具體應用本體的建立和交互奠定了建模基礎,大大提高了相似領域本體的開發效率。
b)明確的概念化標準。SUMO改變了基于敘詞表的本體構建中存在的語義關系不明確的狀況,通過SUO-KIF語言進行形式化描述,并定期自動地轉換為OWL、LOOM、DAML、XML格式。這使得SUMO的概念具有明確的語義描述形式和完全的公理化,而其多本體描述語言的相互映射也適用于基于網格的決策支持系統中不同的本體描述語言定義的本體的共享與復用。
c)一致的本體設計模式。SUMO所定義的時空、計量、代數概念具有很強的實用性與重用性,符合一般哲學上關于時空、代數的共同認知,能夠為更深層次的本體設計與建模一致性提供設計模式。
d)強大的可擴展性。SUMO內的信息遠遠超過字典或術語表,能使計算機處理更多內容細節和結構。首先,SUMO與目前世界上最大的敘詞表WordNet[7]建立了映射,而WordNet豐富的詞匯集能夠為基于SUMO的各個領域本體的概念與關系描述提供充分的詞匯選擇;其次,SUMO具有語言生成模板,可以轉換成印度語、中文、意大利語、德語、捷克和斯洛伐克語和英語,也為不同語種的本體建模提供了擴展的基礎。
1.2 交通網格決策資源本體層次模型
本文采用SUMO作為交通領域決策資源本體的通用上層本體,將交通網格決策本體分為四層結構(圖1),以滿足智能交通系統跨領域協作和提供非凡決策支持能力的要求。四層結構從智能交通系統的不同功能層次出發,滿足了由語法到語義、由基礎設施到高層應用、由信息檢索到系統集成的ITS功能需求。以SUMO為核心的四層結構改善了以往ITS交通本體在開放性和擴展性方面的不足,更利于各系統間的協同工作與統一指揮。
1)語法層 該層包括WordNet與Sinica BOW[8]。這一層的作用是作為信息萃取時所需要的自然語言分解與翻譯的基礎,以及領域本體構建時詞匯選擇與本體結構的基礎。其中,WordNet構成英語的詞匯表,且是下層SUMO的詞匯映射基礎,為交通信息的查找、萃取與組合提供了強大的詞匯關系庫;Sinica BOW是臺灣中央研究院語言學研究所以SUMO和WordNet為基礎建立的中研院中英雙語知識詞網(Academia Sinica Bilingual Ontological WordNet),為中文的本體研究提供基礎架構,且是中文自然語言處理和應用知識本體的依據,可以利用其中文詞匯與WordNet英語詞匯及SUMO概念的映射進行英中概念轉換和本體表示,改善目前大多數本體表示語言與工具對中文推理支持不足的局面。
2)通用上層本體層 該層本體層即為SUMO本體層。這一層主要為領域本體結構的構建與領域本體之間的集成提供一致性的語義基礎。通過將各領域本體相關概念對SUMO概念的映射或包含連接,可以將不同的小本體組合成具有層次性與相關性的本體集,同時也為與跨領域網格上其余使用SUMO為基礎的領域本體的集成和擴展提供了基礎。
3)領域本體層 本文通過對SUMO概念和屬性的繼承或關聯構建交通領域本體。從主要數據源(GIS數據和視頻數據)、交通領域知識、組織結構出發,本文將交通網格決策資源本體集定義為以下四個領域子本體:
(a)地理本體(geographic ontology,GO)。它提供與地理信息相關的概念與關系,包括道路、路口、建筑、天氣、國家、城市、位置等;此本體提供與GIS數據及地圖轉換層次一致的本體概念集。圖2顯示了地理本體對SUMO中基礎概念的引用關系及概念、屬性擴充。其中:mainStem表示概念“主干道”,為SUMO相應概念roadway“道路”的子類;maxSpeedAllowed為增加的道路屬性“最高時速”。這些概念及屬性的設置為ITS提供了必要的GIS信息的語義映射基礎。
基于SUMO的交通網格決策資源本體集片段程序如下:
〈owl: Class rdf: about=\"http://www.owl-ontologies.com/GeographyOntology. owl#MainStem\"〉
〈rdfs: subClass of rdf:resource:=\"http://www.ontologyportal.org/translations/SUMO.owl#Roadway\"/〉
〈/owl:Class〉
〈owl:Class rdf:about=\"http://www.owl-ontologies.com/GeographyOntology.owl#LateralRoadway\"〉
〈rdfs:subClass of rdf: resource=\"http://www.ontologyportal.org/translations/SUMO.owl#Roadway\"/〉
〈owl:disjointwith〉
〈owl:Class rdf:ID=\"MainStem\"/〉
〈/owl:disjointWith〉
〈/owl:Class〉
〈owl:ObjectProperty rdf: ID=\"maxSpeedAllowed\"〉
〈rdfs: domain rdf: resource=\"http://www.ontologyportal.ogr/translations/SUMO.owl#Roadway\"/〉
〈rdfs: range rdf: resource=\"http://www.ontologyportal.org/translations/WUMO.owl#Measure\"/〉
〈/owl:ObjectProperty〉
〈owl:Class rdf: about=\"http://www.owl-ontologies.com/GeographyOntology.owl#Hospital\"〉
〈rdfs:subClass of rdf:resource=\"http://www.ontologyportal.org/translations/SUMO.owl#Building\"/〉
〈rdfs:comment〉A building which provides medical care to patients.
〈/rdfs:comment〉
〈/owl:Class〉
〈owl:ObjectProperty rdf: ID=\"near\"〉
〈rdfs:domain rdf:resource=\"http://www.ontologyportal.org/translations/SUMO.owl#Building\"/〉
〈rdfs:range rdf:resource=\"http://www.ontologyportal.org/translations/SUMO.owl#Roadway\"/〉
〈/owl:ObjectProperty〉
(b)交通本體(transportation ontology, TO)。該本體提供與交通信息相關的概念與關系,又分為靜態本體和事件本體兩類。其中靜態本體描述固有的、實物性的概念,如車輛、紅綠燈、站臺、乘客等;事件本體則描述臨時的、動作類的概念,如堵車、交通事故、加油等。
(c)多媒體本體(multimedia ontology, MO)。交通視頻數據是智能交通決策支持系統中,用于交通流量預測、交通事故鑒定、交通路徑誘導等高層決策支持的重要數據源。為滿足多媒體語義信息和形象特征信息的整合,本文采用多媒體內容描述接口MPEG-7的概念擴展——基于MPEG-7架構的多媒體本體[9]。MPEG-7是MPEG組織制定的國際標準,它規定了一組能充分有效描述各種多媒體信息的描述器以及它們之間的內在聯系,通過其定義的描述定義語言DDL (description definition language)形成標準化的XML Schema描述,提供了一個通用、靈活、可擴展的多媒體內容描述機制MDS(multimedia description schemes)用于描述多媒體環境中的視覺信息和音頻信息。通過與MPEG-7架構的整合,本文利用所定義的多媒體本體對圖像、圖形、圖片等多媒體文件進行符合交通領域信息(如車禍地點、發生時間、發生車輛等)的語義文字描述,為基于語義文本的交通監控多媒體文件查找提供語義基礎。
(d)交通組織本體(organization ontology,OO)。交通網格決策支持系統的一個重要功能是實現各部門協同工作,因此需要定義各個部門的相互關系與數據權限。本文采用根據中國智能交通系統體系框架建立的交通組織本體,為組織之間的協作提供知識表示,包括交通管理中心、旅客運輸部門、交通信息服務提供商、緊急事件管理部門、基礎設施管理部門、貨物運輸服務提供者、政府執法部門。
4)應用本體層(application ontology) 應用本體是在領域本體的基礎上建立的與具體系統應用相關的概念與關系集合,如車輛診斷維護本體、交通事故處理本體等。單一的應用本體均與一個特定的應用相關聯,可以采用事先定義的方式存儲于本體庫中,也可利用本體編輯工具從領域本體中分離概念進行實時編輯。用戶通過對應用本體中概念的選擇、組合并輸入〈屬性—值〉對描述,完成對特定應用中異構資源的查詢與整合,保證跨子系統應用的實現。
2 交通網格決策本體應用場景
2.1 四層交通決策本體模型的應用范圍
基于SUMO的四層交通決策本體模型為基于網格的智能交通決策支持系統跨領域、多部門的協作奠定了知識基礎,它的應用能夠提供以下傳統ITS所難以提供的非平凡的決策支持功能。
1)基于網格的數據集成 網格平臺運用網絡技術與通信協議為分散在各地、各個ITS子系統之間的異構數據庫提供了一致的數據訪問服務接口。通過網格中間件將遠程異地、異構的數據庫無縫地組織起來,可以建立起網格層次上的統一虛擬數據庫,實現遠程大規模異構數據的物理與結構集成,為分布式大規模數據挖掘提供了平臺支持。
2)基于語義的交通信息集成 通過對虛擬數據庫上數據資源的本體概念化描述,使用語義查詢語句對物理集成的數據資源進行語義查詢與組合。同時,對大規模數據挖掘所得到的數據實例進行基于語義的二次集成,建立信息層次上的相互聯系,為信息的有效共享提供保證。
3)基于語義的交通服務集成 利用對用戶的交通服務請求進行基于本體的服務查找及匹配處理,通過誘導的方式提供與用戶需求相同或相似的交通服務來幫助用戶進行服務的選擇與交通工作流的定義,促進子系統內的服務集成并建立相應的語義案例庫。
4)基于語義的交通應用集成 基于網格的交通決策支持系統是一個跨領域的分布式決策支持系統。組織內各領域子系統通過SUMO這個一致的上層本體基礎進行本體集間的映射,建立共同的知識庫。利用共同知識庫對各系統模塊進行服務封裝和語義描述,提供應用集成的語義服務配置與管理,實現跨領域系統的決策資源共享和協同調度工作。
2.2 基于語義的信息獲取流程
基于語義的交通信息獲取是交通網格信息集成的基礎。采用符合OGSA規范的網格服務作為本體應用的統一操作單元,系統基于本體的信息獲取及關聯應用所涉及的網格服務流程定義如圖2所示。
1)問題提交 用戶利用本體層次模型中應用本體所定義的與系統功能相關聯的概念與屬性對應的Sinica BOW中文詞匯庫進行求解問題的描述。其中問題的描述采用〈屬性—值〉對的形式進行表示,并提交給信息處理服務進行信息獲取。
2)信息處理服務 接收交通網格用戶提供的中文問題參數,并通過對其他服務的調用完成信息獲取功能。
3)翻譯服務 借助Sinica BOW的中英文概念互譯模型對中文決策問題描述信息進行英文化處理。
4)本體服務 對已英文化的決策問題參數進行相關本體文件的獲取及概念的匹配。
5)推理服務 對本體文件中涉及到問題參數的相關概念進行基于知識庫的推理,獲取概念與屬性實例間的約束關系。
6)數據服務 利用本體實例查詢語言結合參數選擇的約束條件對與決策問題參數相關的屬性值進行實例化查詢與匹配,通過本體概念屬性與各異構數據庫字段之間的映射關系獲取決策支持所需要的集成信息。
2.3 交通網格決策本體應用場景舉例
城市交通應急系統是智能交通系統的重要組成部分,其主要功能是處理城市道路交通突發事件,包括重特大交通事故、嚴重的交通堵塞、道路及相鄰區域的治安事件等。城市交通應急處理的過程通常需要多個部門的協同工作和統一調度完成,如公安交警的事故現場保護和應急救援,公安消防的消防救護、化學物品的應急搶救,衛生部門的醫療搶救等。但由于各道路交通事故應急系統分散于多個部門,各部門根據自身應急救援的特點建立了相對獨立的應急系統體系,其信息和資源難以集成與共享,很大程度上限制了城市交通應急系統功效的發揮。利用本文采取的四層本體結構,可以在對遺留系統作很小改動的基礎上,通過本體概念及關系的映射,將參與應急的多個子系統的信息進行有效的集成,最終得到所需要的信息以提供交通應急的決策支持。本文模擬了南方某市公交車輛在某路口發生特大交通事故的場景,其涉及到的部門子系統處理事件包括:
a)公交運營系統。增開公交車輛,就近選擇維修站點進行車輛的拖運及維修。
b)122接處警系統。調用路口監控錄像進行交通事故分析及交通車輛疏導。
c)119火警系統。確定是否需要增派消防提供車輛破拆等方面的幫助。
d)醫療急救系統。通過醫院位置、醫護人員、設備要求、當前醫療能力等信息選擇就近醫院進行事故人員搶救。
e)交通誘導系統。通過交通誘導減少車禍發生路段的車堵情況。
圖3表示了基于本體的公交車禍處理實例中部分信息集成后的相互關系。其中,TO:trafficAccident通過TO:happensWhen與車禍發生時間關聯,通過TO:happensWhere與車禍發生地點關聯;MO:camera通過TO:locationAt與車禍地點關聯,以提供交通監控視頻信息;GO:hospital與GO:garage則通過GO:near與車禍發生地點相關聯,以提供最近醫院和維修點信息。
用戶采用2.2節提出的基于本體的信息獲取流程,首先選擇交通事故處理本體并利用用戶界面進行概念屬性的關聯,建立起實例的事故處理信息模型,如通過“鄰接”屬性關聯事故點位置與醫院、交警、火警、修理廠等,利用“攝制”屬性表示事故與事故圖片的關聯關系;其次,對構建的事故處理信息模型進行已有信息〈屬性—值〉對的初始化,包括事故點位置、事故損失情況、事故情形、事故環境等,并提交給信息處理服務進行信息處理;信息處理服務調用其他內部服務進行實例信息的獲取;最后,參考知識庫、規則庫中對交通事故處理中相關問題的約束條件,如對事故人員傷亡所需醫療設施、醫療能力等信息的篩選條件,通過權重設置對最終查詢所涉及的實例化信息進行排序,選出最優的事故處理方案供用戶使用。相應的,也可根據信息對預案庫及案例庫進行基于語義的匹配與查找得到交通誘導方案支持。
3 結束語
本文闡述了在ITS系統中引入基于網格的資源共享與協同調度平臺和基于本體的資源表示與描述方法的重要性,分析了目前交通本體構建及應用方法的不足,提出了基于SUMO的交通網格決策本體層次模型。通過引入通用上層本體SUMO,構建了具有中英文對照及豐富詞匯基礎的交通網格決策資源本體集,解決了傳統本體構建方法所造成的本體集成難度高、耗時久、不支持中文推理的問題。該框架具有良好的開放性和適用性,使得交通網格環境下分布式異構交通信息的訪問和集成成為可能,也為網格環境下其他領域本體模型的構建提供了方法指導。
下階段筆者將重心放到交通決策本體集的應用研究上,如基于本體的交通網格服務體系結構設計、基于本體的交通網格的案例表示與查詢推理、基于本體的交通網格工作流設計等研究課題上,完善基于本體的交通網格系統結構與運作機理。
參考文獻:
[1]“九五”國家重點科技攻關項目《中國智能運輸系統體系框架》專題組.中國智能運輸系統體系框架[M].北京:人民交通出版社,2003:10-22.
[2]黃珂萍,蔣昌俊.基于本體的城市交通的知識分析和推理[J].計算機科學,2007,34(3):192-196.
[3]劉衛寧,朱怡.ITS虛擬共用信息平臺的數據集成包裝器[J].計算機工程與設計,2006,27(22):4197-4200.
[4]李陽,翟軍,陳燕.用本體實現智能交通系統的語義集成[J].信息技術,2005,29(6):10-13.
[5]馬金素,陳毛狗,袁捷.基于本體的問題求解模型在CSP中應用的研究[J].計算機應用與軟件, 2006,23(10): 60-61, 70.
[6]PEASE A, NILES I, LI J. The suggested upper merged ontology: a large ontology for the semantic Web and its applications[C]//Proc of Working Notes of the AAAI-2002 Workshop on Ontology and the Semantic Web. Edmonton, Comada: [s. n.],2002.
[7]WordNet[EB/OL].(2004-12-18) [2007-10-20]. http://www.cogsci.princeton.edu/~wn.
[8]HUANG Chu-ren, CHANG Ru-yng, LEE Shang-bin. Sinica BOW (bilingual ontological WordNet): integration of bilingual WordNet and SUMO[C]//Proc of the 4th International Conference on Language Resources and Evaluation(LREC2004). Lisbon Portugal: [s. n.], 2004:26-28.
[9]TSINARAKI C, POLYOROS P, CHRISTODOULAKIS S. Interoperability support between MPEG-7/21 and OWL in DS-MIRF[J]. IEEE Trans on Knowledge and Data Engineering, 2006, 19(2): 219-232.