毛淑賢 朱桂鳳
摘 要:語義網格使互聯網上日益膨脹的信息資源實現共享,通過協同工作和共享能力,為用戶提供功能強大的一站式服務。為了更加清楚地認識語義網格作為一種新的資源管理技術的應用歸納整理了語義網格的相關研究內容。通過分析目前在語義網格已取得的研究成果,介紹語義網格的基本概念,梳理語義網格的核心技術,分析語義網格的框架及其研究內容,初步分析得出語義網格技術的發展趨勢。
關鍵詞:網格計算;語義網格;Web服務;資源管理
中圖分類號:TP393
0 引 言
資源的有效管理是計算機和網絡有效工作的基礎。建立適用于互聯網環境的語義數據模型,實現有效信息、知識的服務共享和管理的一條重要途徑,語義網格是面向語義的智能互聯應用環境,它需要建立一套新的理論和方法實現對地理分布不同的各種網絡資源進行規范和靈活的組織,實現網絡資源的有效共享和智能利用。
語義網格是在Web技術和網格計算技術發展的基礎上發展而來的,具備智能性、協作性和可靠性等特點,使其逐步成為網格研究的一個新興熱點。國外已經開展了多項關于語義網格的項目研究工作,已建立了100余個試驗項目,如myGrid,WSMO,GEODISE,DartGrid等。近年來,我國也非常重視這方面的研究工作,國內的中國科院計算所、清華大學、國防科技大學等研究單位也對語義網格和網格計算開展了大量研究工作,相關課題進行開展并取得一定的研究成果。語義網格的諸多優勢使其具備廣闊的發展前景,相關研究成果必將推動網格、互聯網等技術的迅速發展。
1 語義網格的基本概念
2001年,David De Roure等人首次使用了語義網格(Semantic Grid)概念,將未來e[CD*2]Science的基礎研究稱為語義網格。語義網格被描述為一個支持全球范圍內,靈活協作與計算的高度自動化開放系統。語義網格概念的提出結合了語義 Web、 網格和 Web服務的優點并彌補了彼此的不足。全球網格論壇成立了語義網格研究組來提供對語義網格的支持,研究把語義網技術應用到網格問題中,把語義網格定義為當前網格的延伸,因為信息和服務有了清晰明了的含義,人與計算機能夠更好地合作[3]。在該定義里,著重描述信息和服務的概念,也基本上規劃了語義網格的發展方向,是以信息和服務為主體,人和計算機更好的合作,不僅作為途徑,也是語義網格發展的中間產物。計算機只有具有更高的靈活性和協作性,才能更快地實現與人的無縫合作,達到信息服務目的。由于語義網格是一個基于網格技術和語義網發展起來的,針對的描述對象領域范圍很大,包括對象、服務、過程、資源、能力等。
從根本上看,語義網格實現了網格和語義網融合的優勢。當前網格缺乏機器可讀可理解的數據語義,缺乏人和機器的合作支撐,機器難以處理異構資源,難以聯合、再利用信息,難以靈活協作、高度易用和無縫自動化,難以根據用戶的需求自動地生產知識。而語義網雖然實現了計算機可理解的數據語義問題,但難以實現互聯網上各種資源(包括硬件和軟件資源)的共享,難以滿足日益增長的計算需求。
圖1表明了Web、網格、語義網和語義網格的關系[4],橫軸用數據和計算能力表示網格的發展方向,縱軸用互操作性能表示語義網的發展方向。可以認為,Web是網格的基礎,Web加上數據和計算能力,則可逐步發展為網格;另一方面,Web(或網格)加上語義能力(豐富的互操作性)即可實現語義Web。語義網格則是Web結合計算和語義能力的最終產物。所以,它具備語義Web和網格的優點,實現二者的結合應用。
2 語義網格的核心技術
語義網格的關鍵之處是把作為一個分布式數據存儲的Web的當前結構,轉化成可以被基于計算機實體理解的信息存儲結構。這里從互聯網的自然特性、人類社會對互聯網應用的需求、信息科學和互聯網本身的進化需求所產生的科學問題出發,介紹新一代互聯網應用平臺的關鍵理論和技術[3,5[CD*2]8]。
(1) 元數據。
元數據是用于描述數據的數據,包含語義和它所涉及數據的解釋,是對語義網格上信息的┮恢知描述方式。這種描述方式使得信息變成計算機可以理解的信息。為了把數據轉換為信息,元數據必須加入到上下文環境中。元數據和本體對語義web的發展是關鍵的。語義網格使用元數據來描述網格中的信息。將信息轉化為一些更有意義的東西,而不只是一個數據集合,這意味著需要正確理解數據的內容、格式和重要性。語義Web就遵循這種模型,即提供其他一些元數據來幫助描述在Web頁面上顯示的信息,這樣瀏覽器、應用程序和用戶就能夠更好地決定如何處理數據。
(2) 本體和本體庫。
本體是一個概念性的描述,共享概念模型的形式化規范說明,目標是獲取、描述和表示相關領域的知識,提供對該領域知識的共同理解,確定該領域內共同認可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術語)和詞匯間相互關系的明確定義。本體也是一個概念性的規范,該規范的本質是在知識和Web工程的上下文空間中通過語義含義提供一個清晰的表達。與模式語言形成對比,例如XML模式,本體試圖用原始的知識表述捕獲研究領域的語義,使得計算機能完全或部分理解一個領域中的概念之間的關系。本體為域提供┮桓霆通用詞匯,并定義屬于的含義和它們之間的關系。本體指的是對一些感興趣領域的┮桓霆共享理解,經常被構思為一個類(概念)、關系、功能、原理和實例的集合。在本體中的概念通常用分類法組織。
本體庫的概念對于取得表達能力是很必要的,在用知識進行建模和推理的過程中需要這種能力。總的來說,一個本體庫決定了術語的外延和它們之間的關系。本體庫的好處是改進了在系統之間的通信,這些系統可以是機器、用戶或者組織。它們的目標就是建立一個一致的,可能是規范的模型。本體庫的另外一個好處是可互操作性,一個本體庫可以作為一種國際語,它可以推動內容的重用,確保給出一個清晰的規范來表達內容或者服務是關于什么的,增加內容和服務被成功集成的機會。可以說,本體庫提供了內容的通信、集成和共享的基礎。但是它們還可以提供更多的便利,它可以通過去除模糊性和指出相關術語,或者通過建立從頁面得到的信息與其他信息建立聯系,來改進搜索準確性。還有,互聯網推理系統開始出現,它可以通過從現有的信息中抽取和產生注釋來開發本體庫。
(3) Web 服務。
開放性網格服務架構(Open Grid Services Architecture,OGSA)以網格服務為中心的架構,非常有利于構建語義網格環境。在OGSA網格體系結構中,由于網格環境中所有的組件都是虛擬的,因此通過提供一組相對統一的核心接口,所有的網格服務都基于這些接口實現,就可以很容易構造出具有層次結構的、更高級別的服務。
(4) 語義Web服務。
現有的Web服務圍繞著UDDI,WSDL和SOAP,提供了有限的機制來實現服務的發現、配置、組合和自動協商,這對服務的調用來說抽象層次較低。語義服務的目標是通過提升服務的描述,來指明服務的能力和任務完成的特性,使得在同一語義空間下的服務更容易整合。
(5) 管理資源。
規范組織是管理資源的有效方法,但互聯網應用要求自組織性。因此,如何諧調規范性和自組織性是互聯網時代資源組織的關鍵問題。通過定義一套語義空間的范式來規范重構各種網絡資源并與對等網絡技術相結合,使動態網絡環境下的無序資源規范化,使資源操作準確、方便,以實現有效的資源共享。
(6) 語義互聯。
如何實現分布在全球的各種網絡資源在語義層上互聯,消除資源語義孤島。通過簡潔的方式從資源空間映射到語義空間,實現異構資源在語義層的互聯,通過與資源空間模型相結合,形成單一語義映像,使得各種資源在簡潔的語義空間中得到統一和互聯。
3 語義網格的框架
現在,隨著Internet的發展,Web網頁的快速膨脹,面對越來越多的信息,人們無法通過互聯網來獲得最有效的資源或者無法獲得資源,或者被過多的引用占用。作為解決這一問題的語義網格,它被描述為┮恢知開放的、面向服務的體系結構。從面向服務的觀點來看,語義網格可劃分為4個服務層次:基本服務、數據服務、信息服務和知識服務。其中,基礎服務主要涉及到分布式資源的共享,包括對資源的分配、配置和重組等;數據服務主要針對共享資源計算和分析,這個層次提供的服務與數據存儲、元數據管理、數據復制和數據傳輸有關;信息服務允許同意訪問各種各樣的信息源,并且提供運行在分布式計算資源上的通用服務;知識服務集中在知識表述和抽取上,支持用戶能隨時表述和存儲它生成的有用的知識,并能方便地從分布在互聯網上的知識倉庫中獲取摘要的知識,來解決遇到的問題。隨著因特網用戶的增多,互聯網上的知識資源能夠迅速積累并發展為整個互聯網團體可以通用的知識財產。在語義網格中,知識層的目標就是作為一個支持科學知識的管理和應用程序的基礎設施,達到特定的目的和目標。總的來說,每個層次都是想要提供適應不同應用的服務。
更深層次的劃分,語義網格框架的表示如圖3所示。隨著網格的發展和語義網格概念的提出,語義網技術不僅在知識層起作用,而且滲透到整個語義網格架構中。語義網格以OGSA和WSRF(Web Services Resource Framework,Web 服務資源框架)為基礎,采用面向服務的結構,提供基本網格服務,語義網格服務,包括以此為基礎的知識網格,提供高級網格應用的接口。語義網格服務可提供知識服務,基于知識的信息服務,基于知識的數據計算服務。語義網格提供了更高級的知識共享和管理平臺,使數據挖掘、文本挖掘等變得更為容易。語義網格在網格中間件和知識網格,高級網格應用間實現了機器的語義理解,為整個網格系統的語義互聯提供了強有力的支撐。語義網格不僅能提供數據計算服務和信息服務,而且引入知識層處理,提供知識的獲取、使用、檢索、發布等知識服務,體現了下一代網格的特點。
4 語義網格的研究內容
語義網格的研究重點是用語義和知識工程的方法來解決目前網格平臺建設和應用中存在的各種問題。其研究內容可以概括為以下幾個方面:
(1) 知識模型。
知識模型將描述系統的知識和推理需求,包括領域知識、推理知識和任務知識。研究元數據,目前的元數據設施已經以RDF的形式存在,┙一步工作研究支持本體設計和運用的方法和工具,注釋工具和方法;研究本體語言的邏輯框架;研究語義網格環境下表示本體的恰當的建模原語集,以及基于本體的推理機制;研究語義網格本體語言及其語義框架。
(2) 通信模型。
通信模型主要描述系統之間或系統與用戶之間的需求和接口。
(3) 知識獲取。
研究適合海量、異構、不完全、半結構化數據挖掘的有效方法和算法;研究基于語義網格本體的知識發現理論和算法,在核心本體的支持下有效地把信息轉化為知識,識別與理解網格信息;研究網格信息自動分類、摘要和領域本體自動、半自動生成等技術。
(4) 知識組織。
研究內容的可視化技術和方法,如何通過概念語義空間進行知識組織,以期獲得快速檢索和高的查準率。
(5) 服務管理。
面向用戶服務的模式和協議,研究網格服務的發布、發現和服務路由機制和算法,尤其是滿足服務質量要求的網格服務的發布、發現和服務路由機制和算法。
5 語義網格的未來
語義網格不僅要融合語義網、Web服務和網格┤者的技術,而且自身還要進一步發展,所以,現在還處于不斷發展中,有很多地方需要改善和完善。主要有分布式資源內容收集,各種媒體內容及格式的引用和轉化;對資源的計算、分享方式的智能化方法以及提高數據交換速度擴展;計算機通用服務安全信任流程、方法和技術的問題;使用內容的數字產權管理問題;語義多元化的體系結構與網格技術的融合;設計與設置問題,所有用戶都應易于使用從設計、發展、配置、運作、維持到重復利用整個生命周期的網格基礎架構和應用。
6 結 語
語義網格致力于建立一種基于網格、語義網和Web服務多種技術的環境,它融合三者的優點,避免┤者各自獨立發展的限制。把信息共享和服務作為發展方向使其成為網格研究的熱點,它的研究必將進一步推動網格、互聯網的發展以及其他領域,如生命科學和智能交通系統,城市交通指揮系統等的應用[12]。語義網格體現了多種技術融合的趨勢,表明了下一代網格的發展方向應該是為所有人服務的一種網格。從目前的現狀來看,語義網格已成為網格研究的一個熱點,它使全球的網絡資源在語義上進行連通,更好的為經濟、科技、能源、社會保障等眾多領域服務。
參 考 文 獻
[1]諸葛海.語義網格的基礎理論、模型與方法研究進展[J].中國基礎科學,2007(6):27[CD*2]29.[LL]
[2]http://www.semanticgird.org/v1.9/semagid.pdf.2004.
[3]http://www.semanticgrid.org,20080405.
[4]李明生.語義網格:語義網技術和網格的結合[J].情報技術,2005(10):46[CD*2]48.
[5]Zhuge H,Shi X.Toward the Eco[CD*2]grid:A Harmoniously 〦volved Interconnection Environment[J].Communications of the ACM,2004,47(9):79[CD*2]83.
[6]Zhuge H.Semantic Grid:Scientific Issues,Infrastructure and Methodology[J].Communications of the ACM,2005,48 (4):117[CD*2]119.
[7]Zhuge H.The Future Interconnection Environment[J].IEEE Computer,2005,38 (4):27[CD*2]33.
[8]Zhuge H.Autonomous Semantic Link Net Working Model for the Knowledge Grid[J].Concurrency and Computation:Practice and Experience,2007,7 (19):1 065[CD*2]1 085.
[9]黃運濤,丁穎.語義網格核心技術及其應用研究[J].福建電腦,2007(12):27[CD*2]28.
[10]http://www.globus.org/research/papers/ogsa.pdf,20020622.
[11]http://www.Semanticgrid.org/documents/semgrid2004/semgrid2004.html,20080905.
[12]吳朝暉,陳華鈞.語義網格:模型、方法與應用[M].杭州:浙江大學出版社,2008.
作者簡介 毛淑賢 女,1968年出生,廣東人,工程師。研究方向為計算機硬件和軟件設計。