999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

對語義網格及其在數字圖書館信息檢索中應用的探討

2009-04-29 00:00:00
現代情報 2009年1期

〔摘 要〕本文在對語義網及網格技術進行簡要介紹、分析的基礎上,提出了語義網格環境下數字圖書館信息檢索模型,并詳細闡述用戶獲取信息的過程。在文章的結尾,還就相關研究的發展方向進行展望。

〔關鍵詞〕語義網;網格技術;數字圖書館

〔中圖分類號〕G250.76 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)01-0068-05

Research on Semantic Grid and its Application in the Information Retrievial of Digital Library

Gu Qi

(Library,Henan University of Science and Technology,Luoyang 471003,China)

〔Abstract〕Based on the brief introduction and analysis of semantic web and grid technology,this paper put forward a digital library conceptual model under the semantic grid environment,at the same time,explored the acquisition process of information in detail.Finally,the development direction of correlated research work was also prospected.

〔Key words〕semantic web;grid technology;digital library

數字圖書館在快速發展的同時,其種種缺陷也逐漸暴露,如檢索服務器智能化程度低、返回大量無關結果,不同系統之間互操作困難、資源難于共享、形成一個個信息孤島等問題。這是因為,大部分網頁上的內容設計是供人閱讀的,并不能使機器理解。利用HTML語言,計算機雖能熟練地解析網頁的版面,知道哪里是標題,哪里有與其他頁面的鏈接,但卻無法理解網頁內容,如無法區別人名和地名等,因為沒有可靠的方法來處理其中的語義。于是出現了把語義網和網格技術應用到數字圖書館建設的動向。語義網在數字圖書館中的應用,可對信息資源進行語義標注,提供基于語義的資源瀏覽與檢索。而在數字圖書館中應用網格技術,則為整合分布、異構、自治的數字資源,實現對資源的透明調用提供了可能。但從數字圖書館要求基于語義的資源整合來看,上述兩種技術各有其局限性[1]

網格雖為我們描繪了一幅誘人的藍圖,即遍布世界各地的資源都可“即插即用”。但現實情況與目標存在較大差距,實現網格的目標并不容易,網格還面臨著許多問題和挑戰。當前網格缺乏機器可讀可理解的數據語義,缺乏人和機器很好地合作的支撐,機器難以處理異構資源,難以聯合、再利用信息,難以靈活協作、高度易用和無縫自動化,難以根據用戶的需求自動地生產知識。而語義網雖然實現了計算機可理解的數據語義問題,但難以實現互聯網上各種資源(包括硬件和軟件資源) 的共享,難以滿足日益增長的計算需求[2]

數字圖書館需要一個新型的技術基礎,這個基礎應充分支持虛擬資源體系在語義層面上的集成,充分支持語義描述,為實現虛擬資源體系的語義導航、語義查詢以及推理機提供可行性,于是語義網格的概念被提出。

1 語義網的基本概念

1.1 語義網的體系結構

2001年,Tim Berners-Lee提出語義網的概念[3],其出發點是通過改變現有互聯網依靠文字信息來共享資源的模式,利用本體來描述語義信息,達到語義級的共享。語義網構建于自定義標記的XML和數據表示靈活的RDF之上。其層次結構如圖1[4]

①Unicode和URI層,是整個語義Web的基礎。Unicode處理資源的編碼,保證所使用的是國際通用字符集。URI負責標識語義網上所有的對象和資源,為精確的信息檢索提供基礎。

②XML+Name Space+ Xml Schema,XML層具有名稱空間(Name Space)和XML Schema,XML置標語言將網上資源信息的結構、內容與表現形式相分離,可確保語義網的定義,并支持與其他基于XML的標準進行無縫集成。XML讓每個人都能通過自己創建的標簽,來對網頁或頁面的部分文字進行注釋。腳本,或者說是程序,可以將這些標簽運用到復雜的應用中。

③RDF+RDF Schema,該層用于描述Web上的資源及其類型,為網上資源描述提供了一種通用框架,也為實現數據集成提供了一個元數據解決方案。

RDF是W3C提出的一個基于XML的數據模型,采用獨特的“資源——屬性——值”的三元組結構來描述互聯網資源特性及其關系。通過這個抽象的數據模型,RDF為定義和使用元數據建立了一個框架,元數據的元素可看成元數據所描述的資源的屬性,由此人們就可以利用RDF來解讀所引用的元數據。通過這種通用的框架,RDF可以描述Web上的各種資源,真正做到了以不變應萬變。

由于對不同資源的描述需要采取不同的詞匯表,RDF并沒有定義描述資源所用的詞匯表,而是定義了一些規則,這些規則是各領域和應用定義用于描述資源的詞匯表時必須遵循的。RDF也提供了描述資源時具有基礎性的詞匯表,這就是RDFS,RDF可以依據這些詞匯來描述資源[5]。如果最底層的URI標識了網上的對象,那么RDF和RDFS層則可對URI標識的對象進行陳述,支持有類型的資源與鏈接的類型。

④Ontology(即本體),是語義網的核心層,用于揭示資源本身以及資源之間更為復雜和豐富的語義信息,避免“一詞多意”或“多詞一意”,使網上的信息具有計算機可理解的語義。本體的目標是獲取、描述和表示相關領域的知識,提供對該領域知識的共同理解,確定該領域內共同認可的詞匯,并從不同層次的形式化模式上,給出這些詞匯與詞匯間相互關系的明確定義。

⑤邏輯層,在上述4層的基礎上進行邏輯推理操作。

⑥驗證層,根據邏輯陳述進行驗證以得出結論。

⑦信任層,用于在用戶間建立信任關系。

其中,第②、③、④層是語義網的關鍵層,用于表示Web信息的語義,也是現在語義Web研究的熱點所在。

1.2 語義網的形式化描述語言

語義網需要專門的描述語言對Web文檔中的術語含義進行形式化描述,大量的研究工作者活躍在該領域,因此誕生了許多種本體描述語言,如RDF、DAML、OIL、OWL等,它們的演進關系如圖2。

W3C提出的本體語言棧如3所示,OWL處于最上層,它是在總結幾種語言開發經驗的基礎上由W3C于2004年2月正式推出,是語義網發展過程中的一個重要里程碑,經過廣泛的討論并已得到一致認可。

在此語言棧中,XML是結構化文檔的表層語法,它對文檔沒有任何語義約束,XML Schema是定義XML文檔的結構約束的語言;RDF是描述對象以及它們之間關系的數據模型,并為數據模型提供了簡單的語義,這些數據模型能夠用XML進行表達,RDF Schema是描述資源的屬性和類型的詞匯表,并提供對這些屬性和類型的普遍層次的語義。RDFS在RDF的基礎上提供了更多建模原語用于元數據定義,這些原語對進一步構造本體有一定作用。事實上,RDFS所構造的元數據已經是一種輕型的本體知識,不過RDFS的功能仍然很有限。為了構造更加完備的本體信息以支持自動推理,就需要更加完備的本體描述語言。OWL就是在這種需求下出現的,它在RDF和RDFS的基礎上通過增加更多建模原語來描述特性、類,以及它們之間的關系,并針對特性提供了更加豐富的類型定義和屬性描述[6]

總而言之,在語義網中,XML、RDF和本體將網絡的作用發揮到極至,網絡中的數據、軟件均是資源,它們將自動被計算機理解,自動化處理、集成、共享和重用,并由機器根據用戶需求確定連接方式,從而支持智能軟件代理Agent對WWW上異構、分布信息的有效檢索和訪問,實現網上信息資源在語義層上的全方位互聯,并在此基礎上,實現更高層的基于知識的智能應用。

2 網格技術概況

眾所周知,利用網關、網橋、路由器和光纖、電纜等基礎設施,傳統因特網實現了計算機硬件的連通;利用HTTP、URI等協議,因特網進一步升級,實現了網頁的連通。而網格不僅可以連通計算機和網頁,還將各種信息資源,如數據庫、軟件以及各種信息獲取設備都連接成一個整體,整個網絡如同一臺巨大無比的計算機,向每個用戶提供包括計算能力、數據存儲能力以及各種應用工具等一體化的透明服務。它強調的是全面地共享資源、全面地應用服務。那么,究竟什么是網格呢?

簡單的講,網格就是利用互聯網把分散在不同地理位置上的多個資源全面連通,建立邏輯關系,并進行統一管理、協調分配,組成一臺“虛擬的超級計算機”。這臺機器把每臺參與其中的計算機都作為自己的一個“節點”,成千上萬個這樣的“節點”并聯起來,就組成了“一張有超級計算能力的網格”。網格計算模式首先把要計算的數據分割,然后,不同節點的計算機依自己的處理能力下載一個或多個數據片斷。當用戶不使用本節點的計算機時,其閑置的計算能力就會被調用。這樣,每一位將自己的計算機連接到網格上的用戶,都可隨時隨地調用其中的計算和信息資源,在獲得一體化信息服務的同時,最大程度地實現資源共享[7]

作為一種新興的技術,網格的優勢不僅在于超強的數據處理能力,而且還在于利用網上的閑置處理能力來節約計算成本,實現資源的共享,消除資源孤島。網格的研究開發工作已受到許多國家的重視,然而遺憾的是,到目前為止,國際上還沒對其確切含義及外延達成共識,也沒有什么約定的標準。盡管如此,其關注的問題卻很明確,即如何有效安全地管理和共享連接到Internet上的各種資源,并提供相應的服務[8]

3 語義網格及其在數字圖書館信息檢索中的應用

語義網格是語義Web和網格相結合產生的新研究領域,最初的提出是為了加速e-Science的發展。e-Science最大的要求是知識共享,需要跨越不同機構、國家和學科來進行聯合的實驗、使用遠程昂貴的科學設備、交換信息和思想。網格本身致力于資源共享,但卻因信息格式異構,語義的多重性以及關系的匱乏等問題無法滿足要求。要達到e-Science所設想的高度易用性和無縫自動化,必須實現盡量多的機器可處理性和盡量少的人類介入,這卻和語義Web的目標有一些相似,于是David De Roure等學者2001年在《Research Agenda for the Semantic Grid:A Future e-Science Infrastructure》中第一次提出了語義網格(Semantic Grid)概念,并把語義網格作為未來e-Science的基礎架構[9]。此后,OGSA的提出,給語義網格的發展注入了新的活力,使語義網技術應用于網格變得更為簡單。語義網格研究小組(Global Grid Forum Semantic Grid Research Group,簡稱SEM-GRG)的成立,也為語義網格的發展提供大力支持,該研究組仿照語義網的定義,提出:語義網格是當前網格的延伸,因為信息和服務有了清晰明了的含義,人與計算機能夠更好地合作[10]。在這個定義里,有清晰含義的是信息和服務,表明語義網格研究的語義的對象包括信息和服務。它把所有的資源,包括服務,都用一種機器可理解、可處理的方式來描述,實現語義的互操作性[11]。其本質就是通過更好的形式化描述網格上的信息來解決語義問題,以使計算機盡可能取代人在網格上進行信息處理,通俗講就是讓傳統網格更智能化,從而讓其他的深層次應用,如數字圖書館等智能化服務在網格上開展成為可能。

語義網格主要解決3個方面的問題[12]:規范組織,即提出資源空間模型及規范化組織管理的理論、方法、技術和工具,使各種無序資源(信息、知識和服務)規范化組織,從而使用戶能正確有效地操作各種資源,提高使用效率;語義互聯,即通過多層語義互聯和單一語義映像,使分布在全球的各種網絡資源在語義層上互聯,消除資源孤島;智能聚合,主要通過軟設備來解決資源間的互操作,使各種資源能根據用戶的需求有效、動態、智能地聚合。

總而言之,網格是Web在計算能力上的提升,而語義網格是網格在語義能力上的擴展;從另一個角度說,語義Web是在現有Web上增強了語義能力,而語義網格是語義Web對計算能力的擴展。語義網格集成了語義Web的機器可閱讀能力和網格強大的計算能力,能更好的幫助數字圖書館為用戶提供優質信息檢索服務。

語義網格的研究在國內外已陸續開展起來,特別是英國的e-Science計劃,已建立了100余個試驗型項目,是語義網格的典型代表。美國、歐盟一些國家也相繼開展了語義網格項目研究工作,并取得了階段性進展。我國也很重視這方面的研究工作,2004年9月科技部批準了國家重點基礎研究計劃(簡稱973計劃):“語義網格的基礎理論、模型與方法研究”。

3.1 基于語義網格的數字圖書館的結構模型

基于Web的數字圖書館屬于技術主導型,凸顯各種關鍵技術;基于網格的數字圖書館屬于資源主導型,凸顯分布式異構資源的整合;基于語義Web的數字圖書館屬于服務主導型,凸顯服務的集成與共享,并在一定程度上使服務增值[13];基于語義網格的數字圖書館則融合了語義Web功能與網格結構體系,在實現資源集成的同時,也凸顯數據計算能力。語義網格技術的應用可以為數字圖書館構建一個良好的中間環境,一方面能形式化地描述知識,使機器理解語義,另一方面使知識實現負載平衡與松散耦合,進而有效地與服務和用戶整合。

如圖4所示,基于語義網格的數字圖書館由4層組成,分別為分布式資源層,網格服務層、語義服務層和知識服務層。

分布式資源是數字圖書館的最底層,也是數字圖書館得以展開各種智能化服務的生命之源,涵蓋了數字圖書館中類型、內容各異的館藏資源,這些資源通過網格服務層虛擬地整合在一起。

網格服務層負責資源的整合、管理、調度和計算,采用開放網格服務結構(Open Grid Services Architecture,OGSA) 實現計算服務、數據服務、信息服務的共享,并為上層提供應用接口,具體包含計算服務層(如資源發現與分配、資源監控、用戶認證、任務調度或合作調度、容錯處理等)、數據服務層(如數據存儲管理、元數據管理、數據回復和傳遞管理等)和信息服務層(為用戶提供一個統一的服務接口,使各種異構數據資源能夠相互訪問)。具體來說,其構成如圖5。各種資源分布在資源層中,采集節點負責對描述資源內容的元數據進行采集,元數據收集和傳輸服務機制把所采集的全部元數據進行整合,并按照一定的規則和機制,將這些元數據分別存儲在各個檢索服務器節點中,索引器負責對服務器上的元數據進行索引管理,并定期對新增的元數據進行索引更新。檢索節點為用戶檢索提供接口,將收到檢索請求分發到服務器節點,并執行檢索,經調度服務排序后,再將檢索結果返回。調度服務存儲有包含數據提供者列表的配置文件,依照此配置文件,系統向任務節點分配任務,任務完成后還要記錄節點和信息資源的參數,以便為新的任務分配提供參考[14]

語義服務層則是根據領域本體中的知識,從語義層面對這些虛擬的資源進行整合。作為語義網格的核心層,該層使用本體和元數據描述信息,按照計算機理解的格式表示知識,可提供多種服務,如數據/計算服務,處理計算資源的分配、調度并選擇執行的方式,可快速傳送網絡數據;信息服務,處理被描述、存儲、接收、共享及保留的信息;知識服務,處理知識獲得、使用、檢索、發布以及維護的方式。這里的知識是指應用于實現目標、解決問題或做出決定的信息[15]。值得注意的是,本體作為一種能在語義上描述信息系統的概念模型,可以把各類元數據方案聯系成一個立體的知識網絡,并能使資源按照知識網絡中的不同屬性,或同一種屬性的不同編碼體系,呈現出規范有序的知識地圖。它還可以通過某些標準的開放的元數據接口,或提供某些可供格式轉換的映射表,向某些登記系統(如UDDI)進行注冊,來達到更大范圍的互操作。

知識服務層則通過文本挖掘、數據挖掘等方法,實現知識服務,并通過接口與高級網格應用互聯,為用戶提供各種服務。通過知識服務層,用戶的查詢請求可到達模型的本體部分,本體利用元數據和語義視圖組件對其進行解析,形成具有語義的表達式后,再與語義空間內的數字資源進行匹配,然后依據系統所提供的計算資源、存儲資源等參數信息,將最終結果返回給用戶[16]

3.2 語義網格環境下用戶獲取信息的基本過程

在語義網格環境下,數字圖書館的各個節點上有類型、內容各異的信息資源,其發布過程可簡單概括為以下幾步:

3.2.1 通過信息資源發現機制尋找到數字圖書館所需的信息資源

發現機制分主動發現和被動發現,主動發現是基于用戶的需求進行,被動發現是基于系統默認的規則進行,即根據數據提供者所描述信息資源的屬性狀態值,選擇合適的資源。系統所管理的是可擴展的有限多個數據庫和節點,除了特定的情況下需要工作人員的參與,其增加和擴充一般是通過被動發現信息資源機制完成的。

3.2.2 通過索引機制對所選信息進行描述、索引和命名,然后將索引信息匯總到索引中心

在各節點中,構成網格系統的計算機因在體系結構,操作系統、數據庫管理系統及元數據模式等多個方面均存在異構,所以,必須對新加入的信息資源重新命名,這樣,用戶在不知道資源所屬數據庫或節點的情況下,也可以下載使用信息。

3.2.3 通過信息資源發布機制把檢索結果呈現給用戶

檢索時,當用戶發出檢索請求后,系統將根據用戶請求在索引中心內查找匹配的索引,然后追根溯源,找到信息資源所在的網格節點。找到節點后,系統便根據節點和資源的狀態信息參數進行信息資源預置(信息資源預置通常用來保證對多個信息資源的并發存取,其作用類似于一個記錄器,記錄所需信息目前的狀態,以確保被順利傳輸)。接著進行狀態估計,即依據信息資源當前狀態和傳送時間等參數為任務調度提供參考信息。最后通過任務調度環節,確定任務執行的相關順序,以確保把檢索結果提交給用戶[17]

4 結 語

基于語義網格的數字圖書館平臺,以不同領域本體互操作組成的知識空間、分布式的網絡和計算環境作為技術支持和應用基礎,可對海量的、多媒體的信息資源在語義層面上進行組織、存儲和發布,可提供分布式數字資源松散耦合與集中管理,能解決數字圖書館中某些復雜的和計算密集型的服務,能提高機器的閱讀能力、實現人機之間良好溝通,能實現用戶基于語義的資源利用、推動用戶之間的協作和數據共享,還可以針對不同需求的用戶群體提供主動的、個性化的信息服務。因此,語義網格技術的應用將是數字圖書館信息檢索的發展方向。隨著語義網格的概念和相關技術的日趨成熟,語義網格技術將更加全面的應用于數字圖書館。

盡管如此,到目前為止,語義網、網格和Web服務都還不夠成熟,還處在不斷發展中。語義網格作為全新的概念,既要良好融合、兼容三者的最新技術,還要注意自身各方面的進一步發展,前進的道路將充滿挑戰。

今后主要的研究內容包括:①語義網基礎理論的研究,如本體描述語言、本體自學習技術、本體互操作等。在語義網中,本體起著非常重要的作用。但目前許多本體仍處在非形式化階段,只提供了領域術語的自然語言描述。這種本體只能用于幫助人與人之間的交互和相互理解,不能被計算機所處理。此外,大多數領域本體都是由手工開發的,缺乏有效的本體管理工具和評價工具。所創建的領域本體是否完全反映出特定領域的概念、領域本體中各種概念是否一致、在本體重用時是否會產生沖突、不同本體之間如何互操作等等,都需要進一步的研究。②網格基礎理論研究,如自動化虛擬組織的創建和管理,需要發展怎樣的通用模型和機制以適合虛擬組織的運作;如服務的協商和協議,研究適合網格系統的協議類型,可利用智能代理進行協商,以互操作方式達成協議;如普適計算,怎么使一切能聯上互聯網的計算裝置都可無縫鏈接并透明地訪問網格;如內容的處理和長期保存,網格系統如何處理各種各樣的媒體內容,并使內容能自動化長期保存等等。③語義Web與網格的融合研究,如在OGSA 基礎上融合了語義網技術的語義網格體系結構是否要變化,怎樣變化等等。

參考文獻

[1]畢強,牟冬梅.語義網格環境下數字圖書館知識組織理論、方法及其過程研究[J].圖書情報工作,2007,(8):8.

[2]李明生.語義網格:語義網技術和網格的結合[J].情報雜志,2005,(10):47.

[3]Tim Berners-Lee,James Hendler and Ora Lassila.The Semantic Web[J].Scientific American,2001,(5).

[4]李衛華.語義Web及層次結構[J].計算機系統應用,2002,(7):31.

[5]朱超.關于元數據互操作的探討[J].情報理論與實踐,2005,(6):645-646.

[6]李景.本體理論在文獻檢索系統中的應用研究:[博士學位論文][D].北京:中國科學院文獻情報中心,2004:114-120.

[7]朱亞玲,畢強.語義網格探微[J].情報理論與實踐,2006,(6):743.

[8]李潔,丁穎.語義網、語義網格和語義網絡[J].計算機與現代化,2007,(7):39.

[9]David De Roure,Nicholas R.Jennings,Nigel R.Shadbolt.Research Agenda for the Semantic Grid:A Future e-Science Infrastructure[EB].http:∥www.semanticgrid.org/html/semgrid.html,2004-12-08.

[10]Semantic Grid Community Portal[EB].http:∥www.semanticgrid.org,2004-12-08.

[11]李明生.語義網格:語義網技術和網格的結合[J].情報雜志,2005,(10):47-48.

[12]諸葛海.語義網格的基礎理論、模型與方法研究進展[J].中國基礎科學研究進展,2007,(6):27.

[13]畢強,牟冬梅.語義網格環境下數字圖書館知識組織理論、方法及其過程研究[J].圖書情報工作,2007,(8):6.

[14]畢強,沈涌.數字圖書館網格信息資源組織模式研究[J].圖書情報工作,2007,(8):11.

[15]朱亞玲,畢強.語義網格探微[J].情報理論與實踐,2006,(6):743-744.

[16]韓毅,黃微,崔春.語義網格環境下數字圖書館知識組織模型構建研究[J].圖書情報工作,2007,(8):16.

[17]畢強,沈涌.數字圖書館網格信息資源組織模式研究[J].圖書情報工作,2007,(8):12.

主站蜘蛛池模板: 亚洲二三区| 国产日韩精品欧美一区灰| 91九色视频网| 2020最新国产精品视频| 曰韩人妻一区二区三区| 国产午夜福利亚洲第一| 亚洲日本中文综合在线| 伊人久久影视| 毛片在线播放a| 99一级毛片| 极品私人尤物在线精品首页 | 亚洲成a∧人片在线观看无码| 视频一区亚洲| 经典三级久久| 国产91麻豆视频| 91精品啪在线观看国产91| 丁香婷婷激情综合激情| 国产欧美日韩视频怡春院| 一个色综合久久| 久久无码高潮喷水| 色久综合在线| 国产在线一区二区视频| 国精品91人妻无码一区二区三区| 国产xx在线观看| 久久综合伊人 六十路| 亚洲小视频网站| 亚洲精品无码日韩国产不卡| 五月婷婷亚洲综合| av一区二区无码在线| 国产麻豆va精品视频| 国产原创演绎剧情有字幕的| 国产午夜精品一区二区三| 噜噜噜久久| 欧美一级爱操视频| 国产亚洲精品精品精品| 国产网站免费看| 91免费国产高清观看| 99尹人香蕉国产免费天天拍| 毛片免费视频| a级毛片免费网站| 欧美日韩在线成人| 播五月综合| 青青国产视频| 国产成人久久综合一区| 97se亚洲综合在线| 亚洲aⅴ天堂| 青青青草国产| 免费AV在线播放观看18禁强制| 亚洲天堂精品在线观看| 5555国产在线观看| 91毛片网| 久久综合激情网| 久久国产精品77777| 日日噜噜夜夜狠狠视频| 五月婷婷导航| 久久国产精品电影| 亚洲日韩久久综合中文字幕| 成人韩免费网站| 手机在线免费不卡一区二| 亚洲欧美精品在线| 国产精品永久久久久| 国产95在线 | 亚洲精品制服丝袜二区| 亚洲欧洲日产无码AV| 国产精品lululu在线观看| 欧美无遮挡国产欧美另类| 国产精品成人第一区| 亚洲欧美一区二区三区图片 | 91成人免费观看| 色综合天天视频在线观看| 日韩精品欧美国产在线| 久久动漫精品| 成人综合网址| 亚洲欧美在线综合一区二区三区 | 欧美在线天堂| 亚洲aⅴ天堂| 一本一道波多野结衣一区二区| 精品国产www| 久久窝窝国产精品午夜看片| 色综合天天操| 国产亚洲精久久久久久久91| 亚洲系列无码专区偷窥无码|