黃素君(廣東省委黨校圖書館,廣東廣州510053)
?
語義網環境下數字圖書館信息服務模式研究
黃素君
(廣東省委黨校圖書館,廣東廣州510053)
[摘要]介紹了當前數字圖書館信息服務中存在的局限性,闡述了語義網技術的層次結構,分析了語義網在數字圖書館中的應用優勢,并對語義網環境下數字圖書館的幾種信息服務模式進行了探討。
[關鍵詞]語義網數字圖書館信息服務服務模式
[分類號]G253
數字圖書館引入了各種現代高新技術,是一種可以承載海量數字化信息的資源庫,也是一種全新的網上信息資源服務模式,它能夠有效擺脫當前信息資源使用限制與分布不均的問題。在互聯網技術高速發展的今天,數字圖書館開始逐漸得到人們的重視,但同時在信息服務方面也逐漸凸顯出不足,如智能化信息服務水平不高、信息反饋機制不健全、很難完全滿足用戶多樣化的信息需求,這也在一定程度上影響到信息資源共享。當前信息環境發生了很大的變化,實際應用中很多信息系統存在語義、信息過載等問題,這就需要在互聯網環境下提高信息服務的實效性與準確度,保障海量信息能夠得到有效利用和互通。基于信息檢索的圖書館傳統信息服務模式已經不適應讀者的需求,在這種情況下,將語義網應用于數字圖書館信息服務成為一種有效的解決模式。
在互聯網技術的推動下,讀者獲取信息資源的渠道逐漸增多,這就要求數字圖書館能夠為用戶提供個性化的信息服務。在這個過程中,數字圖書館首先需要了解用戶對信息的具體需求,然后主動搜集信息資源,并形成個性化的信息資料庫,及時向用戶反饋刊物訂閱、熱點鏈接等信息。從這個角度來說,數字圖書館提供給用戶的信息是否具有時效性、針對性以及準確度,是評判信息服務質量的一個重要標準[1]。
①信息異構、分散的問題。當前數字圖書館為用戶提供個性化的信息服務,其針對的信息系統與用戶群體均是特定的,而在信息異構、分散的環境下服務很難開展。若出現信息異構、分散的服務環境,如何實現各種信息資源的互通,如何在信息系統中準確獲取用戶的需求信息,如何保障獲取信息的準確性與時效性,這些均是圖書館需要考慮的問題。
②集成數據與推送方式問題。數字圖書館在當前信息服務過程中的推送模式較為單一,并且很多信息系統能夠提供給用戶的只是部分信息。在數字圖書館發展過程中,圖書館應盡可能地為用戶提供更多可用的信息,并通過多種方式繼承數據,運用多樣化的信息推送方式,以此適應不同的信息服務環境。
③服務質量問題。當前數字圖書館為用戶提供信息服務的模式,依然在沿用傳統的關鍵詞檢索方法,并沒有引入支撐系統的語義[2]。這樣系統很難對用戶的需求進行準確理解與分析,也很難快速了解搜集資源中是否具備語義數據,同時由于信息系統在算法等方面還存在一些不足,這些均可能導致信息服務質量難以提高,而在信息推送服務中也可能出現很多不匹配的信息。
④時效性問題。數字圖書館在信息服務中要同時保障精確度與時效性還存在一定的難度,這是因為大部分用戶并沒有耐心等待,這樣系統可能在保障時效性的同時無法兼顧質量。因此,如何在信息異構以及分散的情況下也能夠保證信息服務的時效性就顯得尤為關鍵。
2.1語義網的層次結構
語義網這一概念的提出改變了傳統的信息資源共享模式,它可將各種語義信息通過本體來描述,進而實現語義資源共享。何紹華、宮兆暉在《基于語義網的網絡信息檢索相關性研究》一文中曾給出語義網的層次結構圖,其基本模型如圖1所示。筆者通過對其詳細的分析,以期促進語義網在數字圖書館環境下的應用。語義網的構建充分融合了RDF 和XML技術,其層次結構的基本模型如圖1所示[4]。

圖1 語義網的層次結構
從中可以看出,語義網一共可分為7層,其中的Unicode 和URI奠定了整個結構的基礎。語義網中所有信息資源的編碼與標識均在該層完成,可以保障信息查詢的精確度。第二層中的XML語言可以分離網絡資源的結構、形式以及內容,并為系統與其他以XML為基礎資源無縫對接提供支撐。第三層主要功能是描述互聯網上各種類別的資源,并為信息資源的集成提供解決方案。其中RDF為信息資源的描述制定了一些準則與詞匯表,在進行資源描述時必須按照這些準則執行。第四層即本體,是該結構中比較重要的部分,可以賦予網絡資源一定的語義以理解人的意圖。這一層主要用于收集、表示與理解相關領域的信息,并從多個層次與形式來明確定義信息以及詞匯表之間的關系。第五層主要是對第四層的信息數據進行邏輯推理。第六層是在前幾層的基礎上進行驗證,而最后一層為信任層,可以讓用戶與系統之間建立一定的信任關系。
在該層次結構中,二三四層是最為重要的部分,主要是對信息資源進行語義描述,它也是很多學者研究的重點內容。語義網中各種類型的資源均可以在收集后被計算機獲取,然后通過準則并被理解后進行處理,進而與用戶建立一定的連接,保障智能設備可以輕松訪問、檢索分散異構的網絡資源。在這樣的技術環境下,網絡資源可以實現全面的語義上的關聯,促進信息數據智能化的應用[5]。
2.2語義網環境下的數字圖書館模型
語義網技術在數字圖書館的應用,一方面可以對信息資源進行語義描述,另一方面可以保障系統各種負載信息的平衡,并有合適的耦合度,以此為整合用戶需求信息提供便利。圖2為語義網環境下數字圖書館的基本模型[5]。

圖2 語義網環境下數字圖書館的模型
圖2顯示,在語義網環境下的數字圖書館可分為4層。其中分布式資源層涵蓋了多種類型的資源,它既為圖書館存儲海量信息創造了條件,同時也是圖書館開展各項智能化服務的基礎。數字圖書館信息資源的搜集、整合、計算以及調度主要在網格服務層中完成,并可以提供應用接口和共享信息、數據、計算等服務。從語義的角度來描述、整合信息資源,并運用本體知識處理信息主要是在語義服務層完成的,這是整個系統的核心,可以提供計算、數據處理以及調度信息等多種服務。知識服務層則主要提供知識服務,應用數據挖掘、網格等技術來提供應用接口,并保障信息資源之間的互聯和語義匹配,然后向用戶及時反饋各種需求信息。
2.3語義網在數字圖書館中的應用優勢
在數字圖書館信息服務過程中,互聯網頁面對信息服務效率有一定的影響,而信息系統的很多功能均受到超文本語言的限制。而引入語義網的概念可以改變傳統的通過關鍵詞匹配的模式,賦予計算機理解人的意圖的能力,進而促進數字圖書館信息服務質量的提升。在數字圖書館信息資源服務中應用語義網技術,其優勢主要有以下幾個方面。
①應用可擴展標記語言。可擴展標記語言(XML)的語法功能非常強大,對于用戶自己標記的字段以及語言也給予支持,并且可以方便地通過字段結合來表達數字圖書館中較為少見的信息。與超文本語言不同,運用該語言編寫的頁面可以區分元信息與信息,并可以保障信息的嵌套,增強了信息檢索的功能,也提高了信息資源的查詢與檢索的準確性。
②RDF的應用。數字圖書館中應用RDF可增強系統的搜索能力,并發揮強大的信息導航作用。它可以對信息結合之間的關系進行語義表述,保障知識之間的交互與共享[6]。同時可以對相對獨立的文集進行轉換,變為常用的Web頁面,并對該頁面的知識產權給予說明。這樣有助于數字圖書館對信息資源進行有效利用、管理和維護,也可以達到保護網上資源產權的目的。
③本體的應用。數字圖書館常用的信息檢索模式是關鍵詞,這樣獲取的信息資源沒有必要由語義來連接,而網上資源本身較為分散,這樣就無法提高信息服務的效率。通過對用戶的需求進行分析,可以發現他們要求圖書館搜集、獲取以及處理知識與信息的方式更加靈活多樣。要想滿足用戶對信息資源組織的要求,可以將本體技術應用于信息資源服務中,實現對信息資源語義的重復利用與共享,便于不同類型、領域之間的信息交流。
語義網是在網格以及Web技術上的進一步擴展,它可以從語義層對知識進行閱讀,并且具備強大的計算能力,將語義網應用于數字圖書館中,可以構建良好的信息檢索環境,有效整合用戶與信息資源,有助于數字圖書館為讀者提供優質的信息服務,豐富數字圖書館信息服務的內容與模式。通過對數字圖書館的相關研究與實踐,語義網環境下數字圖書館的信息服務模式主要有以下幾種。
3.1以語義關聯為基礎的信息服務模式
數字圖書館在處理信息資源時充分應用語義網技術,可以幫助用戶快速發現平臺中的資源。通過語義導航體系可以汲取資源與數據集合中相關聯的信息,并將這些資源根據著者、種類以及研究領域表述為不同的主題,并將各種主題資源通過主題圖的形式展現出來,然后根據主題的區別來為用戶提供信息導航服務。通過這種導航的方式,在科研與資源開發過程中的所有相關信息均會被用戶輕松獲取,這也為研究創新提供了思路。同時數字圖書館可以應用該技術對用戶提供的信息進行映射與匹配,增加圖書館信息資源的瀏覽量,而在用戶進行信息檢索時也可以給出相關的類別以及資源數量等信息[7]。語義導航可以同時支持信息的瀏覽與檢索,促進用戶與系統之間的溝通,而對于用戶的每一步操作,系統均能快速作出反應,以幫助用戶去發現與獲取信息。
若系統中的各類信息有規范的組織體系,并保障各詞匯表之間映射的有效性,就可以得到一個與各詞匯表關系對應的數據模型,進而為不同的RDF提供查詢服務。該技術與適宜的多媒體技術的融合,能夠為梳理各信息類別的語義關系提供便利,也有助于信息資源的發現與共享。
3.2跨越空間的移動信息服務模式
移動通信技術的發展以及移動通訊設備的廣泛應用,為用戶便捷、泛在、高效地獲取信息提供了多樣的途徑。而智能手機、GPS等移動服務方式的推廣,也為數字圖書館提供移動信息服務創造了條件。在語義網這種全新的技術環境下,數字圖書館的移動服務將有充足的空間,并可以整合用戶驅動、在線支付和網上社區等社交服務模式。讀者可以通過移動信息服務來搜索、預約以及借閱圖書館提供的資源,促進知識、信息的發現與共享并拓展信息推薦、用戶交流等移動社交服務模式。
3.3結合科研動態的信息鏈接服務模式
語義網的提出與發展為研究者提供了新的數字化環境,在科研過程中的各項信息均可以被計算機獲取,并在通過可視化、信息關聯等方式進行處理后被展示出來,這樣就可以幫助用戶了解科研設施、基本理論、觀察數據以及模擬分析等方面的動態信息。在現有的技術條件下,科研人員需要獲取更深入的信息資源,而在科研中涉及的人員、數據、設施以及項目等重要的信息資源,均會在計算機中進行數字化標識與表述。利用語義網可以發現這些數字化資源之間的相互關系,進而可以為科研人員提供有效的信息鏈接服務。數字圖書館通過語義網等技術可以實現信息資源的一站式鏈接,這樣分散于各個圖書館中的資源可以被有效整合與關聯,形成云知識產物,即便是異構、分散的復雜信息資源,也可以通過相關分析工具為用戶提供知識鏈接服務。
移動通訊與互聯網技術的高速發展,提升了人們對信息資源的需求量,在各類信息資源迅速增多的同時,由于用戶信息檢索技能以及系統無法理解用戶需求等問題,反而增加了用戶獲取信息資源的難度。將語義網引入數字圖書館信息資源服務中,提出以語義關聯為基礎、跨越空間并結合科研動態進行語義檢索的模式,其目的在于進一步提高信息服務的高效性與準確性,以此為廣大用戶獲取信息提供便利。
參考文獻:
[1]何紹華,宮兆暉.基于語義網的網絡信息檢索相關性研究[J].情報雜志,2010(12).
[2]王文峰,趙莉.語義網中的本體對象研究及應用[J].棗莊學院學報,2011(2).
[3]王松林,王玉媛.語義網的技術體系結構及其對圖書館的影響[J].圖書館學刊,2012(12).
[4]谷琦.對語義網及其在數字圖書館信息檢索中的應用[J].數字圖書館技術,2010(3).
[5]代金晶,紀希禹.基于語義網的智能搜索引擎在數字圖書館中的應用[J].圖書館學研究,2011(9).
[6]黃果,周竹榮,周亭.基于語義網的信息檢索研究[J].西南大學學報:自然科學版,2011(1).
[7]陳駿.基于本體的語義網在數字圖書館中的應用[J].科技情報開發與經濟,2012(34).
黃素君女,1979年生。碩士,館員。研究方向:圖書館服務、網絡和數字技術、數據庫建設。
收稿日期:(2014-12-30;責編:楊新寬。)