魏淑勤
摘要: 數字圖書館的信息體系結構將分散在異地的數字化信息統一起來,構成一個虛擬的而且具有優化結構的相關有機實體,為數字圖書館的應用提供統一的資源訪問,而且能方便地對資源進行管理。
關鍵詞: 數字圖書館信息體系結構設計
數字圖書館設計信息體系結構的目的在于使其豐富的信息資源能夠合理地、規范地組織,一般按類型組織資源庫中的信息,提高信息資源的網絡化共享程度,最大限度地滿足用戶的信息需求。
一、數字圖書館信息體系結構的設計要求
第一,必須給用戶及其應用程序以相當的靈活性。用戶查檢資料方法和途徑的多樣化,要求在組織數字化信息時不能在用戶檢索資料的方法、專業性程度或文獻檢索的序列上有所傾向。
第二,藏品結構應易于直接管理、跨庫連接及快速查詢。數字圖書館是以相對較少的專業人員管理非常龐大的館藏,體系結構應能使這些人員在管理方面盡可能擺脫日常事務。同時體系結構的設計要易于實現不同類型資源庫的連接和滿足用戶快速檢索的需求。
第三,信息體系結構應能反映經濟、社會和法律等構件在信息基礎中的發展,特別是應能識別信息是否有價值,可否類化和條件化,可否傳遞到無國界的非安全網絡上,等等。
二、數字圖書館核心服務的主要特征
數字圖書館體系結構中的內容是以數字對象形式存儲的,數字對象是用全局唯一的持久名字——句柄標識的,句柄用命名服務器注冊,用名錄服務器解析出句柄標識的數字對象的位置。數字對象的存儲和訪問是由倉儲服務系統實現的。索引服務提供發現數字對象的機制,使用戶易于從館藏中尋找和發現所需的對象。用戶接口網關提供以人為中心的數字圖書館的功能入口。
三、數字對象系統
數字對象是數字圖書館體系結構中存儲信息的基本邏輯單位和實體,是以一定結構的數字形式表達信息內存的一種方法,是網絡環境下的數字資料??梢哉f數字圖書館是由數字對象構筑而成的,數字圖書館中的信息以數字對象形式存儲、訪問、傳播和管理,數字對象存放于倉儲中,其形式如一篇文章、一張圖片、一部音樂作品或是一段影像。數字對象是由數字資料(或數據)和其唯一的標識符——句柄組成的,其中關于數據的信息稱作元數據。
四、倉儲服務系統
倉儲也稱為數據倉庫或資源庫,是—種專門類別的倉庫,特別適于保存含有價值信息的材料,主要是分布式信息倉儲,基本存儲單元是數字對象,整個系統就是為了存儲、訪問、管理數字對象而設計的。存放數字信息的倉儲有多種類型,如FTP文檔、web服務器、在線數據庫等。
倉儲服務系統通常是由關系型數據庫來管理、應用程序通過資源庫提供的庫訪問協議RAP(Repository Access Protocol)來訪問資源庫,可實現存儲、訪問、復制、移動和刪除數字對象等操作。RAP定義了外界訪問倉儲的最基本的接口。如果一個數字對象的句柄解析成相應的倉儲,則認為該數字對象包含在此倉儲中,只有通過向相應的倉儲發送服務請求才能訪問該數字對象。
五、名錄服務系統
名錄服務系統也稱為命名系統,是針對長期標識符即數字對象名字的分配、管理及解析的綜合系統。句柄系統(Handle System)是美國國家研究創新公司(CNRl)為數字圖書館提出的第一個完整可用的名錄服務系統或URN系統。作為CNRI開發的第一個命名系統,句柄系統顯然獨立于RUN系統開發,但它與URN是兼容的;系統在整個因特網范圍內為用戶提供安全的名錄解析和分布式的句柄管理服務,提供手段使句柄與數字對象關聯,使地址與數字對象關聯,并對系統中的人員、計算機資源、網絡、數據倉庫、數字對象、Web服務器等進行識別、監控和調度等。
名錄服務系統類似于DNS(域名系統)和URL(統一資源定位器),包括開放的句柄協議、名字空間和句柄協議的具體實現。名錄服務系統具有唯一性、持久性、可擴展性、多實例、國際字符支持、分布式的服務和管理、安全有效的解析等特點。分布式的計算機系統可以存儲數字資源的名字或句柄,通過句柄協議,將句柄解析成數字資源所在倉儲的地址信息,從而使用戶或代理可以通過句柄訪問和使用這些資源。數字資源的存儲位置發生變化時,句柄不變,只是由句柄系統修改句柄與地址信息間的對應關系,因此資源的名字是持久性的。
名錄服務系統或句柄系統是由位于頂層的全局句柄注冊系統和位于底層的多個局部句柄服務系統共同組成的層次服務系統。全局句柄注冊系統提供解析句柄和管理句柄名字空間的功能,是一個集中管理的注冊服務,所有的命名授權均必須用全局句柄注冊系統注冊。局部句柄服務系統管理由自己命名授權的句柄,為這些局部名字提供解析和管理服務。同時,局部句柄服務系統和多個倉儲相關聯,實現了倉儲與名錄服務系統的交互,如倉儲要求刪除句柄的請求,可直接發送給與其綁定的局部句柄服務系統。
六、索引服務系統
索引服務系統是數字圖書館信息體系結構的重要組成部分,提供了使用戶通過查詢能夠很容易地從館藏中尋找和發現所需數字對象的機制。系統的資源發現功能由索引服務器和索引管理器兩部分合作完成。索引管理器選擇執行查詢的索引服務器,在索引服務器中執行查詢,合并來自索引服務器的結果。
1.索引服務器
索引服務器是收集關于數字對象的信息。這些信息可以是數字對象的替代信息,如傳統圖書館編制的機讀目錄,也可以是對象的全部內容,如全文搜索引擎使用的全文信息。這些替代信息被組織成結構化的索引,保證了搜索引擎在響應請求時的查準率和查全率及檢索效率。查詢請求返回的是一個結果集,每個結果都是符合查詢要求的數字對象的唯一標識符,通過名錄服分解析該標識,就可訪問相應的數字對象。
2.索引管理器
選探索引服務器并執行查詢。索引管理器必須了解各個索引服務器所存儲的數字資源,定期更新索引服務器中的源列表,以及描述源的元數據和內容摘要。同時,為了對各個索引服務器的查詢結果進行合并、排列,索引管理器還必須了解有關查詢結果集的信息。
七、用戶接口網關
提供以用戶為中心的數字圖書館功能接入點、用戶接口網關負責向用戶提供查詢界面,接受用戶的檢索請求,然后將用戶的檢索請求進行語義規范和語法轉換,選擇合適的館藏服務進行搜索和訪問,并對返回的命中結果根據相關性、資源類型、數據格式等進行過濾、排序或做具體顯示處理。用戶接口網關可支持Netscape或IE在任何計算機系統上運行。