摘 要:主要探討了數字圖書館的體系結構與數字圖書館信息組織的主要模式,并分析了各個模式的特點。
關鍵詞:數字圖書館;結構;模式;體系結構
中圖分類號:TP271+.82文獻標識碼:A文章編號:1672-3198(2008)01-0267-02
1 數字圖書館的基本概念
關于數字圖書館的定義, 目前而言,還是仁者見仁,知者見者,說法不一。但大多數研究者認為, 數字圖書館并不是空間意義上的“館”, 而是一種擁有多媒體內容的信息資源, 它的存在方式是將文字、圖像、聲音等信息數字化, 并通過互聯網向用戶方便快捷地提供信息知識的服務技術。數字圖書館與傳統圖書館的最大不同就在于: 它變用戶的集中為信息服務的集成。對于不同的使用對象來說, 數字圖書館表現出不同的特征和功能, 因而對數字圖書館的理解自然就各不相同。所以, 數字圖書館的共有特征可以概括為:收藏數字化;操作計算機化;傳遞網絡化;信息資源存取自由化;信息資源共享化; 結構連結化。基于此, 我們可以把數字圖書館簡述為: 對有高度價值的文本、圖像、語音、音響、影像、影視、軟件和科學數據等多媒體信息進行收集, 進行規范性的整理加工, 進行高質量的保存和管理,實現知識增值, 并提供在廣域網上高速橫向跨庫連接的電子存取服務系統。
2 數字圖書館的體系結構
體系結構是數字圖書館建設的關鍵, 它關系到系統的信息組織(即數字對象的存儲) 和檢索方式。影響數字圖書館體系結構的因素有很多, 包括社會與法律環境、通訊基礎設施和網絡技術、軟件工程、硬軟件環境、系統安全、訪問權限、數字對象類型和數量等方面。美國數字圖書館研究的重要成果之一是提出了建設數字圖書館的八項原則, 并得到了學術界的普遍認同。這八項原則是:
(1)數字圖書館的技術框架存在于法律和社會的框架之內。
由于社會網絡進程的不斷加快, 數字圖書館將存在于一個廣泛的經濟、社會和法律框架內。這就意味著:法律體系必須根據迅速變化的經濟和社會框架制定新的法律,包括知識產權、通訊法、國際法等; 數字圖書館的體系結構必須能夠保護著者和所有者的權利, 考慮所涉及的經濟、社會和法律問題。
(2)數字圖書館概念的統一理解。
數字圖書館中的對象稱為數字對象(Digital Object),它們存儲在倉儲(Repository), 用句柄(Handle) 來標識。存儲在數字對象中的信息稱為內容(Content), 內容被分為數據(Data), 關于數據的信息稱為屬性( Property) 或元數據(Metadata)。作為基礎的體系結構應和保存在數字圖書館中的信息相分離數字圖書館中的內容是多種多樣的, 可以是文本、圖片、動畫、音頻資料、計算機程序、模型設計或多種類型構成的復合資料。存儲在數字圖書館中的這些信息內容往往和數字圖書館的體系結構相分離。適合于各種資料類型的特征是由體系結構規定的。這種特征通常包括適用于某類資料的特定的格式、協議和權限管理等。
(3)名字和標識符是數字圖書館的基本建構塊。
名字用于標識數字對象, 登記數字對象中的知識產權, 記錄所有權的變化, 在引用、檢索和對象鏈接中不可缺少。名字是唯一的, 長期保持。句柄系統用于標識數字對象。用于標識用的字符串稱為標識符。
(4)數字圖書館不僅僅是二進制數位的集合在數字圖書館中信息存儲為數字對象, 不能簡單地把數字對象看成是二進制數位的集合。數字對象可由兩部分構成: 內容和元數據。一個數字對象可含有多種類型的內容如文字、圖像、聲頻等。復雜的數據類型可由簡單類型構成。元數據包括句柄、權限、訪問方式、數字簽名、交易日志等。(5)數字圖書館對象使用時和存儲時的形態可能完全不一樣。
數字對象在使用時的形態和存儲形態可能完全不同。例如, 圖像可以小波形態存儲, 使用時利用小波生成圖像。音樂作品可以曲譜的形式直接傳送給用戶, 也可在倉儲中用合成器演奏后將聲頻信號傳給用戶。數字圖書館的體系結構必須仔細區分生成的原始數字對象、存儲在倉儲中的數字對象和提交用戶的數字圖像。
(6)倉儲應保管好所存儲的信息。
數字對象包含有價值的知識產權, 倉儲中的數字對象含有是否允許其在特定的經濟和社會框架中被存儲的信息。倉儲必須妥善管理, 提供參考引用、安全控制等措施, 以確保對數字對象的操作的合法性。用戶通過倉儲訪問協議與倉儲交互, 以屏蔽倉儲的內部結構和數字對象的存儲形式。
(7)用戶需要的是供人利用的知識作品, 而非供機器處理的數字對象數字對象是數字圖書館的基本元素, 但用戶需要的往往是更為抽象的數據項。
3 數字圖書館的主要模式
目前, 圖書館用來處理數字存取的主要模式是以網絡為中心的用戶機P服務器(CPS) 模式和由此而演化來的Web 為中心的瀏覽器PWeb 服務器P數據庫(BPSPD) 模式,后者也稱為Web 模式。世界上已運行的數字圖書館系統大多采用這兩種模式。用戶機P服務器模式通過消息傳遞機制對話, 由用戶機向服務器提出請求, 服務器進行相應處理計算后將結果傳遞回用戶機。在此種模式中, 服務器往往只負責數據庫的管理和查詢, 因此客戶機任務比較繁重, 須配備大量的軟件, 尤其是較多的客戶機軟件和應用程序。在這種結構中, 傳統的服務器被分成兩部分, 即Web 服務器和數據庫服務器。Web 服務器負責Web 頁面的管理、組織、傳遞和數據庫查詢請求的提出, 而數據庫服務器則負責接受Web 服務器的查詢請求并提供運算處理結果。因此,在這種模式中, 客戶機的任務比較輕松, 只要配備操作系統、網絡協議和瀏覽器等軟件即可。瀏覽器的作用只是從Web 服務器下載Web 頁面。Web 模式在資源配置、系統安全等方面比簡單的客戶機P服務器模式要好得多。Web 模式的系統結構如圖1 所示。
國內外已被圖書館采用了的IBM 數字圖書館系統就是在瀏覽器PWeb 服務器P數據庫模式的基礎上實現的。其系統基本框架如圖2 所示。
在這種系統中, 圖書館服務器管理圖書館的索引信息, 負責執行查詢及將用戶的請求轉交給相應的對象服務器, 對象服務器管理數字對象, 用戶通過網絡訪問服務器。用戶、圖書館服務器和對象服務器構成系統信息傳遞的三角形框架。用戶登錄圖書館服務器, 并進行查詢, 圖書館服務器將客戶的請求轉交給相應的對象服務器, 對象服務器則將查詢到的信息直接傳送給用戶, 這樣就實現了數字對象的發布。在IBM數字圖書館的三角形構架中, 用戶只能訪問圖書館服務器, 這保證了存儲在對象服務器中的數據的安全性。圖像、聲音和動畫等數字對象的數據量比較大, 數據量大的數據對象及頻繁使用的數字對象可以放在接近用戶的地方, 這樣可以減少數字對象復制和傳達的次數, 減少網絡的數據傳遞量, 提高系統的性能。
加快我國數字圖書館的建設是互聯網上中文知識信息的基礎建設, 它將迅速扭轉互聯網上中文知識信息匱乏的狀況, 形成我國知識信息的資源優勢。這對于正在實施西部大開發的信息基礎建設和文化教育建設更具有前瞻性的戰略意義。因此, 數字圖書館的建設, 既代表著現代化圖書館發展的方向, 更代表著先進文化的前進方向。
參考文獻
[1]鄂云龍. 數字圖書館——信息時代發展新階段的國家級挑戰[J]. 情報資料工作, 2001, (5) : 16 - 20.[2]王軍, 楊冬青, 唐世渭. 數字圖書館的研究內容和方向[J]. 中國圖書館學報, 2001, (6) : 33 - 38.
[3]盛小平. 國內外數字圖書館發展的比較研究[J]. 中國圖書館學報, 2001, (6) : 39 - 44.
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文。