程 萌
(1.武漢大學(xué)信息管理學(xué)院,湖北 武漢 430072;2.銅川圖書館,陜西 銅川 727031)
數(shù)字圖書館是用數(shù)字技術(shù)處理和存儲(chǔ)各種圖文并茂文獻(xiàn)的圖書館,實(shí)質(zhì)上是一種多媒體制作的分布式信息系統(tǒng)。它把各種的不同載體、不同地理位置的信息資源用數(shù)字技術(shù)存儲(chǔ),以便于跨越區(qū)域、面向?qū)Ψ降木W(wǎng)絡(luò)查詢和傳播。它涉及信息資源加工、存儲(chǔ)、檢索、傳輸和利用的全過程。也就是說,數(shù)字圖書館就是虛擬的、沒有圍墻的圖書館,是基于網(wǎng)絡(luò)環(huán)境下共建共享的可擴(kuò)展的知識(shí)網(wǎng)絡(luò)系統(tǒng),是超大規(guī)模的、便于使用的、沒有時(shí)空限制的、可以實(shí)現(xiàn)跨庫(kù)無縫鏈接與智能檢索的知識(shí)中心。
數(shù)字圖書館是一門全新的科學(xué)技術(shù),也是一項(xiàng)全新的社會(huì)事業(yè)。簡(jiǎn)而言之,數(shù)字圖書館是一種擁有多種媒體內(nèi)容的數(shù)字化信息資源,能夠?yàn)橛脩籼峁┓奖?、快捷、高水平的信息化服?wù)機(jī)制。數(shù)字圖書館不是圖書館實(shí)體,它對(duì)應(yīng)于各種公共信息管理與傳播的現(xiàn)實(shí)社會(huì)活動(dòng),表現(xiàn)為各種新型信息資源組織和信息傳播服務(wù)。它借鑒圖書館的資源組織模式、借助計(jì)算機(jī)網(wǎng)絡(luò)通訊等高新技術(shù),以普遍存取人類知識(shí)為目標(biāo),創(chuàng)造性地運(yùn)用知識(shí)分類和精準(zhǔn)檢索手段,有效地進(jìn)行信息存儲(chǔ),使人們獲取信息消費(fèi)不受空間的限制,也不受時(shí)間的限制。
“數(shù)字圖書館”從概念上講可以理解為兩個(gè)范疇:數(shù)字化圖書館和數(shù)字圖書館系統(tǒng),涉及到兩個(gè)工作內(nèi)容:一是將紙質(zhì)圖書轉(zhuǎn)化為電子版的數(shù)字圖書;二是電子版圖書的存儲(chǔ),交換,流通。
隨著信息技術(shù)的發(fā)展,需要存儲(chǔ)和傳播的信息量增大,信息的種類和形式更加豐富,傳統(tǒng)圖書館的機(jī)制顯然不能滿足現(xiàn)在需求。因此,人們提出了數(shù)字圖書館的設(shè)想。數(shù)字圖書館是一個(gè)電子化信息的倉(cāng)儲(chǔ),能夠存儲(chǔ)大量各種形式的信息,用戶可以通過網(wǎng)絡(luò)訪問它,方便獲得這些信息,并且其信息存儲(chǔ)和用戶訪問不受地域的限制。
數(shù)字圖書館隨著信息時(shí)代的發(fā)展,它不但包含了傳統(tǒng)圖書館的功能,向社會(huì)公眾提供相應(yīng)的服務(wù),還融合了其他信息資源(如博物館、檔案館等)的一些功能,提供綜合的公共信息訪問服務(wù)。也可以說,數(shù)字圖書館將成為未來社會(huì)的公共信息中心和樞紐。信息化、網(wǎng)絡(luò)化、數(shù)字化,這一系列的名詞符號(hào)其根本點(diǎn)在于信息數(shù)字化;同樣電子圖書館、虛擬圖書館、數(shù)字圖書館,不管用什么樣的名詞,數(shù)字化也將是圖書館的發(fā)展方向。
數(shù)字圖書館是一個(gè)相當(dāng)復(fù)雜的系統(tǒng),必須有統(tǒng)一、規(guī)范和系統(tǒng)化的模型作為研究和開發(fā)數(shù)字圖書館的理論指導(dǎo)和前提。對(duì)數(shù)字圖書館模型的研究,根據(jù)建模側(cè)重點(diǎn)不同,可以將系統(tǒng)模型分為:結(jié)構(gòu)模型、框架模型、動(dòng)態(tài)模型、過程模型和功能模型。這五種模型各有所長(zhǎng),如何將其結(jié)合和統(tǒng)一,形成對(duì)數(shù)字圖書館的相對(duì)完整刻畫,還需要做更多的研究。
數(shù)字圖書館研究和建設(shè)的迅速發(fā)展,系統(tǒng)資源和信息資源已顯得非常更加重要,如何有效、合理地管理和利用有限的系統(tǒng)資源和信息資源滿足數(shù)字圖書館的各種需求,是資源管理研究的主要內(nèi)容。其中包括資源管理的機(jī)制和策略、管理模型和優(yōu)化算法等。
在數(shù)字圖書館的通信中有時(shí)不僅需要實(shí)時(shí)、等時(shí)地傳輸多媒體數(shù)據(jù),而且需要各種媒體對(duì)象間保持時(shí)間和空間的同步約束。實(shí)時(shí)性、等時(shí)性和同步性是多媒體通信的基本特點(diǎn),也是實(shí)現(xiàn)多媒體通信的關(guān)鍵技術(shù)和基礎(chǔ)。同步性要求各種媒體在傳輸后仍然保持原來時(shí)間和空間上的制約關(guān)系。目前國(guó)際上關(guān)于多媒體同步模型的研究可分為時(shí)間線模型、層次模型和參考點(diǎn)模型三大類。各種媒體信息時(shí)態(tài)關(guān)系的研究也是多媒體同步中的重要組成部分。目前多媒體同步模型的研究較深入,人們提出了很多模型,但還沒有一種比較完善的、能夠滿足數(shù)字圖書館通信要求的分布式多媒體同步模型。
多媒體數(shù)據(jù)庫(kù)技術(shù)是以有效管理大量多媒體數(shù)據(jù)和相關(guān)信息為目標(biāo)的數(shù)據(jù)庫(kù)系統(tǒng),它是開發(fā)數(shù)字圖書館的關(guān)鍵技術(shù)之一,是多媒體、圖像處理和識(shí)別、人工智能和數(shù)據(jù)庫(kù)技術(shù)相結(jié)合的產(chǎn)物。數(shù)字圖書館的媒體資源內(nèi)容的組織方式將與傳統(tǒng)的方式不同。其內(nèi)容將按照用戶需求挑選的高價(jià)值知識(shí)內(nèi)容,經(jīng)過分類、編輯、整理、加工,變成需用者易于接受的形式。它是一種有很大增值、有序的知識(shí)庫(kù),會(huì)出現(xiàn)新的知識(shí)產(chǎn)權(quán)關(guān)系。數(shù)字圖書館將資源分為元數(shù)據(jù)和對(duì)象數(shù)據(jù)。對(duì)象數(shù)據(jù)是指數(shù)字化的文本、圖像、聲音、影像等,元數(shù)據(jù)則是那些描述和管理對(duì)象數(shù)據(jù)的數(shù)據(jù)。對(duì)象數(shù)據(jù)呈分布式存放在各地的資源點(diǎn)內(nèi),元數(shù)據(jù)則有必要集中在數(shù)字圖書館中心的超大規(guī)模服務(wù)器上,用戶查詢時(shí),中心調(diào)度系統(tǒng)通過元數(shù)據(jù)調(diào)度各對(duì)象數(shù)據(jù)庫(kù)數(shù)據(jù)以提供服務(wù)。
基于內(nèi)容的檢索技術(shù)是多媒體數(shù)據(jù)庫(kù)的重要組成部分,是目前數(shù)字圖書館研究的最新熱點(diǎn)。所謂基于內(nèi)容的檢索是指根據(jù)媒體對(duì)象的語義和上下文聯(lián)系進(jìn)行檢索。特點(diǎn)在于:從媒體內(nèi)容中提取信息特征。即對(duì)圖像、視頻、音頻進(jìn)行分析和特征提取,利用這些內(nèi)容建立特征矢量作為索引進(jìn)行檢索;是一種基于媒體多維特征進(jìn)行的近似性匹配,是一種信息檢索技術(shù)。該技術(shù)將支持從數(shù)字圖書館的多媒體數(shù)據(jù)庫(kù)中以用戶可以接受的相應(yīng)速度查詢到所要求的信息。
該技術(shù)是信息科學(xué)的關(guān)鍵技術(shù)及基礎(chǔ)理論問題,同時(shí)也是建設(shè)數(shù)字圖書館系統(tǒng)的關(guān)鍵技術(shù)。壓縮編碼的理論基礎(chǔ)是信息論。從信息論的角度看,壓縮就是刪除信息中的冗余,即保留不確定的信息,去除確定的信息(可推知的),也就是用一種更接近信息本質(zhì)的描述來代替原有冗余的描述。編碼方法可以分成三類:(1)考慮圖像信源的統(tǒng)計(jì)特性。采用預(yù)測(cè)編碼方法、變換編碼方法、矢量量化編碼方法、子帶-小波編碼法、神經(jīng)網(wǎng)絡(luò)編碼法等。(2)考慮人眼視覺特性。采用基于方向?yàn)V波的圖像編碼法、基于圖像輪廓-紋理的編碼法。(3)考慮圖像傳遞的景物特征采用分形編碼方法、基于模型的編碼方法。
[1]胡述兆、王梅玲合著(民92)。圖書信息學(xué)導(dǎo)論。臺(tái)北市;漢美。
[2]顧敏(民90),站點(diǎn)圖書館:數(shù)字媒體與網(wǎng)域服務(wù)環(huán)境下的圖書館新型態(tài)。信息傳播與圖書館學(xué)。
[3]羅劍麗(民93)。傳統(tǒng)圖書館與虛擬圖書館功能比較。紹關(guān)學(xué)院學(xué)報(bào)。