徐輦

【摘 要】建設(shè)發(fā)展有價(jià)值的數(shù)字圖書(shū)館,是數(shù)字圖書(shū)館對(duì)用戶的承諾。遵循數(shù)字圖書(shū)館建設(shè)發(fā)展原則,以及從之而來(lái)的實(shí)踐經(jīng)驗(yàn),有利于建設(shè)、維護(hù)和發(fā)展數(shù)字圖書(shū)館。建設(shè)合理的組織、使用合適的標(biāo)準(zhǔn)和自動(dòng)化系統(tǒng),能高質(zhì)量地處理和保存有價(jià)值的內(nèi)容,保護(hù)數(shù)字材料和版權(quán),使數(shù)字圖書(shū)館的內(nèi)容能夠持久保存且易于訪問(wèn)。
【關(guān)鍵詞】數(shù)字圖書(shū)館;元數(shù)據(jù);開(kāi)放獲取;數(shù)字版權(quán)
【中圖分類號(hào)】G252 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1674-0688(2018)05-0228-02
0 引言
數(shù)字圖書(shū)館建設(shè)需要高昂的投資和海量的資源,因此針對(duì)數(shù)字圖書(shū)館的建設(shè)、維護(hù)和發(fā)展,相關(guān)方都會(huì)有一些基本的考慮和必須遵循的原則,這些原則不僅適用于將模擬對(duì)象轉(zhuǎn)換為數(shù)字形式,也適用于數(shù)字圖書(shū)館。遵循這些原則,并吸取從之而來(lái)的實(shí)踐經(jīng)驗(yàn),會(huì)使設(shè)計(jì)、建設(shè)和維護(hù)開(kāi)發(fā)數(shù)字圖書(shū)館的工作受益。
1 數(shù)字圖書(shū)館發(fā)展原則
數(shù)字圖書(shū)館要適應(yīng)和迎合變革。持續(xù)變化的技術(shù)環(huán)境對(duì)于數(shù)字圖書(shū)館來(lái)說(shuō)是一個(gè)巨大的挑戰(zhàn),紙質(zhì)文檔被轉(zhuǎn)換成數(shù)字格式。隨著技術(shù)的變革,當(dāng)市場(chǎng)不再支持相應(yīng)的系統(tǒng)和格式時(shí),該格式的數(shù)字化文檔就會(huì)逐漸被淘汰。如果在某特定程序中創(chuàng)建一個(gè)重要文檔,那么為了訪問(wèn)附件就會(huì)依賴這個(gè)特定程序,假設(shè)我們的目的是為后人保留重要信息,而未來(lái)技術(shù)的變革可能意味著普通用戶無(wú)法訪問(wèn)這個(gè)文檔。
互聯(lián)網(wǎng)和Web技術(shù)使數(shù)字圖書(shū)館成為可能,數(shù)字圖書(shū)館設(shè)計(jì)者依賴現(xiàn)有的范例和工具,依然會(huì)出現(xiàn)不可預(yù)見(jiàn)的問(wèn)題。比如,用HTML創(chuàng)建Web站點(diǎn)便于訪問(wèn)數(shù)字圖像和文檔,但是也會(huì)因?yàn)镠TML更改或被其他技術(shù)取代而過(guò)時(shí)。技術(shù)變革的速度超過(guò)管理者維護(hù)數(shù)字圖書(shū)館的能力,所以數(shù)字圖書(shū)館需要方法和計(jì)劃以應(yīng)對(duì)改變,保持對(duì)信息提供持久的訪問(wèn)能力。
發(fā)展數(shù)字圖書(shū)館要切實(shí)了解“內(nèi)容”。對(duì)于用戶來(lái)說(shuō),內(nèi)容是數(shù)字圖書(shū)館中最值得關(guān)注的部分。創(chuàng)建者需要管理和決定數(shù)字圖書(shū)館的內(nèi)容,選擇包含的對(duì)象、數(shù)字化模擬形式,用標(biāo)準(zhǔn)語(yǔ)言(例如SGML)標(biāo)記項(xiàng)目,并分配元數(shù)據(jù),用以描述每個(gè)對(duì)象的內(nèi)容和其他屬性。
對(duì)于開(kāi)發(fā)人員來(lái)說(shuō),在項(xiàng)目伊始確定元數(shù)據(jù)元素的性質(zhì)和數(shù)量非常重要。一些元數(shù)據(jù)元素描述了項(xiàng)目的內(nèi)容,包括標(biāo)題、創(chuàng)建者、發(fā)布日期和討論主題,其他元素可能被分配來(lái)管理集合,包括掃描狀態(tài)、質(zhì)量控制狀態(tài)和內(nèi)部注釋,以及數(shù)字對(duì)象的技術(shù)方面,例如文件格式和大小。
數(shù)字圖書(shū)館建設(shè)團(tuán)隊(duì),需要包容不同背景及提供各種專業(yè)知識(shí)的成員。從多個(gè)領(lǐng)域獲得構(gòu)建系統(tǒng)的建議和幫助,從而建立更好的數(shù)字圖書(shū)館。
計(jì)算機(jī)科學(xué)和圖書(shū)館學(xué)是用于構(gòu)建數(shù)字圖書(shū)館最關(guān)鍵的兩個(gè)學(xué)科領(lǐng)域。計(jì)算機(jī)專家能領(lǐng)會(huì)和鑒別技術(shù)的可行性和局限性,關(guān)心數(shù)字圖書(shū)館元數(shù)據(jù)標(biāo)準(zhǔn)在龐大互聯(lián)網(wǎng)信息空間中提供的語(yǔ)義互操作性;而圖書(shū)館員是信息資源的管理者,具有豐富的編目和索引經(jīng)驗(yàn),并能認(rèn)識(shí)到這些概念對(duì)于信息檢索的重要性,而且他們了解用戶的信息需求,關(guān)心保存材料以繼續(xù)獲取和使用的問(wèn)題。此外,能夠提供長(zhǎng)期財(cái)政、材料、人力支持的組織和高層管理人員同樣重要。
設(shè)計(jì)“易用的系統(tǒng)”。大多數(shù)數(shù)字圖書(shū)館是通過(guò)網(wǎng)絡(luò)技術(shù)在互聯(lián)網(wǎng)Web上提供的。成功的Web站點(diǎn)設(shè)計(jì)包括許多因素,例如,計(jì)算機(jī)和瀏覽器之間的技術(shù)差異、訪問(wèn)速度和用戶之間的差異、Web導(dǎo)航偏好等。瀏覽器在顯示信息的方式上有所不同,即使它們使用相同的基本通信協(xié)議(如Http、Https)和標(biāo)準(zhǔn)標(biāo)記語(yǔ)言(比如HTML或XML)。由于用戶可能會(huì)更改默認(rèn)設(shè)置,所以最好創(chuàng)建盡可能簡(jiǎn)單的接口,并避免服務(wù)器端對(duì)數(shù)據(jù)的精確顯示進(jìn)行控制。此外,開(kāi)發(fā)面向數(shù)字圖書(shū)館的接口時(shí),對(duì)于具有一定物理缺陷的用戶來(lái)說(shuō),可訪問(wèn)性也是一個(gè)問(wèn)題。
確保開(kāi)放存取的原則。確保開(kāi)放存取與可用性問(wèn)題密切相關(guān),包括對(duì)數(shù)字圖書(shū)館的內(nèi)容及對(duì)數(shù)字圖書(shū)館本身的訪問(wèn)。確保對(duì)內(nèi)容開(kāi)放存取的一種方法是避免使用專有的軟硬件解決方案。許多用于創(chuàng)建數(shù)字圖像的收費(fèi)軟件,同時(shí)允許軟件接口免費(fèi)使用,數(shù)字圖書(shū)館開(kāi)發(fā)人員可以清楚地知道需要哪些軟件來(lái)查看這些圖像,可以方便地訪問(wèn)這些內(nèi)容。為了確保持續(xù)可訪問(wèn)性,開(kāi)放的非專有系統(tǒng)是建設(shè)數(shù)字圖書(shū)館的首選。
數(shù)字版權(quán)意識(shí)。我國(guó)的版權(quán)法和著作權(quán)法保護(hù)數(shù)字知識(shí)產(chǎn)品,而開(kāi)放獲取信息可能會(huì)威脅知識(shí)產(chǎn)權(quán)。數(shù)字信息基礎(chǔ)設(shè)施易于獲得大量信息,但是信息的不當(dāng)復(fù)制和訪問(wèn)控制存在不確定途徑的風(fēng)險(xiǎn)。創(chuàng)建數(shù)字圖書(shū)館應(yīng)關(guān)注這個(gè)問(wèn)題,并參與討論相關(guān)的解決方案,盡可能地建立管理程序以保護(hù)館藏資源。例如,在數(shù)字轉(zhuǎn)換項(xiàng)目中,應(yīng)該得到實(shí)體版權(quán)所有者的許可。考慮個(gè)人隱私問(wèn)題,當(dāng)重要的私人文件被數(shù)字化的時(shí)候,要根據(jù)捐贈(zèng)者標(biāo)記出的敏感物品及處置說(shuō)明,仔細(xì)地跟蹤權(quán)限和隱私信息,確保這些信息不存在法律風(fēng)險(xiǎn)。
系統(tǒng)自動(dòng)化程度。建立數(shù)字圖書(shū)館需要系統(tǒng)創(chuàng)建者進(jìn)行大量的腦力勞動(dòng),構(gòu)建和使用自動(dòng)化工具越多,就能更好地利用寶貴的人力資源;這些工具使內(nèi)容專家能夠?qū)W⒂谥R(shí)任務(wù)(如圖1所示),只需使用元數(shù)據(jù)輸入系統(tǒng)向主數(shù)據(jù)庫(kù)一次性添加元數(shù)據(jù),然后根據(jù)訪問(wèn)用戶的需要從主數(shù)據(jù)庫(kù)提取和組合這些信息,生成HTML頁(yè)面、搜索索引和報(bào)告。一次性輸入數(shù)據(jù)可以節(jié)省人力和時(shí)間,降低錯(cuò)誤率,并允許最大的靈活性。幾乎整個(gè)Web界面都是由數(shù)據(jù)庫(kù)生成的,只要有必要就允許更新,同時(shí)能遵循最新的Web標(biāo)準(zhǔn)。系統(tǒng)進(jìn)行模塊化設(shè)計(jì)時(shí),要求現(xiàn)有模塊易于修改,易于為新功能添加新模塊。
采用并遵循標(biāo)準(zhǔn)。在系統(tǒng)構(gòu)建中遵循標(biāo)準(zhǔn)使應(yīng)用程序易于擴(kuò)展、可互操作和可移植,這些特性對(duì)于數(shù)字圖書(shū)館的設(shè)計(jì)、實(shí)現(xiàn)和維護(hù)非常重要。使用標(biāo)準(zhǔn)對(duì)于數(shù)字圖書(shū)館來(lái)說(shuō)尤其重要,掃描、元數(shù)據(jù)輸入和文檔標(biāo)記,集合中所有涉及需要評(píng)估和處理的單個(gè)項(xiàng)目,都是資源任務(wù)密集型的工作,需要一次性完成。遵循標(biāo)準(zhǔn)將使今后可能發(fā)生的數(shù)據(jù)遷移更加容易實(shí)現(xiàn)。此外,使用標(biāo)準(zhǔn)文件格式保存的信息,比用專有格式編碼的信息更容易訪問(wèn)。
對(duì)于開(kāi)發(fā)人員來(lái)說(shuō),使用標(biāo)準(zhǔn)更易于實(shí)現(xiàn)互操作性。通過(guò)使用標(biāo)準(zhǔn)通用的數(shù)據(jù)標(biāo)簽和Web技術(shù),發(fā)布數(shù)字圖書(shū)館的內(nèi)容,增加其他Web搜索引擎訪問(wèn)圖書(shū)館及其中具體條目的機(jī)會(huì)。未來(lái)數(shù)字圖書(shū)館或許能成為某個(gè)更寬泛的系統(tǒng)組成部分,那么開(kāi)放的標(biāo)準(zhǔn)設(shè)計(jì),將使未來(lái)的轉(zhuǎn)換和重組更加平順。
保證質(zhì)量的原則。質(zhì)量度量可以應(yīng)用于創(chuàng)建一個(gè)數(shù)字圖書(shū)館所涉及的所有過(guò)程和結(jié)果。它們與選擇、元數(shù)據(jù)條目、圖像捕獲及系統(tǒng)的總體可用性有關(guān)。完整和正確的元數(shù)據(jù)會(huì)帶來(lái)許多好處;不完全或不正確的元數(shù)據(jù)會(huì)影響整個(gè)數(shù)字圖書(shū)館的建設(shè)質(zhì)量。元數(shù)據(jù)在資源發(fā)現(xiàn)和集合管理方面都扮演著重要角色,如果主題代碼被隨意或不正確地應(yīng)用,那么根據(jù)這些代碼生成瀏覽層次結(jié)構(gòu)的嘗試可能會(huì)被阻止,訪問(wèn)可能會(huì)更加困難。
轉(zhuǎn)換項(xiàng)目中掃描過(guò)程的指導(dǎo)方針,如果包括對(duì)被掃描圖像的外觀標(biāo)準(zhǔn),如方向、分辨率、色調(diào),將會(huì)減少很多潛在的問(wèn)題。一些質(zhì)量控制指標(biāo)可以實(shí)現(xiàn)自動(dòng)化,有些則需要人工審查。數(shù)字圖書(shū)館項(xiàng)目應(yīng)定義并堅(jiān)持實(shí)施質(zhì)量控制方法,確保質(zhì)量評(píng)估成為構(gòu)建和維護(hù)數(shù)字圖書(shū)館的重要組成部分。
內(nèi)容持久性原則。對(duì)于數(shù)字圖書(shū)館而言,首先是數(shù)字對(duì)象的“遷移策略”,它要求將數(shù)據(jù)從一個(gè)文件格式轉(zhuǎn)換為另一個(gè)文件格式,從一個(gè)軟件環(huán)境轉(zhuǎn)換為另一個(gè)軟件環(huán)境,或者從一個(gè)物理介質(zhì)轉(zhuǎn)移到另一個(gè)物理介質(zhì)。遷移意味著機(jī)構(gòu)強(qiáng)大持久的承諾和支持,不斷刷新其集合以跟上技術(shù)進(jìn)步的步伐。其次是數(shù)字對(duì)象的保存和持久性,保存是指對(duì)象的技術(shù)壽命和質(zhì)量;持久性則是一個(gè)更廣泛的概念,包含保存,也包括這個(gè)對(duì)象將來(lái)是否還會(huì)以其他形式存在。數(shù)字信息的持久性意味著存儲(chǔ)信息并保持其可訪問(wèn)。
2 結(jié)語(yǔ)
遵循以上原則,以及從這些原則演變而來(lái)的實(shí)踐經(jīng)驗(yàn),可以讓我們更加方便、順利地建設(shè)、維護(hù)和發(fā)展數(shù)字圖書(shū)館,保護(hù)高質(zhì)量有價(jià)值的信息資源,為用戶持續(xù)提供開(kāi)放的訪問(wèn)服務(wù)而努力。
參 考 文 獻(xiàn)
[1]阿姆斯.數(shù)字圖書(shū)館概論[M].北京:電子工業(yè)出版社,2001.
[2]張樹(shù)忠.人、組織、技術(shù)共同演繹的精彩故事——《數(shù)字圖書(shū)館概論》評(píng)介[J].大學(xué)圖書(shū)館學(xué)報(bào),2001(5):84.
[3]曾蕾,張甲,楊宗英.數(shù)字圖書(shū)館:路在何方?——關(guān)于數(shù)字圖書(shū)館定義、結(jié)構(gòu)及實(shí)際項(xiàng)目的分析[J].情報(bào)學(xué)報(bào),2000(1):67-76.
[4]邱均平,朱少?gòu)?qiáng).數(shù)字圖書(shū)館版權(quán)保護(hù)技術(shù)及其規(guī)避行為的法律對(duì)策[J].情報(bào)科學(xué),2006(1):1-7.
[5]杜文才.數(shù)字圖書(shū)館建設(shè)中的數(shù)據(jù)交換標(biāo)準(zhǔn)問(wèn)題芻議[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2003(S1):14-16.
[責(zé)任編輯:高海明]