關鍵詞:圖書館;數(shù)字化資源;生命周期;連接方式
摘要:文章介紹了圖書館數(shù)字化資源的利用優(yōu)勢,分析了圖書館數(shù)字化資源的生命周期,提出了圖書館基于數(shù)字化生命周期進行館藏資源建設的策略,探討了館藏數(shù)字化資源的常用連接方式。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2018)10-0084-03
互聯(lián)網(wǎng)時代,隨著圖書館數(shù)字化資源的迅速增多,人們對數(shù)字化資源的利用率也在不斷提高。對信息資源進行數(shù)字化處理,就是將紙質(zhì)資源轉(zhuǎn)化為計算機可以識別的信息,方便圖書館對經(jīng)過轉(zhuǎn)換的信息進行數(shù)字化存取、傳輸與管理。圖書館在采集、創(chuàng)建與管理數(shù)字化資源的過程中,應該認識到信息資源是不斷更新的,且具有特定的數(shù)字化生命周期。在不同的生命周期階段,數(shù)字化資源具有不同的應用價值,因此圖書館應該采用不同的管理方式。數(shù)字化資源處于動態(tài)變化中,在創(chuàng)建的初始階段,用戶出于對新生事物的好奇,其使用頻率相對較高。而隨著時間的推移,這些館藏數(shù)字化資源的利用率會隨之下降,數(shù)字化資源的利用價值也會隨之降低[1]。如何促進數(shù)字化資源的持續(xù)保存與利用,保障用戶知識需求的有序轉(zhuǎn)化,提供更加便于用戶利用的信息資源,是圖書情報界研究的熱點問題。基于數(shù)字化生命周期的信息資源建設,圖書館要根據(jù)數(shù)字化資源所處的不同階段,采取相應的管理與服務策略,借助信息管理軟硬件設施,滿足用戶對館藏數(shù)字化資源進行連接、共享、保護等方面的需求,提高館藏數(shù)字化資源在不同生命階段的利用率。
1圖書館數(shù)字化資源的利用優(yōu)勢
1.1館藏數(shù)字化資源的界定
數(shù)字化資源是指借助先進的信息技術(shù),將信息資源轉(zhuǎn)化為計算機可以識別的數(shù)字化形式,并通過遠程服務器進行高速傳輸,供用戶隨時隨地利用智能檢索技術(shù)獲取的資源。2007年修訂的《高等學校圖書館數(shù)字資源計量指南》將數(shù)字化資源定義為圖書館引入或自建的,擁有磁、光介質(zhì)或網(wǎng)絡使用權(quán)的數(shù)字形態(tài)的文獻資源。數(shù)字化資源的采集、加工與處理是一個復雜、系統(tǒng)的工程,圖書館需要將分散于不同位置、不同載體的信息資源,統(tǒng)一轉(zhuǎn)變?yōu)閿?shù)字化形式,并通過網(wǎng)絡連接為用戶提供服務。目前,數(shù)字化資源可分為電子圖書、電子期刊、二次文獻數(shù)據(jù)庫及其他數(shù)據(jù)庫等四種類型。
1.2數(shù)字化資源的特點
隨著數(shù)字化技術(shù)的廣泛應用,圖書館的數(shù)字化資源迅速增多,存儲容量日益擴大,數(shù)字化資源成為信息建設的重點。由于數(shù)字化資源的檢索便捷,用戶能移動訪問與閱讀,因此其需求量不斷增加。數(shù)字化資源分布廣泛,存儲路徑多樣,類型豐富,包括音頻、視頻及各種類型的數(shù)據(jù)庫等[2]。它具有較高的存儲密度,占用的存儲空間較小,且更新的速度較快,便于圖書館進行長期存儲與動態(tài)管理。圖書館可以將其存儲于本館服務器中,也可借助云計算技術(shù)將其存儲于在線虛擬空間,方便用戶獲取與利用。
1.3數(shù)字化資源的利用優(yōu)勢
圖書館加強數(shù)字化資源建設,目的在于最大限度地發(fā)揮其利用價值。與傳統(tǒng)館藏資源相比,數(shù)字化資源具有使用便捷、檢索途徑多樣、方便隨時獲取、使用方法靈活及查準率高等特點。數(shù)字化資源的存儲時間長、存儲空間小、維護成本低及利用率高[3],同時數(shù)字化資源的不斷更新也有利于豐富館藏,優(yōu)化館藏結(jié)構(gòu),進而滿足用戶的信息需求。數(shù)字化資源便于傳輸?shù)奶攸c決定了其具有共享性,能夠促進不同機構(gòu)間的信息共享,簡化信息組織流程,提高信息反饋速度,實現(xiàn)更大范圍內(nèi)的信息共建共享。數(shù)字化資源便于圖書館進行智能化管理,能減輕館員的工作量,促進圖書館的現(xiàn)代化建設進程。
2圖書館數(shù)字化資源的生命周期分析
生命周期是數(shù)字化信息運行的自然規(guī)律,與信息需求有關,分為生產(chǎn)、采集、組織、存儲、維護和利用等階段。各個階段緊密相連,層層推進,在一個生命周期中按順序展開。
2.1生產(chǎn)與采集
在生產(chǎn)與采集階段,圖書館要確定信息資源的內(nèi)容和范圍,選擇合適的軟硬件設備,為后續(xù)對數(shù)字化資源的篩選和利用提供便利[4]。由于數(shù)字化信息資源來源多樣,載體各異,包括電子圖書、視頻及數(shù)據(jù)庫等,圖書館應根據(jù)館藏建設規(guī)劃,不僅要對各類館藏資源進行數(shù)字化,還要對既有的數(shù)字化資源進行格式轉(zhuǎn)換。圖書館也要通過采集外部數(shù)字化資源的方式,不斷優(yōu)化館藏結(jié)構(gòu),一方面可以利用網(wǎng)絡爬蟲等技術(shù),有針對性地采集互聯(lián)網(wǎng)中的開放信息資源;另一方面可與數(shù)字資源供應商合作,購買或免費獲取使用權(quán),將數(shù)字化資源納入其數(shù)據(jù)庫。不同圖書館還可以通過共享數(shù)字化資源的方式,共同探討知識產(chǎn)權(quán)的保護問題,擴大數(shù)字化資源的傳播范圍。
張穎:圖書館館藏資源的數(shù)字化生命周期及連接方式研究2.2組織與存儲
在組織與存儲階段,圖書館應對已有的數(shù)字化資源進行整合處理,為用戶獲取信息資源提供便利。圖書館需要按照一定的標準和使用規(guī)則,對數(shù)字化資源進行分類,將相同的資源存儲于相同的子系統(tǒng)中[5]。對于引入本體的數(shù)字化資源,圖書館需要進行編目與標引,通過創(chuàng)建元數(shù)據(jù)的方式,提高用戶的檢索效率。數(shù)字化資源規(guī)模大,種類繁多,圖書館有必要設計合理的存儲系統(tǒng),方便不同類型資源的存儲與利用。同時,圖書館也需要考慮資源的存儲形式等問題,即對不同的數(shù)字化資源采用不同的存儲載體,并根據(jù)用戶的使用要求,確定存儲方式。
2.3維護與利用
圖書館要想實現(xiàn)長期保存數(shù)字化資源的目的,就需要做好維護工作。在維護與利用階段,圖書館需要應用各類信息資源管理技術(shù),如射頻識別、大數(shù)據(jù)技術(shù)等,對各類資源進行高效清點、統(tǒng)計及分析,設定不同資源的管理指標,方便系統(tǒng)進行自動化管理。數(shù)字化資源易于變化,圖書館需要關注信息安全問題,引入適合的安全防護技術(shù),及時清理殘缺、陳舊的資源,保障數(shù)字化資源的傳輸、利用安全。共享是利用的前提,沒有共享就無法最大限度地發(fā)揮資源價值[6]。因此,圖書館可秉持跨界融合的理念,與政府、企業(yè)和其他信息機構(gòu)合作,形成寬渠道、多領域的資源共享網(wǎng)絡。
3圖書館基于數(shù)字化生命周期的館藏資源建設
信息資源建設是一個循環(huán)往復的過程,在不同階段涉及不同的內(nèi)容,每個環(huán)節(jié)都需要進行周密思考,保障整個流程的無縫銜接。圖書館基于數(shù)字化生命周期理論,可利用先進技術(shù)對數(shù)字化資源進行集約化建設,構(gòu)建數(shù)字化資源建設技術(shù)框架(見圖1),消除“信息孤島”,促進信息資源的交流融合,實現(xiàn)數(shù)字化資源的共建共享。
3.1采集處理層
圖書館應引入射頻識別技術(shù)和傳感器技術(shù),對數(shù)字化資源進行集約化采集與加工,依托元數(shù)據(jù)實現(xiàn)格式統(tǒng)一。在數(shù)據(jù)采集階段,圖書館需要利用大數(shù)據(jù)技術(shù)對數(shù)字化資源進行綜合處理,了解不同類型數(shù)據(jù)的屬性與特點,確定與其相對應的元數(shù)據(jù)建設標準。圖書館也應按照元數(shù)據(jù)提取、映射規(guī)則,對采集的數(shù)字化資源進行元數(shù)據(jù)描述和語義標注,在保留不同資源共性的基礎上,展現(xiàn)不同數(shù)字化資源的特色,促進不同數(shù)據(jù)之間的轉(zhuǎn)換。同時,圖書館也應將數(shù)字化資源轉(zhuǎn)化為機器可識別的格式,構(gòu)建館藏數(shù)字化資源核心數(shù)據(jù)集,并利用過濾、分析設備抽取核心數(shù)據(jù)。此外,圖書館還應借助數(shù)字化資源標識技術(shù),對不同類型的資源進行標識,通過語義關聯(lián)揭示不同資源之間的內(nèi)在聯(lián)系。
3.2存儲管理層
由于每個機構(gòu)的存儲系統(tǒng)相對獨立,如果圖書館采用傳統(tǒng)的手段與技術(shù)對數(shù)字化資源進行存儲管理,就會導致資源浪費,增加工作人員的工作量,因而無法實現(xiàn)資源的共建共享。因此,圖書館可以聯(lián)合其他信息機構(gòu),利用統(tǒng)一認證、數(shù)據(jù)備份和云存儲等技術(shù),設計能夠兼容多個存儲系統(tǒng)的中心存儲器,滿足分布式數(shù)字化資源的長期存儲需求,提升整體存儲能力,促進館藏數(shù)字化資源的靈活存儲與可持續(xù)利用。圖書館也可依托Hadoop數(shù)據(jù)庫架構(gòu)實現(xiàn)分布式存儲,設置多個存儲設備與云存儲空間,在緩解存儲壓力的同時,提高數(shù)字化資源的存儲效率和可拓展性[7]。此外,圖書館還可利用災難備份技術(shù),對不同模塊的數(shù)據(jù)資源進行備份處理,實現(xiàn)異構(gòu)資源的及時備份,在系統(tǒng)發(fā)生故障時,圖書館依然能夠保障服務的連續(xù)性。
3.3展示反饋層
對于經(jīng)過集約化處理的數(shù)字化資源,圖書館可以在公共信息網(wǎng)絡上建立專用數(shù)據(jù)通道,依托集群式檢索技術(shù),實現(xiàn)高效的數(shù)據(jù)信息傳輸,并通過不同的媒介形態(tài),將館藏數(shù)字化資源以圖文并茂的形式展示給用戶。同時,圖書館也需要對各項業(yè)務進行合理調(diào)度,收集終端用戶的交互反饋信息,并根據(jù)反饋信息調(diào)整與完善服務內(nèi)容[8]。圖書館要想提高數(shù)字化資源的建設與服務質(zhì)量,就需要利用移動信息技術(shù),實現(xiàn)對數(shù)字化生命周期不同階段的質(zhì)量控制,實現(xiàn)數(shù)字化資源管理的規(guī)范化。為了降低數(shù)字化資源建設成本,圖書館需要將更多精力放在質(zhì)量控制上,以規(guī)范化的操作方式避免資源浪費,提高各種資源的利用率。例如,對于部分使用率低,而相對重要的數(shù)據(jù)資源,圖書館可采用常規(guī)設備進行存儲管理;對于實際應用價值、使用頻率高的數(shù)據(jù)資源,圖書館則可采用運行速度快、價格高的設備進行存儲管理。
4圖書館館藏數(shù)字化資源的常用連接方式研究
圖書館不僅要做好基于生命周期的數(shù)字化資源建設工作,還要利用先進技術(shù)實現(xiàn)多種途徑的館藏數(shù)字化資源鏈接,為用戶提供更多的信息獲取途徑,促進信息的廣泛共享。
4.1建立統(tǒng)一的檢索平臺
不同的信息機構(gòu)都有相對獨立的文獻數(shù)據(jù)庫,且具備獨立的文獻展示、控制與揭示等功能。但從整體上看,分散孤立的狀態(tài)不利于有效發(fā)揮數(shù)據(jù)庫的應用價值,容易導致數(shù)據(jù)檢索的缺失或局限。即使用戶有明確的檢索目標,在單一的數(shù)據(jù)庫中也無法保障檢索結(jié)果的完整性。因此,圖書館在加強數(shù)字化資源建設的基礎上,可以聯(lián)合其他機構(gòu)建立統(tǒng)一檢索平臺,以實現(xiàn)館藏數(shù)字化資源的一站式檢索,為用戶獲取信息提供便利。例如,清華大學圖書館通過對多個機構(gòu)數(shù)據(jù)庫進行整合的方式,涵蓋了本館館藏資源、超星圖書館、中國知網(wǎng)、維普中文期刊等數(shù)據(jù)庫,方便用戶利用統(tǒng)一檢索平臺進行跨庫檢索。該方式不僅優(yōu)化了館藏資源的結(jié)構(gòu),還為用戶構(gòu)建了更加便捷的檢索環(huán)境,擴大了數(shù)據(jù)整合的范圍,消除了數(shù)據(jù)檢索、傳輸速度等方面的障礙。
4.2生成超文本鏈接
所謂超文本鏈接,就是在互聯(lián)網(wǎng)頁面上形成的、方便用戶從當前頁面跳轉(zhuǎn)至指定地址的另一個頁面的技術(shù)。圖書館在完成數(shù)字化資源建設后,可以將不同類型的數(shù)字化資源收錄進專門的存儲文本中,并利用先進的技術(shù)對這些文本進行提取操作,從中抽取作者、出版社等重要信息,以及章節(jié)、摘要等結(jié)構(gòu)化信息。圖書館應將這些從原有文本中抽離出來的信息,存儲于另一個單獨的文本文件中,方便用戶進行結(jié)構(gòu)化查詢。圖書館也可利用自動分類器對所有文本文件進行分類,賦予它們對應的分類號,并依據(jù)分類號將它們依次錄入后臺并行的數(shù)據(jù)庫。在用戶進行文獻檢索時,系統(tǒng)會根據(jù)檢索要求將分析結(jié)果傳輸至后臺數(shù)據(jù)庫,自動建立與參考文獻條目相關的超鏈接,進而提高用戶的檢索效率。
4.3基于HTTP協(xié)議的數(shù)據(jù)鏈接
由于數(shù)字化資源的文獻類型、存儲格式存在較大差異,為了提高館藏數(shù)字化資源的利用率,為用戶提供便捷、操作性強的檢索方式,圖書館可以借助文獻編目中的特定字段標記法,對數(shù)字化資源進行科學分類,揭示不同資源之間的內(nèi)在聯(lián)系,并利用HTTP協(xié)議(HyperText Transfer Protocol,超文本傳輸協(xié)議)進行鏈接。用戶在檢索特定文獻時,可以直接閱讀對應的電子版。由于相同的文獻可能被多個出版社或多個數(shù)據(jù)庫收錄,圖書館可以設置多個數(shù)據(jù)鏈接,將所有相關內(nèi)容有機結(jié)合起來,最大限度地提高信息資源的查全率。
5結(jié)語
圖書館應基于數(shù)字化生命周期,對館藏數(shù)字化資源進行科學規(guī)劃與管理,在不同階段進行分層、分級保護與服務,最大限度地提高館藏數(shù)字化資源的利用率。互聯(lián)網(wǎng)環(huán)境下,先進技術(shù)的應用為圖書館數(shù)字化資源建設注入了活力,為基于數(shù)字化生命周期的館藏資源建設提供了新的機遇。
參考文獻:
[1]嚴軒.重慶市公共圖書館館藏資源數(shù)字化及利用情況研究[J].圖書館研究與工作,2017(2):44-47.
[2]劉香蘭.基于生命周期的跨機構(gòu)文化資源數(shù)字化建設[J].圖書館,2016(4):62-65.
[3]劉永剛.數(shù)字化時代下對高校圖書館整合院系圖書資源的思考[J].內(nèi)蒙古師范大學學報(哲學社會科學版),2015(1):146-148.
[4]史艷芬,劉玉紅.基于科學數(shù)據(jù)管理生命周期的高校圖書館服務角色定位研究[J].新世紀圖書館,2016(4):35-39.
[5]尹文武.信息生命周期理論下的移動圖書館信息服務質(zhì)量控制[J].圖書館理論與實踐,
2017(4):91-93.
[6]薛晶晶,焦坤,張欣,等.國外大學圖書館基于科研生命周期的科研支持服務研究[J].情報理論與實踐,2016(5):110-114.
[7]周淑云,伍丹.基于信息生命周期的高校圖書館數(shù)據(jù)監(jiān)護流程分析[J].山東圖書館學刊,
2016(3):26-29.
[8]孫仙閣.基于數(shù)據(jù)生命周期理論的學術(shù)圖書館科研數(shù)據(jù)管理模型研究[J].圖書館學刊,
2016(12):4-7.
(編校:孫新梅)第38卷第10期河南圖書館學刊2018年10月
收稿日期:2018-09-13
作者簡介:張亮(1979—),鐵嶺市圖書館副研究館員。