陳 翔
(河南省圖書館,河南 鄭州 450000)
數(shù)字圖書館信息存貯量大數(shù)據(jù)化。目前我國網(wǎng)絡(luò)信息建設(shè)飛速發(fā)展,網(wǎng)絡(luò)信息資源呈現(xiàn)膨脹式增漲,不同來源的電子數(shù)據(jù)資源在短時間內(nèi)融入到圖書館。種類繁多的數(shù)據(jù)資源為圖書館提供了豐富的數(shù)字資源,由此也會給圖書館帶來更多的用戶,信息技術(shù)背景下,電子信息資源也是不斷擴(kuò)大,圖書館電子信息存儲量年增長率也是屢創(chuàng)新高,其下載量、閱讀量同樣也隨之增高。此外,時代在不斷進(jìn)步,數(shù)字信息資源也在不斷完善、優(yōu)化,圖書館信息資源建設(shè)也變得更先進(jìn);存儲類型種類繁多,覆蓋面更廣、形式多樣化,更適合不同需求讀者的個性化需求。從最原始的數(shù)據(jù)單一存儲,演變到電子期刊、媒體數(shù)據(jù)、視頻流數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)流等現(xiàn)代化流行資源,不同需求的用戶可以在圖書館里快速便捷的獲得自己想要的信息資源。方便且 實(shí)用。
數(shù)字圖書館信息資源大數(shù)據(jù)量管理架構(gòu),大數(shù)據(jù)采集、存儲、處理、應(yīng)用一共是4層,從圖1可以看出大數(shù)據(jù)儲存在第2層,是在大數(shù)據(jù)采集后處理的第一關(guān)。大數(shù)據(jù)量的高效、穩(wěn)定、安全、長期保存,是圖書館面對數(shù)字信息圖書館建設(shè)的首要問題。

圖1 圖書館大數(shù)據(jù)架構(gòu)圖
1)技術(shù)方面沒有形成統(tǒng)一標(biāo)準(zhǔn),導(dǎo)致存儲方式方法種類多,儲存質(zhì)量也是參差不齊。當(dāng)前數(shù)字信息資源保存方法較多,方式靈活,一部分技術(shù)較為成熟,一部分保存技術(shù)不完善,保存質(zhì)量較差,而且熟悉信息資源存在不穩(wěn)定因素,有數(shù)據(jù)丟失、失真等特性,在資源所依賴的技術(shù)在技術(shù)變化、環(huán)境變化情況下也會隨之發(fā)生變化,亦有可能造成數(shù)據(jù)損壞,無法正常使用的情況。由于當(dāng)前熟悉信息數(shù)據(jù)種類多,其內(nèi)容也龐大復(fù)雜,大部分圖書館都會進(jìn)行有選擇性的儲存,如何進(jìn)行專業(yè)規(guī)范化收藏仍然是技術(shù)難題,其主要的難點(diǎn)在對重要的元數(shù)據(jù)收藏,怎樣建立元數(shù)據(jù)、怎樣存放元數(shù)據(jù),存放在哪、元數(shù)據(jù)如何選用等一系列的常見問題。這些問題都對圖書館數(shù)據(jù)保存環(huán)節(jié)提出了更多的技術(shù)要求。
2)基礎(chǔ)設(shè)施設(shè)備不夠健全,存儲的連續(xù)性,穩(wěn)定運(yùn)行沒法得到有效保證。圖書館應(yīng)配備完善的硬件基礎(chǔ)設(shè)施設(shè)備,同時應(yīng)具備規(guī)模化發(fā)展和經(jīng)濟(jì)基礎(chǔ),否則大數(shù)據(jù)信息資源的長期穩(wěn)定保存沒法得到保障,目前圖書館基礎(chǔ)設(shè)施較為落后,大多沒有投入或者只是少量投入現(xiàn)代化的先進(jìn)設(shè)備,在大數(shù)據(jù)管理不夠全面。數(shù)字信息資源保存技術(shù)不夠嫻熟。大數(shù)據(jù)數(shù)字信息的保存工作又是一項(xiàng)長期工程,這些要求都需要圖書館具備過硬的經(jīng)濟(jì)基礎(chǔ),如果沒法持續(xù)性進(jìn)行維護(hù)優(yōu)化,勢必會對圖書館信息資源造成重要的損失。而我國目前還沒有出臺對數(shù)字信息保護(hù)的政策支持。資金短缺問題時有發(fā)生,數(shù)據(jù)圖書館不能在短時間內(nèi)為圖書館帶來相應(yīng)的經(jīng)濟(jì)收益,導(dǎo)致圖書館在無法盈利的情況下依舊需要對數(shù)據(jù)進(jìn)行相應(yīng)的保護(hù)措施。
1)法律規(guī)范不夠明確,版權(quán)保護(hù)和資源歸屬傳播存在爭議等問題。任何信息資源都會面對的問題就是法律層面的問題,數(shù)字信息資源亦是如此,信息資源是否涉嫌抄襲、侵權(quán)、侵犯作者隱私等問題應(yīng)在圖書館采集數(shù)據(jù)信息時加以確認(rèn),做到所收藏資源不觸犯法律、不侵犯歸屬隱私、不涉嫌抄襲,安全合理方可長期保存。
2)用戶使用缺少約束力,信息的傳播無法得到保障,圖書館在保存熟悉信息資源的同時,還要為用戶提供閱讀、檢索權(quán)限,但是在目前網(wǎng)絡(luò)信息傳播途徑廣泛、傳播門檻低、用戶對版權(quán)法律意識淡薄、不尊重歸屬作者隱私的環(huán)境下,圖書館沒法限制用戶的這一類行為,無法約束其規(guī)范合理利用數(shù)字資源,這給圖書館數(shù)字存儲工作帶來了問題。圖書館是為大眾服務(wù)機(jī)構(gòu),是沒有約束用戶除閱覽檢索除外附屬約束的權(quán)利,但是網(wǎng)絡(luò)信息傳播有局限要求,圖書館應(yīng)保護(hù)作者的合法權(quán)益、沒有形成對數(shù)字信息傳播保障,從而產(chǎn)生矛盾與 沖突。
1)首先應(yīng)在技術(shù)層面上明確數(shù)字資源的儲存方式,是以光盤儲存、服務(wù)器存儲形式、磁盤陣列方式、等方式明確一個存儲方式,從而制定專項(xiàng)的管理技術(shù)手段。傳統(tǒng)的光盤存儲方式是比較普遍的存儲方式,而且具有成本不高,系統(tǒng)維護(hù)較為簡單等優(yōu)點(diǎn),但是對于大數(shù)量數(shù)據(jù)資源卻并不適用,單張光盤存儲量較小,如果是大數(shù)據(jù)量系統(tǒng)文件,則需要上百張甚至上千張光盤來存儲,則顯得不合適。文件服務(wù)器存儲方式是借用網(wǎng)站服務(wù)器存儲,使用用戶只需簡單的注冊賬號、設(shè)置登陸密碼,登陸到資源服務(wù)器就能查閱到所需資源,方便快捷。磁陣列則是用于大數(shù)據(jù)的數(shù)據(jù)備份,保障信息安全可靠。具有傳輸速度快的特點(diǎn),缺點(diǎn)是價格昂貴。這幾種存儲方式是圖書館數(shù)字信息資源長期保存的主要幾種方式。該類方式還可以通過擴(kuò)展當(dāng)前較為新穎的微云和網(wǎng)絡(luò)存儲空間,但其方式具有技術(shù)門檻高,需要相對嫻熟的技術(shù)支撐才能保障數(shù)據(jù)安全可靠運(yùn)行。
2)全面維護(hù)保證安全,精心管理保證持久穩(wěn)定運(yùn)行,圖書館應(yīng)在保存工作上建立科學(xué)的管理體系,選擇合格的管理機(jī)構(gòu),構(gòu)建規(guī)范的管理網(wǎng)絡(luò),統(tǒng)一整體建設(shè)方案,所有的計劃都圍繞在信息資源有效、安全、長期保存這一目標(biāo)進(jìn)行。此外,技術(shù)平臺的管理和維護(hù)也十分重要,技術(shù)質(zhì)量對信息儲存是否合理,能不能穩(wěn)定長久運(yùn)行產(chǎn)生直接影響。軟件與硬件體系和與之相關(guān)的媒體體系的建設(shè)、維護(hù)、管理對數(shù)字信息的失效時常產(chǎn)生影響,采用新媒體材料可以有效控制信息丟失。圖書館應(yīng)對長期保存的大數(shù)據(jù)信息進(jìn)行規(guī)范管理,就必須對寄存的媒體數(shù)據(jù)加以優(yōu)化過濾控制,不僅涉及存儲環(huán)境,更關(guān)系到存儲安全問題。
綜上所述,大數(shù)據(jù)時代大數(shù)據(jù)資源存儲是圖書館在其數(shù)字信息系統(tǒng)建設(shè)過程中必須面對的重要問,積極運(yùn)用高效的技術(shù)手段和合理有效的管理方式方法結(jié)合才能保證大數(shù)據(jù)信息資源存儲空間保障,加強(qiáng)開發(fā)技術(shù)手段和擴(kuò)展管理水平在圖書館數(shù)字資源存儲工作中要常抓 不懈。