黃尤精
[摘 要] 數字化信息資源建設是圖書館發展的新趨勢,面對這種新變化,圖書館必須加大力度建設數字化信息資源。互聯網資源采集是圖書館獲取數字資源的一個重要途徑,文章從互聯網資源采集方向、采集標準、資源保存等方面描述了圖書館的網絡資源建設工作。
[關鍵詞] 圖書館;互聯網;資源采集;資源保存
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 07. 056
[中圖分類號] G251 [文獻標識碼] A [文章編號] 1673 - 0194(2018)07- 0136- 02
0 前 言
隨著網絡化和信息化的快速發展,圖書館業務系統環境也發生了翻天覆地的變化。圖書館館藏類型已經發生了很大變化,從圖書館內部所具有的資料擴展到了互聯網書目數據庫、全文數據庫等,此外,圖書館采集收藏的對象還擴大到了網絡上其他信息資源。因此豐富圖書館數字資源,讓讀者能夠方便順利地獲取知識,成為新一代圖書館人思考的話題。
網絡信息資源的發展,為豐富圖書館的館藏資源建設提供了更廣闊的發展空間,但是網絡資源又存在分散分布性、大量無序性、資源品質的優劣不一性等特點,又給圖書館采集網絡資源帶來了困難。
目前,各地圖書館開始注重對網絡資源的采集和保存的研究, 但對如何從館藏資源建設政策的角度,制定網絡資源的采集和保存制度及策略的不多。本文試圖從網絡資源的采集方向、網絡資源的采集標準、網絡資源保存等方面探討網絡資源的采集及保存制度。
1 網絡資源采集方向
1.1 重視特色資源的采集
圖書館建立文獻資源的出發點就是實現館際間和網絡上的資源共享,資源有效共享的前提是館藏文獻信息特色化,因此,圖書館在在資源收集時,應該重點考慮采集各地區、各單位有特色的網絡信息資源。同時,達到完整級、研究級的水平,特色資源庫還應該具有一定規模且有較高的學術品位和信息價值,同時,還必須在網絡環境下能實現方便、快捷、系統的利用。所以,建設特色館藏應注意以下幾點:第一,選題準,要根據本館性質、任務、藏書優勢和服務特點確定館藏特色。第二,文獻信息的收集內容要全要廣,要突出重點,力求系統、完整和新穎, 做到人無我有, 人有我全,人全我好[1]。
1.2 大力發展本地資源
地方文獻信息是特色資源信息采集的一個重要來源,但是地方文獻類型多樣、內容豐富、時間跨度較大,且文獻源分布分散,不僅有公開發行和內部發行的,還有私人珍藏的,采集工作難度較大。因此在采集的時候應做到以下三點。第一,提前制定詳細的采集大綱,按照大綱有重點地實施。第二,為保障該項工作能長期、穩定堅持下去,并使采集工作在圍繞本館地方文獻采集大綱的基礎上向廣度、深度展開,采集工作必須有專款支持。第三,采集方式要明確,信息采集要準確,可以通過地方政府網站、地方報紙網站、地方電視臺和地方檔案館、博物館網站、地方出版物等渠道采集信息[2]。
1.3 加強對網絡學術資源的采集
隨著網絡信息技術的發展,網絡學術信息資源日益增多,來源廣泛,其中可以通過網絡檢索到大量在正式出版系統中無法獲得的“灰色文獻”。因此, 在進行網絡信息資源采集時,應當把網絡學術信息的采集作為重點工作之一,通過對網絡學術資源的采集、整序和評價,并加以保存和提供使用,充分發揮其應有的作用。
2 網絡資源采集標準
網絡資源作為圖書館館藏資源建設的組成部分,應當對資源采集的品質和資源采集的程度制定一個標準。
2.1 網絡信息資源的采集與傳統文獻資源的采集互補
在采集資源的時候,第一,需要充分考慮用戶對信息的需求,從實用性、針對性和經濟性出發采選網絡資源。第二,需要將傳統文獻與網絡資源作為互相補充,相互結合,傳統文獻具有很好的史料性、理論性和專業性較強,網絡資源具有動態性,更新速度快,二者相輔相成,組成信息資源保障體系,不僅能彌補出版物嚴重滯后問題還能彌補網絡資源史料少的不足。
2.2 對網絡數據庫的選擇,要求質量第一
由于一些基層圖書館資金較為匱乏,入藏量不足現象在各地均存在,導致館藏文獻資源在一定程度上不能滿足讀者需求。而一些大性網絡數據庫學術性和時效性較強,因此圖書館采集的重點應面向這個專業性的網絡數據庫,如CNKI中國知網數據庫、Apabi電子圖書、龍源電子期刊等。另外還可以申請試用一些免費的數據庫,如博看期刊數據庫等。
2.3 數據庫資源集中購買,共建共享
數據庫的使用權限希望能夠做到集體統一購買,費用共同分擔,或者上一級圖書館購買資源,下級圖書館免費使用,這樣費用就可能少得多。例如天津市圖書館在購買眾多數據庫資源的時候,都以成員館的方式將本地18個區縣圖書館囊括其中,要求數據庫企業為區縣圖書館提供數據訪問服務,這無疑能豐富圖書館館藏資源又能減輕區縣圖書館的財政負擔。
2.4 注重網絡資源來源的真實性和可靠性
由于互聯網的開放性,每個人都能在互聯網上發布網絡信息,信息良莠不齊且不能保證信息真實性,因此圖書館工作人員應對網絡資源進行篩選,盡量選擇那些由政府機構、企事業單位、科研院所、大型網站等有較高信譽度的機構提供的網絡資源,確保采集到網絡資源真實可靠[3]。
2.5 注重網絡資源來源的時效性和準確性
時效性和準確性是網絡資源的生命力所在,因此,時效性強而又相對穩定信息源顯得非常重要,在確定采集網站后,隨時跟蹤相關網站,采集其更新的信息,提高所采網絡信息資源的時效性。如今有一些專業的抓取軟件,能夠自動抓取相關信息,可以節省一些人力物力,但是為了保證信息的完整性、準確性,對于“抓取”的信息必須經過嚴格的校準審核才能提供給讀者使用。
3 網絡資源保存
為了使圖書館的數字資源長期保存,確保其數字資源能夠持續地、長期地為其用戶提供服務。因此對網絡資源的保存工作,可以分為兩部分,一是網絡資源加工處理保存,二是網絡設備安全維護。
3.1 網絡資源加工處理保存
3.1.1 認真校對文字,保證質量
網上的資源,有時候由于發布者檢查不仔細,以及計算機軟件版本不同等原因,采集到的信息可能會存在錯字、格式錯位等現象。另外在信息采集中有時候會用到一些文字識別工具,而這些工具盡管設計越來越精良,準確度越來越高,但是不可否認還是存在一些錯誤,如OCR文字識別時,對于一些相近字符區分還不是十分準確,如“侯”識別成“候”、“末”識別成“未”,甚至有時候還會出現亂碼等,由此可見,內容必須經過人工審校后,確保準確無誤才能錄入到計算機數據庫中供讀者使用。
3.1.2 數字資源保存格式盡量要求統一
數字資源,尤其是本地自建的特色資源在存儲格式上,以及數據庫建設上盡量要求格式統一,這是信息資源共建共享的基礎。按照行業規范,用統一規劃、統一標準、統一運行規則來指導數字資源的分類和編碼,使其有序地存入計算機,既可避免造成人力、物力、時間上的浪費,還能夠方便讀者查詢使用,否則,這些信息將成為一堆雜亂無章的數據,無法查找,失去使用價值。
3.2 網絡設備安全維護
信息安全歷來是人們關注的焦點,大量的信息都保存在服務器中,因此,如何保護好網絡設備成為重中之重。設備保養主要就是從數據信息備份、設備運行環境等方面入手。
3.2.1 認真做好備份工作,防止數據意外丟失
數據安全性是數據保存中最為重要的環節,硬盤損壞、人為原因、計算機病毒、停電或是天災人禍等,都有可能造成數據的丟失和損壞。目前被采用最多的備份策略主要有:(1)完全備份,每次備份過程都將所有的數據完全備份,一旦發生數據丟失或損壞,只需要一個備份就能完全恢復數據,但是這種備份方式數據量極大,且備份時間較長。(2)增量備份,備份的時候先進行完全備份,以后每天再對新增或被修改的數據備份,備份速度較快,備份數據量較小,但是恢復數據較為麻煩。(3)差分備份,先對數據進行一次完全備份,然后再將每天與完全備份不同的數據進行備份。這種備份方式吸收了前兩種備份方式的優點,又避免了前兩種方式的缺點,備份時間較短,數據恢復也較簡單方便[4]。
結合圖書館的實際情況,備份策略可以采用以上三種策略的結合,例如每周一至周六進行一次增量備份或差分備份,每周日進行全備份。
3.2.2 購置UPS,保障設備24小時不間斷運行
意外停電往往會給數據安全帶來極大的影響,因此配備一臺性能較好的UPS非常有必要,它可以保障網絡設備在停電之后繼續工作一段時間,使負載維持正常工作并保護負載軟、硬件不受損壞,用戶不致因停電而影響工作或丟失數據。在選購UPS的時候,首先盡量選擇穩定性較強、后備時間較長、在線式的設備。其次由于電網中經常會出現諧波干擾、頻率不穩、電壓不穩等情況,故在選擇UPS的時候應選擇適應范圍大的UPS。最后還應考慮UPS的智能化,智能化的UPS不僅方便操作與管理,還具有遠程監控報警,能夠實現計算機機房無人職守。
4 結 語
網絡資源的采集和長期保存的工作是十分艱巨和復雜的。圖書館作為一個重要的文化陣地,應當立足自身條件,加強館際、區域間的協作協調,合理采集、開發利用數字信息資源,最大限度地保存有價值的數字信息資源, 為子孫后代長期利用、為傳承人類文明作出自己的貢獻。
主要參考文獻
[1]梁蕙瑋.公共圖書館自建資源整合研究與實例分析[M].北京:國家圖書館出版社,2014.
[2]李其紅. 淺談圖書館數字信息資源采集的原則、途徑和方法[J]. 金融時代,2010(5):169-170.
[3]胡曉雯. 黨校圖書館文獻采集工作之我見[J]. 文教資料,2017(25):88-89.
[4]曹海霞. 圖書館在網絡環境下的數據備份策略[J]. 資源共享與數字圖書館,2008(1):57-58.