張玉琴
(濟源職業技術學院圖書館,河南 濟源 454650)
隨著數字圖書館的蓬勃發展,全球范圍內的數字資源激增,資源的種類越來越豐富,數字資源建設已經成為圖書館文獻資源建設的重要組成部分,在保障讀者的需求方面發揮著不可替代的作用。但是,隨著科學技術的迅速發展,學科數量愈來愈多,結構愈來愈復雜,學科間的相互滲透、縱橫交叉、綜合,不僅使得信息量劇增,而且更進一步導致了資源的無序和分散。不同的數字資源又有其物理和邏輯結構,具有各自不同的檢索系統和發布系統,檢索方式、檢索手段各式各樣,造成了數據冗余、相互關聯程度低,大量的信息孤島出現,同時用戶的檢索負擔也日益加重。因此,需要有一種手段把這些信息集中、整序、關聯起來,把檢索系統集成起來,使用戶知道到哪里可以找到所需要的信息,怎樣去查找這些信息,如何篩選檢索結果。本文就圖書館數字資源的整合模式進行分析、綜述,以供借鑒。
面對種類、數量、形式、品種多樣的數字資源,不同學者從不同的角度對圖書館數字資源的類型進行劃分。本文根據圖書館數字資源建設的實踐,按圖書館數字資源的來源,將圖書館數字資源分為以下幾種類型:
2.1 自建特色數據庫。包括圖書館的中外文館藏資源數據庫、中外文獻目次庫,學位論文及會議論文數據庫,教學參考書數據庫及館藏特色數據庫等。
2.2 外購數據庫。圖書館引進的各種國內外商用數據庫,類型包括文摘、題錄、全文數據庫等,如CNKI數字圖書館、萬方數據庫、維普、超星數字圖書館、Springer鄄Link等數據庫。
2.3 光盤資源。包括圖書館購買的大量的多媒體光盤、隨書光盤、網絡光盤數據庫等。
2.4 圖書館收集的因特網上一些免費的網絡數字資源等。
目前已有的數字資源整合方案或系統在一定程度上為用戶提供了期望的一站式服務。然而,面對層出不窮的整合系統,用戶并沒有真正享受到滿意的服務[1]。由于數字資源過于豐富和分散,為資源整合帶來了巨大的障礙。同時,由于缺乏完整的理論體系,統一的思想認識、相應的標準和規范、科學的規劃和組織,一些問題就凸現出來,具體表現在以下幾個方面:3.1 高校圖書館的數字資源除了有部分是自建數據庫外,大部分都采用了由不同的數據庫商提供的數據庫、學術期刊、會議文獻等。如CNKI數字圖書館、萬方數據庫、維普、超星數字圖書館、SpringerLink等資源,內容交叉重復,影響用戶對信息的選擇與獲取,造成了數字資源整合中的重復建設。
3.2 存在冗余信息。多數數據庫的資源收錄原則是“全”,使得大量使用價值不高的信息進入資源系統,干擾用戶對信息的獲取。
3.3 知識關聯程度低。現有數據庫資源系統內的數據對象大都是孤立存在的,無法體現學科知識的內在聯系。
3.4 從技術角度看,數字資源不同的描述和表達方式,每個數據資源又都有其自身獨特的檢索界面、查詢方法和下載格式。這就需要讀者進入到不同的檢索界面,采取不同查詢方法進行檢索,并且需要下載安裝不同的閱讀器,這就給用戶實際利用帶來了麻煩。
3.5 由于缺乏規范、統一的標準,不同的數據商開發的數據庫在數據結構上、字段上存在互異,并且擁有各自的檢索系統,因而在檢索上存在著差異,這對實現同一檢索平臺下的分布式檢索造成了困難。
OPAC(Online Public Access Catalog)即聯機公共目錄檢索系統,將MARC記錄納入本館的OPAC系統,使OPAC真正成為揭示全部館藏的目錄檢索系統。根據整合對象的不同,可將基于OPAC系統的資源整合分為館內整合與館外整合兩種。館內整合是通過在MARC記錄里增加856字段——“電子資源地址與存取”字段,實現在實體館藏中揭示并鏈接全文電子文獻。館外整合的實質是實現本館與不同異構OPAC系統的整合,當前較多的是通過采用Z39.50協議來完成。通過執行Z39.50標準,將所要整合的圖書館的書目數據庫先映像成自己專用的模型,再根據本館要求建立統一的檢索接口。因此,基于OPAC的信息數字資源整合可實現:(1)館際館藏書目數據資源的整合。(2)館藏圖書與隨書光盤資源的整合。(3)館藏圖書與電子圖書的整合。(4)館藏期刊與電子期刊的整合。(5)與其它數據庫的整合等。
基于OPAC系統的數字資源整合,充分利用了OPAC系統高訪問率的優勢,提高數字資源的利用率,在某種程度上起到非常積極的作用。但它也是一種不完全的整合方式,有著先天性的不足。
4.1.1 目前很多電子資源尚不能穩定徹底地支持開放鏈接(OpenRUL)標準,鏈接地址穩定性差,信息源數據的更新或任何一點地址變動都可能產生死鏈,導致整合工作不能得到持續有效的保障。
4.1.2 整合依賴于圖書館OPAC系統功能的完善程度,如要支持856字段的能力、要有修改書目記錄顯示字段的功能等,而這些功能的實現往往需要系統開發商的配合。
4.1.3 直接利用MARC格式組織電子資源時顯得費時費力,不僅數據加工成本較高,而且很難實現批量更新和維護。
4.1.4 基于OPAC系統的資源整合實際上是一種目錄級的整合,只是對信息源進行加工,并沒有涉及到數字資源的內容、結構,因而并沒有真正解決數字資源異構、交叉帶來的使用問題。
數字資源導航系統是指將數字資源的檢索入口整合在一起,建立數字資源導航庫,提供按資源名、關鍵詞、資源標識等獲取數字資源的途徑。它通常按資源類型、學科主題等把數字資源組織起來,通過數字資源的URL,并利用超文本鏈接提供檢索入口。按資源類型不同,可以分別建立電子期刊導航系統、數據庫導航系統、電子圖書導航系統、電子報紙導航系統、學科專題導航系統等。數字資源導航系統一般都有三個功能:字順瀏覽功能、分類瀏覽功能、關鍵詞檢索功能。這三個功能可以幫助用戶迅速找到數字資源,并利用超文本鏈接提供檢索入口,對該數字資源進行檢索。
數字資源導航系統同樣僅定位在數字資源的形式層,不能提供內容層面上的服務,用戶仍需要通過導航系統分別訪問每個數字資源系統的檢索界面。讀者不能按主題、作者查詢文獻,而且由于數據商、出版商大多沒有提供充分的URL信息,數據庫不能創立URL,所以數字資源的導航系統只能引導讀者進入到所在數據庫的界面,讀者必須對信息系統進行檢索。
利用網絡超文本鏈接特性,將文獻的有關知識點鏈接起來,最終達到將有關的數字資源鏈接在一起,形成一個具有內在聯系的有機整體。鏈接整合主要有:一是封閉式靜態鏈接系統,所有鏈接都存在本地數據(封閉式),所有鏈接都通過專門程序事先計算、并通過嵌入URL來表達(靜態鏈接),鏈接準確性高;二是開放式靜態鏈接系統,解決如何為鏈接源中包含的別人擁有的鏈接對象提供鏈接;三是開放式動態鏈接系統,在用戶需要鏈接時才根據一定規則計算鏈接路徑進行鏈接,可對用戶鏈接前出現的鏈接對象或位置予以鏈接,也可在鏈接計算規則中嵌入選擇規則實現選擇性鏈接。如OpenURL,SFX,CrossRef/DOI等。
目前使用最多的是開放式動態鏈接系統SFX,它是ExLibris公司推出的新的網絡電子資源無縫鏈接整合軟件系統,也可以稱為上下文敏感參考文獻鏈接解決方案。SFX采用Open URL技術,通過 HTTP請求和元數據傳遞,對數據進行分析、搜尋,鏈接到目標信息源,并根據目標信息源的可獲取情況,動態地創建鏈接到全文、摘要、期刊目錄等不同的級別,從而使用戶能夠實現統一界面檢索,直接獲取目標信息源,真正實現了信息數據庫之間的無縫鏈接。它還能夠實現在數據庫中點擊一篇文章的記錄后顯示所有能夠得到的與這篇文章相關的服務選項列表,實現了在知識整體層面對信息資源進行管理的整合。在實際的應用中也依然存在一些問題:它基于一定的OpenURL協議標準,對于發展比較規范的國外數據庫資源比較適用,但是對于早期遺留數據庫和資源數據庫構建技術不同、標準不統一的國內數據庫存在著很大的難度。各個數據庫根據OpenURL標準制定的接口依然有很大差異,若要根據自己的需求自行開發依然比較困難。此外,SFX技術對檢索數據需要在二次檢索的擴展服務中完成“一步到位式”參考鏈接。
某個學科的文獻資料可能包含在多種數據庫中,讀者要完成某個課題的檢索,往往要通過多個數據庫進行多次檢索,才能將與該課題有關的文獻找全。而每個數據資源又都有其自身獨特的檢索界面、查詢方法、下載格式、檢索式構、檢索字段等都不盡相同,這給用戶的資源檢索造成很大的困難。如果能在同一個檢索平臺下,實現多數據庫同時檢索,將大大提高用戶對信息資源獲取的效率。
跨庫整合檢索可分兩個層次:第一層次是檢索界面的整合。許多數字資源檢索界面存在一定的相似性,可將這些相似性形成統一的參數表,構成統一的檢索界面,共享多個數據庫的索引技術和檢索技術。第二層次是實現數字資源系統間的分布式異構整合檢索。檢索界面整合的常見模式是構建中間層,當用戶提出檢索請求后,其請求被交給服務器端的一個Agent程序,Agent將用戶請求轉換成相應信息系統的查詢語言和檢索方法,再將請求發送到各數據庫,然后將各個系統返回的命中結果經過篩選、去重、歸并等處理后在同一界面上呈現給用戶。在不改變現有信息系統的數據組織結構和檢索方法的條件下,實現對異構的多數據源的統一訪問,即提供“一站式”檢索服務。
實現分布異構環境下的跨庫檢索,情況比較復雜。一方面,追求對所有資源的跨庫檢索只是一種理想狀態,實際上只能做到兼容盡可能多的資源。另一方面,對幾十種以上的資源籠統地實現跨庫檢索并無實用價值,用戶的需求是針對學科范疇、針對文獻類型或者針對個性化需求定制而進行的資源檢索和導航。人們逐漸認識到,跨庫檢索實際上是作為一種關鍵技術應用在圖書館的“資源門戶”中,與開放鏈接、聚類導航、個性化空間與信息定制、用戶認證和權限控制等功能一起構成一個實用的數字資源整合系統。
圖書館的數字資源整合是一項復雜的系統工程,無論采用何種整合模式和技術,要本著“以實用為主”的原則,了解最終用戶的需求,明確本館的資源狀況和目標,要將復雜的應用問題轉化為簡潔、實用、友好的方案呈現給用戶,使用戶在面對類型各異的大量數據資源時,不會再無所適從,充分發揮數字資源的效能。
[1]沈芳.高校圖書館信息資源整合的結構、模式分析[J].現代情報,2007,(10).
[2]陳永選,鄭樂丹.基于網絡的圖書館信息資源整合模式研究[J].科技情報開發與經濟,2008,(5).
[3]謝玲.論現階段數字資源整合的實用技術及發展趨勢[J].現代情報,2007,(8).
[4]張文德,戴曉翔.信息資源整合系統與技術研究[J].現代圖書情報技術,2003,(6).
[5]田向陽.圖書館數字資源整合研究[D].陜西師范大學碩士學位論文,2007.