國家圖書館 江 紅
隨著計算機技術、網絡技術、通訊技術的高速發展和廣泛應用,圖書館涌現出了大量的期刊數字資源,它們的形式多樣、數據量大、種類繁多。很多圖書館通過自建或購買形式擁有了大量電子期刊全文資源,它們大多以獨立的數據庫形式存在,如中國期刊全文數據庫、中國科學引文數據庫、人大復印資料全文數據庫、萬方數據庫等。這些數據庫脫離于圖書館的紙質文獻,且各個數據庫在建庫時沒有一個統一的標準,其檢索系統、數據庫、發布系統都各有其獨立性,導致了不同的數據庫,產生了差異性的檢索界面、異構性的數據格式、多樣性的瀏覽器,這就給讀者檢索和利用文獻帶來了極大的不便,讀者在查找某個課題時,必須把每個數據庫逐一進行檢索,而檢索結果還會有重復,期刊的利用率也受到極大影響。因此,整合數字資源也就成了圖書館期刊資源建設的首要任務。
所謂數字資源整合,是指通過中間技術,根據一定的需求,對館藏資源進行統一的梳理和組織,把不同類型、不同來源、不同格式的數字資源進行重組、類聚和融合,建立一個全方位的、立體化的、整體的資源體系,為讀者提供一個統一的檢索系統和操作界面,實現單一的檢索表達,通過對期刊資源的整合,完成紙質文獻與數字資源的無縫鏈接,使各類數字資源形成一種跨內容、跨數據庫、跨平臺的新的體系。讀者只需一次檢索,就可實現即檢索到印刷型期刊的書目信息,又可獲取到與之相關的視頻、文字、音頻等信息的全部內容,節省了讀者的時間,引導讀者利用OPAC系統使用圖書館各類型的電子資源,為讀者提供了方便的一站式檢索入口。
OPAC的全稱為Online Public Access Catalogue,即聯機公共檢索目錄,是圖書館常用的檢索工具,它具有系統穩定、資源強大、系統架構靈活、操作簡便、功能齊全等特點,讀者無論何時何地只要通過網絡就可全面、快捷地檢索到全部館藏資源,它是揭示館藏信息的第一窗口,是讀者利用和查找圖書館資源的主要途徑。以OPAC系統為統一的檢索平臺,以館藏期刊的書目數據為內容基礎,對圖書館期刊電子資源的整合,已成為OPAC發展的必然趨勢。
基于OPAC的整合是一種基于傳統書目管理的整合模式,是圖書館電子資源最基本的整合方式,它在不改變OPAC檢索界面的基礎上,實現了圖書館館藏資源與數字資源的整合,使圖書館OPAC的書目記錄具有了一次文獻的功能。
MARC格式是被圖書館界廣泛使用的,記錄書目數據的存儲格式,并通過OPAC系統檢索文獻資源,它的技術非常成熟,是OPAC檢索數據格式的基礎。近年來,隨著電子資源發展的日新月異,圖書館界對MARC字段進行了修改補充,增加了一些相應的新字段來揭示電子資源,尤其是可對電子資源進行檢索與定位的856字段,實現了書目數據與電子期刊的鏈接。它是將電子期刊的URL地址記錄到書目數據的856字段中,或者把數據庫廠商提供的電子期刊的MARC數據直接導入OPAC系統的856字段中,讀者利用OPAC系統進行檢索,查找到該電子期刊后,再點擊指定的URL鏈接就可閱讀該電子期刊的全文。對隨刊光盤的整合采用的方法是:在MARC書目數據中注明該刊附有光盤,并鏈接到與之相對應的可訪問到該刊的網頁;使書目數據與電子期刊全文及視聽資料完全鏈接起來。對館藏資源中只有電子版的期刊,可在MARC中增加文獻類型標識――電子資源,通過856字段與該刊的URL網絡地址鏈接起來,這就可使讀者在利用OPAC系統進行檢索時,將印刷型和電子型期刊同時檢出,并利用鏈接到電子期刊的網絡地址,實現在線瀏覽和下載。
MARC中的856字段,成功地完成了MARC數據與電子資源的緊密鏈接,它既把與印刷型期刊相對應的電子資源進行了準確定位,又對其端口、格式、口令等作了描述,將書目信息與電子資源有機地結合起來,使讀者在使用OPAC系統檢索印刷型期刊的同時,又能訪問與其相對應的電子資源。
利用MARC的856字段的整合,因其易操作、方法簡單,所以成為基于OPAC資源整合的主要方式,但也有缺點:其一,對MARC數據庫的依賴程度高,更新困難,電子數據庫的IP地址一旦發生改變,就會造成死鏈無法訪問數據,不能保證整合工作達到預期的效果;其二,這種方式大部分是把電子期刊的856字段的數據直接導入到OPAC系統中,這就使原有的MARC數據量大大增加,給數據的維護、更新都帶來不便,因此,電子資源數量少的圖書館才適合利用856字段進行整合。
通過鏈接解析器進行整合,鏈接整合是圖書館資源整合的有效途徑。很多類型的資源都可利用鏈接解析器進行整合,如:電子圖書、書目數據庫、全文數據庫、電子期刊、索引數據庫、文摘數據庫等,只要這種類型的資源支持某個標準協議,鏈接解析器就可以把它整合進來,對圖書館內各種不同類型的電子資源實現整合,當讀者檢索到文章的題錄、摘要或出處時,只要點擊鏈接點,就可快速獲取文獻全文,為讀者閱讀提供了便利。利用鏈接解析器,OPAC不僅實現了印刷型期刊和電子期刊資源的整合,還可以將圖書館的資源擴展服務大大提高,把不同信息資源鏈接起來,實現各圖書館之間的OPAC系統異構平臺互檢,完全整合整個圖書館系統,SFX、WebBrideg是常用的鏈接解析器。
ALEPH系統和全文獲取工具SFX屬于同一公司,所以整合基礎較好,因此使用ALEPH系統的圖書館普遍使用鏈接模式進行資源整合。它的特點是讀者在使用OPAC系統檢索時,無論是否對應全文,都可看到SFX這一整合工具。這種整合模式的優點是,技術人員只需關注SFX工具源及全文獲取的參數,這一整合過程的起點。其缺點是,技術人員對SFX源資源的配置情況是整合能否實現的關鍵,且當前電子期刊仍以SFX源數據占主導地位,所以仍有大部分記錄沒有全文獲取來源,致使一些圖書館的檢索系統中,點擊SFX后并沒有獲取到與之相對應電子資源全文。
整合各圖書館期刊資源的有效辦法就是建立統一的期刊數據庫檢索平臺。面對數字資源異構性大、載體種類繁多的期刊數據庫,就需要建立一個統一的檢索平臺,將各圖書館期刊資源數據庫,如中文數字期刊數據庫、書目數據庫進行整合,讀者使用一個統一的檢索界面,就能方便地跨庫檢索到各個圖書館的文獻。且這個平臺具有快速檢索、操作簡捷、集海量數字資源、定位準確的特點,這種跨庫跨平臺的檢索,可大大節省讀者的精力和時間。
跨庫檢索平臺,就是在同一個檢索界面中匯聚了不同的、異構的期刊數據庫,讀者可同時在多個搜索引擎或數據庫中進行檢索,并得到返回結果,不需登錄各個數據庫。
當讀者對互聯網或本地的多個異構數據庫,提出檢索請求后,系統首先將它交給服務器端的智能搜索器,由智能搜索器把它轉化為檢索格式,這一格式符合不同數據庫的規定,然后把它發送到每個數據庫,得到各個數據庫返回的檢索結果后,智能搜索器再對它進行整理、篩選、去重、排序,再將這些不同的檢索結果按照檢索平臺的要求轉化成統一格式,最后發送到瀏覽器端,呈現給讀者。而檢索結果又是鏈接起點,鏈接到與之相關聯的各個數據庫中。這一過程讀者只需登錄一次、以一個身份、使用單一的檢索方式就能完成。如清華同方的異構數據庫統一檢索平臺(USP,UnionSearch Platform),簡稱USP,就是一個跨庫檢索平臺。目前USP能夠支持的數據庫或搜索引擎約30多種,它還可按照讀者的需求提供服務。
跨庫檢索平臺的優點:讀者只需發出一個檢索式或檢索詞,系統就可對各數據庫同時操作,為讀者省去了對多個數據庫的分別操作、重復登錄、輸入檢索詞的步驟,同時還可對各數據庫進行高級檢索或二次檢索,為讀者節省了檢索時間,工作效率大大地提高,圖書館的服務質量極大地提升。跨庫檢索平臺的查準率查全率高,整體檢索效率高,具有兼容能力強、智能排序、穩定性好、適用范圍廣、操作簡便的特點,便于日后維護。
總之,不同文獻資源之間的溝通,通過跨庫檢索技術得到了實現,不同的數字資源的無縫集成通過整合技術得以實現,二者對發揮數字圖書館作用,提高讀者對數字資源的檢索效率,起到了積極作用。
基于導航系統的數字資源整合就是通過數字資源的URL建立數字資源的導航系統,將數字資源的檢索入口整合在一起。與傳統圖書館相比,數字資源的導航系統就是傳統的目錄組織系統,其目的是讓讀者了解各個數據源的收錄情況。導航系統按照字順、主題、學科的入口方式,對數字資源進行整合,建立數字資源導航庫,為讀者提供資源標識、關鍵詞、資源名稱等檢索途徑,展現動態的、交互式的、多元化數字資源環境,使讀者更加全面了解數字資源,讀者通過檢索入口可瀏覽、檢索數字資源。依其形式類型數字資源可以分為電子圖書資源、數字期刊資源、電子報紙、會議文集、數據庫資源等,建立與之相應的數字導航系統。其中數據庫導航系統、數字期刊導航系統為主要導航系統。不同導航系統揭示的內容也不同,如數字期刊導航系統要揭示的內容包括學科分類、關鍵詞、期刊名稱、語種、ISSN、該刊的URL、出版商等相關信息,使讀者能快速檢索到數字資源,導航系統為讀者提供了三個功能:關鍵詞檢索功能、分類瀏覽功能、字順瀏覽功能。
當今圖書館的數字資源越來越豐富,為了促進數字資源的高效利用,實現信息檢索的自動化、智能化,圖書館信息服務由原來的“以圖書館為中心”轉變為“以用戶為中心”,各個圖書館所面臨的重要任務就是把數字資源整合成一個整體,才能更好地為讀者服務,所以,圖書館的數字資源建設發展到一定階段對其進行整合是圖書館發展的必然趨勢。
[1]黃婧,郝永艷.基于OPAC系統的全文資源整合實踐模式研究[J].圖書館學研究,2011,3.
[2]祖芳宏,朱東妹,方曙.基于OPAC的安徽高校圖書館電子資源整合[J].圖書館學刊,2010,12.
[3]金巖,于靜.基于OPAC的資源整合研究[J].圖書館雜志,2009,2.
[4]楊昌順.基于OPAC的圖書館館藏資源整合[J].貴州教育學院學報,2006,10.