賈延霞 楊 慧(清華大學圖書館 北京 100084)
目前,各圖書館電子資源的擁有量急速增長,一些圖書館的電子資源采購經費已經超過印刷型資源的采購經費,電子資源已經成為非常重要的館藏資源。電子資源數量龐大、增長速度快,利用數據庫商免費或有償提供的MARC(Machine-Readable Cataloging,機器可讀目錄)數據是快速完成電子資源編目的重要途徑。清華大學圖書館在開展電子資源編目的過程中,采用了中外多個數據庫商提供的MARC數據。本文以清華大學圖書館的實踐為例,討論電子資源編目中利用數據庫商提供的MARC數據可能存在的問題及利用策略,以期為同行合理利用MARC數據提供參考。
2011年,筆者在一項關于電子資源編目實踐的調研中發現,大多數圖書館會利用數據庫商提供的MARC數據對電子期刊和電子圖書進行編目,以加快電子資源編目速度、節約編目成本。在筆者調查的14家已經開展電子資源編目的國內圖書館中,有12家利用了數據庫商提供的MARC數據。筆者在調查中了解到,哥倫比亞大學圖書館、香港中文大學圖書館[1]購買了Serials Solutions公司的服務,由Serials Solutions 公司提供電子期刊的MARC數據并定期更新維護。一份對美國研究型圖書館電子資源編目實踐的調研顯示,接近48%的圖書館表示會購買數據庫商提供的電子資源書目記錄[2]。從上述分析來看,利用數據庫商提供的MARC數據是電子資源編目的主要方法之一,有助于圖書館快速完成大量電子資源的編目工作。
清華大學圖書館先后利用過Springer、MyiLibrary、NetLibrary、Safari、Ebrary、Wiley、Eighteenth Century Collections Online(十八世紀作品在線)等多個西文電子圖書數據庫商以及超星電子圖書和書生之家電子圖書等中文數據庫商所提供的MARC數據。在利用這些MARC數據的過程中,筆者發現有一些問題值得注意。
數據庫商提供的MARC數據極大地方便了圖書館,但并不是所有MARC數據的質量都能令圖書館滿意。就筆者利用電子圖書MARC數據的過程來看,國外數據庫商提供的西文電子資源的MARC數據質量較好,但國內數據庫商提供的中文圖書的MARC數據質量參差不齊。對照MARC著錄規則筆者發現,中外數據庫商提供的MARC數據均存在不規范的問題。數據庫商提供的電子資源MARC數據的質量問題主要表現在以下兩個方面。
2.1.1 著錄字段不齊全
有些數據庫商提供的MARC數據中缺乏完整的電子資源特征字段或子字段。例如,ProQuest學位論文全文數據庫的MARC數據中,245字段缺少“$h[electronic resource]”及$c子字段;IG Publishing數據庫的電子圖書MARC數據普遍缺少006、007字段;書生之家電子圖書的MARC數據中,200字段缺少“$b電子資源”。此外,數據庫商提供的MARC數據中普遍缺少電子資源附注說明字段,如西文電子資源的MARC數據中普遍缺少500字段(題名來源附注)、538字段(系統細節附注);中文電子圖書的MARC數據中則普遍缺少135字段(電子資源編碼數據)、325字段(復制品附注)、337字段(系統要求細節附注)等。
有的電子資源MARC數據雖然具有電子資源特征字段或子字段,但缺少其他應具備的字段或子字段。例如,IG Publishing電子圖書的一些MARC數據中缺少必備的字段,如100字段(個人名稱)、111字段(會議名稱)等。國內很多圖書館訂閱了超星電子圖書,其數據庫商提供的MARC數據中有不少是簡編記錄,有的甚至連最基本的責任者檢索點字段都不具備,如有的數據僅有010字段、135字段、200字段、210字段、215字段、690字段、856字段。
2.1.2 著錄字段不規范
有些電子資源的MARC數據中,已著錄的部分字段或子字段不符合著錄規范,與相應的印刷型資源的著錄形式不一致。例如,在一些西文電子圖書的245字段(題名說明)和中文電子圖書的200字段(題名與責任說明)中,不區分正題名與其他題名或分輯題名等,全部著錄在245$a或200$a子字段中;不區分首要責任者和次要責任者,均著錄在200$f子字段中。ProQuest學位論文全文數據庫的MARC數據中,部分數據的100字段和245字段全部是大寫字母。
著錄不規范有很多弊病,不利于數據交換,不利于讀者查詢和辨識信息,不利于書目數據庫整體的質量控制工作,也不利于館員進行數據查重。
同一種電子資源同時存在于多個數據庫中,這種情況在電子期刊中尤為多見,圖書館必須考慮該如何處理這種情況。例如,同一種電子圖書在超星電子圖書、書生之家電子圖書及阿帕比電子圖書3個數據庫中都有記錄,同一種電子期刊在EBSCO、Gale和ProQuest的數據庫平臺中都有所收錄,圖書館要決定為這些電子圖書或電子期刊建立一條書目記錄還是多條書目記錄。這就要求圖書館制定本館的電子資源編目政策以方便編目員處理實際問題。
在MARC數據中,856字段中的$u子字段是電子資源的鏈接地址,可使讀者通過OPAC(Online Public Access Catalogue,聯機公共目錄查詢)直接鏈接到電子資源的內容。OPAC中鏈接顯示的文字則由856字段中的$z子字段的文字決定。而數據庫商提供的856$z子字段中的內容或形式各不相同,有些根本沒有856$z子字段,這樣使讀者在OPAC中看到的鏈接文字要么內容表現各異,要么僅是抽象的URL地址。清華大學圖書館的參考咨詢館員曾向編目員提出建議:電子資源鏈接地址應能提供有關來源數據庫的信息,以方便讀者進一步了解數據庫。可見,如何清晰地在OPAC中展示電子資源的鏈接信息是值得編目員注意的問題。對856$z子字段公共附注的文字做規范化處理,有利于讀者更清晰地了解電子資源的來源等信息。
為了規范電子資源編目工作,各圖書館應該結合實際情況制訂本館的電子資源編目政策,如制訂編目流程、編目規范、編目數據修改要求等。尤其對于資源同時有電子版和印刷版以及各個數據庫含有同一種電子資源的情況,圖書館必須確定是建立1條書目記錄還是多條書目記錄。這兩種方法各有優缺點:建1條書目記錄符合FRBR(Functional Requirements for Bibliographic Records,書目記錄功能需求)對書目功能的需求,能夠節約館藏空間[3],但維護856字段中的多個URL比較困難;將1種資源的電子版和印刷版以及不同數據庫中的每種資源單獨建立書目記錄,可直接批量灌裝書目數據,新建及后期維護更新都比較簡單,但會帶來數據冗余、重復的問題。各館需要依據本館的實際情況制訂本地政策,用于指導本館的電子資源編目工作。清華大學圖書館對1種資源的電子版和印刷版采取分別建立書目記錄的方式;對不同數據庫含有的同一種電子圖書的情況,采取建立多條書目記錄的方式;對不同數據庫含有的同一種電子期刊的情況,則只建立1條書目記錄,其856$u子字段中的URL指向期刊導航中該期刊的地址。
筆者通過關于電子資源編目實踐的調研發現,在利用數據庫商數據的12家國內圖書館中,有2家圖書館沒有對數據庫商的數據做任何修改,直接加以利用,有10家圖書館表示需要做適當的修改。結合電子資源編目實踐經驗,筆者認為,圖書館拿到數據庫商提供的MARC數據之后,首先應對數據質量進行分析,記錄所有不規范或缺失的字段或子字段,記錄其數據質量的特點,以便為合理利用、適當修改提供依據。
對不同數據庫商提供的MARC數據需要制訂不同的修改方案。有的數據庫商提供的MARC數據不需要修改直接便可利用,如數據庫商提供的是OCLC(Online Computer Library Center,聯機計算機圖書館中心)的記錄;有的數據庫商提供的MARC數據則需要進行必要的字段修改再加以利用。修改的主要目的是使得字段規范,與著錄規則盡量一致。一般來說,需要修改或完善的字段主要有重要的檢索點字段,如CNMARC(China Machine-Readable Catalogue,中國機讀目錄)中的200字段、7--字段;電子資源特征字段和子字段,如MARC21中的5--字段、CNMARC中的3--字段;編碼字段,如MARC21中的006、007字段,CNMARC中的135字段等。此外,需要修改的還有856$z子字段的公共附注,以給讀者提供更清晰的指引。例如,清華大學圖書館將西文電子圖書的856$z子字段的問題統一修改為“Connect to the book via XXX”,其中XXX與圖書館主頁上介紹的數據庫名稱一致,這樣使讀者很清楚現在訪問的是哪些數據庫資源,而且也在無形中向讀者介紹了該數據庫的有關信息。
制訂數據修改方案后,對于存在共性問題的書目記錄(如缺少的電子資源特征字段或子字段、修改856$z子字段的公共附注等)可以盡量利用批處理軟件加快數據處理速度;對于無法批處理的書目記錄,則需要逐一修改。清華大學圖書館利用了冠景公司開發的marcpro工具軟件,對MARC數據進行修改,解決了電子資源書目數據中大部分的問題。但有些數據庫商提供的MARC數據存在著錄錯誤、重要字段和子字段著錄不齊全等嚴重質量問題,這就需要編目員逐一核對后修改完善。為了保證數據質量、滿足讀者的查詢需求、提高查詢的準確性,編目員應當仔細審核數據庫商提供的MARC數據,進行必要的批量規范化修改甚至逐條完善,補充完整的檢索點信息、電子資源特征字段及子字段。
有些數據庫的內容不斷更新,需要圖書館積極主動地獲取更新數據并實施更新維護操作。例如,定期到數據下載網站查看是否有最新的數據,對于數據庫商反饋的需要刪除的資源核實確認后及時刪除。
為了方便對電子資源書目數據的更新維護,圖書館應在建立書目數據時注意保留資源的控制號或唯一標識號等信息,這樣在更新時可以較為方便地與書目數據庫中已有的數據比對并批量刪除已過期的書目記錄。
清華大學圖書館先后利用過中外多家數據庫商提供的電子資源MARC數據。充分利用這些數據在OPAC中揭示電子資源,是加快電子資源編目速度、提高電子資源可見度和利用率的重要途徑。編目員分析審核數據質量、制訂必要的修改方案對于提高書目數據的質量有重要意義。各圖書館應結合本館實際,制訂合理的利用方案,以促進本館電子資源編目工作的開展,優化電子資源服務。圖書館也可以嘗試積極與數據庫商溝通,對MARC數據提出修改完善的意見和建議,以期從源頭上提高數據質量。
[1]張寶珍,吳玉珍,林柔云. 香港中文大學圖書館電子資源管理的挑戰與對策[J].大學圖書館學報, 2008 (6):68-74.
[2]Chen X T, Colgan L, Greene C, et al. E-Resource Cataloging Practices: A Survey of Academic Libraries and Consortia[J]. The Serials Librarian,2004 (1-2): 153-179.
[3]邱 萍.網絡電子期刊編目的難點及對策[J].圖書館建設,2011(7):34-37.