倪道敏?鄭佳盈
摘 要 論文介紹了上海圖書館外文文獻資源獲取及編目情況,以上海圖書館外文文獻不同來源的數據為分析對象,著重分析基于OCLC平臺的數據情況,并結合OCLC平臺使用情況及工作流程提出了對未來編目工作的展望和思考。
關鍵詞 上海圖書館 OCLC 外文文獻 西文數據 編目工作
分類號 G254.3
DOI 10.16810/j.cnki.1672-514X.2018.08.004
上海圖書館(上海科學技術情報研究所,簡稱上圖) 是綜合性研究型公共圖書館和行業情報中心,外文文獻采集在其文獻資源建設中占有相當大的比重。上圖外文文獻的編目和揭示依托于OCLC平臺,是OCLC國內最早的管理性會員單位。本文通過介紹上海圖書館近年開展的外文編目業務情況,分享外文編目經驗與成效,以期為同行提供借鑒參考。
1 2017年度上海圖書館外文文獻資源總體情況
1.1 外文專業圖書采購
上圖外文文獻資源以學術類圖書為主,內容涵蓋人文、社科、自然科學以及工程技術等各學科領域。語種包括英、日、德、法、俄、韓及西班牙語。2017年,共采購各類外文學術資源28 309種,其中外文圖書27 399種、外文視聽資料910種。
1.2 獲贈圖書和國際交換圖書情況
國際交換和國際贈書是上圖館藏建設的一部分,上圖與世界各國、各地區的六十多家圖書館長年保持著交換合作關系。2017年度,上圖共收到交換、贈送的圖書4525冊。
1.3 大眾類圖書采購情況
為了滿足普通讀者對外文圖書的閱讀需求,自2014年起,上圖嘗試外文大眾類圖書的館藏建設,并且收到了良好的成效,采購圖書深受廣大讀者喜愛,借閱率逐年提高。2017年度,共采購大眾類外文圖書2050種,其中英文圖書1739種、日文圖書311種。
1.4 電子圖書采購情況
2017年度,上圖主要采購5家出版社的外文電子圖書,總量達11 884種,具體如表1所示。除此之外,上圖一般還采購ProQuest、EBSCO、易閱通和一些國外出版社出版的電子圖書。
2 2017年度上海圖書館外文文獻編目工作
2.1 外文文獻編目情況統計分析
2017年上圖Horizon流通系統共收錄西文數據44 982條。從圖書來源看,可分為:本館采購、交換贈送、中心館數據、回溯數據。其中,本館采購又可分為紙本書和電子書兩類,中心館數據是指上圖為上海市各區圖書館、街鎮圖書館編制的數據,回溯數據是指長期未編的圖書數據,具體分析見表2、圖1。從數據來源看,可分為OCLC下載數據、自編數據和外來數據三類,具體分布見表3。本館采購的紙本和電子比重達到了76.31%。在全年度收錄數據中利用OCLC平臺下載的數據達到了61.09%,其中本館采購的紙本書并且利用OCLC下載數據的比重達到了54.42%。
外來數據主要用于外文電子書,這些數據一般由出版社隨書配置,編目工作主要是進行分類法修改,不考慮外來數據的影響,上圖2017年度總計編目29 568條(見表4),其中通過OCLC平臺下載編目27 480條,約占總數的92.94%;自建數據2088條,占總數的7.06%。其中本館采購(紙本書) 的自建數據占總自建數據的97%,主要由小語種圖書(大部分為韓語圖書,另有法語、德語、西班牙語等)、西文無數據圖書、視聽資料組成。在本館編目數據中95%為學術類數據,5%為大眾類數據。
2.2 基于OCLC的外文編目數據修改情況
從編目方式看,上圖下載數據中92.5%的下載數據用RDA編目。即使有如此高比例的RDA下載數據,但仍然要進行數據修改。數據的修改是依據《上海圖書館西文文獻RDA編目細則》。該細則類似《RDA本地政策聲明》,數據修改嚴格依照《資源描述與檢索 (RDA)》 《MARC21書目數據格式》 《中國圖書館分類法》 《美國國會圖書館標題表》 《杜威分類法》 等規范進行。外文文獻編目部門定期參閱“RDA TOOLKIT”、美國國會圖書館編目相關政策及OCLC編目字段的更新情況,并結合編目實際對編目細則進行更新。
數據的修改主要是三個方面。一是修改客觀著錄內容與文獻本身描述不相符的地方,主要是責任者遺漏、題名項叢書項混淆、載體描述項(插圖、表格、頁碼)遺漏、ISSN號遺漏等。二是修改與上圖編目細則有出入的方面,主要是責任者著錄數量、RDA特征字段(336-338) 部分子字段的遺漏,504內容附注遺漏,名稱、主題規范的使用與控制等。三是對下載數據添加中圖分類、索書號及上圖本地特征化字段。
上圖編目數據中仍有少量數據為原編數據。原編數據主要分為兩類:一類是在OCLC有相似數據,但與上圖編目要求差異太大,可用度不高,不能認定是否相同載體表現或基于編目效率暫不考慮對OCLC記錄進行升級的,這類數據主要常見于IEEE及相關會議錄數據、SPIE資料以及重印版的系列叢書;另一類是OCLC上無數據,主要是印度、德國等非英美出版社的圖書,以及英美國家中比較小眾的藝術類文獻。
3 OCLC-WorldCat平臺利用及工作流程概述
OCLC書目記錄達到4.1億條、總館藏記錄26億多條,覆蓋491種語言,向全球的圖書館、信息中心及其用戶提供各種信息服務,通過存取世界各地的信息來降低獲取信息的成本。OCLC也是促進國際標準不斷發展的合作機構,尤其是在合作編目、資源共享、聯機參考服務和館際互借等方面做出了卓著的成績。
3.1 上圖西文數據及OCLC使用情況
上圖1996年加入OCLC,成為國內最早參與OCLC合作組織的成員單位,主要利用OCLC平臺進行西文數據的下載和上傳工作。西文語種主要指英語、法語、德語、西班牙語、俄語等。目前,上圖西文數據編制采用套錄下載與原編相結合的方式。其中套錄數據的數據源來自OCLC WorldCat數據庫,突破了原本逐條編制數據的困境。現在西文數據每月下載量達到2000余條,并利用平臺優勢對相關字段做規范控制。
近年來,編目事業有了很大的發展,從傳統的文獻編目轉型為資源的描述,RDA對整個機讀格式目錄進行了重新定義。OCLC作為行業引領者,其平臺的RDA數據在近幾年也呈井噴式增長。針對這一情況,上圖及時調整了編目工作策略,對RDA的推行進行了調研和分析,后于2012年成立RDA工作小組,啟動RDA應用推廣研究項目,對RDA編目實現方式、RDA編目員培訓工作及RDA編目測試階段的工作進行了探索及研究,為RDA的應用打下了基礎。目前,上圖對新舊數據編目格式的界定為:對于2014年以前編制的西文數據仍保留AACR2編目格式,2014年以后新編制的英文數據采用RDA編目格式。目前,上圖外文文獻編目中,英、法、德、西班牙、俄、韓語圖書的下載與原編數據均采用RDA格式。現已有少量西文圖書原編紀錄上傳到OCLC WorldCat數據庫,由OCLC總部質量控制部門審校,反饋情況良好。
除中文圖書和國內出版的西文圖書采用RDA編目格式外,上圖仍保留境外書目數據業務,以服務國外圖書館文獻數據需求。考慮到境外數據的特點,上圖將早年以CNMARC編目的圖書批量轉變為USMARC數據而對于境外數據的編制,參考上圖西文圖書RDA編目細則,以MARC21為基本格式,以新羅馬化拼音為主要編目字符,并通過880連接字段將拼音和漢字字段相連接而構成。依據OCLC互惠互利、共同發展的原則,上圖也積極向OCLC World Cat 提供優質境外原編數據,2017全年上傳2800余種全字段RDA格式數據,通過貢獻知識內容和共享資源共建OCLC數據平臺。
3.2 上圖西文數據OCLC套錄下載工作流程
目前,上圖西文數據下載套錄工作按以下步驟進行(流程見圖2)。(1) 新建一個本地數據目錄,并將新下載的數據保存在此目錄中。(2) 通過ISBN在OCLC的檢索框中進行檢索,未檢索到的記錄可以通過題名、著者等其他途徑檢索。(3) 對于單條檢索結果,如果數據的基本字段完整,則直接套錄下載進入數據修改操作。對于多條檢索結果,根據數據揭示的載體形態、收藏數據的館藏數及First Search平臺顯示的數據質量情況綜合選取質量較高的數據進行數據修改。(4) 對選取的下載數據進行修改。由于OCLC數據為全球聯盟的數據,成員館提供的數據質量差異較大。為保證編目質量,保持上圖編目特色,編目時需特別注意RDA編目特征字段及USMARC標準格式的修改。套錄編目遵循照實著錄原則,不受下載記錄的影響,逐一與所編文獻核對,對不符合之處做出修改,使之符合所編文獻的客觀狀況。同時,根據上圖西文數據編目細則要求對RDA特征字段及上圖本地化館藏字段進行標準化。(5) 對會議名、作者名、主題詞等內容做好規范控制工作。OCLC重視規范化與標準化的建設,除了提供依據 USMARC 標準數據格式和 RDA 標準著錄格式加工并提供書目數據外,還聯機提供規范文檔,以實現規范控制及數據庫質量有效控制。(6) 保存修改內容,進入下一條數據編目。(7) 按批次完成整個目錄下載編目,并對目錄數據進行本地館藏化操作。(8) 移交審校人員進行數據審校工作。
3.3 利用First Search WorldCat輔助檢索
OCLC First Search Service 是一個通過 Web 訪問的, 與Z39. 50協議兼容的聯機檢索與參考服務系統。目前,First Search 實現了多個數據庫的完全整合, 增強了聯合編目數據庫 WorldCat 的館藏信息, 實現了各庫間的聯機全文共享。
上圖西文編目工作也通過First Search的WorldCat數據庫進行檢索。目前查看檢索數據的主要目的是判別數據質量。考慮到OCLC-connexion數據庫的檢索及下載的計費模式,為避免查看多條數據進行數據比較而帶來的額外費用,上圖編目員均通過First Search平臺進行數據查看及選擇,特別對于小語種數據的挑選及查看有很大的幫助。借助于First Search平臺,上圖通過OCLC套錄的數據精度更高,套錄編目數據更加規范化、標準化。
4 編目工作的思考
4.1 編目工作的困境與發展
一方面,許多高校圖書館和公共圖書館正在減少編目人員編制,采用業務外包的方式,把編目工作整體外包給書商或承包商,但是,外部數據來源五花八門,總體質量不高。特別是外文數據編目工作存在編目人員業務能力差、流動性強,下載渠道亂,編目機制不完善,審校力量不強等問題,嚴重影響了編目數據的質量。另一方面,作為編目工作一部分的規范數據正越來越被圖書館所重視。此外,國際編目規則正出現重大變化,以資源描述與檢索為內容的新標準正在替代原有被大家普遍采用的英美編目條例, RDA的采用會使圖書館界的書目更易被互聯網所接納,使數據所反映的實體與關系層次分明、概念清晰,使系統能更有效地對書目進行發現、關聯和開放。
4.2 編目工作應當有一定的投入
目前,許多圖書館的編目數據多為下載套錄,數據的成本很低。有些編目館員認為,編目數據即使下載不到也會等到,不需花力氣原編。但編目數據審核與校對是需要時間成本和人力成本的,在目前技術條件下,還不能通過人工智能的方法加以取代,必須逐條輸入和校對,因此一條符合要求的原編編目數據制作還需要較高的人力成本。
4.3 編目數據的共建共享問題
OCLC聯機計算機圖書館中心是全球最大的聯機編目中心,而在我國,CALIS(中國高等教育文獻保障系統)、國家圖書館聯合編目中心、上海圖書館聯合編目中心是我國三大書目數據共享平臺。
CALIS和國家圖書館聯合編目中心是國家級的書目數據中心,分別擁有巨量的館藏數據和書目數據,為不同的用戶提供服務。上海市文獻聯合編目中心歸屬上海文獻資源共建共享辦公室,由上海圖書館采編中心具體負責運行的區域性文獻聯合目錄中心和文獻編目中心。這些重要的文獻編目數據共享平臺各有特色,但是由于歷史原因,平臺之間的數據交換、共享不夠暢通,成員用戶在利用各家資源時投入較多人力進行數據修改。總體來看,各平臺均存在共享有余、共建不足的問題,理念和機制也需要進一步改進。
4.4 編目標準、規范、要求須統一
目前,我國的編目標準各不相同,尤其在外文編目MARC標準的采用上,有些圖書館采用CNMARC進行外文文獻編目,有些采用MARC21。而在內容標準方面,少數圖書館已完全與國際接軌,外文文獻利用RDA工具套件且完全采用RDA規則編目,但大部分圖書館仍然采用混合方式,即保留下載RDA記錄的同時,原編仍采用AACR2標準。還有圖書館仍采用AACR2進行數據編制。另外,聯編系統之間對數據編制要求也不統一,例如CALIS、國圖、上圖編制的外文數據都有差異。上述因素使平臺間的數據共享與交換難度加大,極大阻礙了我國編目事業的發展。因此,編目標準的制定亟需加以統一。