劉 華 (中國科學技術信息研究所 北京 100038)
書目數據是計算機可識別和可處理的揭示館藏文獻資源的信息。聯合目錄數據庫匯集了多個圖書館和信息機構的書目數據,其完善程度及其書目數據的質量都直接影響著圖書館信息資源的交流與共享,因此,聯合目錄數據庫的數據質量控制成為編目界關注的熱點。OCLC(Online Computer Library Center,聯機計算機圖書館中心)擁有著世界上最大的聯合編目數據庫——WorldCat。考慮到世界上9 031個圖書館都依賴于其書目數據,OCLC非常重視WorldCat的質量控制,并采取了一系列舉措。本文擬對OCLC的書目數據質量控制舉措進行剖析,并對我國聯機聯合編目系統的質量控制提出一些改進建議。
1.1.1 廣泛應用各種現有的標準或規范
WorldCat中的書目數據來自于世界各地眾多的成員館。為了使這些書目數據能夠在格式或著錄規則上一致,OCLC所采取的首要措施是廣泛實施各種標準和規范。這些標準和規范的采用呈現出一定的層次性:首先,采用相關國際標準;其次,采用各國已有的規范;再次,針對上述規范中所未涉及到的內容制訂相應的規范。《書目格式與標準》[1]中詳細地指明了應采用的標準和規范以及國際和各國標準與規范中未涉及的內容,目前已出版第4版,并在不斷更新中,最近一次更新時間是2010年2月。現有標準和規范的廣泛采用最大限度地保證了數據的兼容性(見下頁表1)。
1.1.2 實施OCLC質量計劃
OCLC的質量計劃主要是為了鼓勵其所有的成員館參與WorldCat書目數據的監督和修正,對數據進行補充、修正和去重而制定并實施的。這些質量計劃能夠確保WorldCat數據的完整性和準確性,包括:
(1)WorldCat修改申請(WorldCat Change Requests)這一計劃允許所有編目成員館提出修改申請表格、指出WorldCat書目數據或規范文檔中需要修改的錯誤。也就是說,所有的編目成員館都擁有監督WorldCat數據的權利,這使書目數據處于最廣泛的監督中。
(2)最低級別升級(Minimal Level Upgrades) 這一計劃鼓勵所有編目成員館對WorldCat中未達到完全級的主記錄進行內容添加或修改,以使書目數據更為完整。為了保障所添加或修改的數據的準確性,OCLC賦予所有編目成員館的添加或修改權利是有限的,其可添加或修改的字段僅限于系統中默認的可編輯字段。

表1 WorldCat書目數據用到的標準或規范
(3)數據庫補充(Database Enrichment) 這一計劃是指所有編目成員館都可以對WorldCat中的主記錄進行補充,以提升主記錄的質量。可以補充的內容包括:記錄中的索書號和主題標目,006字段(附件特征)和007字段(載體形態),505字段(附注),在版編目數據中的300字段(載體形態項)。
(4)升級在版編目數據(Cataloging-in-publication Upgrading)[2]這一計劃是指特定的成員館可以對在版編目數據進行補充、編輯或修改。CIP(Cataloging in Publication,在版編目數據)數據是由美國國會圖書館和其他國家或地區的國家編目機構在出版物出版之前創建的書目數據。由于出版物在出版之前許多數據尚未確定,或者出版之后發生了改變,導致在版編目數據的完整性和準確性有所欠缺,因此,所有CIP數據都需要進行升級,以確保其準確性和完整性。1995年,OCLC提出CIP升級計劃,制訂了簡要的項目規范,列出了CIP升級所需要修改的USMARC字段及其子字段以及有資格升級的成員館。該計劃允許任何具有完全級或更高授權的編目成員館添加300字段數據;允許OCLC的高級參與者編輯整個CIP記錄;允許國家級高級授權的成員館將CIP升級為主記錄,并使之成為一個完全級的書目記錄。
(5)OCLC高級參與者計劃(OCLC Enhance Participants)[3]OCLC高級參與者實際上是一種認證機制,經過OCLC的許可,他們可以鎖定、編輯和替換WorldCat中的書目記錄。高級參與者分為兩類:①普通高級參與者,他們可以替換絕大多數由成員館輸入的記錄;②國家級高級參與者,他們主要是從美國國會圖書館選出的編目人員或合作編目項目的參加者,擁有更大的權限,可以替換大多數的國家級記錄。考慮到高級參與者所擁有的權限,OCLC制訂了嚴格的評估和培訓機制,以確保這一計劃的順利進行[4]。
(6)專家社區計劃(Expert Community)[5]專家社區計劃源自于“專家社區計劃實驗”,該實驗于2009年2-8月進行,主要是賦予具有完全級編目授權的成員館更大的修改權限和范圍,以改進和升級WorldCat主記錄。由于該實驗進行得很成功,因此OCLC保留了這一實驗的所有功能,并將之作為專家社區計劃的一部分。被納入專家社區的成員館有權實時修改記錄,有權修改完全級書目記錄,有權修改更多主記錄的字段,有權將書目數據升級為主記錄。專家社區計劃實際上是將WorldCat的記錄維護工作更多地分配給成員館,使這部分工作能夠有更多的技術力量支撐。任何擁有完全級編目授權的成員館都可以申請加入該計劃。
1.1.3 參與非OCLC質量計劃
非OCLC質量計劃實際上是OCLC以合作的方式吸收其他合作機構的高質量數據,并將其補充到WorldCat中,間接地提高其書目數據質量的做法。目前,這一類非OCLC質量計劃包括合作編目計劃以及合作聯機連續出版物和美國報紙計劃。
(1)合作編目計劃(Program for Cooperative Cataloging,簡稱PCC)[6]PCC計劃主要是基于圖書館之間互相認可的標準,提供有用、及時和經濟的編目數據,以滿足讀者對圖書館館藏檢索日益增長的需求。該計劃由美國國會圖書館和PCC計劃的參與者共同協調,旨在增加高質量的數據數量、增加負責國家級記錄的編目員和編目機構的數量、制訂和維護互相認可的數據標準。PCC的書目記錄可以直接提供給WorldCat,也可以通過OCLC規范文檔間接提供給WorldCat。
(2)合作聯機連續出版物(Cooperative Online Serials,簡稱CONSER)[7]CONSER計劃是一個聯合在線連續出版物編目項目,是連續出版物的高質量書目數據源。這一項目還出版關于連續出版物編目的文獻和培訓材料,并發布有關連續出版物的標準。CONSER數據庫嵌在OCLC聯合目錄中,其成員館在OCLC上輸入、驗證和修改連續出版物的編目數據,或者通過FTP(File Transfer Protocol,文件傳輸協議)將原始記錄上傳至OCLC聯合目錄,并為連續出版物的目錄記錄提供日常維護。
(3)美國報紙計劃(U.S. Newspaper Program,簡稱USNP)[8]USNP是美國聯邦政府和各州之間的合作項目,主要是對18世紀至今在美國出版的報紙進行定位、編目并以縮微膠片的方式進行保存。該項目由美國國家人文基金會提供贊助,由美國國會圖書館提供技術支持。USNP的數據庫收錄了自1690年以來在北美出版的300 000多種報紙,不僅提供書目數據和館藏位置信息,而且還致力于保存重要的、瀕臨消失的館藏。OCLC加入該計劃后,WorldCat中報紙記錄的數量和質量均有大幅度的增加和提高。
1.2.1 多層次標準的實施確保其數據更具兼容性
著錄規則和標準是保證書目數據質量的基礎。為了確保書目數據的準確性,也為了提高其兼容性,OCLC實施了多層次標準:①采用廣泛接受的國際標準或國際上通用的標準,如DC(Dublin Core,都柏林元數據),AACR2;②在特定的編目實踐中,參考使用各個國家或地區的相關標準,如美國音樂圖書館協會的《樂譜編目公告》;③與其他質量計劃合作,開發相互認可的標準;④針對自身數據加工的特殊性,制訂相應的細則。
1.2.2 開展最廣泛的合作
OCLC不僅注重與各成員館之間的縱向合作,也積極參加外界的各種質量計劃,加強與OCLC以外的機構的合作。例如,CONSER 計劃的成員館包括:美國國會圖書館和加拿大國家圖書館;選定的大學、政府、研究機構、特殊機構和公共圖書館;選定的圖書館協會;訂閱代理機構和制作摘要與索引的服務部門等。通過加入CONSER計劃,OCLC可以合作的機構不再局限于圖書館領域,還涵蓋了眾多的其他類型機構。這種廣泛的合作也為保障OCLC的書目數據質量奠定了堅實的基礎,一方面,OCLC可以直接將這些機構高質量的書目數據納入WorldCat;另一方面,OCLC可以借助這些機構中的編目人員加強對WorldCat的更新維護。
1.2.3 實行“全員監督、分級更新維護”的原則
WorldCat是由OCLC眾多成員館共同建設的。因此,OCLC也鼓勵所有的編目成員館都參與到WorldCat的監督與更新維護中,可歸納為“全員監督、分級更新維護”的原則。所有的編目成員館在發現書目數據的錯誤時都可以向OCLC提出修改記錄的申請,可以在有限的字段內對WorldCat中的記錄進行補充,但更進一步的更新維護則取決于編目成員館的級別。OCLC建立一定的評估機制,授權給不同水平的編目機構,讓他們對書目數據進行不同程度的更新維護。“全員監督”可以確保WorldCat處于更嚴密的監督機制之下,也使各成員館更具“歸屬感”,有“當家作主”的感覺;“分級更新維護”則能確保對WorldCat記錄修改的準確性。
受OCLC的啟示,我國于20世紀90年代開始開展聯機聯合編目領域的探索。經過十多年的發展,我國已經形成不少聯機聯合編目系統,如全國圖書館聯合編目中心(Online Library Cataloging Center,簡稱OLCC)、CALIS聯機合作編目中心(CALIS Union Catalog Center,簡稱CUCC)、中國科學院聯機聯合編目系統(Union Catalogue of Chinese Academic Library & Information System,簡稱UNICAT)、上海市文獻聯合編目中心(Shanghai Information Union Catalog Center,簡稱SIUCC)和地方版文獻聯合采編協作網(China Regional Library Network,簡稱CRLNet)等。這些系統都有著各自的質量控制舉措,以保障自身書目數據的質量(見表2)。

表2 我國主要的聯機聯合編目系統的質量控制舉措一覽表
與OCLC相比,我國聯機聯合編目系統在質量控制方面有以下特點:
2.2.1 應用的標準和規范各異
我國各大聯機聯合編目系統都基本遵循《中國文獻編目規則》、《中國機讀目錄格式》等基本標準,但是這些國家標準并不足以解決編目過程中的所有細節問題,再加上出版物本身的復雜性,各大系統都制定了自己的標準,以致應用的標準和規范不一致。標準和規范的不一致一方面會給用戶帶來不便,因為用戶在從不同系統下載數據時會面臨數據不兼容的問題;另一方面,會阻礙我國聯機聯合編目事業的進一步發展,因為隨著信息技術的飛速發展,我國各大聯機聯合編目系統勢必會匯聚在一起,數據之間不能兼容將會阻礙這一進程。
2.2.2 側重于自身數據質量的提高
我國幾大聯機聯合編目系統都側重于如何提高自身的數據質量,并且在質量控制方面,大都采取措施保證自身加工信息的完整性和準確性,但不考慮共享其他系統高質量的數據以間接地提升自身的數據質量。這是我國聯機聯合編目系統與OCLC最大的差異。
2.2.3 側重于數據加工的質量控制
我國聯機聯合編目系統的質量控制主要包括兩個方面的內容:制訂相關的標準和進行編目員資格認證。前者能夠確保數據加工人員加工數據時有據可依,后者則能夠確保數據加工人員的素質。然而,我國聯機聯合編目系統大多缺乏對上傳后數據的監督機制與更新維護機制。雖然其中有些系統設立了嚴格的審查小組,但人少數據量大的現實使得這種審查不能及時發現問題并及時更新。
為了實現最大范圍的數據兼容,建議我國各大聯機聯合編目系統:(1)采用國際標準或國家標準進行數據加工。(2)合作開發統一的加工規范,在國際標準或國家標準不能適應數據加工需求時, 各系統之間應進行橫向合作,合作開發相對統一的規范,以規范編目中的細節問題、規范標準中的非標準因素,從而使各方數據能夠互相兼容,為成員館利用不同系統的數據提供便利。
各聯機聯合編目系統都匯集了多個成員單位的數據,但我國聯機聯合編目系統大多只設立專門的審查小組對數據進行審核,這對于數量龐大的數據來說是遠遠不夠的。因此,建議采取一定的措施,鼓勵各成員館或具體用戶在發現問題數據時及時上報;開辟多條途徑,為成員館上報錯誤數據提供便利,如OLCC就為此設有專門的QQ群和編目論壇。
提高書目數據的質量,除了加強對上傳數據的審查以外,還應該強化書目數據更新與維護的機制。建議我國聯機聯合編目系統借鑒OCLC的分級更新維護機制,針對不同編目水平的編目員、圖書館進行不同級別的授權,賦予他們對書目記錄中的特定字段進行更新和維護的權利。這樣一來,編目員對于書目數據中存在的某些問題可以在自己的權限內及時處理,無須上報聯編中心,從而減少數據在審查過程中反復上傳的程序,間接加快數據上傳的速度,在保障書目質量的同時提高數據加工與審查的速度。
[1] Bibliographic Formats and Standards[EB/OL]. [2010-05-13]. http://www.oclc.org/bibformats/default.htm.
[2]Upgrading of Cataloging-In-Publication (CIP) Records[EB/OL].[2010-05-13]. http://www.oclc.org/worldcat/catalog/quality/cip/default.htm.
[3]OCLC Enhance Participants[EB/OL]. [2010-05-13]. http://www.oclc.org/worldcat/catalog/quality/enhance/#enhance.
[4]Enhance Evaluation Procedure[EB/OL]. [2010-05-13]. http://www.oclc.org/asiapacific/zhtw/support/documentation/worldcat/records/enhanceevaluation/default.htm.
[5]Expert Community[EB/OL]. [2010-05-13]. http://www.oclc.org/worldcat/catalog/quality/expert/.
[6]Program for Cooperative Cataloging[EB/OL]. [2010-05-13]. http://www.loc.gov/catdir/pcc/.
[7]Cooperative Online Serials[EB/OL]. [2010-05-13]. http://www.loc.gov/acq/conser/.
[8]U.S. Newspaper Program[EB/OL]. [2010-05-13]. http://www.neh.gov/projects/usnp.html.
[9]全國圖書館聯合編目中心[EB/OL]. [2010-05-13]. http://olcc.nlc.gov.cn/about-zxzc2.html.
[10]全國圖書館聯合編目中心2009 年工作會議資料[EB/OL]. [2010-05-13]. http://olcc.nlc.gov.cn/attendent/09年會/資料匯編2.pdf.
[11]CALIS聯機合作編目中心[EB/OL]. [2010-05-13]. http://www.calis.edu.cn/CALIS/lhml/index.asp.
[12]中國科學院聯合目錄集成服務系統[EB/OL]. [2010-05-13]. http://union.csdl.ac.cn/index.jsp.
[13]上海市文獻聯合編目中心[EB/OL]. [2010-05-13]. http://catalog.library.sh.cn/.
[14]地方版文獻聯合采編協作網[EB/OL]. [2010-05-13]. http://www.crlnet.org/.