

摘要:維護館藏目數據,保證書目數據質量是圖書館編目人員的重要工作之一。E環境下圖書館維護館藏編目數據具有重要意義,在海量的館藏數據中運用系統查錯、技巧查錯、分編新書壹重過程查錯以及其它部門的協作查錯等方法,查出錯誤,并根據書目數據出錯情況不同,采取不同方法進行修錯,達到維護館藏書目數據的目的。
關鍵詞:圖書館;書目數據;數據維護
中圖分類號:G254.3 文獻標識碼:A 文章編號:1008-0821(2012)07-0122-04
網絡環境下圖書館事業發展日新月異,計算機的普及、圖書館編目業務外包以及幾大聯編中心的日益壯大。擴大了圖書館編目數據源,編目人員既可以自制數據。也可以將數據外包給書商制作,還可以從國家圖書館聯合編目中心、上海聯合編目中心、中國高等教育文獻保障系統(Calis)等中心下載套錄數據……,多渠道的編目方法使圖書館編目速度加快了,書目數據質量提高了,但也由此帶來了一些困惑:由于我國數據標準尚未完全統一,這么多來源的書目數據如何保證館藏數據的一致性?如何在海量的館藏數據庫中發現書目數據錯誤?通過何種方法查錯、修錯以維護館藏書目數據庫質量呢?編目數據維護具體有何意義?實施數據維護有哪些步驟?筆者結合本館的實踐經驗對上述問題進行闡述。
1、E環境下維護館藏書目數據意義和實施步驟
E環境下對編目數據進行質量管理對圖書館有著重要意義,有計劃地、系統地維護館藏書目數據能夠保證編目數據規范、標準,是實現文獻資源共享的重要環節,能夠準確、完整地揭示所有實體館藏和虛擬的數字化館藏,保證館藏書目數據標引和著錄格式前后一致,提高圖書館藏書的整序質量,保證將同種圖書集中歸類排架、同一主題文獻歸入相同的類目,避免“一書兩分”現象,便于圖書館管理,利于讀者準確、全面、快捷查找文獻,是為讀者提供高質量服務的前提和保障。
眾所周知,館藏書目數據是不能隨意更改的,圖書館是在嚴格執行各項標準的前提下,有組織、有步驟、科學地組織人員修改數據錯誤、清理垃圾數據,達到凈化館藏數據,使館藏書目數據規范、標準、一致,在書目數據維護工作中應遵循以下步驟:
1.1 規范崗位責任,明確職責劃分
由專人主管,專人負責,一般情況下,由主管領導負責,技術主管定義維護操作權限,維護人員完成維護任務,圖書館書目數據維護工作通常由業務領導主抓,系統部與采編部配合協作,編目人員負責具體數據維護工作。
1.2 實施計劃管理
書目數據維護工作不能采取“一次改一個錯”的零敲碎打方法,要統籌安排計劃內容,包括維護的工作范圍、采用的方法、所需資源、確認的需求、維護進度安排等。
1.3建立維護依據
數據的標準化、規范化與一致性是書目數據質量的關鍵,在保證遵守“數據質量控制工作規程”規定的各項國際、國家標準基礎上,針對本館工作實踐中提出的具體問題,采用國內權威機構制定的具體業務細則,求同存異,建立本館質量控制細則,對略有出入的細節問題,建立文檔予以注明,以保證館內數據加工細則的完善與統一,保持數據的一致性。
1.4 監督、檢驗維護成果
當維護工作告一段落時,維護人員要將維護內容形成書面報告,交給維護主管,由上級進行監督,進行抽檢驗收。
1.5 建立系統維護文檔
建立文檔是維護數據過程的“痕跡”,是系統維護人員延續進行的保證,文檔的缺欠和文檔的隨意性極有可能導致原來維護人員流動后,數據維護有遺漏,因此要重視文檔的建立。要維護文檔的一致性,保持文檔的可追蹤性。使文檔管理制度化。
2、查找館藏書目數據錯誤的方法和技巧
盡管我們在數據入庫前進行了嚴密地組織,嚴格地審校,但數據中仍會存在各種各樣的問題,編目員應運用一定方法和技巧,有計劃、系統地在館藏數據庫中查找錯誤。找出在分編庫中沒有被發現而轉入了館藏的書目數據錯誤,以便改正錯誤,維護館藏,提高館藏書目數據質量。
2.1 有計劃、系統地在館藏數據庫中全面核查
凡檢索途徑均可查錯,如用索取號查錯法、分類號查錯法、主題查錯法等,在有計劃、有步驟、系統地查錯過程中,最常采用索取號查錯法。這種查錯法操作有序,具有可行性、連續性和無遺漏性,它依據中圖法的分類體系,檢出索取號由A類到z類的館藏數據,通過逐條翻檢。發現書目數據錯誤,進行修改。
為保證館藏數據庫的穩定和查錯過程不發生遺漏,用索取號查錯法檢索時,要化整為零,每一次提取少量數據,可單獨用索取號提取A類、B類……,當某類的館藏數據較多時,還可以拆開,分段查錯,比如T類,可以拆成二級類目TB、TD、TE……來提取數據;也可使用“介于”的關系,將介于TP3與TP4的數據提取出來。如圖1,待數據通過翻檢維護完成后,再提取其它類目的數據,每天檢到哪個索取號為止要記下來,第二天接著查,照這樣的方法查錯、修錯,直至所有類目查完為止。
2.2 運用技巧查遺補漏,找出零散數據錯誤
編目員要善于運用逆向思維來尋找錯誤數據,如通過檢索錯誤的符號、數字來提取含有錯誤的書目數據,查錯,例如索取號為0(拼音“喔”)經常被誤錄為0(阿拉伯數字“零”),編目員一般很難分辨,但是用數字O做分類或索取號的檢索點,就可以提出分類、索取號中帶有數字“0”的錯誤數據。以此類推各種各樣的錯誤均可查出來。
還要善于運用圖書館自動化系統強大的檢索組合查詢功能查找錯誤。如大家都知道,如果索取號A——K類館藏地點分配到自科,N ——Z類館藏地點分配到社科是不符合館藏分配的,在自動化系統中運用組合檢索,將檢索項設為“索取號”,檢索條件選擇“介于”,檢索內容為A與K之間,并且館藏地點設為“自科”,設置方式如圖2,這是查找館藏地點有誤的方法之一。用多種檢索途徑進行組合查詢,能夠快捷地查找出錯誤,進行數據維護。
2.3 善用查重,在分編新書過程中發現錯誤
館員分編新書過程中,在館藏數據庫中進行查重是必不可少的重要程序,并不是所有圖書一次查重就可以完成任務,一般情況下編目員要經過多次查重后才能達到最終目的。優秀的館員在查重過程中,能夠掌握規律,運用技巧,既能夠以最少的檢索途徑精準地達到查重目的,又能夠在查重過程中發現館藏庫中的數據錯誤。
2.3.1 ISBN查重發現書目數據錯誤
不同內容、甚至版本、裝幀、文種不同的圖書ISBN號各不相同,查重中如果一個ISBN出現多條書目數據時要仔細分辨,準確判斷。細心的編目員善于在這一過程中發現書目數據錯誤,如“一種書兩條記錄”、“兩種書一條記錄”、“一書兩分”等現象,筆者用ISBN為978-7-5023-6869-2檢索由曹健林主編的《國際科學技術發展報告.2011》一書時,看到索取號給出N11/C09,表面看是正確的,可是查重卻發現是錯誤的,因為《國際科學技術發展報告》從2003年開始,每年在內容更新基礎上出版1次,我館其它年份的《國際科學技術發展報告》都沿襲首個分編數據一徐冠華主編的《國際科學技術發展報告.2003》的索取號N11/X74,因此2011年給出的索取號是錯誤的,需要修改。
2.3.2 對題名項、多卷書項、叢書項查重,發現書目數據錯誤
用題名查重能準確判斷館藏數據分類是否正確。著錄格式是否一致。比如有些圖書的修訂版、多次版本等多種形式的不同版本,正題名未變,但重新分配了ISBN號,在題名查重過程中很容易發現是否分類一致,著錄格式是否正確。
多卷書、叢書一定要在館藏書目數據庫中進行查重,通過查重檢出已到館的多卷書、叢書的其它卷、冊數據,編目員從提出的館藏數據可以檢查分類、主題標引是否前后一致、著錄格式是否統一,以保證館藏數據的統一。例如,筆者檢到標準書號為978-7-22109619-7的《南京保衛戰》一書,分到K類,在查錯過程中發現我館將這套《話說中國抗戰史》叢書的其它分冊集中處理都入E類,因此,《南京保衛戰》一書的數據需要修改。
2.3.3 善于運用責任者查重發現錯誤
遇有如《高等數學》、《概率與統計》、《自動控制原理》、《大學英語四級考試》等題名重復率較高的圖書,或在同一領域有大量著作,或常年有考研著作、各種英語水平考試著作、公務員方面著作等的責任者,有經驗的編目員善于運用責任者進行圖書查重,能夠快捷、準確地判斷分類與索取號,發現館藏數據的錯誤。例如用著者“伍樂其”查重能夠檢出許多條書目數據,由于“樂”字發“le”和“yue”兩個音,容易出現同一作者分配作者號時不一致錯誤。
2.3.4 主題做為輔助查重
編目員在分編新書過程中,有時會通過主題查重,才能完全確定主題詞與分類號正確與否,用某一主題詞檢索,往往會檢索出很多條相同主題詞的數據,通過快速地比較分析,判斷分類,也能夠查出錯誤。
2.4 與流通部、閱覽部等其它部門協作發現錯誤
圖書入庫進行流通之后,需要收集流通部、閱覽部等部門反饋回來的信息,使編目人員在其它部室工作人員的配合協作下發現書目數據錯誤。一些平時不易在編目室被發現的錯誤,在其他部門的工作運行中比較容易被發現,如010字段中的價格與圖書實際不符、題名中的錯字、分類號或索書號錯誤、館藏地點有誤、入藏條形碼掃串等現象。
3、對館藏數據進行維護修錯方法
發現錯誤,如何進行修改維護呢?筆者認為,對書目數據維護要遵循“掌握重點,量力而行,靈活機動,有始有終”的原則,也就是說編目員要認清哪些錯誤是必改不可的,哪些錯誤需要立刻修改,哪些錯誤可以延遲修改。數據修改要看編目部門的修改能力:有沒有時間?有沒有足夠的人手?修改錯誤要靈活機動,有足夠的人力和足夠的時間條件下。發現的錯誤都要及時改正過來,沒有時間和人力的,要保證重要檢索字段以及影響流通、借閱、管理的數據錯誤獲得及時有效地修改,并且凡涉及數據的替換、更新、合并、刪除等重要錯誤數據必須修改。具體修改館藏書目數據錯誤時要視不同出錯情況。用以下不同方式處理。
3.1 大量的、共性的字段錯誤,用計算機程序進行批處理
大量的、共性的字段錯誤常產生于某一時期大批量的加工過程,如回溯建庫過程中,由于各種原因,著錄不規范,數據出錯率較高,如我館在1997-1999年回溯建庫階段,225字段既鏈接生成410字段,同時又生成461字段,應刪去461字段;606字段子字段標識有@b、@c現在都換為@x;200字段題名不僅有全拼字段,還拼音首字母字段,拼音首字母字段是多余的,這些都可以利用計算機功能進行批量修改,既改得準確徹底,又修改得速度快。
3.2 對于小量的,單個的數據錯誤,隨時發現,隨時修改
在查錯過程發現不涉及條形碼、分類號、索取號,書目數據著錄內容或者著錄格式有錯誤的,能夠確定直接修改的,可以邊查邊修改,例如:
200@a求解代數特征值問題模板@e實用指南@e英文影印版@ghsojun Bai等著@AQiu Jie Dai Shu Te Zheng ZhiWen Ti Mo Ban
701@8白照音@4著@ABai Zhao Yin
701@a德梅爾@g(Demmel,James)@4著@ADe Mei Er
701@a唐加拉@g(Dongarm,Jack)@4著@ATang Jia La
上面這條數據中200字段中@f明顯是錯誤的,像這類錯誤不必提回圖書,依照與7字段直接在數據上進行修改即可。如果不能確定,也可以打開其它館的書目數據,如國家圖書館的數據,參考進行修改即可。
3.3 不能判斷的錯誤要提回圖書,研究分辨
涉及分類、索取號、條形碼以及不能判斷是否有錯的圖書要及時提回,依書進行判斷,如需要修改,則將書標與數據同時修改,盡量一次全部改完。備有記錯本,記下外借圖書需要修改的內容和歸還時間,并經常審視,以便及時取回圖書進行修改。
3.4 在不影響新書分編的前提下,適時維護
眾所周知,以最快的速度讓新書與讀者見面是編目人員的工作目標之一,在分編新書時,若在查重過程中發現館藏數據存在錯誤時,視情況緩急程度進行處理,不得影響新書分編速度。新書到館后,館員要以最快速度將其分編上架,發現錯誤時,如果錯誤影響新書的入藏,那么立刻提出圖書并對錯誤數據進行修改,如果不影響新書入藏,就及時記在修錯本中,等新書分編工作告一段落,編目員有空余時間時再進行修改。
4、結語
做為一名編目員,發現錯誤是一件很矛盾的事情,既高興錯誤被發現了,又自責怎么會有錯誤存在呢?這種心理很正常,客觀地說,每一名有責任心的編目人員都不希望有錯誤存在,但只要有手工操作的環節,難免會有錯誤的存在,何況海量的館藏書目數據呢?我們只要充分認識到數據維護的重要性,將它做為一項長期而艱巨的工作,持久地進行著,那么經過維護后的書目數據必將最大限度地發揮出館藏資源的效益。