陳松喜 葉少青
(東莞圖書館,廣東 東莞 523071)
1.1 東莞圖書館為鼓勵員工積極參與圖書館業務建設和業務研究,推動館內各項工作的發展,制定項目管理辦法,推行項目管理,通過彈性的工作時間,調動項目成員的積極性,以便項目順利開展。
1.2 東莞圖書館之城建設日新月異,辦館模式由單館轉變為多館集群模式,集群網內多達60余所圖書館,總書目數據庫的書目數據超過100萬條,書目數據由原來簡單的DBF數據,轉化為標準的CNMARC格式數據。但這種跨越式的發展帶來了新問題,總書目數據庫存在不少重復數據,一定程度上影響讀者檢索、借閱圖書,同時也給圖書館采訪工作人員開展工作帶來很多不便。
1.3 東莞圖書館在遷入新館前后的一段時間里,年購書經費高峰期突破1000萬人民幣,采編工作繁重,全部人員忙于加工新書,無暇維護舊書目數據。
1.4 Interlib系統的技術支持。Interlib系統是基于B/S(瀏覽器/服務器)結構建立的多館集群管理系統,通過互聯網,總分館共用一個Interlib圖書館集群管理系統,共享一個書目數據庫,突破時間、空間限制,為圖書館員工利用業余時間修改數據提供了便利條件。
2.1 收集、整理重復書目數據
收集重復書目數據,主要通過如下3種途徑:第一,通過機器,以ISBN及正題名為檢索點查重;第二,在采訪編目過程中發現重復數據;第三,在圖書外借流通過程中,收集重復數據。通過以上辦法,共收集到重復書目記錄1萬余種、兩萬余條。
2.2 編寫項目計劃書
2.2.1 說明合并重復書目數據的方法
①校正因批套錄標準CNMARC數據時出錯的書目數據。Interlib系統中的書目數據與舊系統的書目數據作比較,索書號一直保持不變,以索書號為檢索點,對新舊系統中的數據作對比分析,判斷書目正誤,若總書目數據庫中已有對應的正確書目數據,則利用Interlib采編子系統中“書目合并”功能,合并到正確的書目記錄,同時刪除重復書目數據;若總書目數據庫中沒有對應的書目數據,則從外網編目中心下載正確書目,履蓋、更正錯誤的書目數據。
②經確認為總、分館重復的書目數據,直接用Interlib采編子系統中“書目合并”功能,把重復書目數據集中到唯一的一條書目記錄上,同時刪除重復書目數據。
③每修改或刪除一條書目數據均要在一個EXCEL文檔中記錄,以備查考。
2.2.2 目標和效果
對收集到的重復書目數據逐一檢查更正,分析錯誤數據產生的原因,形成網絡培訓課件,指導采訪編目人員正確編制書目數據。
2.2.3 項目實施步驟
第一,組織員工。召集對項目有興趣的員工參與這一項目。項目參與人員分別來自網絡部及采編部。
第二,業務培訓。對重復書目數據修改操作辦法作介紹、演示,讓項目組人員明白了解項目的實施方式、操作辦法,做到人人心中有數。
第三,分配任務。制作項目實施進程表。把收集到的重復數據分配給項目參與人員,責任落實到人。對完成任務的進度作估算,按時間列出項目進程表。
第四,編寫課件。重復書目數據檢查、修改完畢后,對修改的書目記錄進行匯總,根據收集到的資料,全面分析產生重復書目數據的原因,并編寫網絡培訓課件,阻止新的重復數據產生,指導、協助各館合并本館重復書目數據。
項目實施前,為防止操作失誤導致總書目數據庫混亂,先對Interlib系統中的館藏書目數據進行備份。為提高效率,能進行批處理的字段,先作批更正處理。項目參與人員按計劃分工協作,對成員遇到的新問題、難題,定期碰頭討論處理。
3.1 書目信息修改要點
舊系統原始數據有錯誤,利用新、舊系統的數據進行對比,同時參考外部編目中心的數據,根據圖書價格、卷冊、出版年份等信息加以更正。上述辦法不能鑒別的館藏書目數據,再按索書號找出圖書核對更正。早期的CNMARC數據與現行的著錄標準有一定的差異,要做適當修改:
3.1.1 010字段:人民幣符號統一用“CNY”表示,RMB、¥、S等符號需更改,價格保留兩位小數。
3.1.2 200字段:指示符 1為“1”,指示符 2為“空”。
3.1.3 205字段:不同版本的書目記錄,如第2版、修訂版等,不作合并處理;不同版的記錄,各保留一條書目記錄后,刪除多余的記錄。
3.1.4 210字段:出版年只取年份,月份刪除。
3.1.5 215字段:尺寸單位用“cm”表示,不用“厘米”;多卷書集中著錄為S a×冊(×,×頁),或Sa×冊(×頁)。
3.1.6 461字段:叢編聯結字段統一用461字段(在225字段按回車鍵,可自動生成461字段后,然后再把410字段刪除)。
3.2 館藏信息修改要點
3.2.1 多卷書:沒有分卷題名的多卷書(如第1冊、第2冊、第3冊;或上、下冊等),館藏合并時,要在館藏卷冊信息中加相應的分卷冊號(如1,2,3;或上冊、下冊等卷冊信息);有分卷(冊)題名的多卷書,原則上作分散著錄,若分館舊數據為綜合著錄,與分館舊數據保持一致,作綜合著錄,但要在館藏的卷冊信息上加分卷題名。
3.2.2 名人贈書:名人贈書在館藏的卷冊信息上反映,例如王匡贈書,其館藏的卷冊信息上錄入“王匡贈書”。
3.2.3 項目負責人對更改的每一條書目數據認真校對,確保每條館藏記錄的其他信息,例如條形碼、索書號、館藏地點修改前后保持不變。
4.1 按計劃完成
項目組人員主要利用業余時間,共修改、合并1萬余條重復(或錯誤)書目記錄,項目組按計劃完成工作任務,使總書目數據庫的質量得到進一步提高。
4.2 總結原因
①早期書目數據在由DBF格式轉換為標準的CNMARC數據時,對一號多書的書目數據未能準確轉換,產生一些重復的書目數據;②分館的館藏書目數據合并時,因著錄格式差異導致書目數據重復;③一些新員工對書目制作業務不熟練,或查重不細心,致使書目數據重復。
4.3 編寫課件、進行業務培訓
培訓課件歸納及整理總分館館藏書目數據建設中存在的問題:一是Interlib書目數據庫常見問題分析;二是分館書目館藏記錄統計分析;三是書目數據制作方法。總分館工作人員可通過FTP到指定的服務器自行下載瀏覽,方便書目制作人員業務交流。結合實際,本館對總分館工作人員共開展了4次針對性較強的業務培訓,受到總分館工作人員的歡迎。
4.4 完善Interlib編目子系統功能
對重復書目數據作批修改時,一些有預訂記錄及驗收記錄的館藏數據無法批修改、批刪除。發現問題后,我們積極與Interlib系統開發人員溝通,隨后系統開發人員增加Interlib書目合并功能,使合并重復書目數據的工作效率得到提高。
4.5 考核達標
東莞圖書館項目評審委員會對項目進行評審,隨機抽查600條經過修改的書目數據,把項目開展前期備份的館藏書目數據重新拷貝到測試系統中,通過修改前后兩組數據的比較,準確率達97.8%,并獲得東莞圖書館達標項目獎。
5.1 在整個項目實施過程中我們體會到:現行的圖書編目理論,主要適應單一館的編目實踐,未能從集群館的圖書目錄及其館藏特征考慮,不能全部滿足集群館的編目實踐需求;Interlib編目子系統中,對檢索到的書目數據不能排序,給查找、判斷重復書目數據帶來困難,對多種圖書共用一個ISBN的書目數據要花很多時間才能清理完成。
5.2 建設總書目數據庫是一項漫長又艱難的工作,需要工作人員不斷地維護。例如項目結束后,在半年的時間內,因新的分館加入圖書館集群網,以及總分館書目制作人員的變動,總書目數據庫中又出現一些重復書目數據,這就需要工作人員不斷地修改維護,以使總書目庫的質量得到保障。
5.3 加強合作,增長知識。合并重復書目數據,操作步驟繁瑣又不能出差錯,考驗項目成員的耐心和細心。通過參與此項目,讓項目參與人員對Interlib業務系統及總書目數據庫有了更深的了解,加強了不同部門同事的合作意識,增長了相關的業務知識。
[1]肖竹,喻名芝.高校合并時圖書館書目數據調整方式探討.河南圖書館學刊,2001(1):49-50.
[2]周雪偉,王愛姣,宋燕菊.高校圖書館合并后書目數據庫建設問題與對策.農業圖書情報學刊,2005(12):19-21.
[3]李世海.高校合并后圖書館書目數據庫的合并.圖書館學研究,2002(12).
[4]程建秀,張忠鳳.淺議高校圖書館書目數據庫質量與書目資源共享.大學圖書情報學刊,2002(1):49-52.
[5]吳玉珍.合并高校館藏書目數據維護中對重復數據的處理.圖書館工作與研究,2009(2):65-67.
[6]陸麗娜.利用ILASⅡ系統進行書目數據清理與合并.農業圖書情報學刊,2007(5):180-181.