〔摘 要〕Millennium系統是美國INNOVATIVE公司開發的一個功能齊全的圖書館集成管理系統,其發展已超過25年歷史,在國內外擁有眾多用戶。我館于2006年引進該系統,本文結合2年的編目模塊實踐,從數據套錄、統計、數據質量控制等方面,全面論述該系統在我館編目工作中的應用,同時分析其存在的問題并提出解決的辦法。
〔關鍵詞〕Millennium系統;編目;數據質量控制
〔中圖分類號〕G254.3 〔文獻標識碼〕A 〔文章編號〕1008-0821(2009)07-0174-03
Applications and Problems of Utilizing Millennium System in CatalogingXiao Liping
(Library,Jinan University,Guangzhou 510632,China)
〔Abstract〕Millennium system is a full-featured integrated library management system developed by INNOVATIVE Corp.of USA with 25 years’ history and thousands of users worldwide.Based on two years’ cataloging experience since 2006,the author analyze the advantages of application of Millennium system in cataloging and provide solutions for the existing defects.
〔Key words〕Millennium System;Cataloging;Data Quality Control
2006年,暨南大學圖書館引進Millennium系統,該系統是由美國INNOVATIVE公司開發的一個集采訪、編目、流通、期刊、OPAC、系統管理等于一體的功能齊全的圖書館集成管理系統,在全世界40多個國家和地區擁有眾多用戶。在中國內地有清華大學、西安交通大學、華中科技大學、國家會計學院、浙江省圖書館等10多家圖書館使用,其功能全面、結構嚴謹,使用方便,得到用戶的廣泛認可。本文將結合2年的編目模塊實踐,具體討論Millennium系統編目模塊應用中的優勢和存在的問題,分析其中原因,并提出較為可行的解決辦法。
1 Millennium系統編目模塊應用的優勢
1.1 支持多數據源檢索
在聯機合作編目的形勢下,圖書館書目數據共建共享,數據套錄漸漸成為編目工作不可或缺的一部分。如何有效提高套錄效率就成為提高編目效率的一個重要方面。在Millennium系統的Z39.50客戶端,可以配置多個Z39.50服務器,其遠程檢索支持不同語種和多種MARC格式,套錄數據可以同時選擇多個數據源庫進行檢索。例如套錄西文圖書數據時,可以同時選上CALIS聯合目錄、美國國會圖書館聯合目錄、美國Ohiolink聯合目錄等數據庫,進行一次檢索,即可同時下載不同數據源庫的檢索結果。
1.2 具有強大而靈活的統計功能
圖書館統計工作是圖書館業務工作的重要組成部分,它對圖書館運行中的各種數據進行搜集、整理、分析研究,以便從中發現問題和解決問題。國內系統在統計方面的功能比較欠缺,例如不能對數據進行深層次的統計和分析,問題數據進入大庫后很難將其查找出來等。Millennium系統具有非常強大的統計功能,編目模塊常用統計工具產生資料檔(Create lists)可以非常方便的統計出幾乎所有需要的統計結果。
利用資料檔,用戶可以根據自己所設定的條件,從書目、館藏等記錄數據庫中進行檢索,找出符合自己要求的記錄集合。設定表達式時,可以針對某一個索引組、某一字段或子字段,利用=、≥、含有等數學表達式,結合“與”、“或”、“非”等邏輯條件[1]。
在編目實踐中,主要用資料檔進行個人工作量統計、抓取有問題記錄、批次業務統計、書目數據審校以及產生新書通報。
1.2.1 抓取有問題或需處理的書目記錄
只要根據需處理記錄的共同特征設定條件,就可以輕而易舉地找出相關記錄進行處理[1]。例如要找出2008年12月已編目數據中漏加索書號字段的記錄,設定條件如下:
BIBLIOGRAPHIC Cat.Date between″2008-12-01″and″2008-12-31″AND BIBLIOGRAPHIC Call No.not exist。通過這個表達式即可抓取12月編目的所有書目記錄中無索書號字段的記錄。
1.2.2 批次業務統計
批次業務統計是編目典藏工作之前非常重要的內容,統計結果的核查尤為重要。利用資料檔的字段排序功能,可以很容易找出取值范圍之外的錯誤記錄。例如用書目記錄的索書號排序,沒有分編(即沒有索書號字段)的記錄就會排在最前面;同樣,用館藏記錄的條碼進行排序,就可以將不符合本條碼段的記錄找出來。
1.2.3 書目數據審校
書目數據審校是書目數據質量控制的重要環節,也是保證書目數據標準化、規范化所采取的重要質量控制措施。Millennium系統資料檔的數據排序及輸出等功能,可以非常方便的完成此工作。利用不同的字段排序,從資料檔里直接輸出該批數據需要檢查的字段內容,比如題名、責任者、版本、索書號等,在本地直接用文本文檔查看。這就省去了逐條打開記錄的繁瑣,而且也更加直觀明了。
1.3 可有效控制數據質量
圖書館的書目數據庫質量的優劣直接影響到文獻檢索效果,進而影響到文獻的流通、文獻的開發利用和文獻資源共享[2]。然而,如何有效控制書目數據質量卻是系統開發商面臨的重要難題。Millennium系統提供的多項功能如全域更新、標目查重、標目異動報表等,為用戶控制書目數據質量提供了充分的空間。只要編目人員充分利用這些功能,就可以極大的提高書目數據庫的質量。
1.3.1 全域更新
Millennium系統的全域更新功能可以批次插入、修改、刪除、復制變長字段,修改特殊字段等。在抓取需要更新的記錄后,利用此功能可以批次快速更新記錄,在執行更新之前還可以通過預覽查看更新之后的結果,以核對更新條件是否正確[3]。
例如我館正在回溯院系資料室回收圖書,需要在某一批數據的館藏記錄中增加一個字段表明該批數據回收來源。設置一定的條件抓取資料檔后,利用“插入定長字段”,將來源信息如“經濟學院回收”加入條件中,執行即可批次添加。
1.3.2 編目即時查重
Millennium系統在編目狀態下,提供了多種幫助功能來保障書目數據質量。其幫助功能主要有:實時MARC格式提示、MARC格式檢查、標目即時查重等。標目即時查重功能可以在3個方面對書目數據的質量予以保障。
(1)避免查重不嚴所致記錄重復。Millennium系統既可以對被編目記錄中某一索引字段即時查重,也可以同時對被編目記錄的全部索引字段即時查重。如遇到多個索引字段值均在書目數據庫中存在的情況,尤其是ISBN與題名同時出現重復的情況,就需要引起編目員的注意,通過仔細判斷來避免失誤[1]。
(2)索書號查重。通過索書號字段的即時查重,可以及時發現重號圖書,從而避免異書同號現象。
(3)排除輸入錯誤。通過對題名、責任者等字段的即時查重,可以顯示相鄰記錄的索引值,有助于發現可能存在的輸入錯誤[1]。
1.3.3 標目異動報表
書目數據庫中的記錄,只要有所變化,Millennium系統都會記錄下其標目的變動,形成標目異動報表。通過報表,我們可以實時監控數據質量。在我館,標目異動報表主要用來記錄重復使用標目的變化。
標目異動報表能夠產生重復控制號、索書號和館藏記錄條碼號的報表。從“索書號”重復提示,直接打開報表中的各個條目,可以進行人工判重,排除因為區分號不同而被系統認為重號的記錄;從“條碼號重復”提示,可以明確標示出重復的條碼,從而保證館藏記錄主要標識的惟一性。
另外,如果圖書館建立有本館的規范記錄庫,還可以使用標目異動報表進行規范記錄控制。通過報表指出與規范記錄有關的規范記錄重復、使用非規范標目和盲目參照等[1]。
2 Millennium系統存在的問題及解決辦法
Millennium系統是西方國家開發的系統,由于國情的差異和思維方式的不同,系統功能開發的側重點也會有所不同。在編目模塊的設計上,國外系統更注重檢索[4],而對中國特殊國情需要的某些功能開發有所欠缺,目前,Millennium系統編目模塊存在的問題主要體現在如下3個方面:
2.1 有些中文字符轉換錯誤
我館Millennium系統使用的是圖形界面,字符集為Unicode碼。Millennium系統對中日韓文采用EACC/CCCII作為內碼存儲,在系統升級為Unicode之后,客戶端漢字輸入設為Unicode字符集。由于客戶端字符集與系統內碼的不同,就需要進行字符集編碼的轉換[5]。因為字符集轉換表的問題,在字符轉換過程中,就出現了一系列的問題,包括字符缺漏,如“稅”字不能保存;有些字符轉換成了異體字或者亂碼,如漢字“真”在導入系統之后變成了“真”,等等。
為了解決字符問題,我館主要采用兩種方式:一是在編目過程中搜集錯誤的字符,并將其發送給公司,由公司方重新匹配字符集,逐個修改;二是定期統計月度編目數據,利用全域更新批次修改轉換錯誤字符。
2.2 中文圖書原編時拼音羅馬化不符合CNMARC著錄要求因為我國使用象形文字,CNMARC著錄規則要求對有檢索意義的字段如題名、主題、責任者增設我國特有的拼音子字段,從而提供多一種檢索途徑。Millennium系統對漢字羅馬化(即產生拼音)的定義是將定長字段language為chi的記錄中所有的中文漢字都匹配一個拼音[6]。顯然,這種羅馬化的定義與CNMARC圖書著錄規則不相符。在Millennium系統中做中文圖書原編時,無法使用其羅馬化功能自動生成拼音,必須手動逐個輸入。為了解決這一問題,我館中文圖書原編都在CALIS Z39.50客戶端完成,數據提交之后再從Millennium系統遠程下載,覆蓋本地系統的簡編記錄。
2.3 Millennium系統還未與中國高等學校文獻保障系統(簡稱CALIS)達成協議,在系統中無法直接向CALIS上交館藏
作為CALIS的成員館,我們在下載其記錄的同時還必須向其提供本館的館藏信息,以利于各成員館之間的館際互借。由于協議尚未達成,我們不能直接通過Millennium系統向CALIS提交館藏,而只能到CALIS Z39.50客戶端重新執行一次檢索并上交館藏信息。目前公司正在與CALIS協商,我們期待早一點有結果。
3 結 語
2年多的編目實踐,我們感受到Millennium系統編目模塊結構嚴密,功能強大,使用方便,它提供了一整套編目業務管理的規范操作,有效提高了數據質量,整體上提高了編目工作效率。然而由于各國國情不同,思維方式的差異等原因,造成了上述的問題。我們希望Millennium在今后的系統升級中,能更多考慮不同用戶的需求以滿足用戶需要。
參考文獻
[1]胡小菁.INNOPAC系統書目數據庫質量控制[J].圖書館雜志,2001,(11):23-26.
[2]萬麗蓉.論書目數據的質量控制[J].圖書館工作與研究,2007,(5):34-35.
[3]INNOPAC Guide and Reference[EB].http:∥202.116.13.244/manual/VALIDATE,Page # 104002,2009-01-01.
[4]孫曉菲,曹玉霞.圖書館集成管理系統Horizon編目模塊評價[J].大學圖書館學報,2002,(4):37-39.
[5]方紅.INNOPAC/MILLENNIUM系統漢字處理問題的研究[J].高等工程教育研究,2006,(S1):119-121.
[6]INNOPAC Guide and Reference[EB].http:∥202.116.13.244/manual/VALIDATE,Page # 105472,2009-01-01.
[7]Millennium ILS:Innovative Interfaces[EB].http:∥www.iii.com/products/millennium_ils.shtml,2009-01-01.