999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

西文編目中的CNMARC到USMARC轉換系統的設計與實現

2014-03-13 05:33:40艾金勇陳小瑩
電腦與電信 2014年8期
關鍵詞:內容

艾金勇 陳小瑩

(1.西藏民族學院圖書館,陜西 咸陽 712082;2.西藏民族學院信息工程學院,陜西 咸陽 712082)

西文編目中的CNMARC到USMARC轉換系統的設計與實現

艾金勇1陳小瑩2

(1.西藏民族學院圖書館,陜西 咸陽 712082;2.西藏民族學院信息工程學院,陜西 咸陽 712082)

在分析編目數據從CNMARC格式到USMARC格式自動轉換可行性的基礎上,研究了兩種MARC的字段和字符內容對應關系,找出其中的對應規律,編制出轉換關系對應表,設計了西文編目中的CNMARC到USMARC的轉換軟件,實現了兩種MARC格式的平滑轉換。

CNMARC;USMARC;西文編目;自動轉換

1.引言

MARC作為書目數據的基本存儲格式,是圖書館界對數據描述的重要手段,已經得到各國圖書館界的普遍認可和采納。但是由于語言以及應用環境的差異,不同國家使用了不同的MARC格式,它們之間的標準也不相同。在我國的西文編目中,目前主要有CNMARC和USMARC兩種。其中CNMARC是我國的機讀目錄格式,它是在UNIMARC的基礎上,結合我國編目工作經驗于1990年正式發布的[l]。而USMARC是加拿大國家圖書館與美國國會圖書館通過對兩國MARC格式的修改共同頒布的MARC格式版本[2]。我國大多數圖書館的西文文獻最開始都是采用AACR2編目,后來考慮到數據共享和交換,開始向國際標準接軌,由于USMARC主要依據《英美編目條例第2版》制訂的,同我國的西文原始數據基本類似,所以西文編目時能直接套錄USMARC的機讀記錄,因而USMARC在西文文獻編目中很快得到了普及推廣。而我館使用的集成系統由于對于西文圖書編目未做出明確規定,加之西文書目數據不多且編目人員比較緊張,因此西文圖書著錄一直套用中文圖書著錄規則。但是隨著越來越多的西文圖書的購置,并且國內大部分圖書館聯盟可以用來共享的西文圖書編目數據均為USMARC格式,這就需要我們考慮如何更好地實現西文圖書編目數據的交換和共享,提高西文圖書編目工作的效率和規范化進程。正是基于這種目的,本文將針對西文圖書編目數據CNMARC格式到USMARC格式轉換系統的實現過程展開研究。

2.系統實現的可行性

CNMARC與USMARC都遵循ISO2709格式,它們的主體結構原理相同,都是由記錄頭標區、地址目次區、數據字段區組成[3]。在對MARC構成的幾個部分進一步分析發現兩種格式在具體的字段設計上也是類似的。謝蓉[4]曾對CNMARC與USMARC的常用項目進行分析,發現二者在字段和子字段的設置與使用方面的差異也有一定的對應性,歸納起來,主要有如下幾種近似關系[5-7]:

(1)一對一的情況,即一個源字段和一個目標字段對應。例如USMARC分別在245和250字段上表示題名和版本項,CNMARC中對應的內容分別設置在200和205字段上。

(2)一對多的情況,即一個源字段對應多個目標字段。例如在相關題名項的設置上,USMARC中只設置了一個246字段,通過其指示符2的不同取值來表示不同的相關題名類型,而CNMARC格式卻用了6個字段來說明各種相關題名。

(3)多對一的情況,即多個源字段對應一個目標字段。例如責任者項的表示上,USMARC中則設有表示團體名稱責任者和會議名稱責任者的主要款目字段,分別在字段110和111上,而CNMARC中對應的內容僅用710字段來表述上面兩個字段的內容。

(4)多對多的情況,即多個源字段和多個目標字段對應。例如在責任者的責任方式描述方面,CNMARC設有表示主要責任者、次要責任者的字段701、702和711、712,另外,還在200字段中分別用$f、$g來表示第一責任說明和其它責任說明。USMARC對應的內容分別用245和701的子字段進行了描述。

由于兩種MARC格式在結構上的相似性以及字段和子字段的可映射性,因此兩種MARC格式之間的自動轉換存在可能性。

3.轉換系統的設計和實現

3.1 轉換系統的流程分析

由于MARC數據格式比較復雜且差異較大,想正確轉換每條記錄,必須根據記錄每個字段的特點,依不同的轉換表對應映射進行轉換。轉換過程中,按照如下幾個步驟進行:MARC數據的校驗、MARC數據的分解描述、MARC格式轉換、人工修正編輯。具體流程如圖1所示。

圖1 CNMARC格式到USMARC自動轉換系統流程圖

3.2 必備字段的選擇

首先要進行的第一步工作是對照西文普通圖書著錄規則選取采用USMARC格式的必備字段及子字段。因為CNMARC和USMARC中所設字段都是針對能著錄多種文獻類型及多文種文獻而制定的,數據格式結構復雜繁多,同一本圖書可能會從多角度進行描述,采取的是詳盡著錄的方式,且字段重疊,重復性高。況且兩者之間的對應關系也不是絕對的,因此在轉換時沒有必要也不可能轉換所有字段,只需要按照圖書著錄標準選擇適用的機讀目錄格式字段進行轉換即可。

3.3 轉換對應關系表的設計

3.3.1 字段對應關系表的設計

在編制轉換關系表時要認真分析CNMARC和USMARC各個字段的對應關系,一個CNMARC與USMARC字段對應關系的轉換表是轉換系統設計與開發的首要任務。轉換表中要詳細注明字段與字段的對應關系,對應的轉換方式及以可以其它需要描述的內容,字段轉換時要特別注意各方面的對應:字段標識符的對應,字段指示符的對應,子字段標識符的對應。如USMARC中的008字段的數據代碼內容對應于CNMARC中的多個字段,轉換規則中需要排列出其所有的對應關系。

在實際記錄中,由于一些字段的可重復性造成該字段重復出現,要考慮其字段對應的USMARC格式字段的可重復性,不能只取其一或讓后者覆蓋前者。對于CNMARC格式中一些無對應的USMARC數據字段或利用價值不大的字段不建立對應關系,轉換時可以不予考慮。由于CNMARC與USMARC的對應關系復雜,首次建立的對應表及轉換規則不可能完全合適用于所有的編目數據,因此還需要建立轉換表的動態添加功能。

3.3.2 字符內容轉換表的設計

兩種MARC格式中還可能出現同樣的內容著錄的字段名、位置相同,但是指示符代表的內容卻不一樣的情況;還可能存在字段名和位置不同,使用的代碼符號各異的情況。因此在具體轉換時,在考慮正確對應字段及位置的同時,也要正確替代使用的符號,例如:描述文學體裁為小說時,USMARC著錄于008字段的第33位,著錄內容為f,而對應的在CNMARC中,使用a代表小說,卻在105@a字段的第11位用a表示。根據這些可能存在的情況,系統也設定了對于此類內容描述不同的字符的對應關系。

3.4CNMARC數據的校對與規范

數據的規范性是正確轉換的前提條件。在一般的應用中,CNMARC中的代碼內容如果出現錯誤,編目員通過對其它相關字段的分析比較,大多數內容可以正確修改和認識。但是,在系統轉換過程中,所有代碼內容都要以位為單位逐個轉換,系統無法通過相關字段進行全面對比分析。所以在轉換之前,需要人工對所有的CNMARC數據進行判別檢驗。CNMARC的檢驗應當全面,包括定長字段的各個元素代碼的合法性。必備字段、子字段的齊全性,字段的重復性及所有字段使用指示符的合法性,甚至也要校驗個別字段必備的字符串信息以及字段間的對應關系。

3.5 轉換程序設計與實現

具體的轉換程序主要有數據分析、數據轉換、修正編輯和記錄生成四個主要模塊。

(1)數據分析模塊:數據分析模塊主要實現MARC數據的分解和切分。對MARC文件中按照結構信息進行切分,對切分出來的內容分塊存放,分解標記不同內容,然后傳送到數據轉換模塊。

(2)數據轉換模塊:數據轉換模塊主要實現兩種MARC格式差異的變換。分別對應于轉換規則數據庫中的字段對應關系表和字符內容轉換表。轉換過程即為數據映射的關系,首先針對匹查詢到待轉換的內容,按照不同的轉換規則,逐條轉換。

(3)修正模塊:數據修正編輯模塊主要是對于兩種MARC格式中可能存在的一些需要手工添加的部分進行處理,還負責對轉換后的MARC格式可能出現的錯誤進行校對。例如在CNMARC中中文數據顯示的標識符號完全依賴子字段代碼來完成,USMARC的標識符號則需要人工輸入,而且這些符號只限于子字段之間,結尾處的符號則因USMARC對不同的字段有不盡相同的規定,很難整體考慮。因此需要根據字段的特殊要求人工實現。

(4)生成模塊:生成模塊是對轉換以后的結果按USMARC字段的要求逐條字段生成,并對字段排序形成數據區,再形成目次區,生成完整的USMARC數據。

4.結束語

本文在認真分析CNMARC與USMARC規則的基礎上,歸納整理了國內西文編目中CNMARC與USMARC著錄數據的特點,設計實現了CNMARC到USMARC的自動轉換系統,該系統已在實際工作中得到較好的應用。系統的實現為下一步批量實現西文編目數據從CNMARC向USMARC的轉換提供了較好的思路。但由于兩種編目格式在細節上的設計差異以及中英文表達方式的不確定性等原因的存在,仍需要在實際的轉換工作中,不斷地更新和完善映射規則,以便最終實現數據的直接交換和共享使用。

參考文獻:

[1]北京圖書館《中國機讀目錄格式使用手冊》編委會.中國機讀目錄格式使用手冊[M].北京:華藝出版社,1995.

[2]陳穎.從MARC21和CNMARC對叢書項著錄的差異看編目工作國際化[J].重慶圖情研究,2012,02:56-58.

[3]張贊,梁肇英,楊維利.淺談CNMARC與MARC21[J].圖書館工作與研究,2011,09:83-85.

[4]謝蓉.USMARC與CNMARC的比較研究[J].現代情報,2005, 04:124-127.

[5]宓永迪.《USMARC和CNMARC雙向轉換系統》的分析和實現[J].現代圖書情報技術,2002,03:32-34.

[6]孫華,陳世海.USMARC與CNMARC自動轉換系統[J].大學圖書館學報,2000,01:56-58.

[7]余敏.從CNMARC到MARC21數據轉換研究[J].圖書館論壇,2011,03:105-108.

Analysis and Implement of Transition System between CNMARC and USMARC in the Cataloguing of Foreign Books

Ai Jinyong1Chen Xiaoying2
(1.The Library of Xizang University of Nationalities,Xianyang 712082,Shaanxi; 2.College of Information Engineering,Xizang University of Nationalities,Xianyang 712082,Shaanxi)

tract】 Based on analyzing the feasibility of cataloguing data automatic conversion from CNMARC format to USMARC format,this paper compiles the character map about two MARC formats;and then finds the law between the two formats.At last we design the conversion software that realizes the smooth conversion from CNMARC to USMARC.

words】 USMARC;CNMARC;cataloguing of foreign books;automatic conversion

艾金勇,男,湖北襄陽人,館員,研究方向:藏文信息處理。

西藏民族學院科研項目(13myQ12)的階段性成果。

猜你喜歡
內容
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
內容回顧 溫故知新
科學大眾(2021年21期)2022-01-18 05:53:48
內容回顧溫故知新
科學大眾(2021年17期)2021-10-14 08:34:02
內容回顧溫故知新
科學大眾(2021年19期)2021-10-14 08:33:02
內容回顧 溫故知新
科學大眾(2021年9期)2021-07-16 07:02:52
內容回顧 溫故知新
科學大眾(2020年23期)2021-01-18 03:09:18
內容回顧 溫故知新
科學大眾(2020年17期)2020-10-27 02:49:04
引言的內容
引言的內容
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
主站蜘蛛池模板: 成人在线观看不卡| 国产乱人伦精品一区二区| 精品亚洲麻豆1区2区3区| 中文字幕 91| 亚洲二区视频| 亚洲天堂高清| 亚洲第一黄色网址| 欧美一级特黄aaaaaa在线看片| 久久综合伊人 六十路| 99热免费在线| 人与鲁专区| 精品久久久久无码| 亚洲精品大秀视频| 婷婷六月在线| 亚洲欧美日韩另类在线一| 中文天堂在线视频| 四虎免费视频网站| 亚洲AⅤ波多系列中文字幕| 综合人妻久久一区二区精品| 亚洲精品第1页| 亚洲三级a| 久久永久视频| 国产91久久久久久| 亚洲日本韩在线观看| 天天操天天噜| 91久久精品国产| 在线国产欧美| 97国内精品久久久久不卡| 丝袜无码一区二区三区| 99久久国产自偷自偷免费一区| 无码网站免费观看| 成人国产免费| 在线综合亚洲欧美网站| 久久久噜噜噜| 亚洲AV色香蕉一区二区| 欧美精品在线视频观看| 97青青青国产在线播放| 国产亚洲高清视频| 久久精品66| 欧美成人影院亚洲综合图| 国产女人在线观看| 久久久久中文字幕精品视频| 欧美日韩另类在线| 2020国产精品视频| 中文字幕久久波多野结衣| 蜜臀AV在线播放| 最新日韩AV网址在线观看| 精品国产成人国产在线| 2021国产精品自产拍在线| 国产夜色视频| 国产丝袜91| 欧美日本一区二区三区免费| 丰满少妇αⅴ无码区| 国产午夜一级淫片| 四虎永久免费在线| 国产精品入口麻豆| 亚洲一级毛片免费观看| 久久久久亚洲精品无码网站| 国产精品人成在线播放| 成人免费视频一区二区三区 | 一本久道热中字伊人| 成年人视频一区二区| 青青青视频蜜桃一区二区| 亚洲国产成人综合精品2020| 久久综合丝袜日本网| 免费一级毛片完整版在线看| 欧美97色| 九色在线视频导航91| 日韩天堂在线观看| 精品国产福利在线| 日本爱爱精品一区二区| 人妻无码中文字幕第一区| 国产69精品久久| 99er这里只有精品| 久久婷婷综合色一区二区| 国产高潮视频在线观看| 99久久精品国产精品亚洲 | 波多野结衣一二三| 最新国产精品第1页| 国产精品成人观看视频国产| 亚洲Aⅴ无码专区在线观看q| 日本黄色不卡视频|