999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

MarcEdit在元數據組織與管理中的應用

2009-04-29 00:00:00姚曉鋒
現代情報 2009年9期

〔摘 要〕在分析了元數據組織和管理的現狀后,本文探討了如何使用MarcEdit工具,來提高圖書館工作人員獲取元數據和轉換元數據格式的能力,為讀者提供更好的在線服務。

〔關鍵詞〕MarcEdit;元數據;MARC編輯;元數據獲取;格式轉換

〔中圖分類號〕G350.7 〔文獻標識碼〕B 〔文章編號〕1008-0821(2009)09-0151-04

Application of the Metadata Orga nization and Management of MarcEditYao Xiaofeng

(Library,Jiaxing University,Jiaxing 314001,China)

〔Abstract〕In the analysis of the status of the metadata organization and management,this paper discussed how to improve the library staff’s ability to harvest metadata and metadata format conversion with MarcEdit tool,and to provide the better online services for users.

〔Key words〕MarcEdit;metadata;Edit MARC;harvest metadata;format conversion

隨著Internet的發展以及網絡資源的廣泛應用,數字圖書館的數量也在不斷增多。圖書館中的紙質收藏(如圖書、期刊)需要編目,數字圖書館的數字收藏(digital collection)也同樣需要著錄和標引,以便用戶能夠準確快速地找到自己所需的信息。元數據是建設數字圖書館過程中的關鍵性基礎問題,但是由于數字圖書館中的資源類型多種多樣,單一元數據標準不能滿足描述各種數字資源的需要,從而出現適用于不同資源或適用于不同組織的元數據標準。比如說,DC(Dublin Core)元數據是當前國際上最有影響力的元數據格式,其基本內容是由15個元素構成的元數據元素集合,稱為“都柏林核心元數據元素集”(Dublin Core Metadata Element Set:DCMES),已成為多個國際標準組織和許多國家的正式標準[1]。

1 元數據組織和管理的現狀

近十年的電子圖書館、電子商務和電子政務等應用的結果顯示,都柏林核心集(DC)等元數據及元數據的互操作方案并未有效簡化因特網的知識組織和信息發現。與之相反,Google等搜索引擎已成為大眾獲取最新信息的入口,連OCLC(Online Computer Library Center,聯機計算機圖書館中心)都將經營多年的WorldCat(世界上最大的書目數據庫)數據貢獻給搜索引擎。后者的成功源于專注用戶的需求并及時調整檢索結果的次序,即依據用戶的點擊(鏈接)而不是信息本身的“元數據”來判斷信息的價值[5]。元數據作為一種描述數據的數據,雖說歷年來頗受重視,但在實際應用中失敗的案例屢見不鮮,有時候甚至受到排斥。可見,在元數據的組織和管理上的確還存在著一些問題。

對此,相關專家也已經做了很多的研究和嘗試,如DC曾針對網頁搜索的查詢效率和準確性不能令人滿意的狀況,試圖引入圖書館員館藏編目的方法對網頁進行“書目控制”,以元數據的再組織方式實現對元數據的有效管理[1]。然而由于沒有適當的工具對網頁進行高效率而低成本的處理,更由于“作者”(網頁創建者)自己對網頁進行標注極易造成元數據的“濫用”,使得元數據的“書目控制”問題一再擱淺。

2 MarcEdit簡介

MarcEdit最初的構思是在2000年夏,主要是針對俄勒岡州立大學圖書館電子目錄數據庫的清理項目。這個項目的主要問題在于,系統中有到底多少要清除的無效記錄。經過細心統計后發現,竟然有45 000條記錄必須予以糾正。面對如此龐大的清理任務,使用國會圖書館(Library of Congress,LC)現有的MARCBreakr或者MARCMakr工具顯然已無法勝任。要完成這個清理計劃,必須要有一個功能更強大的工具。于是,一個新型的MARC工具——MarcEdit誕生了,它能夠輕松快捷的完成數量龐大的清理任務(僅用了短短幾個小時),同時也使圖書館工作人員能有充足的時間去驗證這些已修正過的錯誤數據。這個項目獲得了極大的成功,MarcEdit在其中發揮了極大的作用[4]。

3 MarcEdit的功能介紹

隨著元數據格式和需求的不斷改變,MarcEdit也在不斷的變化著。在今天來看,MarcEdit這個名字似乎已經不太恰當了,因為它已不再是一個單純的MARC批量編輯工具,它的功能已經擴展了,包括對MARC記錄的編輯、元數據的轉換以及元數據的獲取等等。

3.1 MARC記錄的編輯

MarcEdit內置有一個MarcEditor,它是一個專門為編輯MARC記錄而設計的文字編輯器,適用于各種MARC格式。使用MarcEditor可以實現大批量的MARC編輯任務,最大容量可以定義成2GB。MARC編輯器的目標,就是要使用戶用最簡單的方法,輕松快捷的實現對大批量MARC數據的修改。其功能主要有修改字段(Edit Fields)、修改子字段(Edit Subfields)、修改指示符(Edit Indicators)等等,見圖1:

在圖1這個例子中,用戶將把所有300字段(載體形態字段)中描述為“MIN.”的D|Sa子字段(篇幅)內容替換成“min.”。對于圖書館工作人員來說,MARC修改是一個非常繁重的任務,特別是大批量MARC修改時,一條一條地修改記錄,將是一個非常耗時耗力的工作。而MarcEditor操作簡單,支持批量修改,可以讓工作人員非常輕松的完成MARC修改任務。并且針對“作者”自己對網頁進行標注極易造成元數據的“濫用”問題,MarcEditor也可以對它進行恰當的修改,使元數據能夠更加精確地描述數據。

3.2 元數據的轉換

在可擴展語言轉換樣式表(the Extensible Stylesheet Language Transformations,XSLT,專門用于轉換XML文件)的基礎上,MarcEdit可以輕易地將各種元數據格式轉換成MARC格式。其主要功能有:將MARC文件轉換成文本文件(MarcBreaker),將文本文件轉換成MARC文件(MarcMaker),元數據格式和MARC格式的相互轉換(MARC→MARCXML,MARCXML→MARC,XML Functions)等等,見圖2。

MarcEdit格式轉換的第一步,就是將各種元數據格式先轉換成MARC21 XML格式。為什么要轉換成MARC21 XML格式呢?這是因為MarcEdit使用的是一種輪輻性(Wheel-and-Spoke)轉換模式,而MARC21 XML處在一個最中心的位置。一旦發生轉換請求,就可以實現輪輻之間的相互轉換。也就是說,通過MARC21 XML,不僅可以實

現各種元數據格式向MARC格式轉換,也可以實現MARC格式向各種元數據格式的轉換。比如說可以將EAD(Encoded Archival Description,檔案描述編碼)轉換成MARC,也可以將MARC轉換成MODs(Metadata Object Description Schema,元數據對象描述框架),見圖3:

舉個例子來說,我們可以將一條從OCLC WorldCat下載下來的MARC21記錄轉換成MARC記錄的文本格式,使之成為更加容易識別的記錄,其原始記錄格式如下:

01191nam 2200253Ka 45

0001001300000003000600013005001700019008004100036040 00130007709200150009004900090010510000210011424501250013

52600061002605380036003215000081003575380073004385000128

00511650004700639610004100686711007900727856011900806994

001200925-ocm67705864 -OCoLC-20060426101930.0-060426s2006stks100 0 eng d- aCX@cCX@-0 a025.04222- aCX@A-1 aDunsire,Gordon.-14aThe Centre for Digital Library Research and the common information environmenth[electronic resource]/cGordon Dunsire.- aGlasgow:bCentre for Digital Library Research,c[2006].- aMode of access:World Wide Web.- aTitle from title screen.Description based on contents viewed Apr.26,2006.- aSystem requirements:Plug-in viewer for Adobe Acrobat PDF documents.- a″The text of a presentation given to the 8th seminar on Archives,Libraries,Museums,24-26 November 2004,Porec,Croatia.″-0aInformation storage and retrieval systems.-24aCentre for Digital Library Research.-2 aArchives,Libraries,Museums(Conference)n(8th:d2004:cPorec,Croatia)-40acdlr.strath.ac.ukdpubs/dunsiregfcdlrcie.pdf-

uhttp:∥cdlr.strath.ac.uk/pubs/dunsireg/cdlrcie.pdfqapplication/pdf- aC0bCX@

使用MarcBreaker功能將MARC21記錄轉換成文本格式后,其記錄格式如下:

=LDR 01191nam 2200253Ka 45 0

=001 ocm67705864

=003 OCoLC

=005 20060426101930.0

=008 060426s2006\\\\\\\\stk\\\\\\\\\\s\\\\\\\\\\100\\0\\eng\\d

=040 \\\\D|SaCX@D|ScCX@

=092 0\\D|Sa025.04D|S222

=049 \\\\D|SaCX@A

=100 1\\D|SaDunsire,Gordon.

=245 14D|SaThe Centre for Digital Library Research and the common information environmentD|Sh[electronic resource]/D|ScGordon Dunsire.

=260 \\\\D|SaGlasgow:D|SbCentre for Digital Library Research,D|Sc[2006].

=538 \\\\D|SaMode of access:World Wide Web.

=500 \\\\D|SaTitle from title screen.Description based on contents viewed Apr.26,2006.

=538 \\\\D|SaSystem requirements:Plug-in viewer for Adobe Acrobat PDF documents.

=500 \\\\D|Sa″The text of a presentation given to the 8th seminar on Archives,Libraries, Museums,24-26 November 2004,Porec, Croatia.″

=650 \\0D|SaInformation storage and retrieval systems.

=610 24D|SaCentre for Digital Library Research.

=711 2\\D|SaArchives,Libraries,Museums(Conference)D|Sn(8th:D|Sd2004:D|ScPorec,Croatia)

=856 40D|Sacdlr.strath.ac.ukD|Sdpubs/dunsiregD|Sfcdlrcie.pdfD|Suhttp:∥cdlr.strath.ac.uk/pubs/dunsireg/cdlrcie.pdfD|Sqapplication/pdf

=994 \\\\D|SaC0D|SbCX@

MarcEdit實現了各種元數據格式與MARC格式的相互轉換,在很大程度上,可以改變元數據格式多樣化、標引混亂和難以利用的局面。通過MarcEdit,圖書館工作人員可以將各種轉換成MARC格式的元數據導入本地的自動化系統,還可以對元數據進行深度加工,使標引更加精確,管理更加簡單,讀者使用起來也就更加方便。

3.3 元數據的獲取

MarcEdit還簡化了獲取OAI元數據的過程,用戶只要簡單的提供元數據倉儲的地址(Server Address)和集名(Set Name),就可以獲取來自這個倉儲中所有屬于這個集內的元數據記錄。此外,用戶還可以隨意限定要獲取的元數據類型(Metadata Type),并通過預先設置好的橫道(Crosswalk Path),實現獲取和轉換的同步操作。在高級設置中,還有一些特殊的功能,比如說用戶可以對子集進行限制(Start,End),可以獲取個別的記錄(GetRecord),可以恢復預定的記錄點(Resumption Token,重獲功能),還可以將記錄的編碼轉換成MARC8格式。(見圖4)

在圖4這個例子中,用戶將在衛奇塔州立大學的元數據倉儲中,獲取所有來自hdl10057253(COE Theses and Dissertations)集內的所有DC元數據記錄,并將獲取的所有DC記錄轉換成MARC21 XML格式。圖4 元數據收割示例圖

MarcEdit實現和簡化了元數據獲取和轉換的過程,使圖書館工作人員能夠輕松的將各種類型的元數據導入本地的自動化系統,并同時轉換成容易識別的MARC格式,使網絡資源的組織和管理更趨向于合理化和有效化,同時也使讀者使用這些資源時無需面對各種復雜的格式或編碼,實現了元數據格式的低障礙MARC化,從而提高讀者對各種元數據的使用率。

4 MarcEdit應用實例

4.1 解決編碼無法辨認的問題

俄勒岡州立大學圖書館的工作人員在獲取元數據的時候,發現獲取到的元數據很多都是用UTF-8編碼(Unicode Transformation Format-8 bit)的,而他們的圖書館自動化系統卻不能識別這種編碼形式,從而導致獲取到的元數據不能順利地導入本地的書目系統。在使用了MarcEdit以后,他們輕松地將UTF-8編碼轉換成了MARC記錄,實現了元數據和本地書目數據的兼容并存,更好地為讀者提供在線服務[6]。

4.2 解決元數據獲取中出現的問題

密歇根州立大學圖書館的工作人員在元數據獲取時,發現了兩個問題。一個是數據提供者的服務器運行不穩定的問題。在獲取過程中,一旦超過了10萬條記錄以后,服務器經常會斷線。一旦斷線之后,恢復獲取將非常困難,而重新獲取又將耗時耗力。另一個是元數據編碼錯誤的問題。這是因為有些數據提供者并沒有嚴格遵守OAI協議,返回記錄的語法和編碼有問題,一些特殊字符也沒有正確編碼。一條記錄的編碼錯誤可能使整個記錄集無效,這時又必須面對重新獲取的問題了。MarcEdit很好的解決了這兩個問題。首先它有一個Re sumption Token功能,能夠支持從斷點開始繼續獲取元數據。另外,在元數據輸出時,一旦 發現有錯誤記錄,MarcEdit在獲取的同時也可以馬上對它進行修正。使用了MarcEdit以后, 工作人員很快就解決了這兩個主要問題,元數據的獲取也能夠快速簡單地進行了[6] 。

5 結束語

隨著越來越多的圖書館提供數字典藏的在線服務,我們圖書館的工作人員也將面對分布式元數據組織和管理的問題。不像正式出版物典藏,如今的元數據倉儲和數字典藏,將迫使我們的工作人員去創造一個新的工作流程,為讀者提供更為寬闊的數字化服務。MarcEdit無疑已經簡化了這個過程,它能夠使我們的工作人員(即便是非技術人員)輕松地獲取和轉換各種格式的元數據,不再需要面對復雜的編碼問題。也許在不久的將來,我們的工作人員就會把獲取和轉換元數據作為一個工作的重心,而新的工作流程和新型的工具也會被不斷的開發出來。

參考文獻

[1]劉煒等.DC元數據的歷史、現狀及未來[EB/OL].DCChina.http:∥www.libnet.sh.cn/sztsg/fulltext/reports/2005/DCoverview.pdf,2009-01-31.

[2]http:∥www.dspace.org/.dspace.org[EB].2009-03-15.

[3]http:∥www.contentdm.com/.CONTENTdm Digital Collection Management Software by OCLC[EB].2009-03-15.

[4]http:∥oregonstate.edu/~reeset/marcedit/html/index.php.MarcEdit Homepage:Your Complete Free MARC Software[EB].2009-03-15.

[5]毛軍.元數據、自由分類法(Folksonomy)和大眾的因特網[J].現代圖書情報技術,2006,(2):1-4,9.

[6]Terry Reese.Automated metadata harvesting:low-barrier MARC record generation from OAI-PMH repository stores using MarcEdit[J].Library Resources Technical Services,2009,(2):121-134.

主站蜘蛛池模板: 久久中文字幕2021精品| 91色国产在线| 一区二区欧美日韩高清免费| 思思热在线视频精品| 久久a级片| 国产精品一区二区在线播放| 粉嫩国产白浆在线观看| 婷婷综合缴情亚洲五月伊| 国产嫖妓91东北老熟女久久一| 日韩精品无码免费一区二区三区| 亚洲成a人片77777在线播放| 国产香蕉97碰碰视频VA碰碰看| 日韩欧美中文| h网址在线观看| 亚洲自偷自拍另类小说| 成年免费在线观看| 亚洲人妖在线| 97国产在线视频| 无码精品一区二区久久久| 久久婷婷国产综合尤物精品| 99视频全部免费| 免费国产高清精品一区在线| 亚洲精品无码AⅤ片青青在线观看| 无码精品国产VA在线观看DVD| 亚洲黄网在线| 国产亚洲精品91| 国产区网址| 91福利片| www.99在线观看| 小蝌蚪亚洲精品国产| 99人妻碰碰碰久久久久禁片| 亚洲欧美h| 日韩精品一区二区三区免费| 无码专区在线观看| 99在线观看国产| 亚洲美女一级毛片| 54pao国产成人免费视频| 无码精油按摩潮喷在线播放 | 最新国产麻豆aⅴ精品无| 青青草综合网| 午夜在线不卡| 波多野结衣一区二区三区88| 国产永久在线视频| 九色综合伊人久久富二代| …亚洲 欧洲 另类 春色| 国产精品一老牛影视频| a级毛片免费播放| 免费中文字幕在在线不卡| 精品无码国产自产野外拍在线| 又粗又硬又大又爽免费视频播放| 国产亚洲视频播放9000| 欧美综合一区二区三区| 亚洲二三区| 亚洲精品你懂的| 日韩无码黄色| 亚洲精品手机在线| 国产地址二永久伊甸园| 人妻精品久久无码区| 91精品人妻互换| 人妻精品久久久无码区色视| 伊人久久婷婷| 精品一区二区三区波多野结衣| 国产91视频免费观看| 91精品国产自产91精品资源| 亚洲乱强伦| 亚洲天堂成人在线观看| WWW丫丫国产成人精品| 国产91视频观看| 中文字幕天无码久久精品视频免费| 在线国产毛片| 日本亚洲国产一区二区三区| 日韩黄色精品| 亚洲男人天堂久久| 日韩最新中文字幕| 亚洲综合片| 无码日韩视频| 欧美成人国产| 久久99久久无码毛片一区二区| 国产精品视屏| 日韩在线欧美在线| 久久毛片网| 91成人在线免费观看|