蔡惠霞
(廣東醫學院圖書館,廣東 湛江 524023)
網絡信息資源是指通過計算機網絡可以利用的各種信息資源的總和。所有以電子數據形式把文字、圖像、聲音、動畫等多種形式的信息存儲在光、磁等非紙介質的載體中,并通過網絡通信、計算機或終端等方式再現出來的資源,都可稱為網絡信息資源。為滿足讀者檢索網絡信息資源的需要,圖書館界積極探索網絡信息資源的組織和整序問題。在這種背景下,MARC、DC元數據、MODS、TEI、EAD等用來描述網絡信息資源的基本特征和相互關系的元數據,被應用到圖書館的信息資源編目工作中。筆者以題名“MARC”并含“網絡信息”為檢索詞,檢索CNKI的《中國學術期刊網絡出版總庫》,共檢索到18條記錄;以題名“DC元數據”并含“編目”為檢索詞,檢索到9條記錄;以題名“MODS”并含“編目”為檢索詞,只檢索到3條記錄。由此可見,學者比較重視研究MARC在網絡信息資源組織中的應用,而對DC元數據、MODS等在網絡信息資源編目中的應用研究較少涉及。本文著重就MODS在網絡信息資源編目中的應用進行探討,以期能起到拋磚引玉的作用。
MARC作為一種詳細描述的元數據格式,是圖書館文獻資源組織的重要工具。其定義的每個字段都非常詳盡,而且對著錄的內容有嚴格限制,能夠提供多種檢索途徑。因網絡信息資源缺乏類似實體信息資源那樣的主要信息源,其主要著錄信息一般散見于多個頁面的不同位置上,而且反映網絡信息資源位置的URL具有較大的變動性,即不同的URL可能代表同一個資源,同一個URL可能在不同的時間代表不同的資源,不具備實體信息資源中的ISBN等那樣的可靠性和穩定性。因此,對于網絡信息資源而言,MARC只有通過設置135字段、230字段、336字段、337字段、856字段來提高其描述網絡信息的能力。隨著MARC應用的不斷深入,其局限性越來越明顯,主要表現在:(1)MARC 按照 ISO2709標準編碼,ISO2709所規定的語法結構常常使非專業人員感到MARC記錄的混亂。MARC字段標識符沒有語義表達功能,字段、子字段代號不直觀,致使數據的交換性與互操作性差,MARC著錄結果無法直接在Web上瀏覽;(2)MARC系統的大部分應用局限在對書目信息的描述,著錄效率無法適應海量的網絡資源著錄需求;(3 MARC格式是經過嚴格限定和檢驗的數據流格式,目前只有專用的符合MARC格式的應用前端才能對MARC數據加以利用,這就導致大量網上資源無法通過通用的搜索引擎向因特網用戶提供鏈接。
為了提供一種更容易被人們掌握和使用的網絡資源著錄格式,方便網絡資源的描述,提高網絡資源的利用率,圖書館界、計算機及其相關領域的專家積極探索新的網絡資源描述方法,DC(Dublin Core)元數據應運而生。DC元數據有簡單和復雜之分。簡單DC元數據有15個核心元素,即:題名項(Title)、主題詞(Subject)、描述項(Description)、語種(Language)、來源項(Source)、關聯項(Relation)、覆蓋范圍項(Coverage)、出版者項(Publisher)、作者項(Creator)、其他責任者(Contributor)、權限項(Rights)、日期項(Date)、類型(Type)、標識符(I-dentifier)、格式項(Format)。 在對資源編目時,著錄者可以根據需要選擇若干元素進行資源描述,這樣可以簡化著錄項目。復雜DC是在簡單DC基礎上引入修飾詞的概念,主要有體系修飾詞(Scheme)、語種修飾詞(Language)和進一步修飾元素屬性的子元素修飾詞(Subelement)。其中體系修飾詞借鑒了MARC的優點并把分類法、主題詞表等控制語言吸收進去。
雖然DC元數據可采用多種編碼語言描述,簡單易用,方便靈活,具有良好的可修飾性,但其也存在一定的局限性:一是字段定義的模糊性。DC元數據字段定義相對簡單,因對字段定義的不同理解和操作上的不一致,數據規范性較差,降低信息的檢索率;二是限定詞使DC變得復雜化。為了能更為明確和精確地檢索,DC在語法上先是增加修飾詞,后又允許自定義修飾詞,進而允許自定義新元素,這就增加了著錄者的負擔。如果限定詞和著錄規范越來越多,那么著錄者也要進行相關的培訓或依靠著錄說明才能著錄,DC元數據變得越來越復雜。
MODS(Metadata Object Description Schema),中文譯名為元數據對象描述模式,是由美國國會圖書館下屬的網絡發展部和MARC標準辦公室共同研制出的一種新的元數據。MODS是在MARC的基礎上發展起來的,其復雜程度介于MARC與DC元數據之間,彌補了兩者的缺陷性,并與兩者都有著良好的兼容性。MODS由元素、子元素、屬性三部分構成。如表1所示,MODS共有20個主元素。每個主元素下設有若干子元素,元素具有屬性。所有元素都可以重復使用,但屬性不可重復使用。每個MODS記錄至少要有1個元素,即主元素“題名信息”和子元素“題名”是必不可少的,其他元素均是可選的。MODS是以MARC21的元素和語義學為基礎,用XML語言描述的元數據。MODS在書目描述中適用于網絡環境下多種信息資源的描述。

表1 MODS主元素表
與MARC和DC元數據相比較,MODS有以下幾個特點:(1)元數據集比DC更豐富,比MARC更簡潔。MODS元數據字段參考MARC字段,取自MARC的子集,同時又提供了比DC更為豐富的字段,故MODS是復雜程度介于兩者之間的元數據標準;(2)MODS允許開發者自定義標簽。MODS采用的語言標簽,允許資源創建人員自定義標簽,標簽的名稱和含義可由創建者根據需要作出選擇。資源創建者不需要具備專業的編目能力,因此,MODS簡單實用,滿足各類信息交換的需要,具有良好的適應性;(3)MODS是集成MARC及DC的橋梁。由于MODS的結構復雜程度介于MARC和DC之間,而且MODS與DC在一定程度上借鑒了MARC的標準,是從MARC發展而來,故三者具有一定的互通性。可將MODS作為MARC和DC之間轉換的橋梁。
MODS采用XML作為編碼語言,靈活性強,不僅能勝任紙質文獻處理,而且可以勝任對網絡信息資源的處理。MODS采用語言標簽,增加了可讀性,簡單實用,可以由資源創造者而不是專業編目人員創建描述記錄,能夠簡單、快速地制作記錄。MODS中所有元素的次序都是不固定的,其記錄顯示次序由Style Sheet控制,屬性間次序也不固定。
本文應用MODS對廣東醫學院圖書館網站中的“本館介紹”網頁進行編目,格式如下:

本站是廣東醫學院圖書館網站的其中一個特色網頁,主要介紹廣東醫學院圖書館概況


不同的網絡信息資源描述方法各有優點,圖書館要結合各種信息資源描述標準的特點,根據自身的需要,選擇適合的信息資源描述方法,開展網絡信息資源編目工作。國外圖書館有較多以MODS為標準元數據集成各類資源描述格式的項目,如美國國會圖書館將American Memory和Global Gateway中大約200 000條MARC記錄轉為MODS格式。在圖書館處于紙質資源和數字資源并存的復合圖書館發展階段,圖書館工作者要積極開展MODS在網絡信息資源組織的應用研究,利用MODS整合館藏資源和網絡資源,使讀者既可以找到紙質文獻也可以找到數字資源。
[1]倪娟.MODS元數據的新發展與應用[J].農業圖書情報學刊,2007(6):165-167.
[2]羅昊,劉宇.文獻編目的第三條道路:MODS的簡介與分析[J].四川圖書館學報,2003(3):31-34.
[3]羅紅燕,李章平,陳紹蘭.MARC、DC、MODS、FRBR 等文獻編目元數據比較[J].圖書館學刊,2009(12):25-27.
[4]李世玲,李素喜.MODS與MARC、DC之比較研究[J].現代情報,2006(6):138-143.
[5]劉孝文.從MARC到MODS:編目元數據MODS分析與研究[J].圖書館雜志,2007(7):14-17,30.
[6]魏文暉.DC元數據在特種地方文獻著錄中的應用[J].圖書館論壇,2004(2):126-128.
[7]李衛峰.基于MODS的數字圖書館元數據集成[J].大學圖書情報學刊,2010(6):58-59.
[8]徐險峰,網絡信息資源的Dublin Core元數據編目[J].農業圖書情報學刊,2009(2):52-54,58.