李 婧
(遼寧省圖書館,遼寧 沈陽 110015)
所謂資源集合,是指一個資源分成的每一部分都表現為具體的物理形式,各部分之間相互獨立,并且它們合并之后繼續組成原來的反映一個中心內容的資源整體。這些可劃分的部分是集合的成員,描述為集合──成員關系;與資源集合不同的不能劃分的相互獨立的資源則稱為資源對象,即為一個整體的資源。除了特定的應用需求,資源集合的組織要盡量避免重復性,因此要對資源內容進行審定,這也是有效組織信息資源的要求。
國際標準化組織界定的質量是指提供的產品或服務表現在現實和潛在需求所能達到的整體性狀態與特性[1]。信息資源的質量則是滿足用戶對知識的需求所能達到的程度和體現出來的價值。元數據描述提供的有關資源的各種信息,其本身不具有制定質量評價的功能,但是,元數據通過對信息資源特征的揭示,幫助用戶結合自己的實際利用所產生的效果和影響來判斷信息的質量和價值。
信息資源的存在、聚集是多樣化的,應該有效地對其進行劃分和組織,方便元數據描述,揭示信息資源的特點及其相互關系,并最終有利于信息資源的檢索與利用。借鑒邏輯學中關于客觀事物的類與分子關系和群體與個體關系的邏輯理論,可以把信息資源按群的概念進行組織和按類的概念進行劃分,這樣可以在面向實際應用時提供靈活的功能服務。
通過對信息資源集合和資源對象的界定、數據質量判定,依據邏輯學方法對信息資源按分類法進行有效劃分和組織,整合建立邏輯結構視圖,讓資源集合按照類和群兩種概念聯系起來,并按分類法形成規范的目錄檢索體系,讓信息資源的組織情況一目了然。
元數據作為在信息數據組織、管理中的概念和基礎工具,正在日益被人們所重視。目前,國際上已分別制定出適用于不同學科領域的元數據規范標準,其中,信息資源集合元數據是用來描述物理形式或數字形式的對象集合的信息特征,在圖書館的信息資源描述和組織中具有極其重要的作用。
元數據理論的發展推動了信息資源的存取和發現。而元數據應用的各個領域對其關注也轉入深層次,需要元數據能夠滿足描述資源與資源、資源各組成部分之間的復雜結構關系。由此,便誕生了資源描述框架(Resource Description Framework,RDF),其利用明確的表達語義結構,對標準化的元數據進行編碼、交換和自動加工[2-4]。對于信息資源多種形式的現實,一方面,資源描述按統一元數據標準建立元數據之間的映射;另一方面,通過元數據框架的方式實現不同元數據單元的交互操作。
為了適應信息資源組織的要求,經常把信息資源對象組合成資源集合來描述,即資源集合元數據,可分為兩種類型:一是純描述型,二是功能型。純描述型元數據是以一定結構組合的靜態元素集為基礎的數據描述,便于管理和檢索。功能型元數據以一個標準框架支持分布式、異構式信息數據系統的互操作,以靈活的結構提供封裝、復用機制,方便系統之間的交互處理。資源描述框架以一個標準的結構描述不同領域的元數據,便于信息資源數據的管理、組織和互操作。
2.2.1 有效管理和組織信息資源
元數據能夠解決諸多具有復雜關系的信息資源數據的描述:如資源樹型結構的集合與成員關系,以多項指標分類的資源集合之間的關系,整體和部分的關系以及資源之間的其他關系等。元數據同時也提供關系本身的描述,利用元數據描述資源組織結構信息的優勢,有效地管理和組織信息資源。
2.2.2 有利于長期保存信息資源
元數據的描述和制定要支持信息資源長期保存的需要。統一制定標準的元數據格式隨時間的變遷依然能夠明晰地反映資源數據的相關信息,按規范化的描述語言及標準方法來描述的元數據,從根本上保障信息資源長久地保存和利用。
2.2.3 推動信息資源的有效利用
元數據所揭示的信息資源集合和資源對象各方面的特征信息,方便用戶以明確的資源特征去檢索和利用所需的資源數據。同時,元數據也支持分布式、異構信息資源之間的數據互訪、共享,推動了信息資源被有效利用。
描述元數據可以根據學科、主題、資源類型及用途來編制不同的描述標準。
2.3.1 描述元數據內容
描述元數據是用來描述或標識信息資源數據的內容、屬性以及外觀特征,并對資源對象進行組織管理和發現、獲取、利用數據的中介。其組成包括許多具有不同功能的具體描述的元素項,如題名、責任者等具體元素項目。而元素的最小術語單位是修飾詞,包括對元素語義修飾的語義修飾詞和解析某術語值上下文信息及規則的編碼體系修飾詞。
2.3.2 描述元數據規范
描述元數據規范也稱為元數據標準,是指描述信息資源具體對象所采用的準則,包括完整描述資源對象所需要的具體數據元素項、各元素項的語義定義、著錄規則和應用時的語法規則。
信息資源的多種來源和各種各樣的存在形式,讓用戶在檢索利用時無所適從,元數據的描述功能揭示了信息資源各方面特征信息,有利于信息資源的組織與管理,方便了用戶的檢索和獲取。
①建立集合元數據描述機制,對信息資源集合的組織結構以及資源之間的相互關系的描述,有效引導檢索獲取方向,提高文獻信息資源的查準率。②設計規范的信息資源元數據,以標準規范的格式描述信息資源的內容、特征等各方面信息,保持信息的時效性,促進信息資源的長期保存及有效利用。
根據目前國內外已制定的元數據標準DC元數據元素集1.1版本[5],參考主流元數據標準和比較成熟的方案,并結合用戶需求進行復用和擴展,滿足本領域信息資源描述的要求。
元數據描述方案是解決信息資源組織與利用問題的有效工具,元數據本身需要被長期復用。元數據的規范標準及其表述的信息資源的特征信息支持它被長期重復使用;元數據規范描述機制支持其在不同組織或系統之間長期地應用于數據的互操作。元數據的形式化描述主要包括文檔語法及結構的形式化描述和元數據詞匯表的形式化描述。①文檔語法及結構的形式化描述,元數據可以用不同的語法描述,但需要轉換才能實現元數據交換。XML以標準化方式表述數據結構,并讓用戶可自定義標記,XML的擴展性讓其適應不同領域的數據描述需求。因此,基于XML語法描述元數據是目前的趨勢。W3C于1999年推薦的元數據描述標準RDF/XML提供用來描述和交換元數據的通用框架[6]。RDF使用多種語法,與XML結合的RDF/XML對元數據進行規范描述,促進了元數據元素集之間的互操作性。②元數據詞匯表的形式化描述,W3C定義的元數據詞匯表描述版本RDF Schema是元數據詞匯表描述定義的主要工具,使用者可以通過RDF Schema的語義定義元素框架來描述自己的元數據,從而實現元數據之間的互操作[7-8]。
RDF Schema和RDF/XML對上述兩種元數據形式化描述都有規范化的語法和結構,筆者以實際工作中的實例加以說明。
下面是RDF Schema格式描述的元數據詞匯“文獻”的定義:

元數據描述的信息資源特征與RDF Schema的資源、屬性、值的概念相對應。本實例用rdf:Property元素定義元數據的元素,rdf:Property元素的屬性rdf:about的值為統一資源標識符URI;其中的子元素rdf:label定義元素名稱,即實例中的“文獻”;
對于具體的信息資源,需要定義一些詞匯來具體地描述,即定義一些類和特性,比如定義literature類用來描述文獻,resources類用來描述資源,定義Book特性用來描述圖書,這些都要通過RDF Schema來實現。
RDF Schema描述類是通過其資源參數rdfs:Class和rdfs:Resource和特性參數 rdf:type和 rdfs:subClassOf來實現的。例如定義一個資源類ResourcesClass,并且為其指定一個URI-ref,如ex:ResourcesClass,然后把它描述成一個具有rdf:type特性,其值為rdfs:Class的資源,完整描述就是:ex:Resources-Class rdf:type rdfs:Class。
如果把The godfather這本特定圖書描述為圖書類,用rdf:type來完成,就是:extings:The godfather rdf:type ex:Book-Class。
利用rdfs:subClassOf可以定義子類。如,定義經濟economic類為圖書類 BookClass的子類:ex:economic rdf:type rdfs:Class

描述資源的類的特性,是利用RDF類rdf:Property和RDF Schema特性rdfs:domain(定義域)、rdfs:range(值域)和rdfs:subPropertyOf來描述的。定義域指定某個特性的類,值域定義該特性的取值范圍,rdfs:subPropertyOf表示該特性為指定特性的子特性。關于圖書特性的描述為:ex:Literature rdf:type rdfs:Class。

下面是關于圖書館自建數字資源整合及利用的RDF/XML描述,此元數據包含“title”元素,元素值為“圖書館自建數字資源整合及利用”,部分代碼如下:

這個文檔由三部分組成:首先是聲明XML版本及文檔所用字符,然后是RDF/XML文檔根元素rdf:RDF及定義空間名稱。元數據的元素被定義在rdf:Descripition包裝內,它用于描述信息和資源的具體內容,這樣可以讓不同的系統很容易地連接和關聯不同的信息資源。定義資源需要指定一個包含主語、謂詞和賓語的表達式。如描述圖書館自建數字資源整合及利用網站的具體內容,主語就是該網站的名稱,即“圖書館自建數字資源整合及利用”,謂詞是這個網站的“包含信息”,即各個資源的欄目和具體內容,賓語就是描述“圖書館自建數字資源整合及利用”網站資源內容的各種類型及特征。如果要建立該網站下各資源欄目指向其資源的具體位置,可通過使用Friend of a Friend(FOAF)標記來建立這兩個資源之間的鏈接。這樣,用戶在客戶端就可以點擊并獲得所需要的具體信息資源的詳細內容。此處僅做簡述說明,實際網站的資源建設需要根據具體情況和資源的性質來采用不同的設計風格進行表達。因此,具體的元數據描述是一項比較繁雜的標準性語言表述體系。
RDF描述的目的是把關于各類信息資源通過自然語言表述的方式轉化為機器可以解析的格式。作為描述信息資源通用方法的RDF Schema和RDF/XML描述的元數據,是以XML規范語言為基礎的文件,所以很容易地被計算機程序讀取并理解,在不同類型的操作系統和應用語言的計算機之間進行交換。
元數據描述方案能夠有效揭示圖書館信息資源中各層次資源的邏輯特征及組織結構,利用規范格式的元數據進行組織和描述,使各資源對象或資源集合通過標識符而固定其位置,為實現信息資源的有效管理,建立資源體系的邏輯視圖,為實現數據資源的長期保存、重復利用和質量評價等提供了規范化的基礎工具,為圖書館開展知識服務奠定了業務基礎,對提高圖書館信息資源組織管理的效能以及不斷提升圖書館信息服務的能力大有裨益。
[1]International Organization for Standardization[EB/OL].[2013-12-10].http://www.iso.org/iso/home.html.
[2]肖瓏,趙亮.中文元數據概論與實例[M].北京:北京圖書館出版社,2007.
[3]劉嘉.元數據導論[M].北京:華藝出版社,2002.
[4]宋琳琳,李海濤.大型文獻數字化項目的元數據標準的調查與構建[J].圖書館雜志,2013(11):45-54.
[5]CADAL.CADAL元數據規范草案(Version 2.0)[R/OL].[2013-12-10].http://www.cadal.cn/softdown/CADAL_metadata_2004.pdf.
[6]CDLS.我國數字圖書館標準規范專門數字對象描述元數據規范[DB/OL].[2013-12-11].http://cdls.nstl.gov.cn/2003/SpcMetadata/.
[7]OpenLibrary.OpenLibrary to Dublin Core[DB/OL].[2013-12-11].https://openlibrary.org/about/infogami-dc
[8]數字圖書館推廣工程[EB/OL].[2013-12-10].http://www.ndlib.cn/gcjs_1/201108/t20110818_47872.htm.