999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數(shù)字圖書館的元數(shù)據(jù)方案及互操作研究*

2011-03-10 05:55:48吳育芳
圖書館學(xué)刊 2011年2期
關(guān)鍵詞:語(yǔ)義定義圖書館

吳育芳

(湛江師范學(xué)院圖書館,廣東 湛江 524048)

1 引言

數(shù)字圖書館是采用現(xiàn)代高新技術(shù)的數(shù)字信息資源系統(tǒng),它將從根本上改變目前信息分散、不便于使用的現(xiàn)狀[1]。隨著Internet的飛速發(fā)展,特別是Web應(yīng)用的不斷普及,數(shù)字圖書館及其信息急劇增加。為了適應(yīng)這種快速發(fā)展,人們建立了許多適用于不同資源、面向特定領(lǐng)域的元數(shù)據(jù)方案,如MARC、DC、VRA等。元數(shù)據(jù)為數(shù)字圖書館提供了精確描述數(shù)據(jù)內(nèi)容、語(yǔ)義和服務(wù)的機(jī)制,可以方便標(biāo)識(shí)、發(fā)現(xiàn)、評(píng)估和管理信息資源。

元數(shù)據(jù)開發(fā)和應(yīng)用的經(jīng)驗(yàn)表明,盡管元數(shù)據(jù)的應(yīng)用日益標(biāo)準(zhǔn)化、規(guī)范化,DC等少數(shù)元數(shù)據(jù)方案將占主導(dǎo)地位,但是許多專業(yè)或?qū)iT領(lǐng)域仍然會(huì)有大量的元數(shù)據(jù)方案,很難有一個(gè)統(tǒng)一的元數(shù)據(jù)格式來(lái)滿足所有領(lǐng)域的數(shù)據(jù)描述需要。從應(yīng)用的角度講,國(guó)際上公認(rèn)的元數(shù)據(jù)標(biāo)準(zhǔn)在短時(shí)間內(nèi)很難形成和統(tǒng)一。為緩解元數(shù)據(jù)資源描述的特殊性和一般性矛盾,解決元數(shù)據(jù)間多元化、非標(biāo)準(zhǔn)化的協(xié)調(diào)發(fā)展問題,迫切需要在元數(shù)據(jù)間建立某些機(jī)制,從而有效地實(shí)現(xiàn)元數(shù)據(jù)間的互操作。

互操作原則[2]體現(xiàn)在對(duì)異構(gòu)系統(tǒng)間互操作能力的支持上,不僅可以為自己的應(yīng)用系統(tǒng)所操作,而且可以為其他組織或機(jī)構(gòu)的應(yīng)用系統(tǒng)所操作;不僅可以在不同系統(tǒng)實(shí)現(xiàn)同一元數(shù)據(jù)標(biāo)準(zhǔn)間的數(shù)據(jù)傳輸、交換或轉(zhuǎn)換,而且可以在不同元數(shù)據(jù)標(biāo)準(zhǔn)間實(shí)現(xiàn)數(shù)據(jù)的傳輸、交換或轉(zhuǎn)換。在元數(shù)據(jù)的具體應(yīng)用上,互操作性表現(xiàn)為易轉(zhuǎn)換性,即在所攜帶信息損失最小的前提下,方便地將元數(shù)據(jù)轉(zhuǎn)換為其他系統(tǒng)常用的元數(shù)據(jù)標(biāo)準(zhǔn)。

2 數(shù)字圖書館的元數(shù)據(jù)

在元數(shù)據(jù)研究的初期,常從單一信息系統(tǒng)的角度,按照描述、組織和檢索信息內(nèi)容對(duì)象的要求來(lái)考慮元數(shù)據(jù),從信息資源中抽取說(shuō)明其特征、內(nèi)容的數(shù)據(jù),如題名、版本、出版數(shù)據(jù)、相關(guān)說(shuō)明等。元數(shù)據(jù)的含義與傳統(tǒng)文獻(xiàn)領(lǐng)域中的著錄款目的性質(zhì)相同,信息資源的元數(shù)據(jù)用作信息資源的代替物組織檢索系統(tǒng)。

隨著分布式環(huán)境下數(shù)字圖書館互操作的發(fā)展,元數(shù)據(jù)不再僅是描述信息內(nèi)容的工具,而是一種基本的信息資源組織方法,為數(shù)字圖書館系統(tǒng)的各個(gè)層次內(nèi)容提供規(guī)范化的定義、描述、交換和解析機(jī)制,為分布的數(shù)字圖書館系統(tǒng)提供互操作和整合的紐帶,為計(jì)算機(jī)智能識(shí)別、處理、集成各種信息內(nèi)容提供工具。

元數(shù)據(jù)可以描述各種粒度(granularity)水平的信息資源和信息體,這主要取決于數(shù)字圖書館所需達(dá)到的層次、信息資源的情況和用戶的需求等。一般來(lái)說(shuō),數(shù)字圖書館根據(jù)特定館藏的性質(zhì)、館藏量的多少及館藏使用者的需求等具體情況,可以進(jìn)行館藏水平、數(shù)據(jù)庫(kù)、單一文獻(xiàn)等幾種水平的描述。

元數(shù)據(jù)可以劃分為3種比較寬泛的類型:描述性元數(shù)據(jù)、結(jié)構(gòu)性元數(shù)據(jù)、管理性元數(shù)據(jù)[4]。描述性元數(shù)據(jù)指描述和識(shí)別信息體的特征、分析信息體知識(shí)內(nèi)容的數(shù)據(jù)。結(jié)構(gòu)性元數(shù)據(jù)有時(shí)也被稱為技術(shù)型元數(shù)據(jù)、顯示型元數(shù)據(jù)或使用型元數(shù)據(jù),是用于確保數(shù)字化信息體正常發(fā)揮功能的技術(shù)性信息。它是指相關(guān)文件的結(jié)構(gòu)或“標(biāo)記”,如何組成在一起,如何在各種系統(tǒng)中顯示和發(fā)布等。管理型元數(shù)據(jù)提供有關(guān)數(shù)字對(duì)象的存儲(chǔ)條件和轉(zhuǎn)換過(guò)程相關(guān)的信息。它的目的是滿足管理、決策、保管記錄的需要,有助于檢測(cè)、復(fù)制和備份數(shù)字資源。但是到目前為止,大多數(shù)有關(guān)元數(shù)據(jù)的討論仍只是針對(duì)描述性元數(shù)據(jù)。

元數(shù)據(jù)是結(jié)構(gòu)化的編碼數(shù)據(jù),用于描述信息實(shí)體的特征,以便標(biāo)識(shí)、發(fā)現(xiàn)、評(píng)估和管理這些信息實(shí)體。它為數(shù)字圖書館的信息提供完全綜合的向?qū)В瑢?duì)數(shù)字圖書館的各個(gè)方面都很重要,不僅是實(shí)現(xiàn)資源發(fā)現(xiàn)的關(guān)鍵,也是利用館藏資源和實(shí)現(xiàn)互操作的基礎(chǔ)。具體用途如下:

①描述數(shù)字圖書館的數(shù)據(jù)和內(nèi)容;

②在描述數(shù)據(jù)中提供檢索點(diǎn),使數(shù)字圖書館的數(shù)據(jù)和信息便于查詢和利用;

③允許用戶決定數(shù)據(jù)和信息是否是他們需要的;

④指出數(shù)據(jù)和信息的存儲(chǔ)地址,使用戶得到或使用數(shù)據(jù);

⑤說(shuō)明數(shù)據(jù)的格式、編碼方式、解密方法等,指導(dǎo)用戶“讀懂”數(shù)據(jù);

⑥在提供多種格式的數(shù)據(jù)時(shí),根據(jù)元數(shù)據(jù)提供的信息,參照相應(yīng)評(píng)估標(biāo)準(zhǔn),結(jié)合使用環(huán)境和實(shí)際需要,幫助用戶決定利用的數(shù)據(jù)實(shí)例;

⑦給出影響數(shù)據(jù)使用的信息,如法律條件、使用范圍、使用時(shí)間限制等;

⑧給出數(shù)據(jù)的最初來(lái)源、演變歷程等;

⑨給出數(shù)據(jù)的聯(lián)系信息,如數(shù)據(jù)擁有者的聯(lián)系方式等;

⑩給出數(shù)據(jù)前后版本的鏈接、使用本數(shù)據(jù)所需的其他數(shù)據(jù)和程序等;

3 元數(shù)據(jù)方案

為了使計(jì)算機(jī)能夠理解并操作,元數(shù)據(jù)必須存在于一個(gè)元數(shù)據(jù)體系之中。元數(shù)據(jù)體系的基本組成部分包括方案(schema)和元素[4]。元數(shù)據(jù)的元素是指封裝描述信息體的一條一條信息的類目或字段。元數(shù)據(jù)方案是為了滿足特定組織的需求而設(shè)計(jì)的元素集,如MARC元數(shù)據(jù)用于描述書目數(shù)據(jù);EAD元數(shù)據(jù)用于描述檔案文獻(xiàn)和手稿資源;CDWA、VRA Core、CIMI元數(shù)據(jù)用于描述藝術(shù)作品類目;GEM元數(shù)據(jù)描述教育資源等。由于不同組織的需求各不相同,元數(shù)據(jù)方案在數(shù)據(jù)元素的數(shù)量、強(qiáng)制性和復(fù)用性元素的使用、編碼、受控詞表的使用等方面有很多不同。

一個(gè)元數(shù)據(jù)方案要規(guī)定元數(shù)據(jù)3個(gè)方面的特征:語(yǔ)義(semantics)、句法(syntax)、結(jié)構(gòu)(structure)。

語(yǔ)義是指元數(shù)據(jù)元素本身的意義。一個(gè)元數(shù)據(jù)體系通常要對(duì)每一條元數(shù)據(jù)的元素給予命名和解釋。元數(shù)據(jù)體系還要指出每個(gè)元素是否必選、可選或有條件選擇,以及是否可重復(fù),這些都是元數(shù)據(jù)的語(yǔ)義范圍[5]。

句法是指元數(shù)據(jù)的編碼,是對(duì)元素賦值方法的規(guī)定。即指描述元素時(shí)所采用的標(biāo)準(zhǔn)、最佳實(shí)踐(bestpractices)或自定義的描述要求。

結(jié)構(gòu)是指用于封裝元數(shù)據(jù)的數(shù)據(jù)模型(或體系結(jié)構(gòu))和元數(shù)據(jù)聲明的表述方式。它規(guī)定了元素怎樣以機(jī)器可讀的方式給予編碼。結(jié)構(gòu)除了規(guī)定數(shù)據(jù)怎樣在計(jì)算機(jī)系統(tǒng)中存儲(chǔ)外,更重要的是,可以提供一種不同系統(tǒng)間元數(shù)據(jù)交換、重用的通用格式。因此,元數(shù)據(jù)方案的結(jié)構(gòu)也可以稱為交換格式、通信格式或傳輸語(yǔ)法。

我們也可以把這3個(gè)方面稱為元數(shù)據(jù)方案的3個(gè)組成要素,從邏輯上說(shuō),具備以上3個(gè)要素才能構(gòu)成一個(gè)完整的元數(shù)據(jù)方案。

4 數(shù)字圖書館元數(shù)據(jù)的互操作

互操作是指不同系統(tǒng)之間不管使用哪種硬件或軟件都可以實(shí)現(xiàn)互聯(lián),它最大限度地減少了因技術(shù)差異而造成的信息損失。由于不同的領(lǐng)域存在著多種元數(shù)據(jù)格式,當(dāng)用不同元數(shù)據(jù)格式進(jìn)行資源描述、檢索和利用時(shí),就需要解決多種元數(shù)據(jù)格式間的釋讀、轉(zhuǎn)換問題,以確保系統(tǒng)對(duì)用戶的一致性服務(wù),即實(shí)現(xiàn)元數(shù)據(jù)的互操作[6]。數(shù)字圖書館元數(shù)據(jù)的互操作性[7]是指在不同的組織和數(shù)字圖書館制定與管理元數(shù)據(jù)的環(huán)境下,元數(shù)據(jù)的技術(shù)規(guī)范不盡相同時(shí),向用戶提供一個(gè)統(tǒng)一透明的檢索界面,確保系統(tǒng)對(duì)用戶的一致性服務(wù)。也就是說(shuō),數(shù)字圖書館元數(shù)據(jù)的互操作問題是與不同元數(shù)據(jù)格式間的信息共享、轉(zhuǎn)換、跨系統(tǒng)檢索等相關(guān)問題。

對(duì)應(yīng)于元數(shù)據(jù)方案的3個(gè)組成要素,我們將元數(shù)據(jù)的互操作性分為語(yǔ)義互操作、句法互操作、結(jié)構(gòu)互操作,也就是說(shuō)元數(shù)據(jù)的互操作要解決元數(shù)據(jù)方案所包含的3個(gè)方面的異構(gòu)問題。語(yǔ)義互操作是指不同的元數(shù)據(jù)方案中實(shí)際相同的語(yǔ)義是否采用相同的表達(dá)方式,主要克服資源描述過(guò)程中語(yǔ)義方面的差別。句法互操作是指元數(shù)據(jù)記錄如何被表達(dá)出來(lái),要克服元素表現(xiàn)形式方面的障礙。結(jié)構(gòu)互操作是指系統(tǒng)元數(shù)據(jù)和與其他系統(tǒng)交換元數(shù)據(jù)的能力,即一個(gè)系統(tǒng)的元數(shù)據(jù)聲明能否被其他系統(tǒng)所理解。語(yǔ)義互操作的實(shí)現(xiàn)需要通用語(yǔ)言和編碼格式的幫助。

4.1 語(yǔ)義互操作——元數(shù)據(jù)轉(zhuǎn)換

元數(shù)據(jù)轉(zhuǎn)換(metadata crosswalks、metadata mapping)[8]也稱元數(shù)據(jù)映射,其實(shí)質(zhì)是為一種元數(shù)據(jù)格式的元素和修飾詞在另一種元數(shù)據(jù)格式里找到相同功能或含義的元素和修飾詞。元數(shù)據(jù)轉(zhuǎn)換是人們?cè)趯で蠡ゲ僮魍緩椒矫孢~出的第一步,也是目前實(shí)現(xiàn)元數(shù)據(jù)互操作的主要方法。映射可以解決幾種格式間的統(tǒng)一檢索。映射有多種方式:

4.1.1 一對(duì)一轉(zhuǎn)換

一對(duì)一映射將一種元數(shù)據(jù)標(biāo)準(zhǔn)中的元素映射為另一種元數(shù)據(jù)標(biāo)準(zhǔn)中的相應(yīng)元素。元數(shù)據(jù)體系A(chǔ)→元數(shù)據(jù)體系B(來(lái)源A到目標(biāo)B,一個(gè)映射過(guò)程);元數(shù)據(jù)體系A(chǔ)?元數(shù)據(jù)體系B(兩者互為來(lái)源和目標(biāo),兩個(gè)映射過(guò)程)。

單向轉(zhuǎn)換相對(duì)容易而雙向轉(zhuǎn)換則較難[9]。這尤其體現(xiàn)在一個(gè)簡(jiǎn)單元數(shù)據(jù)格式與一個(gè)復(fù)雜元數(shù)據(jù)格式之間的轉(zhuǎn)換上。如DC與MARC的轉(zhuǎn)換,由于MARC的描述能力大大豐富于DC,所以數(shù)據(jù)由DC格式向MARC格式的轉(zhuǎn)換較為成功,但若是由MARC格式向DC格式轉(zhuǎn)換則將產(chǎn)生信息的缺失。這種技術(shù)可以解決幾種格式間的統(tǒng)一檢索[8]。也就是說(shuō),一個(gè)適合第一種數(shù)據(jù)格式的檢索式,通過(guò)兩種格式間的映射關(guān)系,可以自動(dòng)轉(zhuǎn)換為適合第二種格式的檢索式,在第二種數(shù)據(jù)庫(kù)里檢索。

利用特定轉(zhuǎn)換程序?qū)Σ煌獢?shù)據(jù)格式進(jìn)行轉(zhuǎn)換,目前已有大量的轉(zhuǎn)換程序存在,供若干流行元數(shù)據(jù)格式之間的轉(zhuǎn)化,例如DC與USMARC、DC與EAD、DC與Gils、Gils與USMARC等。

但是,要達(dá)到元數(shù)據(jù)互操作的目的,必須在元數(shù)據(jù)方案之間建立兩兩映射,在元數(shù)據(jù)格式數(shù)量較多時(shí),轉(zhuǎn)換模板的數(shù)量也呈指數(shù)增長(zhǎng),因此這種技術(shù)一般適用于使用面較窄的范圍。此外,因受各種各樣復(fù)雜的實(shí)際情況影響,建立語(yǔ)義匹配基礎(chǔ)上的元數(shù)據(jù)映射的應(yīng)用效率并不十分令人滿意,很少有元數(shù)據(jù)轉(zhuǎn)換工具可以提供數(shù)據(jù)無(wú)損的往返轉(zhuǎn)換。在轉(zhuǎn)換過(guò)程中,或在還原過(guò)程中,或同時(shí)在這兩個(gè)過(guò)程中,總是不可避免地造成一定程度的數(shù)據(jù)損失。

4.1.2 中介元數(shù)據(jù)格式轉(zhuǎn)換

當(dāng)參與互操作的元數(shù)據(jù)格式很多、映射過(guò)程較為復(fù)雜時(shí),可選擇一種廣泛而普遍使用的元數(shù)據(jù)標(biāo)準(zhǔn)作為中心轉(zhuǎn)換格式,其他各種格式都向這一中心格式轉(zhuǎn)換,從而實(shí)現(xiàn)以中心元數(shù)據(jù)格式為中介的元數(shù)據(jù)格式轉(zhuǎn)換[6],如圖1所示。

圖1 中介元數(shù)據(jù)格式轉(zhuǎn)換

被采用的標(biāo)準(zhǔn)格式應(yīng)該在元素組成、元素語(yǔ)義定義和應(yīng)用領(lǐng)域等方面具有普遍適應(yīng)性,本身有較廣泛的應(yīng)用,能被多數(shù)系統(tǒng)識(shí)別。理想的中介格式能夠?yàn)楦鱾€(gè)異構(gòu)元數(shù)據(jù)提供對(duì)照,語(yǔ)義轉(zhuǎn)換比較容易的公共核心集[10]。

當(dāng)前,以DC元數(shù)據(jù)格式作為轉(zhuǎn)換的標(biāo)準(zhǔn),此種方式轉(zhuǎn)換脈絡(luò)清晰,便于元數(shù)據(jù)的擴(kuò)展及管理。典型實(shí)例是OAI-PMH機(jī)制。在OAI-PMH元數(shù)據(jù)采集協(xié)議中,允許不同格式的元數(shù)據(jù)結(jié)構(gòu)并存,但指定DC作為數(shù)據(jù)提供方提供的元數(shù)據(jù)格式。也就是說(shuō),數(shù)據(jù)提供方提供的元數(shù)據(jù)不是DC格式的,要先轉(zhuǎn)化成DC元數(shù)據(jù)后再提供給數(shù)據(jù)需求方使用。OAI-PMH不要求所有成員遵守同一個(gè)協(xié)議實(shí)現(xiàn)統(tǒng)一和互操作,而是要求所有元數(shù)據(jù)的發(fā)布方都支持以XML語(yǔ)言表示的簡(jiǎn)單DC元數(shù)據(jù)結(jié)構(gòu),從而實(shí)現(xiàn)跨領(lǐng)域的資源發(fā)現(xiàn)和共享數(shù)據(jù),使不同格式、不同標(biāo)準(zhǔn)的元數(shù)據(jù)在語(yǔ)義層面上實(shí)現(xiàn)互操作。

將元數(shù)據(jù)映射為一種兼容性比較強(qiáng)的、比較全面的元數(shù)據(jù),可以降低復(fù)雜性,當(dāng)參與映射的格式越多時(shí),這種技術(shù)的好處就越明顯。

4.2 句法互操作——XML語(yǔ)言

元數(shù)據(jù)的編碼語(yǔ)言是針對(duì)元數(shù)據(jù)元素和結(jié)構(gòu)進(jìn)行定義、描述的具體語(yǔ)法和語(yǔ)義規(guī)則[8]。目前使用的元數(shù)據(jù)編碼語(yǔ)言有SGML(標(biāo)準(zhǔn)通用標(biāo)記語(yǔ)言)、HTML(超文本標(biāo)記語(yǔ)言)、XML(可擴(kuò)展標(biāo)記語(yǔ)言)。SGML存儲(chǔ)格式很好,但復(fù)雜難懂,不便于網(wǎng)絡(luò)傳輸;HTML結(jié)構(gòu)性不強(qiáng),擴(kuò)展能力差,描述內(nèi)容的能力也較弱;XML本身就是一種定義語(yǔ)言,使用者可以定義標(biāo)記來(lái)描述文件中的任何數(shù)據(jù)元素。它突破了HTML固定標(biāo)記集合的約束,使文件的內(nèi)容更豐富、復(fù)雜,并組成一個(gè)完整的信息體系。XML具有良好的數(shù)據(jù)存儲(chǔ)格式、可擴(kuò)展性、高度結(jié)構(gòu)化、便于網(wǎng)絡(luò)傳輸?shù)葍?yōu)勢(shì),決定了其卓越的性能表現(xiàn)。XML由于自身的特點(diǎn),使得它成為了元數(shù)據(jù)互操作的基礎(chǔ),為各種互操作模式提供語(yǔ)法支持。因此,在數(shù)字圖書館元數(shù)據(jù)方案中,選擇XML作為編碼語(yǔ)言,能夠?yàn)樾畔⒔粨Q提供獨(dú)具特色的解決方案,以實(shí)現(xiàn)元數(shù)據(jù)的共享、互換。

XML有標(biāo)準(zhǔn)的DTD(documenttype definition,文檔類型定義)定義方式。DTD包含有定義元素的元素聲明和屬性列表聲明,這些元素組成了詞匯表,屬性列表聲明說(shuō)明了這些元素的屬性。DTD在簡(jiǎn)單的文檔結(jié)構(gòu)定義方面很出色,每種格式的元數(shù)據(jù)都可以通過(guò)XML-DTD定義。XSLT是基于W3C標(biāo)準(zhǔn)的用于描述XML文檔之間進(jìn)行轉(zhuǎn)換的語(yǔ)言,它利用XML語(yǔ)言,定義一個(gè)轉(zhuǎn)換格式表(transformation style sheet,又稱轉(zhuǎn)換樣式、轉(zhuǎn)換模板),可將某種XML-DTD定義的元數(shù)據(jù)轉(zhuǎn)為用另一種XML-DTD定義的元數(shù)據(jù)[6]。

但是,DTD支持的數(shù)據(jù)類型只有字符型,不支持命名域(namespace),缺乏良好的擴(kuò)展性,也不具備開放性,擴(kuò)充困難,難以進(jìn)行自動(dòng)化處理。因此,W3C推出XML Schema彌補(bǔ)上述缺點(diǎn)。

XML Schema是DTD的發(fā)展,它不僅包括了DTD能實(shí)現(xiàn)的所有功能,而且本身就是規(guī)范的XML文檔,規(guī)范了文檔中的標(biāo)簽和文本可能的組合形式。XML Schema是一種描述信息結(jié)構(gòu)的模型,它是借用數(shù)據(jù)庫(kù)中一種描述相關(guān)表格內(nèi)容的機(jī)制,為一類文件建立一個(gè)模式。它利用XML的基本語(yǔ)法規(guī)則來(lái)定義XML文檔結(jié)構(gòu),實(shí)現(xiàn)了由內(nèi)到外的統(tǒng)一,不僅易于編輯,也可使用XML工具來(lái)解析,這是Schema較DTD的一個(gè)本質(zhì)變化。它還具有良好的擴(kuò)展性,有豐富的內(nèi)建簡(jiǎn)單數(shù)據(jù)類型,允許用戶自己擴(kuò)展;它支持屬性分組,屬性的應(yīng)用范圍是多種多樣的,可以針對(duì)不同元素;具有擴(kuò)展性,定義的內(nèi)容模式是開放的,原形可以更新;它還支持名字空間,能在同一文檔中加載多個(gè)Schema定義。此外,它還具有互換性、規(guī)范性,利于高層次的數(shù)據(jù)轉(zhuǎn)換,約束XML文檔中置標(biāo)的使用。

XML實(shí)現(xiàn)不同元數(shù)據(jù)的簡(jiǎn)單轉(zhuǎn)換如圖2所示。

圖2 基于XML語(yǔ)言的元數(shù)據(jù)轉(zhuǎn)換

首先要用XML-DTD或XML Schema對(duì)元數(shù)據(jù)記錄進(jìn)行編碼,再利用XSTL擴(kuò)展樣式轉(zhuǎn)換語(yǔ)言實(shí)現(xiàn)元數(shù)據(jù)之間的轉(zhuǎn)換。在轉(zhuǎn)換過(guò)程中涉及到結(jié)構(gòu)、語(yǔ)義、應(yīng)用等方面的映射關(guān)系,可以由建立基于概念集的語(yǔ)義詞典來(lái)解決[11]。

4.3 結(jié)構(gòu)互操作——RDF資源描述框架

解決結(jié)構(gòu)層元數(shù)據(jù)互操作性的思路是建立一個(gè)標(biāo)準(zhǔn)的資源描述框架,用這個(gè)框架來(lái)描述所有元數(shù)據(jù)格式,那么只要一個(gè)系統(tǒng)能夠解析這個(gè)標(biāo)準(zhǔn)描述框架,就能解讀相應(yīng)的元數(shù)據(jù)格式。資源描述框架RDF(resourcedescription framework)就是這樣一個(gè)例子。RDF是在W3C的主持下開發(fā)的,它是對(duì)結(jié)構(gòu)的元數(shù)據(jù)進(jìn)行編碼、交換及再利用的一個(gè)基礎(chǔ)框架體系,能夠?qū)崿F(xiàn)各種元數(shù)據(jù)互操作。

RDF采用XML作為交換和處理元數(shù)據(jù)的通用語(yǔ)法體系結(jié)構(gòu),通過(guò)定義一些描述元素,把不同的元數(shù)據(jù)描述體系結(jié)合起來(lái),將多種元數(shù)據(jù)封裝在一個(gè)統(tǒng)一的描述框架中,從而使這些不同的元數(shù)據(jù)體系可以交換元數(shù)據(jù),實(shí)現(xiàn)多種元數(shù)據(jù)間的互操作。這樣,只需一個(gè)能夠解析這個(gè)標(biāo)準(zhǔn)描述框架的系統(tǒng),就能解讀相應(yīng)的元數(shù)據(jù)格式。另外RDF通過(guò)使用XML中的命名域,允許RDF有效地引用特殊的RDF詞表或模式體系,這不僅減少了創(chuàng)建新元數(shù)據(jù)模式的工作量,而且保證了高度互操作性,同時(shí)又不犧牲各相關(guān)系統(tǒng)的特點(diǎn)[7]。目前,RDF已成為Web上實(shí)現(xiàn)元數(shù)據(jù)互操作的標(biāo)準(zhǔn)[10]。

RDF由3部分組成:RDF Data Model,RDF Schema和RDF Syntax[6]。RDF Data Model提供了一個(gè)簡(jiǎn)單且功能強(qiáng)大的模型,它定義了一個(gè)由資源(resource)、屬性(properties)和聲明(statement)3種對(duì)象(object)組成的基本模型,其中資源和屬性的關(guān)系類似于實(shí)體—關(guān)系模型,而聲明是對(duì)資源與屬性的關(guān)系進(jìn)行具體描述。通過(guò)資源、屬性及其聲明來(lái)描述特定資源,RDF通過(guò)這個(gè)抽象的數(shù)據(jù)模型為定義和使用元數(shù)據(jù)建立一個(gè)框架,元數(shù)據(jù)元素可看成其描述資源的屬性。RDFSchema則對(duì)RDF的語(yǔ)義進(jìn)一步擴(kuò)展,提供描述相關(guān)資源以及這些資源之間關(guān)系的機(jī)制, 規(guī)定了聲明資源類型、聲明相關(guān)屬性及其語(yǔ)義的機(jī)制,以及定義屬性與其他資源間關(guān)系的方法。并提供RDF核心類(coreclass)、核心屬性(coreattribute)和核心限制(coreconstraint)等機(jī)制來(lái)定義資源的類。RDF Syntax則構(gòu)造了一個(gè)完整的語(yǔ)法體系以利于計(jì)算機(jī)的自動(dòng)處理,它以XML為其宿主語(yǔ)言,通過(guò)XML語(yǔ)法實(shí)現(xiàn)對(duì)各種元數(shù)據(jù)的集成。在具體實(shí)現(xiàn)中,基于RDF的元數(shù)據(jù)轉(zhuǎn)換是通過(guò)RDF架構(gòu),把所有的元數(shù)據(jù)集中到一起,實(shí)現(xiàn)多種元數(shù)據(jù)在異構(gòu)系統(tǒng)之間的共享。

5 結(jié)束語(yǔ)

元數(shù)據(jù)是揭示信息資源的基礎(chǔ),它為數(shù)字圖書館提供了一種精確描述數(shù)據(jù)內(nèi)容、語(yǔ)義和服務(wù)的機(jī)制。關(guān)于元數(shù)據(jù)互操作的討論,是元數(shù)據(jù)研究領(lǐng)域的核心問題,也是有效利用網(wǎng)絡(luò)信息資源的基本要求。筆者從元數(shù)據(jù)方案的3個(gè)層面理解元數(shù)據(jù)互操作的3個(gè)層次,可以有助于揭示元數(shù)據(jù)互操作的本質(zhì)。相信隨著技術(shù)的進(jìn)步和人們認(rèn)識(shí)的深入,元數(shù)據(jù)的互操作性問題將會(huì)得到徹底解決。

[1]任繼愈.建設(shè)中國(guó)數(shù)字圖書館工程[N].人民日?qǐng)?bào),2000-04-04.

[2]金更達(dá),何嘉蓀.電子文件元數(shù)據(jù)標(biāo)準(zhǔn)設(shè)計(jì)框架研究[J].檔案與建設(shè),2005(9):4-7.

[3]馬費(fèi)成.信息資源開發(fā)與管理[M].北京:電子工業(yè)出版社,2004.

[4](美)Arene G.Taylor著.信息組織[M].張素芳等譯.北京:機(jī)械工業(yè)出版社,2006.

[5]張東.論元數(shù)據(jù)互操作的層次[J].情報(bào)理論與實(shí)踐,2005(6):648-650.

[6]畢強(qiáng),朱亞玲.元數(shù)據(jù)的標(biāo)準(zhǔn)及其互操作研究[J].情報(bào)理論與實(shí)踐,2007(5):666-670.

[7]陳虹濤,李志俊.元數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范及其互操作性[J].情報(bào)雜志,2005(7):93-95.

[8]孔慶杰,宋丹輝.元數(shù)據(jù)互操作問題解決方案研究[J].情報(bào)科學(xué),2007(5):754-758.

[9]羅昊.互操作——數(shù)字圖書館元數(shù)據(jù)方案的關(guān)鍵[J].情報(bào)雜志,2003(12):32-33,36.

[10]鄭志蘊(yùn),宋瀚濤,牛振東.數(shù)字圖書館元數(shù)據(jù)互操作機(jī)制的研究[J].計(jì)算機(jī)應(yīng)用,2005(3):699-702.

[11]韓夏,李秉嚴(yán).元數(shù)據(jù)的互操作研究[J].情報(bào)科學(xué),2004(7):812-814,877.

[12]朱超.關(guān)于元數(shù)據(jù)互操作的探討[J].情報(bào)理論與實(shí)踐,2005(6):644-647,655.

猜你喜歡
語(yǔ)義定義圖書館
語(yǔ)言與語(yǔ)義
圖書館
飛躍圖書館
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
圖書館里的是是非非
認(rèn)知范疇模糊與語(yǔ)義模糊
去圖書館
修辭學(xué)的重大定義
山的定義
主站蜘蛛池模板: 天天摸天天操免费播放小视频| 国产一区二区影院| 亚洲 欧美 偷自乱 图片| 日本高清免费一本在线观看| 亚洲成aⅴ人片在线影院八| 夜夜操天天摸| 欧美亚洲欧美| 国产制服丝袜91在线| 国模极品一区二区三区| 国产丝袜无码精品| 女人18毛片水真多国产| 丰满少妇αⅴ无码区| 国产丰满成熟女性性满足视频| 国产成人综合亚洲网址| 国产成人免费| 欧美精品亚洲精品日韩专区va| 国产精品福利尤物youwu| 欧洲高清无码在线| 99尹人香蕉国产免费天天拍| 91黄视频在线观看| 日韩精品一区二区三区swag| 国产精品自在拍首页视频8| 六月婷婷激情综合| 高清色本在线www| 国产精品污视频| 亚洲无码视频一区二区三区| 91青草视频| 华人在线亚洲欧美精品| 国产91av在线| 欧美精品在线免费| 亚洲视频一区| 狠狠亚洲五月天| 亚洲色婷婷一区二区| 精品伊人久久久久7777人| 97在线观看视频免费| 手机在线看片不卡中文字幕| 日韩黄色大片免费看| 欧美a在线视频| 免费无码网站| 中文字幕 欧美日韩| 午夜福利无码一区二区| 在线观看无码av免费不卡网站| 性欧美精品xxxx| 欧美性天天| 久久99热这里只有精品免费看| 色婷婷丁香| 亚洲天堂久久久| 日本五区在线不卡精品| 91精品视频播放| 成人国产小视频| 亚洲视频免费播放| 国产三级a| 欧美区国产区| 激情乱人伦| 精品国产自在现线看久久| 久久精品嫩草研究院| 最新国产高清在线| 在线国产三级| 中文字幕人妻无码系列第三区| 天天综合亚洲| 无码免费视频| 中文天堂在线视频| 丁香婷婷激情网| 欧美天天干| 久久久久亚洲AV成人网站软件| 亚洲人成影院在线观看| 国产乱人乱偷精品视频a人人澡| 亚洲午夜18| 在线观看精品自拍视频| 蝌蚪国产精品视频第一页| 亚洲精品国产乱码不卡| 久青草免费视频| 亚洲一本大道在线| 国产乱码精品一区二区三区中文| 亚洲精品中文字幕午夜| 国产午夜无码专区喷水| 无码一区18禁| 婷婷亚洲视频| 日本一区高清| 波多野一区| 激情亚洲天堂| 99视频在线免费观看|