999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于RDA關(guān)系的擴展中文關(guān)聯(lián)書目數(shù)據(jù)模型研究?

2018-06-08 01:12:38周小萍
圖書館學(xué)刊 2018年2期
關(guān)鍵詞:關(guān)聯(lián)資源模型

周小萍 唐 維

(遼寧大學(xué)圖書館,遼寧 沈陽 110036)

1 引言

關(guān)聯(lián)數(shù)據(jù)、本體以及RDF等技術(shù)在互聯(lián)網(wǎng)領(lǐng)域的應(yīng)用宣布語義互聯(lián)時代的到來,同時改變著傳統(tǒng)的信息資源組織方式。文檔的網(wǎng)絡(luò)在向數(shù)據(jù)的網(wǎng)絡(luò)邁進,數(shù)據(jù)的價值越來越體現(xiàn)在數(shù)據(jù)本身與其他數(shù)據(jù)的關(guān)聯(lián)程度。圖書館作為傳統(tǒng)的信息資源收藏及提供機構(gòu),雖然擁有大量的結(jié)構(gòu)化數(shù)據(jù),典型的包括書目數(shù)據(jù)及規(guī)范數(shù)據(jù),但是由于基于MARC格式的書目結(jié)構(gòu)是單一的線性排列,彼此之間缺乏必要的關(guān)聯(lián),同時書目數(shù)據(jù)的交換與共享仍需通過相應(yīng)的協(xié)議(典型的Z39.50)才能實現(xiàn),難以適應(yīng)當(dāng)前的網(wǎng)絡(luò)發(fā)展環(huán)境,其價值與功能也難以得到充分的體現(xiàn)。故圖書館界一直在努力探索,試圖改變現(xiàn)有的資源描述環(huán)境。在資源的內(nèi)容描述規(guī)則方面,經(jīng)過多年探索,不斷地對AACR2進行修訂,于2010年6月正式發(fā)布了基于FRBR模型的RDA;在書目結(jié)構(gòu)方面,美國國會圖書館分類法(LC)發(fā)布了基于關(guān)聯(lián)數(shù)據(jù)的書目框架BIBFRAME,并已實現(xiàn)了MARC21數(shù)據(jù)向BIBFRAME的轉(zhuǎn)換。基于RDA及新的書目框架BIBFRAME的書目數(shù)據(jù)不再是單一的線性結(jié)構(gòu),而是彼此之間互聯(lián)的立體網(wǎng)狀結(jié)構(gòu),這樣的書目數(shù)據(jù)結(jié)構(gòu)能夠更好地融入互聯(lián)網(wǎng),同時為基于圖書館資源的知識發(fā)現(xiàn)與獲取提供極大的便利。而MARC21與CNMARC雖同由MARC發(fā)展而來,但由于受文獻特征差異性及制定者主觀因素的影響,二者在字段的設(shè)置及功能的實現(xiàn)上還是存在一定的差別,故若要實現(xiàn)RDA的中文化及CNMARC的BIBFRAME轉(zhuǎn)換存在一定的困難。筆者旨在對RDA中所描述的“關(guān)系”進行分析的基礎(chǔ)上,構(gòu)建CNMARC的關(guān)聯(lián)書目數(shù)據(jù)模型,從而為中文書目數(shù)據(jù)的關(guān)聯(lián)式發(fā)布打下基礎(chǔ)。

2 RDA關(guān)于書目關(guān)系的描述

“關(guān)系”在編目學(xué)中一直占有舉足輕重之位,編目是進行各類信息資源組織的基礎(chǔ),而最終面向用戶的信息檢索又正是以信息組織為基礎(chǔ)。書目間的關(guān)系可分為內(nèi)部關(guān)系及外部關(guān)系,內(nèi)部關(guān)系是指書目實體內(nèi)部各要素之間的關(guān)聯(lián),外部關(guān)系是指書目與書目之間的關(guān)聯(lián)。內(nèi)部關(guān)系滿足了信息檢索的精確性限定檢索需求,而外部關(guān)系滿足了信息檢索族性檢索的需求。而在語義網(wǎng)的環(huán)境下,對書目“關(guān)系”有了更近一層的要求,需要實現(xiàn)與更多外部資源的關(guān)聯(lián),一是為了突破當(dāng)前書目只能進行內(nèi)部信息交換的局限,改變數(shù)據(jù)孤立的局面;二是通過與外部資源的關(guān)聯(lián)引導(dǎo)用戶發(fā)現(xiàn)更多潛在的有價值的資源。而RDA為以上三種關(guān)系的描述與建立提供了良好的途徑。

2.1 RDA概述

《資源描述與檢索》(Resource Description and Access,以下簡稱RDA)是為了適應(yīng)當(dāng)前的數(shù)字網(wǎng)絡(luò)環(huán)境,滿足當(dāng)下信息用戶的知識發(fā)現(xiàn)需求而制定的國際最新的資源描述規(guī)則。相對于AACR2,RDA展現(xiàn)給我們的是一種全新的世界觀。與原有的基于平面線性的資源描述方式相比,RDA以FR家族為思想基礎(chǔ),注重對于資源實體及屬性關(guān)系的揭示與表達,呈現(xiàn)出一種多維度的立體網(wǎng)狀結(jié)構(gòu)。前面我們提到RDA的理論基礎(chǔ)為FR家族,包括FRBR《書目記錄的功能需求》、FRAD《規(guī)范數(shù)據(jù)的功能需求》及FRSAD《主題規(guī)范數(shù)據(jù)的功能需求》,但由于RDA發(fā)布之初,F(xiàn)RSAD的的編制尚未完成,故RDA的基礎(chǔ)框架主要基于FRBR及FRAD來實現(xiàn)。筆者主要基于FRBR的概念模型來對RDA之間的關(guān)系進行剖析。

2.2 RDA關(guān)系

RDA以FR家族為框架而構(gòu)建,圍繞“實體-屬性-關(guān)系”模型展開。無論是FRBR、FRAD或是FRSAD,都是以實體、屬性及關(guān)系3個方面來對書目資源從內(nèi)容規(guī)則角度進行描述的。實體對應(yīng)于所描述資源對象及其所包含的若干數(shù)據(jù)元素;屬性指實體所具有的特征;關(guān)系則是FR模型的重要內(nèi)容,由兩部分組成,即被關(guān)聯(lián)的實體和關(guān)系類型。RDA中定義了四種關(guān)系:

(1)資源與資源之間的關(guān)系,對應(yīng)于FRBR第一組實體之間的關(guān)系;

(2)資源與相關(guān)個人、家族和團體間的關(guān)系,對應(yīng)于FRBR第一組實體與第二組實體的相互關(guān)系,描述了資源與責(zé)任的關(guān)系;

(3)作品、內(nèi)容表達、載體表現(xiàn)和單件間的關(guān)系,對應(yīng)于FRBR第一組實體內(nèi)部間的關(guān)系;

(4)資源與概念、實物、事件和地點間的關(guān)系,對應(yīng)于FRBR第一組與第三組實體間的關(guān)系,描述了資源與主題的關(guān)系。

資源與資源間的關(guān)系主要指作品與作品之間的關(guān)系,“作品”作為一個抽象的概念,指的是智力或藝術(shù)創(chuàng)作的行為。JSC的前主席芭芭拉.B.蒂利特把作品家族的關(guān)系劃分為3類:等同關(guān)系、衍生關(guān)系及描述關(guān)系;

FRBR第一組與第二組實體之間的關(guān)系指第二組實體對于第一組實體所承擔(dān)的責(zé)任方式,既包含創(chuàng)作者、編譯者、制造者,也包含擁有者及收藏者等個人或團體;

FRBR第一組實體內(nèi)部間關(guān)系是從抽象到具體過程,作品通過內(nèi)容表達來實現(xiàn),內(nèi)容表達通過載體表現(xiàn)來實現(xiàn)物化,載體表現(xiàn)通過單件來例證;

FRBR第一組與第三組實體間的關(guān)系為主題關(guān)系,第三組實體從內(nèi)容角度對第一組實體從各個方面進行揭示。

圖1展示了基于FRBR關(guān)系的RDA實體間關(guān)系

圖1 RDA實體間關(guān)系

3 CNMARC現(xiàn)有書目記錄中關(guān)系的揭示

CNMARC對于資源的描述側(cè)重于其全面性及規(guī)范性,而缺乏對于記錄與記錄間以及其內(nèi)部構(gòu)成元素間彼此關(guān)系的揭示。CNMARC對于系統(tǒng)內(nèi)記錄間關(guān)系的揭示主要通過“4XX”連接字段來實現(xiàn)。連接字段可以連接與在編文獻實體有關(guān)的其他實體的記錄,或是在不存在被關(guān)聯(lián)的記錄時,可以標(biāo)識被關(guān)聯(lián)文獻實體本身。目前的CNMARC記錄可以通過連接字段實現(xiàn)以下幾種實體關(guān)系的連接:

(1)通過410字段實現(xiàn)叢編項與分叢編實體的連接;

(2)通過422字段實現(xiàn)補編或是增刊與其正編或是正刊之間的關(guān)聯(lián);

(3)通過423字段實現(xiàn)合訂本與被合訂作品的單獨書目實體的連接;

(4)通過430/440字段實現(xiàn)實體之間的繼承與被繼承關(guān)系,主要用于連續(xù)出版物的更名,實現(xiàn)更名前后實體之間的連接;

(5)通過451字段實現(xiàn)同一載體不用版本之間實體的連接;

(6)通過452字段實現(xiàn)不同載體之間的實體之間的連接;

(7)通過461/462字段實現(xiàn)具有共同題名的總集及分集之間的連接;

(8)通過488字段實現(xiàn)與在編文獻實體相關(guān)作品之間的連接。

而實現(xiàn)系統(tǒng)內(nèi)記錄與外部數(shù)據(jù)之間的關(guān)聯(lián),則可通過$2及$3子字段來實現(xiàn)。$2在6XX主題字段中用于實現(xiàn)與詞表《漢語主題詞表》的連接,而$3子字段出現(xiàn)在CNMARC的5XX、6XX及7XX等字段中,可以實現(xiàn)記錄與其他規(guī)范檔,包括主題規(guī)范檔、人稱規(guī)范檔及地理名稱規(guī)范檔等的連接。不同于上述4XX字段對于實體的連接是發(fā)生于系統(tǒng)內(nèi)部,這種連接發(fā)生于不同系統(tǒng)之間,雖一定程度上為實現(xiàn)本地書目數(shù)據(jù)與外部數(shù)據(jù)集的關(guān)聯(lián)提供了基礎(chǔ),然而距離本地書目數(shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù)還有一定距離,原因在于其目前還不符合與關(guān)聯(lián)數(shù)據(jù)發(fā)布的4個基本原則,技術(shù)層面需要實現(xiàn)的方面還有很多。此外,目前CNMARC對于4XX字段及$3子字段的規(guī)定都是選擇性使用,尤其對于$3子字段,由于國內(nèi)尚未建立起相關(guān)規(guī)范檔的數(shù)據(jù)集,啟用的頻率普遍偏低,這就導(dǎo)致了CNMARC對于書目數(shù)據(jù)關(guān)系描述的缺失。

4 基于RDA關(guān)系的擴展中文書目數(shù)據(jù)關(guān)聯(lián)模型構(gòu)建

構(gòu)建基于RDA關(guān)系的CNMARC書目數(shù)據(jù)關(guān)聯(lián)模型,首先需要基于RDA的內(nèi)部及外部關(guān)系對CNMARC的各字段及子字段進行分析,在此基礎(chǔ)之上對原有字段進行解構(gòu)再與RDA中的元素進行映射,進而構(gòu)建基于RDA關(guān)系的CNMARC書目數(shù)據(jù)關(guān)聯(lián)模型。

4.1 CMMARC字段的拆分及轉(zhuǎn)化

CNMARC以ISBD規(guī)定的著錄項目為基礎(chǔ),設(shè)置了10大功能區(qū)來對編目資源進行描述。ISBD制定之初主要針對的是印刷型文獻,雖后來為了適應(yīng)網(wǎng)絡(luò)環(huán)境下日益豐富的文獻載體形式進行了增補和修訂,但其本質(zhì)還是為描述印刷型文獻,故其規(guī)定的著錄項目主要圍繞印刷型文獻的外部特征來進行,從若干方面來進行全部揭示,較少考慮文獻的內(nèi)部特征及各特征之間的關(guān)聯(lián)。而RDA在沿襲了ISBD的傳統(tǒng)之上,更是革命性的提出基于“實體-屬性-關(guān)系”模型來對文獻進行系統(tǒng)性的關(guān)聯(lián)揭示,突出了所描述的資源與其他資源以及其屬性之間的關(guān)聯(lián)。故若要實現(xiàn)RDA應(yīng)用于CNMARC,必須從“實體-屬性-關(guān)系”出發(fā),對CNMARC結(jié)構(gòu)中的各字段、子字段甚至標(biāo)識符進行解構(gòu),進而構(gòu)建基于RDA關(guān)系的中文關(guān)聯(lián)書目數(shù)據(jù)模型,從而為實現(xiàn)RDA的中文化打下基礎(chǔ)。

目前,國外RDA的官方網(wǎng)站(http://www.rdajsc.org/,http://www.rdatoolkit.org/)已經(jīng)推出了基于RDA格式的MARC21數(shù)據(jù)轉(zhuǎn)化工具。而同為MARC格式,CNMARC與MARC21盡管在內(nèi)容方面基本一致,但是在資源描述對象的劃分、字段及子字段的設(shè)置、字段標(biāo)識符的取值等方面均存在差異,故若要通過CNMARC與MARC21的映射為基礎(chǔ),進而實現(xiàn)CNMARC數(shù)據(jù)的RDA格式轉(zhuǎn)換,雖理論上存在可能性,具體實踐起來還有諸多方面的問題需要考慮及解決,所以我們不妨直接進行RDA實體屬性與CNMARC字段的映射,再以此為基礎(chǔ)構(gòu)建擴展的中文書目數(shù)據(jù)關(guān)聯(lián)模型。

FRAD主要涉及規(guī)范數(shù)據(jù)的功能需求,參考現(xiàn)行最新的書目控制理論,我們可以通過建立各類規(guī)范檔與書目記錄進行關(guān)聯(lián),故筆者主要通過FRBR所涉及的的實體以及屬性關(guān)系為基礎(chǔ)來進行映射進而構(gòu)造中文書目數(shù)據(jù)的擴展模型。

FRBR定義了三組11個實體,“作品”位于整個結(jié)構(gòu)的最高層,是一個抽象的概念,該實體的范圍很難確定,F(xiàn)RBR定義了作品間的三種關(guān)系;“內(nèi)容表達”是“作品”的實現(xiàn)方式,位于結(jié)構(gòu)的第二層,仍然是一個抽象的概念;“載體表現(xiàn)”是“內(nèi)容表達”的具體物理表現(xiàn)形式,位于機構(gòu)的第三層,我們現(xiàn)在的書目記錄實際上就處于該層;“單件”是“載體表現(xiàn)”的單一樣本,位于結(jié)構(gòu)的最底層,對應(yīng)于圖書館中的館藏項;“個人”、“家族”及“團體”3個實體,可以作為作品的責(zé)任者,也可以作為作品的主題而存在;“概念”“物體”“事件”及“地點”作為 FRBR 的第三組實體,用來揭示作品所表達或涉及的主題,現(xiàn)將這RDA記錄屬性、記錄關(guān)系及記錄間關(guān)系與CNMARC相關(guān)字段進行映射。根據(jù)需要增加3個新字段:236內(nèi)容表達、237媒介類型、238載體類型。個人/家族/團體之間關(guān)系的表述在MARC21中僅存在于規(guī)范記錄;概念/實物/事件/地點之間的關(guān)系為FRSAD中實體之間的關(guān)系,尚待補充;故不將這兩種關(guān)系作為筆者的研究對象。表1所示為映射后的結(jié)果:

表1 RDA記錄屬性與CNMARC常用字段映射

表2 RDA記錄關(guān)系與CNMARC常用字段映射

4.2 擴展中文關(guān)聯(lián)書目模型的構(gòu)建

基于RDA的屬性關(guān)系及上述映射,同時參照關(guān)聯(lián)數(shù)據(jù)發(fā)布的原理以及BIBFRAME的模型及詞表,對于每個屬性、取值均以URI的形式進行標(biāo)識,構(gòu)建了如圖2的中文關(guān)聯(lián)書目簡化數(shù)據(jù)模型。

圖2 作品層簡化模型

圖3 單件層簡化模型

圖4 載體表現(xiàn)層簡化模型

圖2是作品層的簡化模型,主要描述作品的內(nèi)容信息,包括題名及主題分類;圖4是載體表現(xiàn)層的簡化模型,主要對資源從其物理載體的角度進行揭示,描述了資源的載體形態(tài)、出版發(fā)行、責(zé)任說明以及識別等相關(guān)信息;圖3是單件層的簡化模型,主要揭示館藏方面的信息,包括機構(gòu)排架號及收藏機構(gòu)。3個模型可以從作品層到載體表現(xiàn)層再到單件層建立起縱向的層級關(guān)系,上一層的字段屬性可以被下級繼承。同時對于相關(guān)作品的描述,RDA定義了7種關(guān)系,分別為等同關(guān)系、描述關(guān)系、整體/部分關(guān)系、附屬關(guān)系、繼承關(guān)系、衍生關(guān)系及共有特性關(guān)系,這樣建立了作品及相關(guān)作品的橫向關(guān)系。由此整個書目模型從縱向及橫向兩方面建立起關(guān)聯(lián),同時記錄內(nèi)部,通過URI對資源的屬性進行標(biāo)識,建立起了有機的網(wǎng)狀聯(lián)系,突破了以往MARC的單一線性結(jié)構(gòu),對數(shù)據(jù)的描述實現(xiàn)了內(nèi)容與載體及單件明顯的區(qū)分。

4.3 模型的有效性分析

筆者選取本館7條館藏中文書目記錄,如表3所示,從題名、著者及出版社3個屬性進行書目內(nèi)部關(guān)聯(lián),結(jié)果如圖5所示:

表3 館內(nèi)書目記錄

圖5 基于本館書目的關(guān)聯(lián)后模型

圖5可以看出書目1和書目2通過題名URI(example001/title)實現(xiàn)了關(guān)聯(lián),同樣的方法書目1和書目3、書目2和書目5通過出版社的URI實現(xiàn)了關(guān)聯(lián),責(zé)任者方面可通過本館建立的人稱規(guī)范檔實現(xiàn)數(shù)據(jù)的關(guān)聯(lián),也可通過引入外部成熟的人稱規(guī)范檔資源的URI來實現(xiàn)。

5 結(jié) 語

目前盡管英、美等RDA的編制國每年仍對RDA進行大量修訂,但RDA的實施已進入實質(zhì)性階段。在國內(nèi),CALIS方面從2014年宣布開始實施RDA,實質(zhì)上是對于西文書目記錄在進行套錄的時候采用RDA記錄,而鼓勵有條件的圖書館提交原編的RDA記錄。而對于RDA的中文化,國內(nèi)圖書館界很多專家學(xué)者進行了相關(guān)理論及實踐方面的研究,但尚未進入實質(zhì)性的應(yīng)用階段。筆者對CNMARC進行了解構(gòu),并以RDA所描述的“實體-關(guān)系”為基礎(chǔ),構(gòu)建了CNMARC的關(guān)聯(lián)書目數(shù)據(jù)模型,希望能以此推動RDA在國內(nèi)中文化的進程,進而促進語義網(wǎng)及關(guān)聯(lián)數(shù)據(jù)等技術(shù)在圖書館中的應(yīng)用。

[1]羅翀.RDA全視角解讀[M].北京:國家圖書館出版社,2015:14.

[2]羅翀,李菡.解析RDA中的關(guān)系描述[J].數(shù)字圖書館論壇,2014(6):55-62.

[3]周德明.RDA:從理論到實踐[M].北京:海洋出版社,2014:101.

[4]王松林.從423字段看CNMARC書目格式中的數(shù)據(jù)關(guān)聯(lián)[J].圖書館學(xué)刊,2013(2):1-4.

[5]胡小菁,張期民.《資源描述與檢索》的中文化[M].北京:國家圖書館出版社,2015.

[6]賈君枝,白林林.關(guān)聯(lián)數(shù)據(jù)中CNMARC到MARC21的映射實現(xiàn)[J].國家圖書館學(xué)刊,2015(4):80-93.

猜你喜歡
關(guān)聯(lián)資源模型
一半模型
基礎(chǔ)教育資源展示
“苦”的關(guān)聯(lián)
重要模型『一線三等角』
一樣的資源,不一樣的收獲
重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
資源回收
奇趣搭配
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
智趣
讀者(2017年5期)2017-02-15 18:04:18
主站蜘蛛池模板: 亚洲AV免费一区二区三区| 久久久精品久久久久三级| 亚洲综合精品第一页| 日本久久免费| 美女视频黄频a免费高清不卡| yy6080理论大片一级久久| 啦啦啦网站在线观看a毛片| 国产精品一区在线观看你懂的| 欧美日韩中文国产| 亚洲日韩精品伊甸| 国产一在线观看| 亚洲国产日韩在线观看| 国产女人综合久久精品视| 一区二区三区精品视频在线观看| av尤物免费在线观看| 这里只有精品在线播放| 伊人色综合久久天天| 欧美a在线看| 小说 亚洲 无码 精品| 婷婷六月激情综合一区| 亚洲日韩高清在线亚洲专区| 亚洲无线一二三四区男男| a级毛片在线免费| 国产视频久久久久| 精品無碼一區在線觀看 | 亚洲男人在线天堂| 久久久久国产精品熟女影院| 伊人久久综在合线亚洲91| 国产在线视频二区| 欧美午夜在线观看| 乱人伦视频中文字幕在线| 国产在线小视频| 国产色婷婷| 久久人妻系列无码一区| 91小视频在线观看免费版高清| 5388国产亚洲欧美在线观看| 四虎精品黑人视频| 黄色网站不卡无码| 噜噜噜久久| 精品国产成人高清在线| 亚洲成人动漫在线观看| 97超爽成人免费视频在线播放| 国产成熟女人性满足视频| 精品免费在线视频| 亚洲一级毛片在线观播放| 国产麻豆aⅴ精品无码| 92午夜福利影院一区二区三区| 欧美专区日韩专区| 午夜日韩久久影院| 狂欢视频在线观看不卡| 国产成年女人特黄特色毛片免 | 欧美成人二区| 国产白丝av| 欧美日韩成人在线观看| 国产精品大白天新婚身材| 久久久久久久久亚洲精品| 成年片色大黄全免费网站久久| 91午夜福利在线观看精品| 九九热精品视频在线| 婷婷综合色| 国产亚洲欧美在线专区| 欧美日韩国产在线播放| 国产视频只有无码精品| 亚洲成人黄色在线| 国产欧美综合在线观看第七页| 国产精品污污在线观看网站| 欧美一区二区精品久久久| 91高清在线视频| 日韩黄色大片免费看| 国产杨幂丝袜av在线播放| 欧美日韩北条麻妃一区二区| 久久精品丝袜高跟鞋| 一区二区在线视频免费观看| 亚洲精品视频免费| 456亚洲人成高清在线| 欧美午夜在线视频| 9啪在线视频| 青青草91视频| 日韩第九页| 国产剧情国内精品原创| 久久久久人妻精品一区三寸蜜桃| 亚洲无线观看|