999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理研究

2012-04-27 05:39:54西北大學圖書館西安710069
圖書館理論與實踐 2012年9期
關(guān)鍵詞:關(guān)聯(lián)圖書館

●吳 旻(西北大學 圖書館,西安 710069)

1 對關(guān)聯(lián)數(shù)據(jù)的初步認識

關(guān)聯(lián)數(shù)據(jù)(Linked data) 描述了通過可鏈接的URI方式來發(fā)布、分享、連接Web中各類資源的方法,一般認為是語義網(wǎng)的主題之一。[1]關(guān)聯(lián)數(shù)據(jù)的基本原理是用一種基于標準的知識表示與檢索協(xié)議、可逐步擴展的機制來實現(xiàn)可動態(tài)關(guān)聯(lián)的知識對象網(wǎng)絡(luò),并支持以此為基礎(chǔ)的知識發(fā)現(xiàn)與知識組織。[2]這樣看來,關(guān)聯(lián)數(shù)據(jù)將對圖書館的知識組織起促進作用。

研究者認為,關(guān)聯(lián)數(shù)據(jù)的核心技術(shù)是使用資源描述框架(RDF)進行資源的組織與交換。關(guān)聯(lián)數(shù)據(jù)通過URI、HTTP、RDF等語義網(wǎng)技術(shù)將網(wǎng)絡(luò)上相關(guān)的數(shù)據(jù)資源進行關(guān)聯(lián),是從文件網(wǎng)絡(luò)向數(shù)據(jù)網(wǎng)絡(luò)轉(zhuǎn)化的一種優(yōu)化策略,其技術(shù)體系框架如圖1所示。[3]圖書館擁有大量的結(jié)構(gòu)化數(shù)據(jù),國外圖書館界對關(guān)聯(lián)數(shù)據(jù)的應(yīng)用已引起了足夠重視并進行推廣,比較典型的是美國國會圖書館和瑞典國家圖書館。目前國內(nèi)關(guān)于關(guān)聯(lián)數(shù)據(jù)在圖書館應(yīng)用的研究成果較少,筆者查閱了國內(nèi)外相關(guān)資料,經(jīng)過一番探索后認為,圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理可歸納為關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建、關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)構(gòu)建、關(guān)聯(lián)數(shù)據(jù)的發(fā)布、關(guān)聯(lián)數(shù)據(jù)的瀏覽、關(guān)聯(lián)數(shù)據(jù)的鏈接維護。

圖1 關(guān)聯(lián)數(shù)據(jù)的技術(shù)體系

2 圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理

2.1 圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建

圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建是實現(xiàn)其集成管理的首要環(huán)節(jié)。圖書館創(chuàng)建關(guān)聯(lián)數(shù)據(jù)需要用規(guī)范形式描述內(nèi)容對象的內(nèi)部結(jié)構(gòu)、描述內(nèi)容的語義(如作者、書名、出版社、內(nèi)含數(shù)據(jù)集和圖表等)。該描述深度取決于所依據(jù)元數(shù)據(jù)格式的豐富程度和內(nèi)容對象的內(nèi)容深度,描述結(jié)果是依據(jù)元數(shù)據(jù)格式轉(zhuǎn)換的RDF關(guān)聯(lián)記錄。圖書館關(guān)聯(lián)數(shù)據(jù)創(chuàng)建過程中較有難度的工作是在描述信息中建立彼此內(nèi)容對象之間的關(guān)聯(lián)描述,只有建立該關(guān)聯(lián)描述,所創(chuàng)建的數(shù)據(jù)才算是關(guān)聯(lián)數(shù)據(jù)。在關(guān)聯(lián)數(shù)據(jù)創(chuàng)建前,圖書館已積累了大量的文獻和電子資源,如何將現(xiàn)有的數(shù)據(jù)資源創(chuàng)建成關(guān)聯(lián)數(shù)據(jù)并在網(wǎng)上發(fā)布,成為當前急需解決的問題之一。圖書館的數(shù)據(jù)量非常龐大,需要將其放進RDF數(shù)據(jù)庫中,并選擇合適的服務(wù)器作為關(guān)聯(lián)數(shù)據(jù)服務(wù)的前端。一般而言,圖書館關(guān)聯(lián)數(shù)據(jù)的更新頻率相對較快,那么還需要引入更新機制,或在請求關(guān)聯(lián)數(shù)據(jù)時依據(jù)原始數(shù)據(jù)在線生成RDF,但這可能影響用戶的在線連續(xù)訪問。在圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建中,還將面臨一些現(xiàn)實問題:詞表的定義和選擇、復(fù)雜數(shù)據(jù)的結(jié)構(gòu)化(RDF化)、數(shù)據(jù)集內(nèi)數(shù)據(jù)關(guān)聯(lián)的自動生成等。[4]

2.2 圖書館關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)構(gòu)建

圖書館關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)關(guān)系構(gòu)建與圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建是兩個不同的過程,二者存在本質(zhì)的區(qū)別。關(guān)聯(lián)數(shù)據(jù)通過“鏈接”來為用戶開展服務(wù),并通過鏈接實現(xiàn)不同數(shù)據(jù)集的關(guān)聯(lián)。[5]對于圖書館來說,關(guān)聯(lián)數(shù)據(jù)關(guān)聯(lián)關(guān)系的構(gòu)建是圖書館關(guān)聯(lián)數(shù)據(jù)發(fā)布的前提。可以認為,圖書館關(guān)聯(lián)數(shù)據(jù)中關(guān)聯(lián)關(guān)系的構(gòu)建是圖書館關(guān)聯(lián)數(shù)據(jù)集成管理的核心環(huán)節(jié)。圖書館關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)構(gòu)建主要采取兩種方式:映射關(guān)聯(lián)和非映射關(guān)聯(lián),可采取三種常見的自動關(guān)聯(lián)構(gòu)建方法:基于圖相似度的映射、基于規(guī)則的關(guān)聯(lián)構(gòu)建和基于實體的文本映射。基于圖相似度的映射是對單一三元組比較方法的擴展,基于實體的文本映射是實現(xiàn)自動關(guān)聯(lián)的基本方法,這兩種方法具有通用性,但創(chuàng)建的關(guān)系類型比較有限。而基于規(guī)則的關(guān)聯(lián)構(gòu)建能創(chuàng)建較復(fù)雜的關(guān)系,但要依賴特定的相關(guān)規(guī)則和數(shù)據(jù)模型。對圖書館的書目數(shù)據(jù)來說,館員希望通過識別和確定不同對象間的屬性關(guān)系來構(gòu)建較為豐富的關(guān)聯(lián)關(guān)系。以瑞典聯(lián)合目錄LIBRIS系統(tǒng)為例,該系統(tǒng)通過關(guān)聯(lián)數(shù)據(jù)發(fā)布了600多萬條書目數(shù)據(jù),其規(guī)范文檔數(shù)據(jù)集的類型為組織機構(gòu)名稱或人名,URI為http://libris.db.se/resource/auth/<number>;其書目數(shù)據(jù)類型為書目,URI為 http://libris.kb.se/resource/bib/<number>。[6]

2.3 圖書館關(guān)聯(lián)數(shù)據(jù)的發(fā)布

如何將已有的數(shù)據(jù)或新生成的數(shù)據(jù)發(fā)布為RDF三元組,是關(guān)聯(lián)數(shù)據(jù)發(fā)布的核心,通常需考慮待發(fā)布數(shù)據(jù)的規(guī)模、更新頻率和當前的存儲方式。根據(jù)關(guān)聯(lián)數(shù)據(jù)的基本原理,在Web中發(fā)布關(guān)聯(lián)數(shù)據(jù)必須具有可參照的HTTP或URI標識。一般來說,RDF數(shù)據(jù)的生成方式主要有4種:生成并發(fā)布靜態(tài)RDF文件,通過其他類型信息的RDF轉(zhuǎn)換實現(xiàn),通過關(guān)系型數(shù)據(jù)庫的RDF轉(zhuǎn)換實現(xiàn),通過對已有應(yīng)用或Web API的封裝實現(xiàn)。[7]

我們首先應(yīng)該弄清楚圖書館大規(guī)模的關(guān)聯(lián)數(shù)據(jù)集是怎么發(fā)布到網(wǎng)上的。對于儲存在關(guān)系型數(shù)據(jù)庫里的數(shù)據(jù),可用D2R Server將數(shù)據(jù)轉(zhuǎn)換成RDF格式,并發(fā)布到網(wǎng)上。[7]關(guān)聯(lián)數(shù)據(jù)的發(fā)布步驟如下:(1)從網(wǎng)上下載,然后安裝D2R Server服務(wù)軟件;(2) 用D2R Server軟件將關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)自動生成D2RQ mapping映像文件(包括RDF格式數(shù)據(jù)):(3) 根據(jù)已有的詞匯集對自動生成的D2RQ mapping文件進行手工改動,對D2RQ mapping文件中的資源用網(wǎng)絡(luò)中已有的資源代替;(4)把圖書館的關(guān)聯(lián)數(shù)據(jù)集發(fā)布到網(wǎng)上,并通過RDF links與網(wǎng)上其他數(shù)據(jù)集相連,使瀏覽器或搜索器能搜索和瀏覽圖書館發(fā)布的數(shù)據(jù)。除此之外,還有其他的關(guān)聯(lián)數(shù)據(jù)發(fā)布工具,如:Virtuoso Universal Server,較多的關(guān)聯(lián)數(shù)據(jù)集通過Virtuoso U-niversal Server轉(zhuǎn)換并發(fā)布。舉例來說,美國國會圖書館以簡單知識組織系統(tǒng)(SKOS) 格式將國會標題表(LCSH)全部關(guān)聯(lián)數(shù)據(jù)化,并且提供LCSH詞表的下載,成為關(guān)聯(lián)數(shù)據(jù)在圖書館應(yīng)用的成功范例。除了將權(quán)威文檔LCSH發(fā)布為關(guān)聯(lián)數(shù)據(jù)外,還創(chuàng)建了不同資源之間的關(guān)聯(lián)(如LCSH與瑞典聯(lián)合目錄LIBRIS關(guān)聯(lián))。可以認為,美國國會圖書館的做法可作為國際上其他圖書館的成功實踐范例,已經(jīng)覺察到了圖書館發(fā)布關(guān)聯(lián)數(shù)據(jù)的較大益處。

2.4 圖書館關(guān)聯(lián)數(shù)據(jù)的瀏覽

圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理另外需解決的問題是怎樣在網(wǎng)上瀏覽圖書館的關(guān)聯(lián)數(shù)據(jù)。瀏覽關(guān)聯(lián)數(shù)據(jù)需要專門的瀏覽器或插件,目前主要的瀏覽器有Open Link RDF Browser, Tabulator Browser, Zitgist RDF Browser等。實驗結(jié)果表明,當多個關(guān)系頻繁地進行連接操作時,關(guān)聯(lián)數(shù)據(jù)分布樹CDDT(conjunction data distribution tree)能提高整個分布式系統(tǒng)的查詢性能。所謂關(guān)聯(lián)數(shù)據(jù)分布樹,可以這樣理解:如果某一關(guān)系聯(lián)系圖中不存在回路,則該關(guān)系圖就構(gòu)成一個關(guān)聯(lián)數(shù)據(jù)分布樹,如果該關(guān)系聯(lián)系圖中存在回路,則刪除最少的邊使得該關(guān)系聯(lián)系圖中不存在回路。當刪除一個聯(lián)系時,將其中的一個關(guān)系復(fù)制到另一個關(guān)系一端,使其構(gòu)成新的聯(lián)系,該新的聯(lián)系是被刪除聯(lián)系的一個副本。關(guān)聯(lián)數(shù)據(jù)分布樹如圖2所示,在CDDT中其中的一個關(guān)系也可稱為一個結(jié)點,刪除了U、S之間的一條邊,關(guān)系R為CDDT的根結(jié)點,其中和U相連的關(guān)系為S的一個副本。[8]

圖2 關(guān)聯(lián)數(shù)據(jù)分布樹示意圖

2.5 圖書館關(guān)聯(lián)數(shù)據(jù)的鏈接維護

隨著圖書館關(guān)聯(lián)數(shù)據(jù)集的不斷增多,不同數(shù)據(jù)集之間的關(guān)系將會越來越復(fù)雜。任何一個數(shù)據(jù)集的狀態(tài)發(fā)生變化,都有可能導(dǎo)致與之相鏈接的其他數(shù)據(jù)集發(fā)生訪問故障。因此,圖書館關(guān)聯(lián)數(shù)據(jù)集之間的鏈接關(guān)系建立之后,對這些動態(tài)變化的鏈接進行及時、有效的維護是發(fā)揮關(guān)聯(lián)數(shù)據(jù)的作用、維系數(shù)據(jù)集之間鏈接關(guān)系的重要手段,也是體現(xiàn)關(guān)聯(lián)數(shù)據(jù)價值的重要保證。一般認為,關(guān)聯(lián)數(shù)據(jù)鏈接的狀態(tài)主要有5種:初態(tài)、不變、消失、斷鏈、新鏈接。由源數(shù)據(jù)集到目標數(shù)據(jù)集的鏈接建立后,需要采取一定的方法對其進行維護,包括及時修補斷鏈、刪除已消失的鏈接、建立新鏈接等。有關(guān)研究表明,主要有三種動態(tài)鏈接的維護方法:基于WOD-LMP協(xié)議的方法要求鏈接雙方都遵守WOD-LMP協(xié)議(是專用的關(guān)聯(lián)數(shù)據(jù)鏈接維護協(xié)議);基于主動監(jiān)測機制的方法對目標數(shù)據(jù)集的要求較低,只需要提供SPARQL查詢接口或支持RDF堆下載即可;[9]基于更新通知的方法適用于目標數(shù)據(jù)集具有數(shù)據(jù)更新通知機制的情況,需要針對目標數(shù)據(jù)集的數(shù)據(jù)更新通知機制采取相應(yīng)的更新數(shù)據(jù)獲取方法。相對而言,第二種方法的適應(yīng)性較其他方法的適應(yīng)性要強。

3 圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理主要注意事項

3.1 關(guān)聯(lián)數(shù)據(jù)的效用問題

隨著美國、瑞典等國家的圖書館將自身關(guān)聯(lián)數(shù)據(jù)發(fā)布到Web網(wǎng)上的實踐,其他國家的圖書館也展開了發(fā)布關(guān)聯(lián)數(shù)據(jù)的嘗試。但是,也可能出現(xiàn)關(guān)聯(lián)數(shù)據(jù)斷鏈的問題,因為關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)中的數(shù)據(jù)保持著更新狀態(tài),新的數(shù)據(jù)不斷增加,舊的數(shù)據(jù)需要更改或刪除,數(shù)據(jù)之間的鏈接也發(fā)生變化。數(shù)據(jù)源之間的關(guān)聯(lián)可能產(chǎn)生斷鏈,這將引起關(guān)聯(lián)數(shù)據(jù)的應(yīng)用發(fā)生錯誤,并導(dǎo)致關(guān)聯(lián)數(shù)據(jù)失效。目前的一般做法是將該問題暫時忽略,當在具體應(yīng)用中發(fā)現(xiàn)斷鏈時再加以解決。雖然Web網(wǎng)絡(luò)結(jié)構(gòu)允許一定數(shù)量死鏈接的存在,但過多的死鏈接無疑會影響數(shù)據(jù)網(wǎng)絡(luò)的使用效率。圖書館應(yīng)該保證數(shù)據(jù)源關(guān)聯(lián)關(guān)系的有效性,還應(yīng)建立關(guān)聯(lián)數(shù)據(jù)的監(jiān)測和修正機制,以維護關(guān)聯(lián)數(shù)據(jù)的效用。

3.2 關(guān)聯(lián)數(shù)據(jù)的安全問題

數(shù)據(jù)安全對圖書館來說特別重要,一旦丟失書目數(shù)據(jù)或流通數(shù)據(jù)等,后果將是特別嚴重的。那么圖書館創(chuàng)建并發(fā)布了關(guān)聯(lián)數(shù)據(jù),是不是就意味著萬無一失了呢?答案是否定的。盡管關(guān)聯(lián)數(shù)據(jù)依賴較完善的鏈接保存策略和模式映射,但關(guān)聯(lián)數(shù)據(jù)的安全問題仍是圖書館界擔憂的主要議題之一。關(guān)聯(lián)數(shù)據(jù)的理想目標是將目前的Web資源通過鏈接關(guān)系打造成為一個全球共享數(shù)據(jù)庫,這為Web服務(wù)帶來了極大的便利,但同時也帶來諸多安全障礙,如用戶的個人數(shù)據(jù)有可能被泄漏,無意中可能侵犯別人的知識產(chǎn)權(quán)和網(wǎng)絡(luò)隱私權(quán)。因此,圖書情報界應(yīng)高度重視關(guān)聯(lián)數(shù)據(jù)的安全問題,首先要求用戶具有良好的安全意識,其次依靠技術(shù)手段與法律方式相結(jié)合,共同確保圖書館關(guān)聯(lián)數(shù)據(jù)的安全,更好地為讀者服務(wù),提升圖書館的社會價值。

[1]Wikipedia.Linked data[EB/OL].[2011-09-28].http∶//en.wikipedia.org/wiki/linked_data.

[2]沈志宏,張曉林.關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述[J].現(xiàn)代圖書情報技術(shù),2010(11):1-9.

[3] Passant A,etal.Meaningofatag:acollaborativeapproach tobridge the gap between taggingand linked data[C]//Proceedingsofthewww2008workshop Linked Dataonthe Web (LDOW2008).Beijing:China,2008.

[4]黃永文.關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述[J].現(xiàn)代圖書情報技術(shù),2010(5):1-7.

[5]Malmsten M.Making a library catalogue part of the semantic web [EB/OL].[2011-09-28].http∶//dcpa pers.dublincore.org/ojs/pubs/article/view/927/923.

[6]白海燕.關(guān)聯(lián)數(shù)據(jù)及DBPedia實例分析[J].現(xiàn)代圖書情報技術(shù),2010(3):33-39.

[7]譚潔清.關(guān)聯(lián)數(shù)據(jù)的簡介與進展[J].信息與電腦,2011(1):103,106.

[8]陳慶奎,黃雨田.關(guān)聯(lián)數(shù)據(jù)分布樹在分布式查詢中的應(yīng)用[J].計算機工程與設(shè)計,2008,29(15):4009-4012.

[9]郭少友.關(guān)聯(lián)數(shù)據(jù)的動態(tài)鏈接維護研究[J].圖書情報工作,2011,55(17):112-116.

猜你喜歡
關(guān)聯(lián)圖書館
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
當代陜西(2021年17期)2021-11-06 03:21:36
圖書館
文苑(2019年20期)2019-11-16 08:52:12
“一帶一路”遞進,關(guān)聯(lián)民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
時間重疊的圖書館
文苑(2018年17期)2018-11-09 01:29:40
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
飛躍圖書館
圖書館里的是是非非
主站蜘蛛池模板: 狼友视频一区二区三区| 久久性视频| 欧美一级在线播放| 一级高清毛片免费a级高清毛片| aⅴ免费在线观看| 91口爆吞精国产对白第三集 | 在线视频亚洲欧美| 青青操国产视频| 99精品免费欧美成人小视频| 毛片久久网站小视频| 中文字幕久久波多野结衣| 久久99精品久久久久久不卡| 高潮爽到爆的喷水女主播视频 | 欧美国产在线看| www.日韩三级| 欧美国产在线一区| 国产主播福利在线观看| 亚洲精品麻豆| 久久精品免费国产大片| 伊人久久大香线蕉综合影视| 日韩av无码精品专区| 美女视频黄频a免费高清不卡| 国产成人一区在线播放| 玖玖免费视频在线观看| 成人在线视频一区| 午夜久久影院| 超碰91免费人妻| 日韩av无码DVD| 色成人综合| 免费亚洲成人| 成年人视频一区二区| 亚洲第一天堂无码专区| 国产精品真实对白精彩久久| 国产一区二区福利| 人妻免费无码不卡视频| 亚洲午夜片| 亚洲性一区| 国产在线精品香蕉麻豆| 亚洲男人的天堂视频| 高清国产在线| 九九久久精品免费观看| 波多野结衣一区二区三区AV| 国产精品一区二区无码免费看片| 女人爽到高潮免费视频大全| 综合色在线| 全部免费特黄特色大片视频| 欧美视频二区| 老司国产精品视频91| 一本大道无码高清| 亚洲成年网站在线观看| 永久在线播放| 国产区免费| 亚洲天堂视频在线免费观看| 一区二区在线视频免费观看| 亚洲AV免费一区二区三区| 日韩在线观看网站| 国产福利微拍精品一区二区| 色悠久久久久久久综合网伊人| 久久免费视频6| 毛片基地视频| 欧美成人一区午夜福利在线| 精品无码一区二区三区电影| 久草视频中文| 亚洲性日韩精品一区二区| 99re在线观看视频| 国产成人精品一区二区免费看京| 国产啪在线91| 国产18在线播放| 欧美成人午夜影院| 亚洲bt欧美bt精品| 国产午夜无码专区喷水| 制服丝袜亚洲| 亚洲高清中文字幕在线看不卡| 国产福利小视频高清在线观看| A级毛片无码久久精品免费| 亚洲第一视频区| 在线观看免费国产| 久久人人97超碰人人澡爱香蕉 | 国产精品伦视频观看免费| 亚洲视频三级| 久久午夜夜伦鲁鲁片不卡| 精品无码日韩国产不卡av|