999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理研究

2012-04-27 05:39:54西北大學圖書館西安710069
圖書館理論與實踐 2012年9期
關(guān)鍵詞:關(guān)聯(lián)圖書館

●吳 旻(西北大學 圖書館,西安 710069)

1 對關(guān)聯(lián)數(shù)據(jù)的初步認識

關(guān)聯(lián)數(shù)據(jù)(Linked data) 描述了通過可鏈接的URI方式來發(fā)布、分享、連接Web中各類資源的方法,一般認為是語義網(wǎng)的主題之一。[1]關(guān)聯(lián)數(shù)據(jù)的基本原理是用一種基于標準的知識表示與檢索協(xié)議、可逐步擴展的機制來實現(xiàn)可動態(tài)關(guān)聯(lián)的知識對象網(wǎng)絡(luò),并支持以此為基礎(chǔ)的知識發(fā)現(xiàn)與知識組織。[2]這樣看來,關(guān)聯(lián)數(shù)據(jù)將對圖書館的知識組織起促進作用。

研究者認為,關(guān)聯(lián)數(shù)據(jù)的核心技術(shù)是使用資源描述框架(RDF)進行資源的組織與交換。關(guān)聯(lián)數(shù)據(jù)通過URI、HTTP、RDF等語義網(wǎng)技術(shù)將網(wǎng)絡(luò)上相關(guān)的數(shù)據(jù)資源進行關(guān)聯(lián),是從文件網(wǎng)絡(luò)向數(shù)據(jù)網(wǎng)絡(luò)轉(zhuǎn)化的一種優(yōu)化策略,其技術(shù)體系框架如圖1所示。[3]圖書館擁有大量的結(jié)構(gòu)化數(shù)據(jù),國外圖書館界對關(guān)聯(lián)數(shù)據(jù)的應(yīng)用已引起了足夠重視并進行推廣,比較典型的是美國國會圖書館和瑞典國家圖書館。目前國內(nèi)關(guān)于關(guān)聯(lián)數(shù)據(jù)在圖書館應(yīng)用的研究成果較少,筆者查閱了國內(nèi)外相關(guān)資料,經(jīng)過一番探索后認為,圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理可歸納為關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建、關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)構(gòu)建、關(guān)聯(lián)數(shù)據(jù)的發(fā)布、關(guān)聯(lián)數(shù)據(jù)的瀏覽、關(guān)聯(lián)數(shù)據(jù)的鏈接維護。

圖1 關(guān)聯(lián)數(shù)據(jù)的技術(shù)體系

2 圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理

2.1 圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建

圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建是實現(xiàn)其集成管理的首要環(huán)節(jié)。圖書館創(chuàng)建關(guān)聯(lián)數(shù)據(jù)需要用規(guī)范形式描述內(nèi)容對象的內(nèi)部結(jié)構(gòu)、描述內(nèi)容的語義(如作者、書名、出版社、內(nèi)含數(shù)據(jù)集和圖表等)。該描述深度取決于所依據(jù)元數(shù)據(jù)格式的豐富程度和內(nèi)容對象的內(nèi)容深度,描述結(jié)果是依據(jù)元數(shù)據(jù)格式轉(zhuǎn)換的RDF關(guān)聯(lián)記錄。圖書館關(guān)聯(lián)數(shù)據(jù)創(chuàng)建過程中較有難度的工作是在描述信息中建立彼此內(nèi)容對象之間的關(guān)聯(lián)描述,只有建立該關(guān)聯(lián)描述,所創(chuàng)建的數(shù)據(jù)才算是關(guān)聯(lián)數(shù)據(jù)。在關(guān)聯(lián)數(shù)據(jù)創(chuàng)建前,圖書館已積累了大量的文獻和電子資源,如何將現(xiàn)有的數(shù)據(jù)資源創(chuàng)建成關(guān)聯(lián)數(shù)據(jù)并在網(wǎng)上發(fā)布,成為當前急需解決的問題之一。圖書館的數(shù)據(jù)量非常龐大,需要將其放進RDF數(shù)據(jù)庫中,并選擇合適的服務(wù)器作為關(guān)聯(lián)數(shù)據(jù)服務(wù)的前端。一般而言,圖書館關(guān)聯(lián)數(shù)據(jù)的更新頻率相對較快,那么還需要引入更新機制,或在請求關(guān)聯(lián)數(shù)據(jù)時依據(jù)原始數(shù)據(jù)在線生成RDF,但這可能影響用戶的在線連續(xù)訪問。在圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建中,還將面臨一些現(xiàn)實問題:詞表的定義和選擇、復(fù)雜數(shù)據(jù)的結(jié)構(gòu)化(RDF化)、數(shù)據(jù)集內(nèi)數(shù)據(jù)關(guān)聯(lián)的自動生成等。[4]

2.2 圖書館關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)構(gòu)建

圖書館關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)關(guān)系構(gòu)建與圖書館關(guān)聯(lián)數(shù)據(jù)的創(chuàng)建是兩個不同的過程,二者存在本質(zhì)的區(qū)別。關(guān)聯(lián)數(shù)據(jù)通過“鏈接”來為用戶開展服務(wù),并通過鏈接實現(xiàn)不同數(shù)據(jù)集的關(guān)聯(lián)。[5]對于圖書館來說,關(guān)聯(lián)數(shù)據(jù)關(guān)聯(lián)關(guān)系的構(gòu)建是圖書館關(guān)聯(lián)數(shù)據(jù)發(fā)布的前提。可以認為,圖書館關(guān)聯(lián)數(shù)據(jù)中關(guān)聯(lián)關(guān)系的構(gòu)建是圖書館關(guān)聯(lián)數(shù)據(jù)集成管理的核心環(huán)節(jié)。圖書館關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)構(gòu)建主要采取兩種方式:映射關(guān)聯(lián)和非映射關(guān)聯(lián),可采取三種常見的自動關(guān)聯(lián)構(gòu)建方法:基于圖相似度的映射、基于規(guī)則的關(guān)聯(lián)構(gòu)建和基于實體的文本映射。基于圖相似度的映射是對單一三元組比較方法的擴展,基于實體的文本映射是實現(xiàn)自動關(guān)聯(lián)的基本方法,這兩種方法具有通用性,但創(chuàng)建的關(guān)系類型比較有限。而基于規(guī)則的關(guān)聯(lián)構(gòu)建能創(chuàng)建較復(fù)雜的關(guān)系,但要依賴特定的相關(guān)規(guī)則和數(shù)據(jù)模型。對圖書館的書目數(shù)據(jù)來說,館員希望通過識別和確定不同對象間的屬性關(guān)系來構(gòu)建較為豐富的關(guān)聯(lián)關(guān)系。以瑞典聯(lián)合目錄LIBRIS系統(tǒng)為例,該系統(tǒng)通過關(guān)聯(lián)數(shù)據(jù)發(fā)布了600多萬條書目數(shù)據(jù),其規(guī)范文檔數(shù)據(jù)集的類型為組織機構(gòu)名稱或人名,URI為http://libris.db.se/resource/auth/<number>;其書目數(shù)據(jù)類型為書目,URI為 http://libris.kb.se/resource/bib/<number>。[6]

2.3 圖書館關(guān)聯(lián)數(shù)據(jù)的發(fā)布

如何將已有的數(shù)據(jù)或新生成的數(shù)據(jù)發(fā)布為RDF三元組,是關(guān)聯(lián)數(shù)據(jù)發(fā)布的核心,通常需考慮待發(fā)布數(shù)據(jù)的規(guī)模、更新頻率和當前的存儲方式。根據(jù)關(guān)聯(lián)數(shù)據(jù)的基本原理,在Web中發(fā)布關(guān)聯(lián)數(shù)據(jù)必須具有可參照的HTTP或URI標識。一般來說,RDF數(shù)據(jù)的生成方式主要有4種:生成并發(fā)布靜態(tài)RDF文件,通過其他類型信息的RDF轉(zhuǎn)換實現(xiàn),通過關(guān)系型數(shù)據(jù)庫的RDF轉(zhuǎn)換實現(xiàn),通過對已有應(yīng)用或Web API的封裝實現(xiàn)。[7]

我們首先應(yīng)該弄清楚圖書館大規(guī)模的關(guān)聯(lián)數(shù)據(jù)集是怎么發(fā)布到網(wǎng)上的。對于儲存在關(guān)系型數(shù)據(jù)庫里的數(shù)據(jù),可用D2R Server將數(shù)據(jù)轉(zhuǎn)換成RDF格式,并發(fā)布到網(wǎng)上。[7]關(guān)聯(lián)數(shù)據(jù)的發(fā)布步驟如下:(1)從網(wǎng)上下載,然后安裝D2R Server服務(wù)軟件;(2) 用D2R Server軟件將關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù)自動生成D2RQ mapping映像文件(包括RDF格式數(shù)據(jù)):(3) 根據(jù)已有的詞匯集對自動生成的D2RQ mapping文件進行手工改動,對D2RQ mapping文件中的資源用網(wǎng)絡(luò)中已有的資源代替;(4)把圖書館的關(guān)聯(lián)數(shù)據(jù)集發(fā)布到網(wǎng)上,并通過RDF links與網(wǎng)上其他數(shù)據(jù)集相連,使瀏覽器或搜索器能搜索和瀏覽圖書館發(fā)布的數(shù)據(jù)。除此之外,還有其他的關(guān)聯(lián)數(shù)據(jù)發(fā)布工具,如:Virtuoso Universal Server,較多的關(guān)聯(lián)數(shù)據(jù)集通過Virtuoso U-niversal Server轉(zhuǎn)換并發(fā)布。舉例來說,美國國會圖書館以簡單知識組織系統(tǒng)(SKOS) 格式將國會標題表(LCSH)全部關(guān)聯(lián)數(shù)據(jù)化,并且提供LCSH詞表的下載,成為關(guān)聯(lián)數(shù)據(jù)在圖書館應(yīng)用的成功范例。除了將權(quán)威文檔LCSH發(fā)布為關(guān)聯(lián)數(shù)據(jù)外,還創(chuàng)建了不同資源之間的關(guān)聯(lián)(如LCSH與瑞典聯(lián)合目錄LIBRIS關(guān)聯(lián))。可以認為,美國國會圖書館的做法可作為國際上其他圖書館的成功實踐范例,已經(jīng)覺察到了圖書館發(fā)布關(guān)聯(lián)數(shù)據(jù)的較大益處。

2.4 圖書館關(guān)聯(lián)數(shù)據(jù)的瀏覽

圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理另外需解決的問題是怎樣在網(wǎng)上瀏覽圖書館的關(guān)聯(lián)數(shù)據(jù)。瀏覽關(guān)聯(lián)數(shù)據(jù)需要專門的瀏覽器或插件,目前主要的瀏覽器有Open Link RDF Browser, Tabulator Browser, Zitgist RDF Browser等。實驗結(jié)果表明,當多個關(guān)系頻繁地進行連接操作時,關(guān)聯(lián)數(shù)據(jù)分布樹CDDT(conjunction data distribution tree)能提高整個分布式系統(tǒng)的查詢性能。所謂關(guān)聯(lián)數(shù)據(jù)分布樹,可以這樣理解:如果某一關(guān)系聯(lián)系圖中不存在回路,則該關(guān)系圖就構(gòu)成一個關(guān)聯(lián)數(shù)據(jù)分布樹,如果該關(guān)系聯(lián)系圖中存在回路,則刪除最少的邊使得該關(guān)系聯(lián)系圖中不存在回路。當刪除一個聯(lián)系時,將其中的一個關(guān)系復(fù)制到另一個關(guān)系一端,使其構(gòu)成新的聯(lián)系,該新的聯(lián)系是被刪除聯(lián)系的一個副本。關(guān)聯(lián)數(shù)據(jù)分布樹如圖2所示,在CDDT中其中的一個關(guān)系也可稱為一個結(jié)點,刪除了U、S之間的一條邊,關(guān)系R為CDDT的根結(jié)點,其中和U相連的關(guān)系為S的一個副本。[8]

圖2 關(guān)聯(lián)數(shù)據(jù)分布樹示意圖

2.5 圖書館關(guān)聯(lián)數(shù)據(jù)的鏈接維護

隨著圖書館關(guān)聯(lián)數(shù)據(jù)集的不斷增多,不同數(shù)據(jù)集之間的關(guān)系將會越來越復(fù)雜。任何一個數(shù)據(jù)集的狀態(tài)發(fā)生變化,都有可能導(dǎo)致與之相鏈接的其他數(shù)據(jù)集發(fā)生訪問故障。因此,圖書館關(guān)聯(lián)數(shù)據(jù)集之間的鏈接關(guān)系建立之后,對這些動態(tài)變化的鏈接進行及時、有效的維護是發(fā)揮關(guān)聯(lián)數(shù)據(jù)的作用、維系數(shù)據(jù)集之間鏈接關(guān)系的重要手段,也是體現(xiàn)關(guān)聯(lián)數(shù)據(jù)價值的重要保證。一般認為,關(guān)聯(lián)數(shù)據(jù)鏈接的狀態(tài)主要有5種:初態(tài)、不變、消失、斷鏈、新鏈接。由源數(shù)據(jù)集到目標數(shù)據(jù)集的鏈接建立后,需要采取一定的方法對其進行維護,包括及時修補斷鏈、刪除已消失的鏈接、建立新鏈接等。有關(guān)研究表明,主要有三種動態(tài)鏈接的維護方法:基于WOD-LMP協(xié)議的方法要求鏈接雙方都遵守WOD-LMP協(xié)議(是專用的關(guān)聯(lián)數(shù)據(jù)鏈接維護協(xié)議);基于主動監(jiān)測機制的方法對目標數(shù)據(jù)集的要求較低,只需要提供SPARQL查詢接口或支持RDF堆下載即可;[9]基于更新通知的方法適用于目標數(shù)據(jù)集具有數(shù)據(jù)更新通知機制的情況,需要針對目標數(shù)據(jù)集的數(shù)據(jù)更新通知機制采取相應(yīng)的更新數(shù)據(jù)獲取方法。相對而言,第二種方法的適應(yīng)性較其他方法的適應(yīng)性要強。

3 圖書館關(guān)聯(lián)數(shù)據(jù)的集成管理主要注意事項

3.1 關(guān)聯(lián)數(shù)據(jù)的效用問題

隨著美國、瑞典等國家的圖書館將自身關(guān)聯(lián)數(shù)據(jù)發(fā)布到Web網(wǎng)上的實踐,其他國家的圖書館也展開了發(fā)布關(guān)聯(lián)數(shù)據(jù)的嘗試。但是,也可能出現(xiàn)關(guān)聯(lián)數(shù)據(jù)斷鏈的問題,因為關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)中的數(shù)據(jù)保持著更新狀態(tài),新的數(shù)據(jù)不斷增加,舊的數(shù)據(jù)需要更改或刪除,數(shù)據(jù)之間的鏈接也發(fā)生變化。數(shù)據(jù)源之間的關(guān)聯(lián)可能產(chǎn)生斷鏈,這將引起關(guān)聯(lián)數(shù)據(jù)的應(yīng)用發(fā)生錯誤,并導(dǎo)致關(guān)聯(lián)數(shù)據(jù)失效。目前的一般做法是將該問題暫時忽略,當在具體應(yīng)用中發(fā)現(xiàn)斷鏈時再加以解決。雖然Web網(wǎng)絡(luò)結(jié)構(gòu)允許一定數(shù)量死鏈接的存在,但過多的死鏈接無疑會影響數(shù)據(jù)網(wǎng)絡(luò)的使用效率。圖書館應(yīng)該保證數(shù)據(jù)源關(guān)聯(lián)關(guān)系的有效性,還應(yīng)建立關(guān)聯(lián)數(shù)據(jù)的監(jiān)測和修正機制,以維護關(guān)聯(lián)數(shù)據(jù)的效用。

3.2 關(guān)聯(lián)數(shù)據(jù)的安全問題

數(shù)據(jù)安全對圖書館來說特別重要,一旦丟失書目數(shù)據(jù)或流通數(shù)據(jù)等,后果將是特別嚴重的。那么圖書館創(chuàng)建并發(fā)布了關(guān)聯(lián)數(shù)據(jù),是不是就意味著萬無一失了呢?答案是否定的。盡管關(guān)聯(lián)數(shù)據(jù)依賴較完善的鏈接保存策略和模式映射,但關(guān)聯(lián)數(shù)據(jù)的安全問題仍是圖書館界擔憂的主要議題之一。關(guān)聯(lián)數(shù)據(jù)的理想目標是將目前的Web資源通過鏈接關(guān)系打造成為一個全球共享數(shù)據(jù)庫,這為Web服務(wù)帶來了極大的便利,但同時也帶來諸多安全障礙,如用戶的個人數(shù)據(jù)有可能被泄漏,無意中可能侵犯別人的知識產(chǎn)權(quán)和網(wǎng)絡(luò)隱私權(quán)。因此,圖書情報界應(yīng)高度重視關(guān)聯(lián)數(shù)據(jù)的安全問題,首先要求用戶具有良好的安全意識,其次依靠技術(shù)手段與法律方式相結(jié)合,共同確保圖書館關(guān)聯(lián)數(shù)據(jù)的安全,更好地為讀者服務(wù),提升圖書館的社會價值。

[1]Wikipedia.Linked data[EB/OL].[2011-09-28].http∶//en.wikipedia.org/wiki/linked_data.

[2]沈志宏,張曉林.關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述[J].現(xiàn)代圖書情報技術(shù),2010(11):1-9.

[3] Passant A,etal.Meaningofatag:acollaborativeapproach tobridge the gap between taggingand linked data[C]//Proceedingsofthewww2008workshop Linked Dataonthe Web (LDOW2008).Beijing:China,2008.

[4]黃永文.關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述[J].現(xiàn)代圖書情報技術(shù),2010(5):1-7.

[5]Malmsten M.Making a library catalogue part of the semantic web [EB/OL].[2011-09-28].http∶//dcpa pers.dublincore.org/ojs/pubs/article/view/927/923.

[6]白海燕.關(guān)聯(lián)數(shù)據(jù)及DBPedia實例分析[J].現(xiàn)代圖書情報技術(shù),2010(3):33-39.

[7]譚潔清.關(guān)聯(lián)數(shù)據(jù)的簡介與進展[J].信息與電腦,2011(1):103,106.

[8]陳慶奎,黃雨田.關(guān)聯(lián)數(shù)據(jù)分布樹在分布式查詢中的應(yīng)用[J].計算機工程與設(shè)計,2008,29(15):4009-4012.

[9]郭少友.關(guān)聯(lián)數(shù)據(jù)的動態(tài)鏈接維護研究[J].圖書情報工作,2011,55(17):112-116.

猜你喜歡
關(guān)聯(lián)圖書館
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
“苦”的關(guān)聯(lián)
當代陜西(2021年17期)2021-11-06 03:21:36
圖書館
文苑(2019年20期)2019-11-16 08:52:12
“一帶一路”遞進,關(guān)聯(lián)民生更緊
當代陜西(2019年15期)2019-09-02 01:52:00
時間重疊的圖書館
文苑(2018年17期)2018-11-09 01:29:40
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
飛躍圖書館
圖書館里的是是非非
主站蜘蛛池模板: 一级毛片无毒不卡直接观看| 国产成人精品亚洲77美色| 日韩在线播放中文字幕| 亚洲美女视频一区| 色婷婷亚洲十月十月色天| 在线无码私拍| 成人午夜精品一级毛片| 色噜噜综合网| 五月天久久综合| 国产福利观看| 拍国产真实乱人偷精品| 日韩免费毛片| 欧美亚洲另类在线观看| 亚洲精品在线观看91| 国产主播福利在线观看| 久久99热66这里只有精品一 | jizz在线观看| 五月天福利视频| www精品久久| 女人18毛片一级毛片在线| 亚洲国产中文欧美在线人成大黄瓜 | 欧美笫一页| 成年人国产视频| 这里只有精品国产| 国产精品微拍| 日韩欧美中文在线| 国产成人高清亚洲一区久久| 国产成人91精品免费网址在线| 国产精品熟女亚洲AV麻豆| 国产在线精品99一区不卡| 欧美亚洲国产精品第一页| 欧美日韩成人在线观看| 欧美区一区| 国产精品成人久久| 久久亚洲中文字幕精品一区 | 日本精品中文字幕在线不卡| 九色综合伊人久久富二代| 色综合中文| 色呦呦手机在线精品| 国产91在线|日本| 丰满人妻中出白浆| 一本色道久久88| 国产91全国探花系列在线播放| 草草线在成年免费视频2| 国产精品第一区| 亚洲精品视频免费观看| 欧美不卡视频在线观看| 国产午夜福利亚洲第一| 国产麻豆精品久久一二三| 日日拍夜夜操| 香蕉国产精品视频| 国产毛片不卡| 91免费国产高清观看| 欧美日韩精品一区二区在线线| 欧美综合激情| 国产精品开放后亚洲| 青青青国产视频手机| 国产一级二级三级毛片| 日韩毛片基地| 国产打屁股免费区网站| 亚洲成aⅴ人片在线影院八| 三级国产在线观看| 丁香五月婷婷激情基地| 欧美一级夜夜爽| 激情六月丁香婷婷| 久草视频一区| 免费中文字幕一级毛片| 综合社区亚洲熟妇p| 永久免费精品视频| 国产噜噜在线视频观看| 大陆国产精品视频| 国产chinese男男gay视频网| 麻豆精品视频在线原创| 精品国产欧美精品v| 99视频在线免费观看| 天天色天天综合网| 免费在线国产一区二区三区精品| 性欧美在线| 国产美女自慰在线观看| 五月激激激综合网色播免费| 情侣午夜国产在线一区无码| 日韩欧美国产中文|