999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

關(guān)聯(lián)數(shù)據(jù)特點及發(fā)布研究

2011-09-12 04:12:14胡明玲王建濤
圖書館界 2011年6期
關(guān)鍵詞:關(guān)聯(lián)語義利用

胡明玲,王建濤

(1.浙江萬里學院圖書館,浙江 寧波 315100;2.浙江大學寧波理工學院圖書館,浙江 寧波 315100)

1 引言

關(guān)聯(lián)數(shù)據(jù)(Linked Data)是語義網(wǎng)的一個分支,用來描述一套發(fā)布、分享及鏈接互聯(lián)網(wǎng)通過URI(統(tǒng)一資源標志符)提供的數(shù)據(jù)、信息和知識的方法[1],可以理解為是任何有意義的數(shù)據(jù)(信息或知識)在萬維網(wǎng)上的一種發(fā)布方式。目前,“關(guān)聯(lián)數(shù)據(jù)”的研究熱度已經(jīng)超過其上位詞“語義網(wǎng)”,并已成為推動語義網(wǎng)發(fā)展的重要力量之一,近年來逐漸得到學術(shù)界、工業(yè)界及政府部門的廣泛關(guān)注,包括BBC、紐約時報、MIT、IEEE、HCLS、美國國會圖書館等在內(nèi)的機構(gòu)紛紛加入到關(guān)聯(lián)數(shù)據(jù)的出版發(fā)布行列[2]。關(guān)聯(lián)數(shù)據(jù)對于圖書館而言,也是一種很好的信息服務(wù)發(fā)表形式。圖書館可將自己開發(fā)和組織的事實型信息資源和知識庫以關(guān)聯(lián)數(shù)據(jù)的形式發(fā)布,從而使信息資源得到開放利用,既可豐富互聯(lián)網(wǎng)信息資源,又能提升圖書館的服務(wù)能力、增加服務(wù)方式、拓展服務(wù)內(nèi)容和增強用戶的依賴性。

2 關(guān)聯(lián)數(shù)據(jù)的特點

2.1 簡潔高效的數(shù)據(jù)發(fā)布方法

關(guān)聯(lián)數(shù)據(jù)是發(fā)布RDF(Resource Description Framework,一種用于描述Web資源的標記語言)數(shù)據(jù)的一種簡捷、開放、高效的方法(機制),是語義網(wǎng)的一種表現(xiàn),可以看成是Web上數(shù)據(jù)發(fā)布的一種標準的API,其對HTTP進行進一步的規(guī)定和擴展。在Web2.0環(huán)境下,基于API提供的結(jié)構(gòu)化的數(shù)據(jù)有很多,比如:eBay、Amazon、Yahoo、Google Base APIs等。相對于這些API,關(guān)聯(lián)數(shù)據(jù)則提供單一、標準化的訪問機制,并基于結(jié)構(gòu)化的數(shù)據(jù)提供背景關(guān)聯(lián),而不是依賴于各種接口和從接口獲取的數(shù)據(jù)格式[3]。傳統(tǒng)超文本W(wǎng)eb中,數(shù)據(jù)網(wǎng)絡(luò)是建立在網(wǎng)頁文檔之上的,關(guān)聯(lián)數(shù)據(jù)則是基于RDF描述數(shù)據(jù)之間的關(guān)系。

2.2 可融入萬維網(wǎng)

關(guān)聯(lián)數(shù)據(jù)雖然是語義網(wǎng)的重要的基礎(chǔ)性應(yīng)用,但由于語義網(wǎng)本身與現(xiàn)有萬維網(wǎng)是相融的,所以關(guān)聯(lián)數(shù)據(jù)的應(yīng)用與萬維網(wǎng)也是相融合的。關(guān)聯(lián)數(shù)據(jù)甚至依托萬維網(wǎng)來展現(xiàn)其語義化的處理能力,在形式上表現(xiàn)為萬維網(wǎng)上的富鏈接機制,將超文本鏈接(文件之間的鏈接)轉(zhuǎn)變?yōu)槌瑪?shù)據(jù)鏈接(事物之間的鏈接)。

2.3 數(shù)據(jù)可得到最大限度的關(guān)聯(lián)

在語義網(wǎng)中,不僅僅將數(shù)據(jù)發(fā)布到Web上,而且通過關(guān)聯(lián)數(shù)據(jù)構(gòu)建能被計算機理解的結(jié)構(gòu)化的并富含語義的數(shù)據(jù)網(wǎng)絡(luò),把以前沒有關(guān)聯(lián)的相關(guān)數(shù)據(jù)連接起來,甚至使許多沉睡的數(shù)據(jù)發(fā)揮作用,最終將網(wǎng)絡(luò)變成一個巨大的數(shù)據(jù)庫,再通過計算機解析數(shù)據(jù),從而實現(xiàn)網(wǎng)絡(luò)的許多智能應(yīng)用。

2.4 減少冗余,促進再利用

數(shù)據(jù)內(nèi)容通過開放利用的形式發(fā)布后,相同的數(shù)據(jù)內(nèi)容從理論上講只需構(gòu)建一套,其他系統(tǒng)無需構(gòu)建同樣的數(shù)據(jù),僅僅需要進行數(shù)據(jù)關(guān)聯(lián)即可。數(shù)據(jù)進行關(guān)聯(lián)后,將大大減少互聯(lián)網(wǎng)上冗余數(shù)據(jù),系統(tǒng)開發(fā)和信息服務(wù)的效率將更高。

2.5 可發(fā)現(xiàn)

關(guān)聯(lián)數(shù)據(jù)通過URI發(fā)布在萬維網(wǎng)上,既可通過傳統(tǒng)的信息發(fā)現(xiàn)方式發(fā)現(xiàn)相關(guān)關(guān)聯(lián)數(shù)據(jù),也可根據(jù)關(guān)聯(lián)數(shù)據(jù)中的URI來發(fā)現(xiàn)新的關(guān)聯(lián)數(shù)據(jù)。

3 關(guān)聯(lián)數(shù)據(jù)的類型

關(guān)聯(lián)數(shù)據(jù)根據(jù)數(shù)據(jù)源的開放范圍主要分為三種類型。

3.1 關(guān)聯(lián)開放數(shù)據(jù)(Linking Open Data:LOD)

這是目前關(guān)聯(lián)數(shù)據(jù)的主要形式,其以公開的Web數(shù)據(jù)形式在整個網(wǎng)絡(luò)范圍內(nèi)開放利用,這種類型的關(guān)聯(lián)數(shù)據(jù)契合了互聯(lián)網(wǎng)開放的特性。關(guān)聯(lián)開放數(shù)據(jù)小組(W3C下研究和推廣關(guān)聯(lián)數(shù)據(jù)應(yīng)用的組織)期望通過開放數(shù)據(jù)運動公開更多的數(shù)據(jù),并以開放數(shù)據(jù)應(yīng)用來展示關(guān)聯(lián)數(shù)據(jù)技術(shù)[1]。

3.2 關(guān)聯(lián)私有數(shù)據(jù)

指僅限組織或系統(tǒng)內(nèi)應(yīng)用的關(guān)聯(lián)數(shù)據(jù)。關(guān)聯(lián)私有數(shù)據(jù)的應(yīng)用也稱為關(guān)聯(lián)企業(yè)數(shù)據(jù)(Linking Enterprise Data),私有數(shù)據(jù)的關(guān)聯(lián)實現(xiàn)從技術(shù)上不存在障礙,而且需求將會越來越多,目前已在少數(shù)企業(yè)中得到應(yīng)用,關(guān)聯(lián)數(shù)據(jù)也可以在不同部門之間利用內(nèi)聯(lián)網(wǎng)進行交換[4]。

3.3 關(guān)聯(lián)合作數(shù)據(jù)

主要指合作組織或不同組織之間關(guān)聯(lián)系統(tǒng)中的數(shù)據(jù)相關(guān)聯(lián),即兩個或者兩個以上單位的系統(tǒng)之間可以合法地通過HTTP在網(wǎng)絡(luò)上交換私有的關(guān)聯(lián)數(shù)據(jù),從而實現(xiàn)一些特殊功能的應(yīng)用。

4 關(guān)聯(lián)數(shù)據(jù)的發(fā)布

4.1 關(guān)聯(lián)數(shù)據(jù)發(fā)布基礎(chǔ)

關(guān)聯(lián)數(shù)據(jù)的發(fā)布從技術(shù)的角度分析,主要涉及以下四個方面[5]:1)信息資源。在發(fā)布某類信息資源的數(shù)據(jù)之前,需要明確待發(fā)布的信息資源是信息、知識還是數(shù)據(jù),是否有被關(guān)聯(lián)(引用)的必要,是否希望得到廣泛的利用等。2)資源標識。任何一個信息資源都用一個 HTTP的URI來標識,使得數(shù)據(jù)能真正實現(xiàn)基于 Web的訪問與互聯(lián)。3)資源描述。資源可以有多種描述,例如 HTML,XML,RDF以及JPEG。關(guān)聯(lián)數(shù)據(jù)的描述主要是通過RDF格式來表示。RDF將一個資源描述成三元組(主語、謂語、賓語),從而使其成為帶有語義的結(jié)構(gòu)化數(shù)據(jù)。主語、謂語都需要用 URI來表示;賓語可以用 URI標識另一個資源,也可以是字符串表示的文本。若把主語看做是類資源,將謂語看做是類資源的屬性資源,賓語就或者是類資源或者是文字型資源。根據(jù)賓語的種類,可以將三元組分為兩類:文字型三元組和非文字型三元組,后者可以看做是類資源之間的關(guān)聯(lián)。4)名稱空間。除上述三個方面外,還需要使用URI作為信息資源對象的名稱空間描述,不僅可以簡化數(shù)據(jù)形式,而且方便根據(jù)名稱空間來理解發(fā)布的數(shù)據(jù)屬性。

紐約時報在其關(guān)聯(lián)開放數(shù)據(jù)網(wǎng)站[6]上分別以RDF文檔和HTML文檔發(fā)布其關(guān)聯(lián)數(shù)據(jù),目前已有1萬多個標簽,內(nèi)容涉及人物、組織、地點、主題等領(lǐng)域,可以按照開放共用協(xié)議開放使用。在紐約時報網(wǎng)站的文章頁面中,涉及相關(guān)標簽的人名、組織等詞匯會自動關(guān)聯(lián)到更多文章的鏈接。

4.2 關(guān)聯(lián)數(shù)據(jù)發(fā)布方法

關(guān)聯(lián)數(shù)據(jù)發(fā)布可通過專門的工具來發(fā)布,D2R就是比較流行的一種關(guān)聯(lián)數(shù)據(jù)發(fā)布工具,可用來幫助完成傳統(tǒng)數(shù)據(jù)向關(guān)聯(lián)數(shù)據(jù)的轉(zhuǎn)換[7]。關(guān)聯(lián)數(shù)據(jù)也可通過編程發(fā)布,如筆者所在的寧波市數(shù)字圖書館服務(wù)外包產(chǎn)業(yè)信息門戶(http://soip.nit.net.cn/,以下簡稱SOIP)中是通過PHP從MySQL中提取數(shù)據(jù)并生成RDF文件來發(fā)布的。在具體應(yīng)用中,SOIP關(guān)聯(lián)開放數(shù)據(jù)的發(fā)布利用PHP組件從MySQL中提取數(shù)據(jù),然后根據(jù)合適的名稱空間進行RDF編碼,再利用動態(tài)緩存技術(shù),實現(xiàn)關(guān)聯(lián)開放數(shù)據(jù)的發(fā)布與數(shù)據(jù)動態(tài)更新。SOIP關(guān)聯(lián)開放數(shù)據(jù)的發(fā)布分為綜合發(fā)布的RDF文檔和單條記錄的RDF文檔,方便用戶根據(jù)需要利用。此外,還提供基于網(wǎng)頁的關(guān)聯(lián)開放數(shù)據(jù)瀏覽。在SOIP關(guān)聯(lián)數(shù)據(jù)的具體應(yīng)用中,主要用于信息瀏覽時的信息拓展和關(guān)聯(lián)鏈接。

5 關(guān)聯(lián)開放數(shù)據(jù)發(fā)布與應(yīng)用實例

SOIP是寧波市數(shù)字圖書館特色庫項目建設(shè)內(nèi)容之一,旨在為寧波市服務(wù)外包產(chǎn)業(yè)的發(fā)展提供信息支撐和交流平臺,支持寧波市服務(wù)外包企業(yè)信息化建設(shè)并為本市服務(wù)外包的人才培養(yǎng)和學術(shù)研究提供信息服務(wù)。為此,SOIP通過發(fā)布關(guān)聯(lián)數(shù)據(jù)的形式,使門戶信息資源能在企業(yè)信息環(huán)境中得到廣泛應(yīng)用。SOIP的關(guān)聯(lián)開放數(shù)據(jù)發(fā)布和應(yīng)用的基本框架如圖1(虛線部分為目前還在繼續(xù)研發(fā)中的功能),目前已實現(xiàn)了企業(yè)名錄和專業(yè)人才的關(guān)聯(lián)數(shù)據(jù)發(fā)布,并在SOIP系統(tǒng)內(nèi)實現(xiàn)數(shù)據(jù)關(guān)聯(lián)應(yīng)用。

圖1 SOIP關(guān)聯(lián)數(shù)據(jù)發(fā)布與關(guān)聯(lián)數(shù)據(jù)應(yīng)用架構(gòu)

5.1 專業(yè)人才關(guān)聯(lián)開放數(shù)據(jù)的發(fā)布

在做關(guān)聯(lián)數(shù)據(jù)的發(fā)布與應(yīng)用之前,需要處理好以下幾方面的問題:1)PHP系統(tǒng)環(huán)境的默認最大內(nèi)存限制為8M,處理大的RDF文檔時可能會出現(xiàn)內(nèi)存溢出,因此需要修改php.ini中memory_limit的設(shè)置來增大內(nèi)存,一般不超過系統(tǒng)全部內(nèi)存的1/4,太大會影響系統(tǒng)速度,考慮到目前處理的RDF文檔少有超過50M的,所以設(shè)置為50M即可,這樣相對于服務(wù)器系統(tǒng)幾乎沒什么影響。也可在發(fā)布程序前估算文檔大小,再利用PHP內(nèi)置函數(shù)臨時設(shè)定內(nèi)存大小。2)發(fā)布RDF數(shù)據(jù)前需要對從MySQL中提取的數(shù)據(jù)進行清理,使生成的數(shù)據(jù)符合RDF文件的格式和RDF數(shù)據(jù)處理的需要,主要清理的內(nèi)容有:連續(xù)空白、&符號、url編碼、日期格式、HTML標記等。3)對已經(jīng)發(fā)布的RDF關(guān)聯(lián)數(shù)據(jù),可到W3[8]網(wǎng)站進行RDF驗證。該驗證系統(tǒng)能根據(jù)提供的代碼或URI對RDF自動解析并給出有錯誤代碼的行數(shù),輔助檢查,以確保RDF格式的正確性。4)要盡可能利用標準的、有影響的命名空間,從而提高關(guān)聯(lián)開放數(shù)據(jù)的易用性、開放性和普適性。5)需要發(fā)布的關(guān)聯(lián)數(shù)據(jù)屬性元素盡可能選擇有關(guān)聯(lián)意義的、并能對語義表達有作用的數(shù)據(jù),比如專家學者的簡介內(nèi)容并不是關(guān)聯(lián)數(shù)據(jù)的核心,可以在做數(shù)據(jù)清理時自動截取少量內(nèi)容進行發(fā)布,既不影響數(shù)據(jù)利用,又能減少RDF文檔的大小。

處理好上述事務(wù)后,即可通過PHP編程,開發(fā)相應(yīng)的發(fā)布組件,通過發(fā)布組件處理RDF內(nèi)容的發(fā)布和管理事務(wù)。實例效果請參見SOIP網(wǎng)站的數(shù)據(jù)開放利用欄目。

5.2 專業(yè)人才關(guān)聯(lián)開放數(shù)據(jù)的網(wǎng)頁瀏覽實現(xiàn)

關(guān)聯(lián)數(shù)據(jù)除了以RDF形式提供計算機利用外,還可提供方便人們基于網(wǎng)頁閱讀的方式,以促進關(guān)聯(lián)數(shù)據(jù)的應(yīng)用。在PHP環(huán)境下有一個開源的API工具:RAP(RDF API for PHP),可用于RDF的解析、查詢,并能提供三元組的HTML輸出。在SOIP中,為了集中展示專家名錄信息,并將專家姓名鏈接到單個的RDF文件,就利用了RAP進行數(shù)據(jù)解析,然后生成HTML數(shù)據(jù)供瀏覽,其中的RDF文件來自前文中發(fā)布的專業(yè)人才RDF文檔。

5.3 專業(yè)人才關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)應(yīng)用

專業(yè)人才關(guān)聯(lián)數(shù)據(jù)的關(guān)聯(lián)應(yīng)用主要表現(xiàn)在瀏覽某位專業(yè)人才時能實現(xiàn)如下功能:1)根據(jù)專業(yè)人才關(guān)聯(lián)數(shù)據(jù)的研究興趣,展現(xiàn)與該專業(yè)人才研究興趣相關(guān)的人才列表。2)根據(jù)專業(yè)人才關(guān)聯(lián)數(shù)據(jù)和企業(yè)名錄關(guān)聯(lián)數(shù)據(jù)展現(xiàn)該人才所在單位的其他人才列表。3)根據(jù)企業(yè)名錄關(guān)聯(lián)數(shù)據(jù)對所屬企業(yè)字段與所在企業(yè)的名錄信息數(shù)據(jù)進行自動鏈接。4)根據(jù)知識庫關(guān)聯(lián)數(shù)據(jù)實現(xiàn)相關(guān)知識資源導航。5)根據(jù)地域關(guān)聯(lián)數(shù)據(jù)將該地域的專家信息、名錄信息和行業(yè)動態(tài)信息進行關(guān)聯(lián),促進知識發(fā)現(xiàn)和信息利用。

實現(xiàn)上述功能既可以通過RAP利用SPARQL語言查詢 RDF文檔,也可以直接利用RAP解析RDF文檔數(shù)據(jù)實現(xiàn)關(guān)聯(lián)應(yīng)用。由于SPARQL語言支持多RDF文檔的聯(lián)合查詢,所以應(yīng)用SPARQL查詢在效率上要好。上述功能的前三個已經(jīng)在SOIP中實現(xiàn),后兩個功能將在服務(wù)外包知識庫和地域范圍數(shù)據(jù)庫成熟后,也將進行發(fā)布和開發(fā)相關(guān)應(yīng)用。

6 結(jié)語

基于上述研究與實踐,關(guān)聯(lián)開放數(shù)據(jù)對提升系統(tǒng)服務(wù)能力和信息資源開放利用效益明顯,主要表現(xiàn)在如下兩個方面:一方面,在系統(tǒng)內(nèi)部的應(yīng)用能很好地將與對象信息資源有關(guān)的相關(guān)數(shù)據(jù)進行統(tǒng)一展現(xiàn);另一方面,通過提供關(guān)聯(lián)開放數(shù)據(jù),使得企業(yè)能在自己的系統(tǒng)中應(yīng)用這些數(shù)據(jù),既拓展了數(shù)據(jù)的利用方式,又支持了企業(yè)的信息化建設(shè),大大彰顯了圖書館信息資源建設(shè)和服務(wù)的效果。展望未來,如果圖書館利用自己搜集、整理信息和知識的專長,將大量的可用于關(guān)聯(lián)數(shù)據(jù)的信息和知識以關(guān)聯(lián)開放數(shù)據(jù)的形式發(fā)布到網(wǎng)絡(luò)上,那么,圖書館將重新成為人們心目中的知識寶庫。

[1]Linked Data[EB/OL].[2010 -12 -28].http://en.wikipedia.org/wiki/Linked_Data.

[2]黃永文.關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用研究綜述[J].現(xiàn)代圖書情報技術(shù),2010(5):1—7.

[3]Chris Bizer,Richard Cyganiak.How to Publish Linked Data on the Web[EB/OL].[2010 -12 -28].http://www4.wiwiss.fu - berlin.de/bizer/pub/LinkedDataTutorial/.

[4]Linking enterprise data[EB/OL].[2010 -12 -28].http://events.linkeddata.org/ldow2008/papers/21 - servantlinking - enterprise - data.pdf.

[5]如何利用 D2R 發(fā)布 Linked data[EB/OL].[2010-12 -28].http://www.ibm.com/developerworks/cn/web/1003_zhangjing_d2r/index.html.

[6]New York Times - Linked Open Data[EB/OL].[2010 -12 -28].http://data.nytimes.com/.

[7]D2R Server - Publishing Relational Databases on the Semantic Web[EB/OL].[2010 - 12 - 28].http://www4.wiwiss.fu - berlin.de/bizer/d2r- server/.

[8]W3C RDF Validation Service[EB/OL].[2010 -12 -28].http://www.w3.org/RDF/Validator/.

猜你喜歡
關(guān)聯(lián)語義利用
利用min{a,b}的積分表示解決一類絕對值不等式
“苦”的關(guān)聯(lián)
當代陜西(2021年17期)2021-11-06 03:21:36
利用一半進行移多補少
語言與語義
利用數(shù)的分解來思考
Roommate is necessary when far away from home
奇趣搭配
智趣
讀者(2017年5期)2017-02-15 18:04:18
“上”與“下”語義的不對稱性及其認知闡釋
認知范疇模糊與語義模糊
主站蜘蛛池模板: 日韩在线第三页| 色综合成人| 第九色区aⅴ天堂久久香| 日韩精品亚洲人旧成在线| 九色视频在线免费观看| 亚洲国产成熟视频在线多多| 国产真实自在自线免费精品| 亚洲综合激情另类专区| 亚洲无码高清免费视频亚洲 | 久久人体视频| 波多野衣结在线精品二区| 日本成人不卡视频| 国产一级在线观看www色| 亚洲日本韩在线观看| 国产精品冒白浆免费视频| 思思99思思久久最新精品| 亚洲中文字幕国产av| 在线看片免费人成视久网下载| 99热这里只有成人精品国产| 伊人激情综合| 精品国产一区91在线| 一区二区欧美日韩高清免费| 伊人久久福利中文字幕| 激情五月婷婷综合网| 久久黄色一级片| 成年网址网站在线观看| 国产一区二区网站| 久久精品嫩草研究院| 国产爽歪歪免费视频在线观看 | 欧美不卡在线视频| 免费高清毛片| 精品久久综合1区2区3区激情| 欧美伦理一区| 久久综合伊人77777| 999精品色在线观看| 精品一區二區久久久久久久網站 | 在线观看国产黄色| 国产自产视频一区二区三区| 98精品全国免费观看视频| 日韩中文字幕亚洲无线码| 免费一看一级毛片| 欧美亚洲中文精品三区| 亚洲欧美日韩久久精品| 精品成人免费自拍视频| 亚洲热线99精品视频| 五月天久久综合国产一区二区| 精品国产成人三级在线观看| 国产精品yjizz视频网一二区| 国产区成人精品视频| 亚洲国产精品日韩av专区| 精品久久久久久中文字幕女 | av色爱 天堂网| 天天躁夜夜躁狠狠躁图片| 一本色道久久88| 国产精品尤物在线| 久夜色精品国产噜噜| 综合色88| 亚洲IV视频免费在线光看| a国产精品| 精品视频免费在线| 成人av手机在线观看| 国产综合亚洲欧洲区精品无码| 找国产毛片看| 最新午夜男女福利片视频| 亚洲成人动漫在线观看| AV网站中文| 青青青国产视频| 国产欧美另类| 国产清纯在线一区二区WWW| 国产精品3p视频| 国产成人精品午夜视频'| 国产精品熟女亚洲AV麻豆| 色偷偷男人的天堂亚洲av| 99热国产在线精品99| av尤物免费在线观看| av色爱 天堂网| 夜夜操国产| 亚洲香蕉久久| 国产麻豆91网在线看| 亚洲国产成人久久77| AV无码一区二区三区四区| 国产在线八区|