999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

企業關聯數據應用模式與案例綜析

2015-04-29 00:00:00張悅
科技創新導報 2015年10期

摘 要:Tim Berners-Lee提出的“關聯數據”概念目前是圖書館學、情報學、計算機科學、信息管理和信息系統等學科的研究熱點。關聯數據作為語義網的一種實現方式,正在引領一場網絡革命,它不僅使許多新應用付諸實踐,也為一些特殊領域的應用提供了契機。論文分析了關聯數據技術的背景和現狀以及企業應用關聯數據的原因、意義和模式,根據關聯數據的層次模型以及基于關聯數據的企業信息資源集成的目標取向和功能配置構建了企業關聯數據應用模型,在邏輯上將其分為支撐環境層、信息資源層、信息處理層和應用層,并結合Google、BBC和Renault三大公司的應用案例探討了企業如何利用關聯數據技術創新盈利模式、改善效益,為關聯數據在企業的應用提供了參照。

關鍵詞:關聯數據 語義網 企業 應用模式

中圖分類號: G350 文獻標識碼:A 文章編號:1674-098X(2015)04(a)-0000-00

1 概述

關聯數據作為發布數據的途徑之一,可以視為語義網的一種實現方式。它采用RDF數據模型,利用URI命名數據實體,來發布和部署實例數據和類數據,從而實現數據的相互關聯和易于人機理解,并可通過HTTP協議揭示和獲取數據[1]。關聯數據網絡不僅使許多新應用付諸實踐[2],也為一些特殊領域的應用提供了新的契機[3]。

關聯數據網絡可以視為一個與傳統的文件網絡緊密交織并有許多相同屬性的附加層,它包含了各種類型的數據,允許任何人發布數據,對數據表達詞表的選擇沒有限制;此外,實體通過RDF鏈接相連,因而全球數據資源得以廣泛相連,新的數據資源也能夠及時被發現。

開放數據項目(Linking Open Data, LOD)是關聯數據應用的典型案例之一。2007年1月,LOD項目由民間發起并獲得了W3C語義網教育和外聯組織的支持。該項目以通過定義已有并可公開使用的數據集、根據關聯數據原則將其轉換為RDF并上網發布,從而改善數據網絡為目標,早期參與者主要是大學實驗室和小公司的研發人員,隨著項目深入開展,一些大型機構比如BBC、Thomson Reuters和國會圖書館也積極加入。LOD項目的進展得益于它的開放性:參與者只要根據關聯數據原則發布數據集并將其與已有數據集相連即可[4]。據統計,開放數據網絡已包含了300多億條RDF語句,這些語句被逾5億個RDF鏈接相連。

除了LOD項目,關聯數據應用的典型例子還有關聯數據瀏覽器、關聯數據搜索引擎和索引。關聯數據瀏覽器使得用戶能夠通過由RDF語句表達的鏈接在不同的數據源之間瀏覽,結果是用戶可能從一個數據源開始瀏覽并且跟隨RDF逐漸遍歷網絡。Disco超數據瀏覽器則可以被視為超文本瀏覽范例在數據網絡的一項直接應用[6]。關聯數據搜索引擎能夠通過跟蹤RDF鏈接從而在網絡上抓取關聯數據,并且在大量數據中進行檢索[7]。大體上來看,關聯數據搜索引擎可分為兩類,即面向用戶的搜索引擎和面向應用的索引。

關聯數據在具體領域的應用案例亦層出不窮,例如基于關聯數據原則和語義網技術的通用審查和評價網站Revyu,運行于iPhone及其它手機設備上的定位感知的關聯數據瀏覽器DBpedia Mobile,面向大學師生的基于網絡的資源列表管理應用Talis Aspire等等;數據整合平臺DERI Pipes使得數據源能夠相互溝通從而形成新的數據;BBC公司內部則使用關聯數據作為一項輕量級數據集成技術,本文將選取部分具有代表性的案例進行詳細討論。

2 企業應用關聯數據的意義

企業界廣泛采用電子信息系統已經有30多年歷史。隨著各企業全面實施企業資源計劃(ERP)、供應鏈管理(SCM)、客戶關系管理(CRM)和電子商務(EC)等管理信息系統,整合各系統內部及系統之間數據的訪問勢在必行。關聯數據為這一問題提供了答案,它通過整合所有數據的訪問,降低生產運營成本,提高企業現代化管理和科學決策的效率和水平,提升企業核心競爭力,創造經濟效益。

首先,關聯數據可有效實現企業信息資源整合。企業將RDF模型應用于非結構化、半結構化和結構化的數據與內容,可以消除企業內部數據相互分隔的弊端?;赗DF,企業可以通過關聯數據描述信息資源,從而串聯起非結構化、半結構化和結構化的數據與內容,如圖1所示。此外,通過使用關聯數據以及建立在各個數據庫中數據集的鏈接,使得企業各數據庫可以相互鏈接,從而實現數據庫的整合,如圖2所示。當企業、行業、開放式訂閱系統和開放數據都使用相同的命名規則和術語等,關聯數據即可以方便快捷地將其鏈接,有效地整合內部和外部數據。

企業在生產經營過程中,產生了大量自主、異構和分布的數據,包括各種數據庫、文件、電子文檔和網絡資源等,這些數據不僅存在語義異構的問題,而且缺乏統一規劃和標準;由于數據零散分布,企業也難以有效篩選和過濾出所需的特定信息。對于這些遺留模式的數據而言,關聯數據可實現完全的模型化;因為RDF使用標準的數據模型,用戶無需學習特殊語法即可直接操作數據,因此現有模式幾乎完全可重復利用并且易于拓展、更新和變更。企業無需因為商業模式的改變、并購或其它原因而重構遺留的數據模式,通過關聯數據,可以將遺留數據和現有數據進行語義鏈接,從而實現了非重構環境下的數據使用,如圖3,通過使用已有的數據庫管理程序和設施,企業還可以實現內部關聯數據存儲。

此外,企業還可利用關聯數據創建報表模板及實施數據檢索,節省人工操作,降低生產經營成本和風險;數據訪問、分析和操作并推送到用戶層,為企業決策提供科學依據,提高企業現代化管理水平,改善效益。

3 企業關聯數據應用模式

企業數據處理的主要目的就是通過對企業數據的觀察、分析、傳送或進一步處理,推導出對企業有價值的信息,為行動和決策提供依據;通過保存和管理經過處理的企業數據,方便而充分地利用寶貴的信息資源產生利潤。

傳統的企業數據處理主要是事務性的,數據類型主要是結構化的,不同的信息系統采用的數據格式往往也不一樣(即異構數據)。這不僅為企業用戶、系統分析人員、系統設計人員和編程人員之間交流增加了困難,而且當需求發生變化、增加新的需求或者采用新的信息系統后,原有數據(即遺留數據)就需要轉換。這些情況下,常常需要對系統作大量的修改,結果往往是一再返工,甚至推倒重來,不斷增加投資,浪費時間,用戶意見大。

關聯數據為企業提供了一種全新的模式,它對于企業數據處理的各個步驟都提供了極大的便利,包括數據的收集、轉換、篩選、組織、運算、存儲、檢索和輸出等等。關聯數據技術可以整合企業所有的數據:包括內部和外部數據,當前數據和遺留數據,結構化、半結構化和非結構化的數據;并可隨著商業模式的改變或信息系統的升級進行靈活的改變或更新,具有很強的適應性。關聯數據的出現無疑為數據處理的三大難題給出了最佳答案,即數據的存儲形式、利于數據存取的數據結構以及數據檢索的方法。此外,利用關聯數據技術還可促進企業之間的數據交換、共享和開放。

根據關聯數據的層次模型[8]以及基于關聯數據的企業信息資源集成的目標取向和功能配置[9],可以構建企業關聯數據應用模型,在邏輯上可分為4層結構,自下而上分別為支撐環境層、信息資源層、信息處理層和應用層,如圖4。

3.1 支持環境層

支撐環境是企業關聯數據應用模型存在與運行的基礎,可以分為硬件支撐環境和軟件支撐環境。硬件方面主要包括企業存儲設施、服務器、網絡等基礎設施架構;軟件方面主要包括技術支撐,例如數據庫技術、語義網技術、網絡技術、人工智能技術和信息檢索技術等,以及企業經營管理機制和社會政治、經濟環境等。

3.2 信息資源層

該層為資源集成處理層提供豐富的數據源,可分為內部信息源和外部信息源。

企業內部信息源包括企業內部各部門的管理信息系統和內部網絡信息等,它們可提供信息系統運行數據、業務數據、供應商數據、客戶數據等信息資源。外部信息源包括關聯數據開放項目(LOD)、大眾媒體、會議信息、關聯數據搜索引擎等。信息收集則采用人工和自動相結合的方式進行,一方面利用信息檢索法、問卷調查法等方式人工獲取信息資源,另一方面則由企業管理信息系統等自動記錄和生成。

3.3 信息處理層

該層通過分析企業信息資源內部的特定關聯,并利用HTTP和RDF的關聯數據描述方式來加以表達,對企業信息資源進行挖掘、重組和集成。通過抽取、標識、RDF發布,將RDF格式的信息資源生成RDF鏈接,應用手動或自動鏈接的方式實現不同資源之間的語義關聯,從而構建起企業異構和分布信息資源之間的語義鏈接,并將經過處理后的企業信息資源用于界面管理、信息傳遞、功能整合、業務集成等具體應用中。

3.4 應用層

該層能根據用戶需求提供多樣化的關聯數據應用,提供豐富的瀏覽途徑以及信息資源檢索、調用和集成功能。用戶或應用程序可通過統一的入口無縫訪問到集成后的各種關聯數據,獲取SPARQL、關聯數據瀏覽等建立在關聯數據技術上的應用。

4 企業關聯數據應用案例

4.1 Google

直到2007年,Google還無法搜索Flash中包含的非文本信息和其它富媒體中隱含的信息。隨著大數據時代的降臨,網絡信息數據膨脹變大之迅猛,尤其是其中海量的多媒體信息資源呈指數級增長,對Google提出了嚴峻的挑戰。

2009年9月,Google正式支持使用Facebook Share和Yahoo! SearchMonkey的RDFa標記視頻內容。網站管理員可以在HTML中嵌入視頻的描述信息,Google則將這些信息顯示于搜索結果頁面,這可以說是Google在關聯數據上的一次突破。當年11月,Google支持并開放了兩種用于標記結構化數據的開放標準--微格式和 RDFa,并首先應用于搜索結果的摘要,從而在搜索結果中為用戶提供更多詳情,幫助他們了解網頁的價值。如果用戶得到更多信息,從中看出網頁搜索結果與其搜索請求之間的相關程度,他們就更有可能通過點擊查看完整頁面。這種結構化數據也可供用戶網站中的自定義搜索引擎使用,使其能夠顯著加強用戶對自定義搜索引擎行為的控制力度。

在面臨挑戰的兩年內,Google正式支持使用Facebook Share和Yahoo! SearchMonkey的RDFa標記的視頻內容,成功地運用關聯數據技術迎接挑戰并提高了搜索質量。目前,Google可以接受微數據、微格式和RDFa三種標記格式,并支持對評價、人物、商品、商家和組織、食譜、活動和音樂等內容類型進行網頁摘要的豐富,還可接受視頻內容標記并可用于改進搜索結果。關聯數據在Google的成功運用為未來搜索引擎的發展指明了一個方向,即搜索不僅僅局限于簡單的文本信息,更包括了海量豐富的多媒體信息,搜索引擎就是在不斷滿足用戶需求中實現變革和發展,從而變得越來越智能化和人性化。

4.2 BBC

BBC公司(The British Broadcasting Corporation,BBC)內部使用關聯數據作為一項輕量級的數據集成技術。該公司是世界上最大的廣播電視公司之一,運營著大量電臺和電視頻道,傳統情況下,這些電臺電視分別使用不同的內容管理系統(CMS)。然而近年來,BBC公司已開始使用關聯數據技術并使用DBpedia和MusicBrainz作為控制詞表,從而將位于不同地點的相同主題相互鏈接,并且利用公開數據鏈接云(Linking Open Data cloud)中的其它數據擴充內容?;谶@些鏈接,BBC為其所有的音樂和節目建立了關聯數據站點[10]。

BBC的項目支持、音樂挖掘以及自然史內容等都都可被逆向引用至HTML、RDF、JSON等,從而獲取節目、藝術家、種類和產地的同一HTTP URI,并使用概念自有的URI而不是編造新的URI。此外,BBC電臺的大部分音樂都通過一個名為VCS的系統播放--其實質是一個企業規模的MP3播放器。它不僅將音樂插入廣播鏈中,還在內部發布正在播放的音樂的數據。音樂挖掘小組將資源和檔案相鏈接,將音軌和目錄數據以及MusicBrainz音樂家ID相鏈接,并將所得數據插入節目中從而使單個節目可以提供藝術家的演出數據。BBC發布的音樂測試版網站是BBC音樂在線和整個bbc.co.uk數據結構的一次巨大改進。BBC不僅使用關聯數據實現了系統之間基于目標的數據資源集成,還致力于資源公開。為了便于用戶使用BBC數據,BBC將所有的音樂測試版網頁做成了XML、YAML、JSON和RDF版[11],用戶不僅可以通過網頁間的鏈接從音樂鏈至節目,還可以從節目頁面上的專輯曲目反向鏈接至音樂。BBC認為關聯數據技術使其網站和數據的可用性大大增強,用戶體驗得到巨大提升,搜索引擎的查詢效果得到優化,資源的可查找性、可點擊性和可傳播性都得到極大提高。[12]

4.3 Renault

Renault是世界十大汽車公司之一,關聯數據為阻礙其IS結構的兩大難題--數據存儲和服務--提供了有效的解決方案;并提供了一個易于啟動和鏈接的REST服務結構。Renault將關聯數據原則付諸實踐并促進了語義網技術在公司內部的應用,包括將數據倉儲作為關聯數據發布、實施了一個簡單的RDF瀏覽器、從外部應用訪問已發布數據的樣品并研究了關聯數據相關問題等等。

Renault選擇其售后維修文件部門創建的數據庫進行嘗試和探索,該數據庫也是文件作者在描述維修方法時可能用到的術語詞典,其主要功能就是賦予所有文件對事物共同的命名方案。這些術語被譯成不同語言,然后按照一個類似SKOS的層級進行分類;并且該數據庫也包含一個到不同部門的數據集的鏈接,每個部門負責將一列所謂“通用部分”與各個術語相連。首先,Renault為數據庫構造了URI。其次,在引用非信息資源的URI時,Renault采用了逆向引用非信息資源的URI,即當代理獲得了一個非信息資源的URI,程序組件必須回應以一個303 HTTP 狀態代碼,并且重新定向至信息資源的URI,該信息資源最符合該請求的接收HTTP header的偏好。最后,Renault使用客戶端的java腳本從RDF數據產生頁面,該方法的優點有:提供了“觀點”和“模型”的清晰分離以及先前的GUI小部件的重復利用;減少了服務器上的下載;使得無需發送新請求到服務器即可改變客戶端的顯示成為可能;允許增加RDF寄存[2]。Renault使用java和java腳本將數據庫作為關聯數據發布,它由一個程序組件構成,該程序組件使用包含RDF數據的Jena模型,并可在遵循非信息資源的原則下保證逆向引用URI。

關聯數據原則對網絡和公司信息系統同樣有益。在Renault公司一項關于語義網技術的發布中,他們發布了一個關聯數據庫并展示了如何從外部應用連至所需服務。大部分代碼可重復利用且可擴展,比如他們可以在短期內發布由SOAP網絡服務提供的數據RDF。

整合一個大公司的異構應用和數據源代價十分高昂,使用語義網技術可以大量裁減花費;通過RDF這一成熟的標準,公司在數據模型的交流、整合以及查詢信息方面將更為方便。這一案例證明了利用數據關聯技術可以極大地促進公司的數據整合、交流和查詢。Renault公司的實踐改善了RDF瀏覽器并實施了基于被逆向引用的資源類型而自定義描述的模板,減少了客戶端應用開發的費用。

5 結語

關聯數據作為語義網的一種實現方式,正在引領一場網絡革命。關聯數據網絡不僅使許多新應用付諸實踐,也為一些特殊領域的應用提供了契機。關聯數據可為企業帶來諸多益處,企業通過使用關聯數據創新盈利模式,改善效益。關聯數據為企業數據處理的各個步驟都提供了極大的便利,它不僅可以整合企業所有的數據還可隨著商業模式的改變或信息系統的升級進行靈活的改變或更新,具有很強的適應性。此外它還可促進企業之間的數據交換、共享和開放。根據關聯數據的層次模型以及基于關聯數據的企業信息資源集成的目標取向和功能配置,本文構建了企業關聯數據應用模型,在邏輯上可分為4層結構,自下而上分別為支撐環境層、信息資源層、信息處理層和應用層,為關聯數據在企業的具體應用提供了參照。

一些國外企業成功應用關聯數據技術獲得效益的經驗對于企業界具有重要指導意義。Google運用關聯數據技術支持使用Facebook Share和Yahoo! SearchMonkey的RDFa標記的視頻內容,從而解決了不能搜索富媒體內容的難題,并嘗試了開放和支持標記結構化數據。BBC公司內部使用關聯數據技術并使用DBpedia和MusicBrainz作為控制詞表,從而將位于不同地點的相同主題相互鏈接,并且利用公開數據鏈接云中的其它數據擴充內容;基于這些鏈接,BBC為其所有音樂和節目建立了關聯數據站點。Renault公司發布了一個關聯數據庫并展示了如何從外部應用連至所需服務,證明了利用數據關聯技術可以極大地促進公司的數據整合、交流和查詢。隨著研究的日益深化以及技術難題的逐步解決,關聯數據在企業中的應用也日趨廣泛。

參考文獻

[1] Structured Dynamics LLC. Linked Data FAQ [EB/OL]. http://structureddynamics.com/linked_data.html.2014-2-22.

[2] Aman Shakya, Hideaki Takeda, Vilas Wuwongse. Community-driven linked data authoring and production of consolidated linked data[J], International Journal on Semantic Web and Information Systems[J], 2009, 5(3): pp.23-48.

[3] Fran?ois-Paul Servant. Linking enterprise data[EB/OL]. http://events.linkeddata.org/ldow2008/papers/21-servant-linking-enterprise-data.pdf. 2014-2-25.

[4] Tim Berners-Lee. Linked data[EB/OL]. http://www.w3.org/DesignIssues/LinkedData.html. 2014-3-7.

[5] Christian Bizer, Tom Heath, Tim Berners-Lee. Linked data-the story so far[J], International Journal on Semantic Web and Information Systems, 2009, 5(3): pp.1-22.

[6] Chris Bizer, Tobias Gau?. Disco - Hyperdata Browser [EB/OL]. http://www4.wiwiss.fu-berlin.de/bizer/ng4j/disco. 2014-3-16.

[7] Gong Cheng, Yuzhong Qu. Searching linked objects with Falcons: approach, implementation and evaluation[J], Internation Journal on Semantic Web and Information Systems, 2009, 5(3): pp.49-70.

[8] 潘有能,張悅. 關聯數據研究與應用進展[J], 情報科學, 2011, 29(1):pp.124-130.

[9] 吳泱. 關聯數據驅動的企業信息資源集成研究[D]. 碩士學位論文, 華中師范大學, 2012.

[10] Guy Strelitz. Music beta and linked data[EB/OL]. http://www.bbc.co.uk/blogs/radiolabs/2008/07/music_beta_and_linked_data.shtml. 2014-3-21.

[11] Martin Belam. A history of linked data at the BBC[EB/OL]. http://blogs.journalism.co.uk/editors/2010/02/24/a-history-of-linked-data-at-the-bbc/. 2014-3-23.

[12] 劉煒. 關聯數據:概念、技術及應用展望[J], 大學圖書館學報, 2011(2):pp.5-12.

作者簡介:張悅,(1988 - ),女,碩士,浙江大學城市學院圖書館助理館員。

主站蜘蛛池模板: 91麻豆国产视频| 一级毛片免费播放视频| 中文字幕亚洲精品2页| 欧美日本在线| 国产黄色视频综合| 9丨情侣偷在线精品国产| 不卡无码网| 国产97视频在线| 无码人妻热线精品视频| 美女高潮全身流白浆福利区| 香蕉国产精品视频| 性欧美精品xxxx| 国产91精品久久| 国产香蕉在线视频| 亚洲综合精品第一页| 国产一区二区三区精品久久呦| 日韩欧美国产三级| 九色在线视频导航91| 久久精品无码中文字幕| 亚洲美女视频一区| 国产女人18水真多毛片18精品| 人妻精品久久久无码区色视| 欧美色图久久| 免费va国产在线观看| 亚洲美女一区| 成人福利免费在线观看| 亚洲另类第一页| 人人爱天天做夜夜爽| 国产精品久久自在自线观看| 国产白浆一区二区三区视频在线| 国产精品视频猛进猛出| 欧美国产日本高清不卡| 亚洲首页国产精品丝袜| 九色视频最新网址| 99久视频| 亚洲综合久久成人AV| www.91中文字幕| 91日本在线观看亚洲精品| 亚洲精品在线观看91| 精品国产一二三区| 极品性荡少妇一区二区色欲| 91av成人日本不卡三区| 国产精品妖精视频| 无码网站免费观看| 国产又粗又猛又爽视频| 亚洲,国产,日韩,综合一区| 欧美午夜理伦三级在线观看| 国产精品国产主播在线观看| 国产人成网线在线播放va| 91在线播放国产| 国产黄在线免费观看| 欧美精品不卡| 香蕉视频在线观看www| 97青青青国产在线播放| 无码AV日韩一二三区| 国模视频一区二区| 亚洲一区二区成人| 中国毛片网| 一级一级特黄女人精品毛片| 国产男女XX00免费观看| 久久久久亚洲Av片无码观看| 国产成人8x视频一区二区| 精品人妻一区无码视频| 亚洲永久精品ww47国产| 国产日韩久久久久无码精品| 欧美激情首页| 久久久久无码精品| 在线国产91| 伊人色在线视频| 99精品在线看| 国产成人av大片在线播放| 国产高清在线观看91精品| 亚洲欧美另类视频| 99视频在线观看免费| 亚洲精选高清无码| 亚洲aaa视频| 夜夜操天天摸| 亚洲精选高清无码| 欧美午夜小视频| 亚洲天堂精品在线| 国产剧情伊人| 亚洲综合色吧|