金翼
摘 要:隨著語義關聯時代的到來,數字圖書館資源的組織與服務方式必然發生巨大變革。圖書館關聯數據是真正意義上的數據開放,既對圖書館的用戶開放,也對全球的網絡用戶開放。關聯數據在圖書館中的具體應用主要在三個方面,即圖書館資源可發布為關聯數據,可利用關聯數據擴展資源與發現服務以及利用關聯數據實現數據融合與語義檢索服務,這對推動圖書館融入數據網絡服務具有一定的積極作用。
關鍵詞:關聯數據;圖書館;基本模式;數據網絡服務
中圖分類號:G250.7 文獻標識碼:A 文章編號:2095-7394(2017)03-0114-04
多年來, 文獻資源檢索與提供利用一直是圖書館信息服務的核心。傳統的信息服務是人們所熟知的,當然仍然具有一定的使用價值,但將用戶需求等同于文獻檢索是非常機械的,而那些超出文獻檢索的需求又應該如何處理呢?在信息時代的當下,這種服務顯然已不能滿足人們的需求了。如果說知識發現是公共圖書館服務重要內容之一,那么,關聯數據(Linked Data)則為此種服務提供了極佳的途徑。2006年7月,“互聯網之父”蒂姆·伯納斯-李(Timothy John Berners-Lee,1955-)提出關聯數據以來,關聯數據在短時間內便成為互聯網研究與應用的新寵。隨后,關聯數據應用之廣令人難以想象,它不僅應用于媒介,如英國廣播公司(BBC)、紐約時報和路透社等,而且應用于政府層面,如美國與英國政府的政府信息等。2008年,瑞典國家圖書館(National Library of Sweden)率先以關聯數據形式發布LIBRIS(Library Resources Information System,即圖書館資源信息系統)國家書目,兩年后便有20多個圖書館的關聯數據集。甚至連美國國會圖書館(The Library of Congress)也采用關聯數據技術。關聯數據可以將圖書館的知識或資源與外部世界連接起來,為讀者或用戶提供了更加便利和全面的服務,更為重要的是,它可創造更有價值的知識或資源。因此,圖書館利用關聯數據,并整合不同的知識或資源,盡可能接近支持用戶解決問題的目標。[1]關聯數據對圖書館的意義越來越重大,它對于將全球圖書館的數據進行互通互聯,并為用戶提供新的服務內容和服務方式,都具有重要的作用。
一、關聯數據及其基本模式
什么是關聯數據呢?所謂關聯數據,指國際互聯網協會(World Wide Web Consortium,W3C)所推薦的一種規范,用以發布與聯接各種數據、信息與知識。它是基于萬維網而建立的一個數據網絡,包括所有的自然、社會與精神世界。如此一來,世界萬事萬物及其相互關系都可進行機器可讀描述,使互聯網成為真正意義上的互聯互通,使任何一個用戶不僅可查找,而且還可分享和利用這些相互關聯的數據、信息與知識。[2]其實,關聯數據的定義繁多,其中,最常用的或許就是維基百科的定義:關聯數據是語義網的主題之一,它描述了通過可鏈接的URI(Uniform Resource Identifier,即統一資源標識符)方式來發布、分享、鏈接WEB中的各類資源的一種方法。[3]
關聯數據有兩種基本模式:1)瀏覽器/服務器模式(Browser / Server);2)客戶端/服務器模式(Client / Server)。瀏覽器/服務器模式指人們通過瀏覽器便可以非常便利地訪問相關的關聯數據;而客戶端/服務器模式則指應用的系統,她實指系統與系統之間所進行的數據與數據之間的傳遞。但在兩種模式中,關聯數據都必須通過HTTP(Hyper-Text Transfer Protocol,即超文本傳輸協議)來進行數據傳遞。
眾所周知,作為一種網絡技術,關聯數據與圖書情報工作極為相關。當互聯網發展到當下的語義網時代(the Age of the Semantic Web),作為一種基礎技術的關聯數據,可對所有網上的資源進行編目與控制。關聯數據也是數字圖書館發布信息資源和提供服務的一種核心技術。
二、關聯數據之應用于圖書館
21世紀,關聯數據之應用于圖書館不僅可提高自身的對讀者的服務意識,也可增強自身在資源或知識方面的核心競爭力。如果要解決這些問題,那么,知識集成與資源發現就成為了圖書館一個關鍵問題。關聯數據就是一種極佳的途徑。關聯數據具有以下特點:框架簡潔、去中心化、標準化、自助化、低成本,因而得到快速發展與應用。[4]現在,許多政府部門、國際組織、研究機構、大型傳媒、商業企業等,始建自己的關聯數據。圖書館既能將其數據發布為關聯數據,并提供利用以及與之相關的各種服務,又能將數據網絡引入圖書館的服務之中。[5]
(一)將圖書館資源發布為關聯數據
關聯數據可增強也可擴展圖書館的資源發現平臺,也可以創造這樣一個機會,即將圖書館的資源與外界相互聯接成一個網絡。隨著我國互聯網的快速發展,關聯數據也得到了很好的發展,并且其應用前景非常廣泛。萬維網聯盟(國際互聯網協會)宣布,SKOS(Simple Knowledge Organization System,即簡單知識組織系統)已經全面關聯數據化了。對圖書館而言,這是極具里程碑的意義的。目前,國外在關聯數據的應用方面比較發達,如一些圖書館開始采用RDF(Resource Description Framework,資源描述框架)和關聯數據。國外對關聯數據的應用確實有很多值得學習的地方,如瑞典國家圖書館、德國國家經濟學圖書館(Deutsche Zentralbibliothek für Wirtschaftswissenschaften,ZBW)等,都在采用RDF和關聯數據。[6]
關聯數據的應用可以推動和推廣圖書館關聯數據的新的應用模式與途徑。一般而言,圖書館通過四個步驟而將相關的關聯數據集發布于網絡,如安裝D2R Server軟件,自動生成D2RQ mapping文件(RDF格式數據)等,然后發布于網絡,在與網上其他數據集關聯。[7]
瑞典是世界上第一個將書目數據發布成關聯數據的聯合目錄的國家。目前,瑞典皇家圖書館已創建從聯合目錄到DBpedia(資料庫百科全書)的鏈接。其經驗與方法值得其他圖書館學習和借鑒,包括我國的圖書館。美國國會圖書館也以SKOS的格式來將國會標題表LCSH(Library of Congress Subject Headings,即美國國會圖書館編制的一部大型綜合性標題表)全部關聯數據化,它也提供LCSH詞表的相關下載。這自然就能更好推動關聯數據之于圖書館的進一步應用與發展。另外,美國國會圖書館也創建不同資源之間的關聯,如LIBRIS和LCSH之間的關聯等。通過應用關聯數據,使美國國會圖書館服務器的負載得到有效降低,提高對圖書館資源查詢的效率。它也作為其他圖書館的效仿的對象。
圖書館一方面,可利用館內的關聯數據或知識;另一方面,也可將許多獨具特色的數據發布成關聯數據,以便于世界上其他資源或知識形成一個又一個的網絡,以提高服務質量。因此,圖書館既可以擴展其關聯數據,又可以增強其自身的公共價值與社會凝聚力。
(二) 利用關聯數據擴展資源和發現服務
圖書館必須為讀者或用戶提供高質量的知識資源服務,就必須鏈接其他機構的知識資源,與此同時,相關的關鏈接又可以擴大圖書館的知識資源的使用范圍。[8]目前,許多圖書館已開始擴展相關資源,并實施資源發現服務,如AquaBrowser、Encore、Endeca及Primo等的使用便是如此。這既可以擴展和豐富目錄的檢索界面功能,提高讀者或用戶對圖書館資源的發現與使用率,又可以利用圖書館資源發現服務,使讀者或用戶可隨時瀏覽圖書館動態更新的結果。
隨著網絡技術的發展,圖書館的書目目錄信息也在不斷變化,且增加了很多額外的信息,如目次、圖書封皮及評論的鏈接。關聯數據技術改變了傳統的服務方式,因它主要以記錄為中心。關聯數據從不同分面展示資源,并從第三方鏈入圖書館資源,而提供書目數據以外的信息,如如人、地點、出版信息及教學信息等。Open Library便是其中的代表。Open Library旨在成為全球最大最全的圖書目錄。[9]該方法對圖書館資源查詢具有一定的方便性,但其僅限于書目層次上的信息。在此,關聯數據可以擴展圖書館的書目信息,并提供結構化的數據基礎,從而使其超越圖書館的資源或知識,并提供新各種不同的資源服務。關聯數據可以使圖書館關聯更加廣泛的信息資源或知識,以便于讀者或用戶利用關聯數據擴展資源發現服務;它也可幫助用戶判斷其所需要的圖書館資源信息,還可提供圖書館以外的資源或知識。
現在,可以利用關聯數據的倉儲庫與搜索引擎來擴展圖書館的資源及知識的范圍。上海圖書館應用以關聯數據為代表的新型數據管理技術,其家譜數據,既可以滿足一般用戶的尋根服務,又可以為人文研究者提供語義搜索、可視化瀏覽及知識挖掘服務,這有助于促進知識的流動,推動數據的開放,充分發揮圖書館的潛在價值。[10]
關聯數據可通過某一點關聯并集成更為廣泛的信息資源,基于語義關系二揭示更豐富的知識與知識之間關系,從而為開展知識服務提供重要保障。關聯數據還可深入和拓展使圖書館的服務方式與范圍。就學術成果傳播而言,可以利用關聯數據,整合并集成相關內容,如研究人員、參加會議、科研項目、所屬機構、研究成果等,實現學術資源推薦服務。而在出版方面,關聯數據也開始參與出版物描述與導航功能的改善、出版物的自動評估及引用檢索等。可見,關聯數據起了關鍵作用,它提供了新的查詢服務、資源與知識訪問。
(三)利用關聯數據實現數據融合與語義檢索服務
在關聯數據云圖中,許多關聯資源可以作為圖書館的資源庫和知識庫,以便為讀者和用戶提供更加多樣、更加豐富的檢索結果。
在語義關聯的時代背景下,有這樣一種越來越明顯的趨勢,即科學數據與其他領域的數據之間相互融合以及數據與數據之間的關聯、交換和利用。作為信心資源與知識的中心之一的圖書館與其他機構的數據關聯、識別和交換也更加頻繁,其數據與其他數據的融合度也就愈高。同時,圖書館也承擔更多的責任與義務,如幫助研究者管理其創建的數據等。
在圖書館檢索系統如OPAL(Open Phone Abstraction Library)等中,用戶只能檢索作者、主題、題名等,卻無相關鏈接或關聯的知識檢索與知識發現等服務。關聯數據則能研究相關知識的網絡關系。計算機技術的發展導致不同數據之間進行交換和利用的頻率增加,同樣,對圖書館的資源數據信息與其它組織的數據之間進行交換和識別也愈發簡便,如此就增加了數據與數據之間的融合度。有鑒于此,圖書館極為重視數據與數據之間的融合。同時,圖書館在數據的融合方面也發揮巨大的作用。圖書館與其他機構,如博物館、數據存儲機構等之間的合作也越來越緊密,如CultureSampo是芬蘭文化記憶的語義WEB門戶,也是博物館開放數據之一例。
作為歐洲國家圖書館的數字資源門戶,Europeana能聚合圖書館、文化機構與圖書館對象的元數據等。這種數字資源重視門戶對門戶的相互操作性,它采用SKOS和其他元數據模式。采用數字資源門戶的語義檢索服務能更好地幫助讀者和用戶查詢相關資源信息,查詢出的結果也更準確、更有實際意義。使用該檢索服務模式,能把檢索詞匹配到名字、概念、地點、日期以及題名等相關信息。另外,通過Europeana,EuropeanaConnect可以引入語義層,以便在對象之間建立語義鏈接。
目前,我國國內有關關聯數據技術的研究尚處于起步探索階段。2015年,由上海圖書館與上海科學技術情報研究所共同開發的上海圖書館開放數據平臺向互聯網公開發布了各種術語表、規范檔、書目數據等開放關聯數據集,在國內率先推出了基于關聯數據的數字人文服務。[11]
三、結語
伴隨互聯網發展而來的語義關聯時代的來臨,我國圖書館急需擴展和豐富相關的信息資源服務的手段與方法,提供更好的數據資源服務。科學技術的發展日新月異,圖書館的相關管理及技術也要努力發展,只有這樣,才能趕上時代的步伐,才能不斷滿足讀者和用戶的需求,以確保圖書館的信息資源和數據資源服務更加具有競爭力。而關聯數據在圖書館中的應用便很好地解決了這個問題,對我國圖書館事業的發展具有里程碑的意義。有些圖書館將擺脫實體存在,以便為科研、教學及社會機構的決策等提供更多的互聯網數據服務。關聯數據通過互聯網而使全世界的知識連成一體,而最終成為“大數據”。關聯數據將加強并拓展知識與知識之間的聯系。關聯數據技術在圖書館中的應用及其發展將使圖書情報成為真正的數據資源服務和知識服務。
參考文獻:
[1] 羅錚. 高校圖書館應用關聯數據的意義及注意事項[J]. 圖書館雜志,2012(5):50-57.
[2] 劉煒. 關聯數據:概念、技術及應用展望[J]. 大學圖書館學報,2011(4):5-12.
[3] 黃永文. 關聯數據在圖書館中的應用研究綜述[J]. 現代圖書情報技術,2010(5):17-25.
[4] 白海燕. 關聯數據及DBpedia實例分析[J]. 現代圖書情報技術,2010(3):39-45.
[5] 林海青,樓向英,夏翠娟. 圖書館關聯數據:機會與挑戰[J]. 中國圖書館學報,2012(1):60-69,114.
[6] 徐華. 關聯數據在國外圖書館的應用及其借鑒意義[J]. 圖書館學研究,2011(8):62-67.
[7] 譚潔清. 關聯數據的簡介與進展[J]. 信息與電腦,2011(1):103,106.
[8] 黃永文. 技術,關聯數據在圖書館中的應用研究綜述[J]. 現代圖書情報,2010(5):1-7.
[9] Welcome to Open Library (Open Library)[EB / OL]. [2016-12-24]. http://openlibrary.org/.
[10] 夏翠娟. 家譜關聯數據服務平臺的開發實踐[J]. 中國圖書館學報,2016(3):27-38.
[11] 曹月珍. 關聯數據在圖書館的最新發展[J]. 圖書館學研究,2014(14):6-12.
The Application of Linked Data in the Library
JIN Yi
(Library, Jiangsu University of Technology, Changzhou 213001, China)
Abstract: With the advent of the age of semantic relations, the organization and service of digital resources of libraries must be a huge change. Linked data used in the library is really open data, which is open to both library users and the global Internet users. This article sums up the definition and the basic model of linked data. And it also analyses the actual uses of linked data in library, in terms of the following three aspects: library resources being released for linked data, using the linked data to extend and discover services, and utilizing linked data to realize data fusion and semantic retrieval service. All of this will positively promote libraries to be integrated into data network.
Key words: linked data; libraries; basic mode; data network service
責任編輯 徐 晶