齊云飛 趙宇翔 朱慶華
摘 要:為滿足數字圖書館語義化資源整合與發現需要,文章提出了基于書目框架(BIBFRAME)的數字圖書館語義搜索框架,并對資源的語義化描述、組織和搜索過程以及各模塊的功能進行了設計和說明。最后,通過搭建實驗系統對框架功能進行測試,實驗結果表明,系統滿足了預期的功能需求,提出的數字圖書館語義搜索框架具有較好的科學性和有效性。
關鍵詞:書目框架;數字圖書館;關聯數據;資源整合;語義搜索
中圖分類號:G250.76 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2017010
Abstract This paper proposes the semantic search framework in digital library to meet the needs of resource integration and discovery. On the basis, the author introduces the process of semantic description, organization, and search, as well as the function of each module. Furthermore, an experiment system is constructed to verify the function of the framework. The results show that the system meets the functional requirements, and the semantic search framework of digital library is scientific and efficient.
Key words BIBFRAME; digital library; linked data; resource integration; semantic search
隨著分布式存儲、云計算等信息技術的快速發展,互聯網已經成為用戶發布、獲取信息的主要渠道,以知識服務為核心的圖書館正面臨著用戶流失的風險[1]。數字圖書館作為數字資源的存儲、組織和傳播中心,實現了圖書館功能向互聯網的延伸,代表了圖書館未來的發展方向。然而,在網絡信息高速發展的今天,數字圖書館仍然無法真正融入開放的互聯網絡,且面臨著多個方面的發展困境,如:核心資源主要來源于長期的館藏積累,數據量少,更新慢,且不完整;資源組織方面仍然采用圖書館特有的MARC元數據,編目信息缺少通用性和可讀性,無法適用互聯網多來源異構、多類型、多粒度資源的整合需要;仍然采用基于關鍵詞的檢索方式,缺少對檢索語句的語義解讀,無法發現深層的用戶需求。
語義搜索是基于語義網技術提出的全新的資源搜索方法,其能夠從語義層面識別用戶的檢索請求[2],以機器可理解的方式對資源及資源間的關系進行語義描述和組織,并通過邏輯推理實現資源的語義檢索[3]。本體是實現語義搜索的基礎,其與關聯數據的結合可以有效解決多來源、多領域、多類型資源的整合問題[4]。書目框架(BIBFRAME)是美國國會圖書館提出的新一代編目本體。與MARC元數據不同,BIBFRAME采用本體的方式對資源進行描述,并通過關聯數據進行發布。本文基于BIBFRAME提出了一種數字圖書館的語義搜索框架,該框架融合了關聯數據、自然語言處理、SPARQL搜索等相關技術,實現了信息的語義整合、需求的語義識別和資源的語義搜索。以為解決數字圖書館語義整合和搜索提供了經驗。
1 數字圖書館語義搜索分析
1.1 語義搜索概述
語義搜索的出現源于語義網這一概念的提出[2]。根據蒂姆·伯納斯·李的構想,語義網環境下所有的資源具有唯一的URI,資源之間通過語義關系進行關聯,整個互聯網被聚合成為一個巨大的數據庫,通過語義搜索為各個領域提供知識發現和決策支持服務[5]。語義搜索作為語義網環境下新一代的知識獲取方式,涉及信息檢索、人工智能、語義網挖掘等眾多研究領域[6],許多研究者將本體、關聯數據、自然語言處理等技術應用于語義搜索,取得了豐碩的研究成果[3]。
在資源組織方面,本體是語義搜索的基礎[2],本體中的抽象概念可以對資源進行聚類,屬性可以描述資源間豐富的語義關系,基于本體構建的概念模型是結構化、語義化資源組織的重要工具。目前,許多研究者探索了本體在非結構化信息描述[7] 、元數據轉換[8]和移動語義搜索中的應用[9-10]。在語義編碼方面,關聯數據是本體發布和映射的主要方式,其采用三元組對語義關系進行描述,通過RDF對概念模型進行編碼,并支持以RDF圖的形式進行基于推理的關系發現和語義檢索[11-16]。在自動化處理方面,自然語言處理技術提供了高效和智能的語義處理,可以解決搜索過程中的語義標注[17-18]、語義識別[19-21]、語義排序[22]和搜索評價[23]等問題。
1.2 數字圖書館語義搜索
語義搜索具有廣闊的發展前景,許多研究者從互聯網、生物、醫療、旅游等眾多領域探索了其在網絡內容監管[24-25]、極地數據分析[26]、用戶生成內容挖掘[27-28]、學科知識服務[29]等方面的應用。在數字圖書館領域,我們認為語義搜索同樣具有重要的價值:(1)在海量資源管理方面,基于本體的資源描述可以更好的實現數字圖書館資源的組織與整合;(2)在編目數據序列化方面,基于關聯數據的編目信息具有更好的通用性和可讀性。通過關聯數據云技術,數字圖書館可以更方便的分享館藏信息,提高互聯網環境下的資源可見度;(3)在資源語義檢索方面,基于語義的檢索方式可以更有效的發掘資源內涵、理解用戶需求,提供更全面、更準確的知識發現服務。
同時,筆者也認為數字圖書館在實現語義搜索方面存在著巨大的優勢:(1)數字圖書館采用結構化的資源描述和組織方式,專業人員編輯的書目數據提供了豐富的語義信息,這些信息在揭示資源內涵方面發揮著重要的作用;(2)語義網一直是圖書館領域的研究熱點,許多受控詞表、本體模型已經通過關聯數據進行發布。BIBFRAME是美國國會圖書館基于關聯數據發布的新一代編目本體,其代表了編目格式未來的發展趨勢。通過上述分析,筆者認為BIBFRAME作為圖書館領域的編目本體,具有強大的語義描述和組織功能,如果將其與語義搜索技術結合將可以有效的推動數字圖書館知識服務的創新與變革。
2 BIBFRAME概述
2.1 BIBFRAME的產生與發展
2011年5 月,美國國會圖書館開始了“書目框架轉換活動”計劃,旨在解決傳統MARC數據向關聯數據的轉化問題。次 年11月,又發布了書目框架的模型草案(BIBFRAME1.0),隨后陸續修訂、完善了元數據、轉換工具、測試數據集等相關內容。BIBFRAME提出后受到了業界極大的關注,美國國會圖書館聯合英國國家圖書館等機構對BIBFRAME的功能性和交互性進行了大量研究和測試,并于2016年1月提出了最新的修訂版本BIBFRAME2.0。
2.2 BIBFRAME的特點
BIBFRAME作為新一代的圖書館編目標準,其目標是打破傳統OPAC系統的封閉性,實現互聯網資源與圖書館資源的整合與共享,使圖書館真正融入以互聯網為核心的現代信息社會[1]。對此,BIBFRAME采用了全新的資源描述和組織方式。
(1)構建層次化的概念模型。BIBFRAME2.0將資源統一抽象為作品、實例和單件三個核心類,其他的類和屬性均與這三個類進行關聯(見圖1)。作品是對資源本質的概念化描述,與其相關的是主題、責任者、事件等內容。實例反映的是作品的一個具體版本,與其相關的是作品的出版信息。單件反映的是作品的一個具體副本,與其相關的是副本的館藏信息。本文通過構建層次化的概念模型,BIBFRAME對圖書館編目數據進行了層次劃分,實現了不同主題的資源描述。
(2)明確定義實體類型和屬性。BIBFRAME明確規定了作品、實例支持的實體類型,并以子類的形式進行規范。如明確規定作品支持的實體為文本、地圖、音頻等11種類型。實例支持的出版物為印刷版、手稿、電子版等5種類型。在實體關系方面,BIBFRAME在描述的通用性和專業性上作出了平衡,制定了合理的屬性用于描述實體內部和實體間的關系。
(3)采用語義網和關聯數據技術。BIBFRAME接受了語義網的思想,采用實體-關系的方式構建概念模型,實現了編目數據的層次化組織。在概念模型和內容規則方面,BIBFRAME充分借鑒了已有的RDA、Schema.org等標準,堅持復用已有的本體術語,從而保持了數據的兼容性;在編碼方式方面,采用RDF/RDFS、OWL等關聯數據和本體描述語言進行編碼和發布,為基于關聯數據的資源整合和SPARQL搜索提供了支持。
2.3 BIBFRAME的應用
為推動BIBFRAME的發展,美國國會圖書館開發了BIBFRAME的編輯、比較和轉化工具,并聯合英國國家圖書館等機構發布了BIBFRAME的數據集。此外,美國國會圖書館還開通了針對BIBFRAME的應用注冊服務,目前已經有15家機構參與其中。BIBFRAME的快速發展同樣引起了國內圖書館領域學者的關注。劉煒[20]、夏翠娟[1]等國內較早開展相關研究的學者詳細介紹了BIBFRAME的內涵和特點,并對其在語義網和家譜本體方面的應用進行了深入的研究;安小麗等[33]研究了BIBFRAME對圖書館工作帶來的變革;婁秀明和危紅[34]介紹了從MARC到BIBFRAME編目格式的發展歷程,并對BIBFRAME的實踐進行了探索;胡小菁[35]深入分析了BIBFRAME模型變化的原因,并對其發展方向進行了研究;李勇文[36]對BIBFRAME的數據模型、應用規則等進行分析,提出了BIBFRAME的實踐策略。目前,關于BIBFRAME的研究主要集中在圖書館資源描述和組織方面,而將其應用于資源語義整合和搜索的研究還很少,尤其是在具體的系統設計方面還沒有實際的研究案例。
3 基于BIBFRAME的數字圖書館語義搜索框架
3.1 功能需求
本研究提出的數字圖書館語義搜索主要實現三個方面的功能:(1)實現互聯網資源的語義化描述與整合。互聯網環境下,數字圖書館需要面對網絡用戶、數字出版商和圖書館同行等的信息交互與共享需求,為了提供完整、準確的知識服務,語義搜索系統要能夠適應不同的資源描述方式,實現異構資源組織與整合;(2)實現用戶需求的語義化解讀。用戶在訪問數字圖書館時通常采用自然語言進行檢索,語義搜索系統要能夠識別檢索語句中的實體對象和深層語義,理解用戶真正的檢索需求;(3)實現資源的語義化搜索。語義搜索系統要支持對語義關系的描述和基于推理的檢索,提供全面、準確的知識發現服務。
3.2 系統架構
針對上述需求,本研究提出了基于BIBFRAME的數字圖書館語義搜索框架(見圖2),該框架主要包括七個核心模塊,實線箭頭顯示了資源的構建過程,虛線箭頭顯示了資源的檢索過程。資源的構建過程主要通過模型構建、模型映射、模型編碼和語義存儲四個模塊實現。首先,模型構建模塊負責基于BIBFRAME構建資源描述的概念模型。模型映射模塊則負責對外部數據進行整合。由于外部數據通常采用不同的描述格式,所以需要采用差異化的映射方式;然后,模型編碼模塊對上述模塊生成的描述信息進行關聯數據編碼,生成機器可理解的RDF文件;最后,語義存儲模塊將生成的RDF數據存入三元組數據庫,并提供添加、刪除、查找等數據管理功能。資源的搜索過程主要通過檢索語句處理、檢索語句轉換和SPARQL搜索三個模塊實現。首先,檢索語句處理模塊對用戶檢索式進行語義分析,通過自然語言處理技術提取其中的本體術語和命名實體;然后,檢索語句轉換模塊對提取到的本體和實體詞匯進行標注,并將其轉化為SPARQL檢索語句;最后,SPARQL搜索模塊對數據庫進行檢索,并將結果返回用戶。
3.3 系統模塊
(1)模型構建模塊。該模塊主要負責基于BIBFRAME構建概念模型對圖書館本地資源進行描述,具體功能包括:本體模型構建和實體構建。本體模型構建主要根據BIBFRAME構建概念描述模型。因為BIBFRAME已經進行了較為詳細的類和屬性定義,所以構建過程中主要對類的約束、關系(等價、互斥)和屬性特性(功能、傳遞、對稱、反身)等進行定義。實體構建主要定義實體所屬的類,以及實體之間的屬性關系。
(2)模型映射模塊。模型映射模塊主要負責從結構和內容兩個方面對外部異構信息進行整合。BIBFRAME提供了作品、實例、單件構成的層次模型,每個核心類分別對應了不同的描述主題(見表1),能夠實現不同粒度的資源描述。
①整合策略。系統需要根據外部資源類型選擇合適的概念層次對信息進行整合。對于海量的網絡用戶生成內容(User Generated Content,UGC)由于缺少明確的出版和館藏信息可以在作品層進行描述,通過添加標題、作者、主題等信息實現數字圖書館對網絡資源的整合。對于出版機構可以在作品層和實例層進行描述,實現數字圖書館與出版機構資源的交互與共享。對于圖書館同行之間的信息整合可以在作品、實例、單件三層進行,實現完整的書目信息整合;②整合方法。在結構方面,對于非結構化的外部信息,系統需要根據整合策略為其補充相應的描述信息。對于基于不同本體的異構信息,系統首先需要設置本體之間的等價關系(等價類、等價屬性、等價實體),然后通過推理實現本體模型和實體數據的整合。在內容方面,利用BIBFRAME提供的主題、事件、集合等抽象概念,從內容上對資源信息進行整合。
(3)模型編碼模塊。模型編碼模塊主要通過關聯數據的方式對之前構建的概念、實體模型進行編碼,生成機器可識別的RDF文件。概念、實體模型的關聯數據編碼主要包括兩項內容:①為所有的類、屬性和實體定義全網唯一的URI,從而實現資源的唯一定位。URI由前綴和對象名兩部分組成;②生成RDF編碼。資源描述框架(Resource Description Framework,RDF)是W3C組織發布的語義網資源描述標準,其采用三元組的方式(主語、謂語、客體)對資源間的關系進行描述,生成機器可理解的關系模型。目前,DC、DCTERMS、BIBFRAME等元數據和本體詞匯集都已經通過RDF進行發布。
(4)語義存儲模塊。語義存儲模塊負責對生成的RDF數據進行存儲和管理。由于RDF特殊的數據結構,傳統的關系數據庫無法對其進行有效管理,所以需要專門的三元組數據庫進行存儲。三元組數據庫主要采用SPARQL語言進行管理,能夠提供對RDF數據的插入、刪除、修改和查詢操作。區別于傳統數據庫的處理方式,三元組存儲器主要通過圖模式匹配的方式執行SPARQL操作。
(5)檢索語句處理模塊。檢索語句處理模塊負責檢索句的命名實體提取和本體標注[37]。因為編目信息中已經包含了完整的本體和實體定義,所以系統主要采用基于規則和用戶詞典方式進行分詞。具體方法是將全部的命名實體和本體詞匯存入用戶詞典,以優化用戶檢索語句的分詞。分詞后所有的命名實體和本體詞匯將被單獨切分,對此還需要構建實體索引和本體索引。實體索引以類為單位進行構建,索引表的名稱為類的名稱。本體索引主要包括本體名稱和URI兩個關鍵字段,分別存儲類和屬性的相應信息。通過對分詞結果進行實體和本體檢索,系統就可以識別檢索語句中的命名實體和本體詞匯。
(6)檢索語句轉化模塊。SPARQL轉化主要負責將提取的命名實體和本體標注結果轉化為SPARQL語句進行語義搜索。SPARQL是W3C針對RDF提出的查詢標準和數據訪問協議,主要由PREFIX、SELECT、FROM和WHERE四部分構成。PREFIX用于設置前綴,SELECT用于設置檢索的對象,FROM用于設置檢索的位置,WHERE用于設置檢索的條件。檢索語句的轉換涉及較為復雜的句法分析,目前本研究僅針對簡單句提出了若干轉換規則,對于復雜句的處理還需要更深入的研究。
(7)SPARQL搜索模塊。SPARQL搜索模塊主要負責對構建的SPARQL檢索式進行語義檢索。區別于傳統的檢索方式,SPARQL檢索的對象是RDF三元組。檢索過程中,SPARQL搜索引擎首先將數據庫存儲的三元組數據轉化成RDF圖,然后通過圖搜索算法進行檢索。目前,常用的SPARQL搜索引擎是Apache開發的fuseki。另外,也可以通過調用JeanAPIs對JenaTDB進行檢索。為了提高系統檢索質量,還可以采用推理機提高系統的語義發現能力。目前,JeanAPIs主要支持基于規則的推理,而RACER、FaCT++、Pellet等則可以在OWL2 RL規則的約束下進行更專業的推理。
4 語義搜索框架測試
為了驗證上述語義搜索框架的效果,本研究搭建了基于該框架的驗證系統,并設計了多個實驗對系統的運行效果進行檢驗。
4.1 驗證系統的搭建
(1)本體模型的構建及序列化。采用protege5.0對概念模型進行構建,并在模型的基礎上進行實體和實體屬性的定義。概念模型主要基于BIBFRAME進行構建,除此以外還復用了DC、EVENT、FOAF等常用的本體詞匯集;根據實驗需要,選取了網絡用戶、圖書館和出版機構等多個來源的信息,如書籍的出版信息、館藏信息和用戶評論等;構建完成后系統生成RDF格式的序列化文件。
(2)檢索語句處理及轉換。采用NLPIR2016進行檢索語句的分詞,用戶字典采用系統自帶的UserDict文件;命名實體索引和本體索引采用MySQL5.7.14數據庫進行存儲和檢索;SPARQL轉換通過JAVA代碼實現。
(3)RDF存儲與檢索。采用JenaTDB+Fuseki+Tomcat的架構。JenaTDB主要負責RDF數據的存儲;Fuseki是開源的SPARQL搜索引擎,提供RDF查詢服務;Tomcat主要提供WEB服務,在使用前需要先導入Fuseki的WAR文件。
4.2 實驗測試
為了驗證系統效果,本研究設計了三個實驗分別對系統的語義描述、語義整合和語義檢索功能進行測試。
(1)語義描述功能測試。為了驗證系統的語義描述功能,本研究從豆瓣、中國圖書網、中國國家圖書館等網站獲取了與書籍相關的書評、出版和館藏信息,然后采用基于BIBFRAME的概念模型對上述資源進行了描述。具體描述了采用的類和屬性(見表2),生成了書評和書籍RDF數據(見圖3)。
實驗結果表明,BIBFRAME提供了豐富的類和屬性定義,Work、Instance和Item三個核心類能夠較好的滿足書評信息、出版信息和館藏信息的描述需要。同時,測試也顯示BIBFRAME具有適度的描述彈性,在描述責任者、分類標記、作品名稱時,允許使用者自己定義需要的類型。如BIBFRAME設置了Contribution類和role屬性,通過定義Contribution實體和該實體role屬性的值,使用者可以定義需要的貢獻者類型。此外,VarientTitle、Source也都采用了類似的定義方法,能夠對已有的標題和標記類型進行擴展。
(2)語義整合功能測試。為驗證系統語義整合功能,本研究收集了多個來源的圖像、視頻、報告、期刊等資源的描述信息,每種信息均采用了不同的本體描述結構。為解決異構信息整合問題,筆者采用owl:equivalentClass 、owl:equivalentProperty和owl:sameAs對異構本體進行映射,并通過FaCT++推理機和BIBFRAME中的事件類實現了資源在結構和內容上的整合。為了驗證整合效果,筆者以“2001年7月13日北京申奧成功”為事件進行檢索,結果顯示了所有與該事件相關的資源信息(見圖4)。測試結果表明基于等價關系的本體映射和BIBFRAME的概念、屬性能夠對異構資源進行有效的整合。
(3)語義檢索功能測試。為了驗證系統的語義檢索功能,本研究采用了多條檢索語句進行實驗(見表3),以測試系統各個環節的運行效果。
系統通過對檢索語句分詞實現了實體和本體詞匯的單獨分割(見表3)。系統對檢索語句的轉換結果(見表4),通過對SPARQL搜索結果進行驗證(見圖5),確認系統獲取了較為準確的結果,達到了預期的語義檢索效果。
上述實驗結果表明,本研究基于BIBFRAME提出的數字圖書館語義搜索框架具有較好的科學性和有效性,根據其構建的驗證系統能夠較好的實現數字圖書館資源的語義描述、組織和檢索,滿足了預期的資源整合和發現需求。同時,測試也顯示驗證系統在深層語義發現和復雜語句識別方面存在不足,這主要由于兩個方面的原因:①驗證系統主要針對實體間的顯性關系構建概念模型,對資源深層語義的發現存在不足;②系統雖然能夠處理常見的簡單句查詢,但是由于缺少句法分析導致系統對復雜語句的識別存在不足。
5 結語
為提高數字圖書館對互聯網資源的整合與發現能力,本文提出了基于BIBFRAME的數字圖書館語義搜索框架,實驗結果表明,本研究提出的數字圖書館語義搜索框架具有較好的科學性和有效性,能夠有效解決數字圖書館面臨的資源整合和發現難題。目前,本文提出的框架還存在深層語義發現和復雜語句處理兩個方面的不足。后續研究中,我們將繼續對框架進行細化,并嘗試采用推理、概率統計的方法提高系統對潛在語義的發現能力;在檢索語句處理方面,將嘗試增加句法分析功能,提高系統對復雜語句的處理能力。
參考文獻:
[1] Pesch O,Miller E.Using BIBFRAME and library linked data to solve real problems:an interview with eric miller of zepheira:edited by oliver pesch[J].The Serials Librarian,2016,71(1):1-8.
[2] 蘇明明,宋文.基于本體的語義搜索引擎解決方案研究新進展[J].現代圖書情報技術,2008(11):24-28.
[3] 郭衛寧,司莉.國外語義搜索引擎調查與分析[J].圖書情報工作,2013,57(23):121-129.
[4] 王碩,周華琳.基于語義搜索引擎的數字圖書館服務優化研究[J].圖書館學研究,2012(14):41-45.
[5] 文坤梅,盧正鼎,孫小林,等.語義搜索研究綜述[J].計算機科學,2008,35(5):1-4.
[6] Wei X,Zeng D D.Exna:an efficient search pattern for semantic search engines[J].Concurrency and Computation:Practice and Experience,28(15):4107-4124.
[7] Hu Y,Janowicz K,Prasad S,et al.Enabling Semantic Search and Knowledge Discovery for ArcGIS Online:A Linked-Data-Driven Approach[M].Agile 2015.Switzerlan:Springer,2015:107-124.
[8] Koutsomitropoulos D A,Solomou G D,Kalou A K.Herding linked data:semantic search and navigation among scholarly datasets[J].International Journal of Semantic Computing,2015,9(4):459-482.
[9] Shin S,Ko J,Eom S,et al.Keyword-based mobile semantic search using mobile ontology[J].Journal of Information Science,2015,41(2):178-196.
[10] Song M,Eom S,Shin S,et al.Enriching Mobile Semantic Search with Web Services[C].Semantic Computing (ICSC),2015 IEEE International Conference on Image Process.Quebec:IEEE,2015:452-455.
[11] Stanchev L.Semantic Search Using a Similarity Graph[C].Semantic Computing (ICSC),2015 IEEE International Conference on Image Process.Quebec:IEEE,2015:93-100.
[12] Stanchev L.Fine-tuning an algorithm for semantic search using a similarity graph[J].International Journal of Semantic Computing,2015,9(3):283-306.
[13] Tablan V,Bontcheva K,Roberts I,et al.Mímir:an open-source semantic search framework for interactive information seeking and discovery[J].Web Semantics:Science,Services and Agents on the World Wide Web,2015(30):52-68.
[14] Cohen T,Widdows D,Rindflesch T.Expansion-by-Analogy:A Vector Symbolic Approach to Semantic Search[C].International Symposium on Quantum Interaction.Filzbach:Springer,2015:54-66.
[15] Fatima A,Luca C,Hobbs M.Free-Text User Queries for Semantic Search[C].2015 IEEE 13th International Conference on Industrial Informatics (INDIN).Cambridge:IEEE,2015:838-843.
[16] El-gayar M M,Mekky N,Atwan A.Efficient proposed framework for semantic search engine using new semantic ranking algorithm[J].International Journal of Advanced Computer Science and Applications,2015,6(8):136-143.
[17] Berlanga R,Nebot V,Pérez M.Tailored semantic annotation for semantic search[J].Web Semantics:Science,Services and Agents on the World Wide Web,2015(30):69-81.
[18] 楊麗姣,肖航.漢語深層語義理解與知識表示-面向語義搜索的語料庫語境信息標注研究[J].語言文字應用,2015 (1):107-116.
[19] Davelaar E J.Semantic search in the remote associates test[J].Topics in Cognitive Science,2015,7(3):494-512.
[20] Hong K J,Kim H J.A Semantic Search Technique with Wikipedia-Based Text Representation Model[C].2016 International Conference on Big Data and Smart Computing (BigComp).Hong Kong:IEEE,2016:177-182.
[21] 陳國華,湯庸,許玉贏,等.基于詞向量的學術語義搜索研究[J].華南師范大學學報(自然科學版),2016,48(3):53-58.
[22] Shabbir U,Kanwal T,Malik R,et al.Comparison between SSTC and LINGO Algorithms in Clustered Based Semantic Search for Browsing Scholarships[C].International Conference on Frontiers of Information Technology.Islamabad:IEEE Computer Society,2015:53-58.
[23] Elibedweihy K M,Wrigley S N,Clough P,et al.An overview of semantic search evaluation initiatives[J].Web Semantics Science Services & Agents on the World Wide Web,2015,30(C):82-105.
[24] Laura L,Me G.Searching the web for illegal content:the anatomy of a semantic search engine[J].Soft Computing,2015(534):1-8.
[25] Ma B,Zhang N,Liu G,et al.Semantic search for public opinions on urban affairs:a probabilistic topic modeling-based approach[J].Information Processing & Management,2015,forthcoming(3):430-445.
[26] Li W,Bhatia V,Cao K.Intelligent polar cyberinfrastructure:enabling semantic search in geospatial metadata catalogue to support polar data discovery[J].Earth Science Informatics,2015,8(1):111-123.
[27] Ma B,Zhang N,Liu G,et al.Semantic search for public opinions on urban affairs:a probabilistic topic modeling-based approach[J].Information Processing & Management,2016,52(3):430-445.
[28] 柯葉青,馬志柔,伍海江,等.一種簡歷語義搜索系統的實現方法[J].計算機科學,2015,42(12):56-59.
[29] 盛東方,孫建軍.基于語義搜索引擎的學科知識服務研究—以GoPubMed為例[J].圖書情報知識,2015 (4):113-120.
[30] 劉煒,夏翠娟.書目數據新格式BIBFRAME及其應用[J].大學圖書館學報,2014,32(1):5-13.
[31] 夏翠娟.面向語義網的書目框架(BIBFRAME):功能需求及實現[J].大學圖書館學報,2014,32(6):61-69.
[32] 夏翠娟,劉煒,張磊,等.基于書目框架(BIBFRAME)的家譜本體設計[J].圖書館論壇,2014(11):5-19.
[33] 安曉麗.BIBFRAME圖書館工作的變革[J].圖書館建設,2015(10):40-42.