李 慧
(南京郵電大學圖書館,江蘇 南京210046)
搜索引擎最重要的任務是搜集網絡信息,提供給用戶與其檢索詞最匹配的結果,并返回相關鏈接。搜索引擎在網絡上抓取足夠的網頁已不再是困難,困難在于如何將這些網頁整理出來,選擇合適的排序算法,把這些結果集返回給用戶。語義網技術的出現,更加加劇了這種困境。語義網的宏觀結構來源于RDF 模型所定義的數據之間的鏈接,隨著RDF 數據大量涌入,傳統搜索引擎更加凸顯出局限性,因此語義搜索引擎應運而生。由于語義檢索的對象不再僅限于文檔和網頁,同時也包括了實體和關系等,所以在一定程度上對排序算法的要求變得更高。對于語義搜索引擎來說,一個合理的排序算法不僅可以幫助用戶提高搜索效率,更是邁向可信語義網的至關重要的一步。從對現有研究與調研的基礎上可以看出,目前針對本體文檔的排序研究較多,已經形成了較為系統的分類排序算法體系,但針對實體和關系的排序的研究還在發展中。本文按照排序的階段將語義檢索排序分為實體排序、關系排序和文檔排序,并詳細闡述了每種排序算法的研究進展,供今后研究人員參考。
傳統搜索引擎的排序算法主要可以分為兩類,分別是基于鏈接分析的方法和基于用戶行為分析的方法,以及在此基礎上進行改進的排序模型。其中基于鏈接分析的方法又可以分為PageRank[1]算法、HITS 算法[2]、SALSA[3]算法等;基于用戶行為分析的方法可以分為BrownseRank[4]和Direct Hit[5]算法等;一些在此基礎上改進的排序算法包括基于節點和邊屬性的排序算法[6-8]、基于監督學習的排序算法[9-10]等。隨著語義網的發展,本體數量與日俱增,本體模型在語義網上被廣泛地應用,傳統的基于關鍵詞的檢索方法不能對本體中的語義關系進行很好的推理,而僅僅基于表述邏輯(description logics)對本體進行檢索,因而用戶滿意度并不高,也無法取得很好的排序結果。與此同時,一些研究將傳統的排序算法應用于語義檢索中,取得了一定的成果,但是由于本體結構的特殊性,目前相關研究仍在探索更加優化的排序算法,下文將詳細介紹當前的研究現狀和進展。
當前按照排序的階段可以將語義檢索排序分為實體排序、關系排序和本體文檔排序,但是這些排序方法之間是有很大交集的,并無嚴格的界限。
語義網中的定義/概念是為了描述現實中的實體數據,這些實體數據都將服務于資源的請求者,比如利用FOAF撰寫的個人檔案就是目前最常用的實體數據。語義網最初發展時,由于實體數據相對匱乏,因而并未引起足夠的重視,近年來隨著語義網的迅猛發展,大量類似于FOAF、RSS 等實體數據的出現,加上實體排序本身就有著巨大的研究價值和商業價值,使得這個問題越來越受到研究者的關注,而且從實際的角度來講,對于大多數一般用戶而言,實體數據的檢索需求更為普遍。實體排序問題的實質是對實體之間異質關聯的分析方法,其排序的目的是從知識庫中發現和檢索與用戶需求最匹配的實體對象,這種最匹配的實體對象一般稱為種子實體(seed entity),排序的困難之處在于實體之間的關聯異常的復雜,一些隱式關聯很難被發現,推理過程不僅牽扯到描述邏輯(Description Logic)的推理規則,還需要使用語義網規則描述語言(SWRL)定義的規則,因此在對實體數據進行排序的過程中,如果想得到全面準確的排序結果,那么推理所起到的作用是不可忽略的。
W.Wei 等人[11]提出了針對特定領域的實體排序算法RareRank,其指出傳統的信息檢索模型主要依靠內容和鏈接分析評分來確定排序結果,即相關性分數(relevance)和質量分數(quality)。作者將這兩種評分相結合,并在此基礎上分配相應的參數來進行優化,并引入了合理搜索模型(Rational Research Model)。其首先將一個領域的知識利用有向圖來表示,然后將領域本體引入到有向圖中,因此該模型的排序分數整合了領域本體的相關性分數和鏈接分析的質量分數。這個方法實質是應用了鏈接分析來對實體進行排序,實證結果證明效果確實有一定改善,但是該模型的參數設置較為簡單,將來還需要大量的數據集進行測試。L.Dali 等人[12]提出了Learning to Rank 算法,其主要是采用查詢詞本身進行實體的優化排序,首先利用PageRank作為參考模型,并將其應用到RDF 圖中,并結合這些詞的變化特點,進而獲得更高的資源關聯,最后計算出更好的排序結果。這種方法的本質是利用查詢詞自身特點的RDF圖。相比一般的文本排序,該方法會產生較大的非連續性,尤其是在關聯數據集(LOD)參與的情況下,很難具有較好的效果;X.Ning 等[13]提出了語義搜索排序框架RSS,這種算法一方面利用關系(relations)的異質性來確定實體的重要性,同時利用一種擴展激活算法(Extended spread activation)來檢索與查詢詞最相關的實體,因此可以邊搜索邊推理,并提供合適的實體排序結果。實驗結果也顯示出這種算法的效果。作者最后也指出,這種算法也具有一些不足,比如目前在模式圖中分配邊權重時無法采用機器自動分配以及跨平臺可移植性效果不佳等;A.Harth 等[14]提出了語義搜索引擎SWSE,其是一種專門用來搜索實體及其相關知識的搜索引擎。SWSE 的排序算法叫做ReCon-Rank,該算法由3 個階段的實體計算構成:①ResourceRank;②ContextRank;③ReConRank。這3 個階段的計算過程都是在RDF 資源圖中利用改進的PageRank 算法來進行的。具體來說,首先從web 上抓取RDF 數據,之后傳遞到有向圖中,并利用ResourceRank 算法計算排序分數;然后使用RDF 數據源流信息的上下文情景語義圖進一步計算ContextRank 分數;最終,利用預定義規則衍生出的整合后的資源語義圖進一步生成ReConRank 分數,這種排序算法考慮了實體及其上下文的重要性,并具有一定的可擴展性;H.Hwang 等[15]提出了專門針對關系數據庫中的排序算法ObjectRank,其主要是基于PageRank 啟發原則來排序實體對象,并提出了一系列指標和參數來改善結果的相關性。其中最重要的兩個參數是特定指標(specificity metric)和質量指標(quality metric)。特定指標是專門用來衡量與檢索詞最相關的實體對象;質量指標(quality metric)是用來衡量返回的實體本身的重要性的。此外還提出了兩個參數,分別是“結果集中的相關實體的數量”和“查詢詞的權重”。作者也探索了將領域本體整合到ObjectRank 算法中,來優化查詢結果;C.Rocha 等[16]提出了一種混合排序算法,在傳統關鍵詞檢索的基礎上,結合擴展激活算法,通過圖遍歷進一步擴展檢索與初始結果相關的更多實體,這是一種依賴特定領域來達到相關結果排序的方法。此外,該方法是通過上下文情景來描述實體之間關系的重要性的,并分配相應的權重。顯而易見,這種實體排序算法對跨領域的排序并不能起到良好的效果;N.Stojanovic[17]等提出一種利用本體中語義的排序算法。該方法結合推理過程的特點和資源內容本身,相結合來確定搜索結果的相關性和排序。其把實體間的語義關系分配兩個權重,分別是“普遍性”和“用戶自定義”,不僅考慮了上下文的情景,也考慮了其他的一些參數,諸如路徑長度和關系的特定性等。也就是說,實體的關系特定性越高,該實體出現在其他關系中的可能性就越低。作者利用這種方法在樣本數據集中進行測試,結果顯示用戶的滿意度有所提高;R.McCreadie[18]等利用一種擴展的投票模型來進行實體的排序,通過考慮查詢詞和實體在上下文的共現程度作為投票的標準,為投票模型建立一種語義關系支持。另外在投票模型之上,開發了一種基于圖的技術來更進一步的增強初始投票評估效果。為了獲取實體,他們利用了DBPedia建立了一個詞典庫,通過基于詞典的方式來識別實體。他們的實驗表明擴展的投票模型可以有效的處理實體排序問題;Z.wang[19]提出了一個實體排序方法,該方法先以文檔中心模型(DCM)為基礎,然后計算查詢術語與候選實體的距離得分。查詢術語和候選實體的距離是指,在候選實體的所有相關文檔中查詢詞和候選實體名稱之間的最短距離。最后把文檔中心模型得分和距離得分做線性累加。
目前語義搜索引擎的研究重點集中在如何更好地發現語義實體上,事實上語義網強調的是實體之間的關聯關系,實體之間是通過關聯關系結合在一起,孤立的實體本身并不包含任何語義信息。所以說,實體之間的關聯關系相比實體本身更加具有研究價值,比如可以挖掘出隱藏在實體之間有價值的某種事實等。隨著語義網資源的大量增長,實體之間的關聯關系的個數必然會超過實體本身,因此,在這種多領域融合的語義搜索中,對關聯關系搜索結果進行排序,將用戶最為感興趣的關聯關系優先返回給用戶,是當前急需解決的難點之一。
關聯關系排序的困難之處在于,實體之間的鏈接異常復雜,某些隱式關聯很難被發現,而且實體之間的關聯反映在圖模型中往往體現為一條路徑,所以傳統排序中鏈接分析無法適用。關聯關系排序的實質就是對實體圖中連接兩個實體之間的路徑進行排序。與實體排序和本體文檔排序不同,語義關聯關系排序是近幾年才逐漸被人們關注的,相關研究還在快速發展中。
K.Anyanwu 等[20]提出了SemRank 算法,這是一種語義關聯關系搜索排序方法,這種方法利用“改進排序模型”(Modulative Ranking Model)來識別與用戶查詢詞相關的上下文情景,然后推斷用戶興趣,綜合了各種語義信息和啟發式信息。用戶還可以改變檢索的模式來得到涵蓋某種特定情景的搜索排序結果;Y.Li 等[21]提出了以關聯關系為基礎的搜索引擎OntoLook,其首先進行網頁的語義標注,利用概念和關系分別作為點和邊進行建模,然后在圖中刪除一系列不相關的概念。利用這種方法,可以生成候選關系詞集(CRKS),進而返回給標注數據庫,最大限度上減少了無關網頁的數量,優化了排序結果。這種方法主要靠個人經驗和知識來識別概念關系,排除不相關概念,重構用戶檢索需求;B.Aleman[22]等在利用復雜關系語義進行關系排序中進行了有益的嘗試,并提出了一個以用戶為中心的排序標準。作者提出了一些語義標準,比如“信任”、“包含”、“稀有度”、“關聯長度”等,并利用這些標準對兩個實體進行了語義關聯的排序。由于這種排序方法包含了較多的參數,所以在計算排序分數權重時需要個人經驗或領域專家的參與,所以并不適用于一般的用戶;值得欣喜的是,國內對關聯關系排序也有一定的探索研究,文坤梅[23]提出了一種關聯關系排序方法,其針對實體之間普遍存在的關聯關系,以統計學、鏈接分析、社會網絡等相關技術為基礎,抽取3 種影響排序的關鍵因素,分別是領域相關度,關聯關系長度以及關聯關系頻度,并提出了這3種關鍵影響因子的計算方法,該方法綜合考慮了3 種因素的影響,能優先返回用戶需要查詢的關聯關系。試驗結果表明該方法能較好地將用戶感興趣的語義關聯關系優先返回,并能挖掘出實體對象之間有價值的關聯關系。
語義/本體文檔檢索的目的是為了找到含有特定類或屬性的本體文檔。傳統的搜索引擎無法識別本體的語義標注信息,所以在檢索結果集中無法將真正符合用戶需求的文檔檢索出來。就語義文檔檢索而言,結果集中應該返回的是包含與查詢詞最相關的實體及其關系的文檔。當前用于本體文檔排序的相關方法大致可以分為:基于鏈接分析的方法、基于結構分析的方法、基于內容分析的方法、基于概念結構分析的排序方法以及一些其他排序方法。目前本體文檔排序雖然形成了較為系統的排序方法,但是還沒有統一的標準,缺乏一致的衡量標準,在計算排序時要從本體鏈接關系、本體的模式和重要性、概念匹配的特征甚至是實體等角度進行綜合考慮,同時也要結合用戶的個性化需求,才能夠獲得需求導向的最佳的排序效果。
2.3.1 基于鏈接分析的排序方法
L.Ding[24]等提出了語義搜索引擎Swoogle,其使用類似于PageRank 的鏈接分析法,作者提出了語義Web 中的3種基本元素:語義Web 文檔 (SWD)、語義Web 本體(SwO)以及語義Web 術語(SWT),針對不同的元素,分別給出了不同的排序算法。其中針對語義Web 文檔(SWD)的排序算法叫做OntoRank[25],在這種算法中,作者引入了3 種不同的隱式鏈接關系,分別是引用(TM/IN)、擴展(EX)以及導入(IM)。引用表示一個本體文檔引用了另一個本體文檔中定義的術語;擴展表示一個本體擴展了另外一個本體;導入表示一個本體導入另外一個本體,基于這些鏈接關系,OntoRank 采用隨機沖浪模型來計算本體的重要性。本體間的連接關系不同于網頁的鏈接,OntoRank 算法引入了更加合理的模型,為實體的關系賦予不同的權重。這種算法可以檢索出大量相關本體,但本體的主題對于排序結果的影響被忽略了,也就是說OntoRank只能以靜態的方式評價本體的重要性,不能將用戶的查詢詞作為影響排序結果的因素。類似于這種改進的PageRank的算法還有ontokhoj[26]算法,在該算法中,本體間的鏈接關系被定義為兩個本體中概念之間的引用關系,同時這種鏈接關系被認為是有向的而且可以傳遞,鏈接的強度隨著鏈接距離的增加而減弱,在確定了本體的鏈接關系后,再采用隨機沖浪模型計算每個本體的排序值即可。這種改進的PageRank 算法將本體看成與網頁類似的無結構數據,但本體具有其特殊性,從而導致排序結果準確度不高。
使用鏈接分析或其他在此基礎上改進后的算法,用來計算本體文檔排序的主要困難在于,本體與網頁不同,本體之間缺乏顯式的鏈接,所以采用鏈接分析的方法就必須要挖掘出本體之間的隱式關聯。這種以OntoRank 為代表的鏈接分析方法,由于本體主題對排序結果的影響被忽略,所以不能將其作為結果排序的因素。
2.3.2 基于結構分析的方法
H.Alani[27]等提出了AKTiveRank 算法,該方法從另一個角度考慮了用戶的查詢,尤其是多個關鍵字查詢對排序的影響。該算法利用了4 個標準對本體的重要性進行評分,分別是類匹配標準 (Class Mateh Measure)、密度標準(Density Measuxe)、語義相似度標準(Semantie Similarity Measue)和中間性標準(Betweenness Measure),用戶在查詢時,本體文檔的排序分數由這4 種標準加權來計算。實證結果顯示,在考慮查詢的情境下,AKTiveRank 算法排序結果比單一的OntoRank 更加貼近實際標準。此外,一些研究[28-31]側重將Swoogle 鏈接分析方法和AKTiveRank 方法結合起來探索本體排序結果,比較有代表性的比如張志強[32]等的研究,其將AKTiveRank 中的類匹配度量、語義相似性度量以及密度度量等保留,并結合匹配類的子類及其屬性,設置相應的權重,迭代計算類的重要性,最后在Swoogle鏈接分析的基礎上計算本體的重要性的分數。相比基于鏈接分析方法,基于結構分析的方法考慮到了本體自身的結構特性,同時也考慮到了用戶查詢詞對結果集的影響,但是這種方法的時間成本較大。
S.Tartir[33-34]等提出了OntoQA 算法,首次把實體數據的考察引入到本體評價中。該算法的創新之處在于不僅考慮本體模式的評分,同時也考慮了本體知識庫的評分。該算法是對搜索到的本體文檔根據其結構特征,再與用戶查詢詞相對比,進行多方面的度量,對各個度量值進行加權計算,從而得到本體的最終排序值。這種算法對本體文檔重要性的評分可以分為兩個方面,分別是本體模式和本體實體。嚴格說來,這是一種基于模式和實體分析的排序方法。
2.3.3 基于內容分析的排序方法
M.Jones[35]等提出了一種基于內容分析的本體排序算法,這種算法不僅考慮了類標簽,同時考慮了本體圖以外的評論等內容。其認為在結果集中本體的重要性不僅與查詢詞有關,與其相關概念的匹配程度也有關,匹配越多的查詢詞,本體就越重要,排序時就應該排在前面。在實驗中,作者利用wordnet 獲得查詢詞的上位詞、下位詞以及同義詞,再根據結果集中與本體中類的匹配程度來計算本體的類匹配值和文本匹配值,通過兩者加權進行本體文檔的排序。
2.3.4 基于概念結構分析的排序方法
A.Harith[36]在研究中考慮了匹配概念在本體結構中的重要程度,充分注重了本體中匹配概念間的結構和關系,通過查詢匹配,找到用戶所關注的概念在本體中的位置,然后分析其結構的特征。這種算法考察了4 種衡量因素:分別是類匹配度量(CMM),中心性度量(BEM),密度度量(DEM),語義相似性度量(SSM),通過對上述4 種因素的加權平均得到每個本體文檔的分數,然后進行排序。
2.3.5 其他排序方法
OntoFetcher[37]從概念覆蓋CCW、關系覆蓋PRW、相關性度量RM、連通性度量CM、關系的豐富度RR 與Swoogle 鏈接分析計算出的本體的秩幾個方面進行了本體重要度的考量,從而進行排序設計,可以說是一種基于內容和鏈接分析相整合的排序方法;V.Sankar[38]等人提出了一種基于OWL 的本體文檔排序方法,OWL 中含有描述類、類公理、屬性定義與約束等內部關系,可以通過對OWL 中類匹配進行計算排序;徐德智[39]等針對傳統本體排序結果不準確的情況下,提出一種新的內容分析方法,首先通過構造本體的概念模型提取本體的主題詞集合得到本體的主題相似度;然后通過對關鍵詞所在的本體上下文進行分析,得到本體相對于關鍵詞的上下文相關度;最后對二者進行加權平均得到本體文檔的排序分數。實驗結果表明,該方法可以有效地提高本體排序的準確性;寇燕歌等[40-41]使用TF-IDF 方法計算查詢詞與本體文檔中術語的權重,通過計算夾角弦值的方法衡量二者的相似度,據此進行本體的排序;楊克特[42]等使用TF-IDF 方法計算匹配類的重要程度,再結合本體鏈接分析方法,提出一種面向特定領域的語義文檔排序算法;T.Ahmed[43]在分析本體鏈接的基礎上,提出了基于HITS 的本體排序方法;H.Lewen[44]探索了用戶對本體評論或用戶信任度等的本體反饋信息對排序的影響;還有一些研究[45]主要從方法的角度對本體排序因素進行了探討,但是沒有闡述具體的量化計算方法。
以上是典型的語義/本體文檔排序算法,近年來一些研究開始逐步關注針對本體中某一片段甚至是個別詞匯的排序。在這種元素級或粒度層級上的排序目前還在快速發展中,代表性的算法有TermRank、CARRank 和TripleRank等。
TermRank[46]是swoogle 中用于術語排序的一種算法,該算法使用術語的流行度作為排序的標準,術語流行度由該術語被使用的次數、推廣的量、所在語義文檔上下文重要性等共同來確定;CARRank[47]是一種利用相互增強關系迭代計算本體中概念與關系的重要性的方法。這種算法根據本體構建模型的特點進行分析,從而得到本體模型的4個特征,最后根據這些基本特征利用本體中元素的中心值來表示本體中片段的重要性;TripleRank[48]是一種利用張量分解對語義網數據進行排序的方法。該算法中使用統計學方法獲得外部語義來增強可用數據,并使用張力模型來模擬RDF 圖。最后使用平行因子法分析此模型,將該模型看成是可以使用HITS 算法進行排序的模型。
語義檢索相比傳統檢索的優勢在于可以實現基于語義的匹配和推理,是一種知識檢索,可以返回與查詢詞更相關的內容。本體在語義檢索中處于非常重要的位置,承擔著知識表達的核心任務,對語義檢索的推理也起著支撐性的作用。由于語義Web 對傳統互聯網進行了革命性的變化,使其檢索和排序的對象不僅僅局限于文檔和網頁,更包括了實體和關系等,雖然可以通過模型變換和算法改進來優化傳統的排序算法,也帶來了一定的效果改善,但是由于語義Web 的特殊結構,傳統排序算法的思路并不能完全移植到語義Web 中。本文在調研的基礎上,詳細闡述了當前實體排序、關系排序和本體文檔排序的研究進展,可以預見的是,在將來的語義排序算法發展中,語義網中信任和信譽度的研究將越來越受到重視,將用戶的社會網絡因素同已有的排序算法相結合,必將是未來重要的研究方向之一。
[1] Page L,Brin S,Motwani R,et al. The PageRank citation ranking:Bringing order to the web [J]. 1999.
[2] 張書江. 基于超鏈接分析搜索引擎頁面排序算法的剖析[J].安徽理工大學學報:自然科學版,2008,28 (2):73 -77.
[3] Lempel R,Moran S. SALSA:the stochastic approach for link -structure analysis [J]. ACM Transactions on Information Systems(TOIS),2001,19 (2):131 -160.
[4] Liu Y,Gao B,Liu T Y,et al. BrowseRank:letting web users vote for page importance [C] ∥Proceedings of the 31st annual international ACM SIGIR conference on Research and development in information retrieval. ACM,2008:451 -458.
[5] 徐金雷,楊曉江. 專業搜索引擎的排序算法研究[J]. 現代圖書情報技術,2006,(7):20 -24.
[6] Han Y,Zhou B,Pei J,et al. Understanding Importance of Collaborations in Co-authorship Networks:A Supportiveness Analysis Approach [C] ∥SDM,2009:1112 -1123.
[7] Haveliwala T,Kamvar S,Jeh G. An analytical comparison of approaches to personalizing PageRank [J]. 2003.
[8] Haveliwala T H. Topic - sensitive pagerank [C] ∥Proceedings of the 11th international conference on World Wide Web. ACM,2002:517 -526.
[9] Tsoi A C,Morini G,Scarselli F,et al. Adaptive ranking of web pages [C] ∥Proceedings of the 12th international conference on World Wide Web. ACM,2003:356 -365.
[10] Agarwal A,Chakrabarti S,Aggarwal S. Learning to rank networked entities [C] ∥Proceedings of the 12th ACM SIGKDD international conference on Knowledge discovery and data mining.ACM,2006:14 -23.
[11] Wei W,Barnaghi P,Bargiela A. Rational research model for ranking semantic entities [J]. Information Sciences,2011,181(13):2823 -2840.
[12] Dali L,Fortuna B. Learning to Rank for Semantic Search [C]∥Proc. of fourth international Semantic Search workshop located at the 20th international World Wide Web Conference WWW2011,2011.
[13] Ning X,Jin H,Wu H. RSS:A framework enabling ranked search on the semantic web [J]. Information Processing & Management,2008,44 (2):893 -909.
[14] Harth A,Hogan A,Delbru R,et al. Swse:Answers before links![J]. 2007,(3):18 -23.
[15] Hwang H,Hristidis V,Papakonstantinou Y. Objectrank:a system for authority -based search on databases [C] ∥Proceedings of the 2006 ACM SIGMOD international conference on Management of data. ACM,2006:796 -798.
[16] Rocha C,Schwabe D,Aragao M P. A hybrid approach for searching in the semantic web [C] ∥Proceedings of the 13th international conference on World Wide Web. ACM,2004:374 -383.
[17] Stojanovic N,Studer R,Stojanovic L. An approach for the ranking of query results in the semantic web [M] ∥The Semantic Web-ISWC 2003. Springer Berlin Heidelberg,2003:500 -516.
[18] McCreadie R,Macdonald C,Ounis I,et al. University of glasgow at trec 2009:Experiments with terrier [R]. GLASGOW UNIV (UNITED KINGDOM),2009.
[19] Z. Wang,W. Lv,H. Li,et al. PRIS at TREC 2011 Entity Track:Related Entity Finding and Entity List Completion. Proceedings of the 20th Text REtrieval Conference (TREC2011),Gaithersburg,MD:NIST Special Publication,2011.
[20] Anyanwu K,Maduko A,Sheth A. SemRank:ranking complex relationship search results on the semantic web [C] ∥Proceedings of the 14th international conference on World Wide Web. ACM,2005:117 -127.
[21] Li Y,Wang Y,Huang X. A relation - based search engine in semantic web [J]. Knowledge and Data Engineering,IEEE Transactions on,2007,19 (2):273 -282.
[22] Aleman - Meza B,Arpinar I B,Nural M V,et al. Ranking documents semantically using ontological relationships [C] ∥Semantic Computing (ICSC),2010 IEEE Fourth International Conference on. IEEE,2010:299 -304.
[23] 文坤梅. 基于本體知識庫推理的語義搜索研究[D]. 武漢:華中科技大學,2007.
[24] Ding L,Finin T,Joshi A,et al. Swoogle:a search and metadata engine for the semantic web [C] ∥Proceedings of the thirteenth ACM international conference on Information and knowledge management. ACM,2004:652 -659.
[25] Ding L,Pan R,Finin T,et al. Finding and ranking knowledge on the semantic web [M] ∥The Semantic Web - ISWC 2005.Springer Berlin Heidelberg,2005:156 -170.
[26] Patel C,Supekar K,Lee Y,et al. OntoKhoj:a semantic web portal for ontology searching,ranking and classification [C] ∥Proceedings of the 5th ACM international workshop on Web information and data management. ACM,2003:58 -61.
[27] Alani H,Brewster C,Shadbolt N. Ranking ontologies with AKTiveRank [M] ∥The Semantic Web - ISWC 2006. Springer Berlin Heidelberg,2006:1 -15.
[28] Yu W,Chen J. Ranking ontology based on structure analysis[C] ∥Knowledge Acquisition and Modeling,2009. KAM'09.Second International Symposium on. IEEE,2009, (2):119 -122.
[29] Yu W,Chen J. Ontology ranking for the semantic web [C] ∥Proceedings of the 3rd international conference on Intelligent information technology application. IEEE Press,2009:573 -574.
[30] Rajapaksha S K,Kodagoda N. Internal structure and semantic web link structure based ontology ranking [C] ∥Information and Automation for Sustainability,2008. ICIAFS 2008. 4th International Conference on. IEEE,2008:86 -90.
[31] Ding Z,Duan Z. Improved ontology ranking algorithm based on semantic web [C] ∥2010 3rd IEEE International Conference on Ubi-Media Computing,2010:103 -107.
[32] Zhiqiang Z,Weitao S,Xiaoqin X. An efficient ontology ranking algorithm- MIDSRank [J]. Journal of Computer Research and Development,2011,48 (6):1077 -1088.
[33] Tartir S,Budak Arpinar I. Ontology evaluation and ranking using OntoQA [C] ∥Semantic Computing,2007. ICSC 2007. International Conference on. IEEE,2007:185 -192.
[34] Tartir S,Arpinar I B,Moore M,et al. OntoQA:Metric -based ontology quality analysis [C] ∥IEEE Workshop on Knowledge Acquisition from Distributed,Autonomous,Semantically Heterogeneous Data and Knowledge Sources,2005,(9).
[35] Jones M,Alani H. Content - based ontology ranking [J].2006,(4):34 -36.
[36] Alani H,Brewster C. Metrics for ranking ontologies [J].2006.
[37] SHAH S A H,KHALID A,QADIR M A. OntoFecher:An approach for query generation to gather ontologies and ranking them by ensuring user's context [C] ∥Proeeedings of the 4th International Conference on Emerging Technologies. Islamabad: [s. n. ],2008:247 -252.
[38] RaviSankar V,Damodaram A. Ranking ontologies based on OWLlanguage [J]. Constructs Information Technology Journal,2010,9 (3):553 -560.
[39] 徐德智,劉怡靜. 一種用于本體排序的內容分析方法[J].計算機應用研究,2010,(6):2127 -2129.
[40] Kou Y,Zhang W. Ranking algorithm based on ontology in semantic Web [J]. Computer Engineering,2008,34 (9):22 -24.
[41] Yu W,Cao J,Chen J. A novel approach for ranking ontologies on the semantic web [C] ∥Pervasive Computing and Applications,2006 1st International Symposium on. IEEE,2006:608-612.
[42] Yang Ke - te,Chen Hua - jun. Special area oreented semantic searchresults ranking algorithm [J]. Computer Applications and Software,2011,28 (12):172 -175.
[43] Tolba A,Eladawi N,Elmogy M. An enhanced indexing and ranking technique on the semantic web [J]. arXiv preprint arXiv:1111. 6713,2011.
[44] Lewen H,d'Aquin M. Extending open rating systems for ontology ranking and reuse [M] ∥Knowledge Engineering and Management by the Masses. Springer Berlin Heidelberg,2010:441 -450.
[45] Vrande cˇi c' D,Sure Y. How to design better ontology metrics[M] ∥The Semantic Web:Research and Applications. Springer Berlin Heidelberg,2007:311 -325.
[46] Finin T W,Sachs J,Parr C S. Finding Data,Knowledge,and Answers on the Semantic Web [C] ∥FLAIRS Conference,2007:2 -7.
[47] 吳剛,張闊,李涓子,等. 利用相互增強關系迭代計算本體中概念與關系的重要性[J]. 計算機學報,2007,30 (9):1490 -1499.
[48] Franz T,Schultz A,Sizov S,et al. Triplerank:Ranking semantic web data by tensor decomposition [M]. Springer Berlin Heidelberg,2009.