999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語義關(guān)聯(lián)的實例相似度計算方法及應(yīng)用研究

2015-07-20 09:41:38梁少星
現(xiàn)代情報 2015年8期

梁少星

(武漢大學(xué)信息管理學(xué)院,湖北武漢430072)

基于語義關(guān)聯(lián)的實例相似度計算方法及應(yīng)用研究

梁少星

(武漢大學(xué)信息管理學(xué)院,湖北武漢430072)

〔摘 要〕相似度計算方法的優(yōu)劣直接影響到信息檢索與推薦的效果。本文根據(jù)本體圖模型中屬性序列的特點,綜合考慮層次關(guān)系和屬性關(guān)系,在分析路徑關(guān)聯(lián)相似度、層次相交關(guān)聯(lián)相似度及屬性相交關(guān)聯(lián)相似度的影響因素的基礎(chǔ)上給出了實例之間綜合語義相似度的計算方法。文章最后討論了該相似度計算方法在解決基于內(nèi)容的推薦中的過于專門化問題、協(xié)同過濾推薦中的稀疏性問題以及檢索中查全率和查準(zhǔn)率問題中的應(yīng)用。

〔關(guān)鍵詞〕語義關(guān)聯(lián);相似度計算;本體;屬性序列

相似度計算是知識檢索和知識推薦的基礎(chǔ)及關(guān)鍵技術(shù),其計算方法與資源和用戶的建模及表示方式有關(guān)。本體建模由于其良好的概念層次結(jié)構(gòu)、對邏輯推理的支持以及對知識的共享和復(fù)用,已成為主流的方法。

當(dāng)前基于本體的相似度計算存在兩大問題:

(1)為簡化本體構(gòu)建和相似度計算,較多考慮本體中的層次關(guān)系,忽略屬性關(guān)系,影響了相似度計算的準(zhǔn)確性。文獻[1]計算相似度只考慮層次關(guān)系,忽略了屬性關(guān)系,丟失了很多語義描述。文獻[2-4]引入屬性關(guān)系計算綜合語義相似度,但考慮的屬性關(guān)系過于簡單,不具有普適性。

(2)側(cè)重概念相似度計算的研究,較少有實例相似度計算的研究。計算概念相似度的目的在于可以將信息資源(如文本、網(wǎng)頁等)特征表示為概念的集合,然后借助概念相似度計算信息資源的相似度。但在實例作為信息資源特征表示對象的應(yīng)用中,需要計算實例相似度。文獻[5]分析了實例相似度的影響因素,但受應(yīng)用的限制,對實例相似度影響因素的分析不夠全面。

本文分析了實例之間的層次關(guān)系和屬性關(guān)系對相似度計算的影響,討論了實例之間基于語義關(guān)聯(lián)的相似度計算方法,并介紹了該計算方法在信息推薦和信息檢索中的應(yīng)用,期望改善內(nèi)容推薦中的專門化問題、協(xié)同過濾推薦中的稀疏性問題以及檢索中查全率和查準(zhǔn)率不高的問題。

1 研究背景

1.1本體模型的構(gòu)建

本體是共享概念模型的明確的形式化規(guī)范說明[6],可以理解和表達為一組概念的定義及其相互關(guān)系。可以將本體形式化表示為:O={C,I,RH,RP,A},其中C指概念,也稱為類;I指實例,即類的具體實體;RH指概念或?qū)嵗g的層次關(guān)系(Hierarchy Relationship),包括概念之間的SubclassOf關(guān)系和概念與實例之間的InstanceOf關(guān)系;RP指概念之間或?qū)嵗g的屬性關(guān)系(Property Relationship),是由用戶自定義的對象屬性,加強了人類的認(rèn)知;A指公理。

本體模型構(gòu)建一般考慮的是層次關(guān)系,表現(xiàn)為本體的樹形結(jié)構(gòu)。如若同時考慮層次關(guān)系和屬性關(guān)系,則表現(xiàn)為更為復(fù)雜的圖形結(jié)構(gòu)。為簡單說明,使用斯坦福大學(xué)開發(fā)的protégé4.3構(gòu)建Movie本體。protégé4.3中的OntoGraf插件可以將Movie本體中的類、實例及關(guān)系以圖形的形式更清楚地呈現(xiàn)出來。在OntoGraf中,本體表示為由節(jié)點和邊組成的有向圖,節(jié)點表示概念或?qū)嵗叡硎緦傩浴H考慮層次屬性RH時,本體表現(xiàn)為樹形結(jié)構(gòu)(圖1),綜合考慮層次屬性RH和對象屬性RP時,本體表現(xiàn)為圖形結(jié)構(gòu)(圖2)。

圖1 僅考慮層次屬性的Movie本體

圖2 綜合考慮層次屬性和對象屬性的Movie本體

1.2屬性序列

文獻[7]首次提出屬性序列的概念,但在屬性序列的定義中僅考慮屬性關(guān)系RP。本文根據(jù)實例相似度計算的需要,綜合考慮層次屬性RH和對象屬性RP,重新對屬性序列進行定義。

定義1在有向本體圖模型中,如果存在n個屬性p1,p2,……,pn將n+1個節(jié)點a1,a2,……,an+1連接起來(如圖3所示),其中pi(1≤i≤n)∈RH∪RP,ai(1≤i≤n+1)∈C∪I,則稱該有限屬性集合為屬性序列(Property Sequences,PS),形式化表示為:ps={p1,p2,……,pn}。屬性序列的長度(length)即ps中屬性的個數(shù)。

圖3 屬性序列示例圖

定義2函數(shù)NodesOfPS()返回屬性序列中屬性所連接的所有節(jié)點,即NodesOfPS(ps)={a1,a2,……,an+1}。節(jié)點a1稱為屬性序列的起點(origin),節(jié)點an+1稱為屬性序列的終點(terminus)。

定義3如果屬性序列ps1和ps2滿足NodesOfPS(ps1)∩NodesOfPS(ps2)≠?,則稱兩個屬性序列相交(Joined Property Sequence),ai∈(NodesOfPS(ps1)∩NodesOfPS(ps2))稱為相交節(jié)點(join node)。

1.3語義關(guān)聯(lián)

本體圖模型中,如果兩個實例間存在連通路徑,則稱兩個實例存在語義關(guān)聯(lián)(Semantic Association,記為SA)。文獻[7-9]將節(jié)點之間的語義關(guān)聯(lián)分為路徑關(guān)聯(lián)和相交關(guān)聯(lián),但因其對屬性序列定義的局限性,沒有考慮層次屬性RH對語義關(guān)聯(lián)的影響,在應(yīng)用上有局限性。

本文在定義1基礎(chǔ)上,分析了實例間連通路徑所包含的屬性序列的特點,將實例之間的語義關(guān)聯(lián)分為路徑關(guān)聯(lián)、層次相交關(guān)聯(lián)、屬性相交關(guān)聯(lián)3類,其定義分別如下:

定義4存在一條屬性序列ps,如果實例x和y分別是ps的起點和終點,且該屬性序列中所有屬性pi∈Rp,則稱x、y之間存在路徑關(guān)聯(lián)(Path Association,記為PA)。

圖4 路徑關(guān)聯(lián)

如果x和y之間存在路徑關(guān)聯(lián),則x和y之間路徑關(guān)聯(lián)的長度等于屬性序列的長度,即length(PA(x,y))=length(ps)。

定義5存在兩條屬性序列ps1和ps2相交,如果實例x和y同為ps1和ps2的起點或同為終點,且ps1和ps2中的所有屬性pi∈RH,即實例x和y屬于同一個類或相似類,則稱x、y之間存在層次相交關(guān)聯(lián)(Hierarchy Join Association,記為HJA)。

根據(jù)層次相交關(guān)聯(lián)中實例x和y所屬的類Cx和Cy是否相同,將層次相交關(guān)聯(lián)分為兩種情況:

(1)若Cx和Cy相同,即實例x和y為同一個類的實例,則ps1和ps2的相交節(jié)點為C(C=Cx=Cy),如圖5(a)所示;

(2)若Cx和Cy不同,即實例x和y為相似類的實例,則ps1和ps2的相交節(jié)點為C(C≠Cx≠Cy),如圖5(b)所示。

圖5 層次相交關(guān)聯(lián)

如果x和y之間存在層次相交關(guān)聯(lián),則層次相交關(guān)聯(lián)的長度等于它所包含的2個屬性序列的長度之和,即length(HJA(x,y))=length(ps1)+length(ps2)。

定義6存在兩條屬性序列ps1和ps2相交,如果x和y同為ps1和ps2的起點或同為終點,且ps1和ps2中屬性p1∈RP,pi∈RH∪RP(2≤i≤n),即實例x和y具有共同或相似的屬性,則稱x、y之間存在屬性相交關(guān)聯(lián)(Property Join Association,記為PJA)。

根據(jù)屬性相交關(guān)聯(lián)中屬性序列特點及相交節(jié)點的類型,將屬性相交關(guān)聯(lián)分為3種情況:

(1)實例x和y通過一個屬性相交于實例I(Join Instance),此時實例x和y有共同屬性,如圖6(a)所示;

(2)實例x和y通過多個屬性相交于實例I(Join Instance),此時實例x和y有相似屬性a1和a2,如圖6(b)所示;

(3)實例x和y通過多個屬性相交于類C(Join Class),與第二種情況類似,此時實例x和y的屬性實例a1和a2仍為相似屬性,如圖6(c)所示。

圖6 屬性相交關(guān)聯(lián)

如果x和y之間存在屬性相交關(guān)聯(lián),則屬性相交關(guān)聯(lián)的長度等于所包含的2個屬性序列的長度之和,即length

(PJA(x,y))=length(ps1)+length(ps2)。

2 基于語義關(guān)聯(lián)的實例相似度計算方法

本體優(yōu)勢在于其圖形結(jié)構(gòu),圖模型中節(jié)點之間的連通路徑體現(xiàn)了節(jié)點之間的相似性。文獻[10-11]將基于本體的語義相似度計算方法分為4類:基于距離的方法、基于內(nèi)容的方法、基于屬性的方法以及混合式方法,其中混合式語義相似度計算方法是對前面3種方法的綜合考慮。本文采用混合式計算方法,綜合考慮本體中的層次關(guān)系和屬性關(guān)系,從語義關(guān)聯(lián)的角度,分析實例之間的路徑關(guān)聯(lián)相似度、層次相交關(guān)聯(lián)相似度和屬性相交關(guān)聯(lián)相似度的影響因素及算法,并對其進行綜合。

2.1路徑關(guān)聯(lián)相似度的影響因素及算法

實例x和y之間可能存在多條路徑關(guān)聯(lián),假設(shè)存在n條路徑關(guān)聯(lián)(如圖7所示),第i條(1≤i≤n)路徑關(guān)聯(lián)的長度為length(PAi(x,y))。通過對圖7進行分析,可知x和y之間路徑關(guān)聯(lián)相似度與以下因素有關(guān):

圖7 實例x和y之間的路徑關(guān)聯(lián)

(1)最短路徑關(guān)聯(lián)的長度min(length(PAi(x,y)))。實例x和y之間的最短路徑關(guān)聯(lián)越短,它們之間的中間結(jié)點越少,相似度也越大。

因此,實例x和y之間的路徑關(guān)聯(lián)相似度可以表示為:

公式(1)中a為可調(diào)節(jié)參數(shù)。

2.2層次相交關(guān)聯(lián)相似度的影響因素及算法

層次相交關(guān)聯(lián)是兩個實例因存在共同祖先而產(chǎn)生的關(guān)聯(lián),層次相交關(guān)聯(lián)側(cè)重層次關(guān)系,體現(xiàn)實例之間的層次相似性。

一個實例可能屬于多個類,即實例存在多重繼承關(guān)系,實例多重繼承導(dǎo)致實例x和y之間可能存在多條層次相交關(guān)聯(lián)。假設(shè)存在n條層次相交關(guān)聯(lián)且相交類為實例x和y的最近共同祖先(Lowest Common Ancestor,LCA)(如圖8所示),depth(x)和depth(y)分別表示實例x和y的深度,實例深度等于實例所屬類在本體樹中的深度,depth(LCAi)為第i條層次相交關(guān)聯(lián)中相交節(jié)點的深度,其中depth(LCA)=depth(LCA1)=depth(LCA2)=……=depth(LCAn)。通過對圖8進行分析,可知x和y之間的層次相交關(guān)聯(lián)相似度與以下因素有關(guān):

(1)相交節(jié)點即最近共同祖先的深度depth(LCA)。最近共同祖先越深,實例x和y越具體,層次相交關(guān)聯(lián)相似度越大。

(2)層次相交關(guān)聯(lián)所在分支的最大深度max(depth(x),depth(y))。分支的最大深度越深,節(jié)點離共同祖先距離越遠,節(jié)點之間的層次相交關(guān)聯(lián)相似度越小。

因此,實例x和y之間的層次相交關(guān)聯(lián)相似度可以表示為:

如果LCA為根節(jié)點,則層次相交關(guān)聯(lián)相似度為0。

如果實例x和y屬于同一個類(如圖5(a)所示),則層次相交關(guān)聯(lián)相似度為1,因為depth(LCAi)=depth(x)=depth(y)。

圖8 實例x和y之間的層次相交關(guān)聯(lián)

2.3屬性相交關(guān)聯(lián)相似度的影響因素及算法

屬性相交關(guān)聯(lián)是兩個實例因存在共同屬性或相似屬性而產(chǎn)生的關(guān)聯(lián),屬性關(guān)聯(lián)側(cè)重用戶自定義對象屬性關(guān)系,體現(xiàn)實例之間的屬性相似性,如兩部電影有同樣的演員或相似的主題。

假設(shè)實例x和y之間存在n條屬性相交關(guān)聯(lián)(如圖9所示),第i條路徑相交關(guān)聯(lián)的長度為length(PJAi),實例x和y的屬性個數(shù)為m。通過對圖9進行分析,可知x和y之間屬性相交關(guān)聯(lián)相似度與以下因素有關(guān):

圖9 實例x和y之間的屬性相交關(guān)聯(lián)

(1)屬性相交關(guān)聯(lián)條數(shù)n。屬性相交關(guān)聯(lián)越多,說明兩個實例相同或相似的屬性值越多,兩個實例越相似。

(2)語義關(guān)聯(lián)長度length(PJAi)。語義關(guān)聯(lián)長度越長,說明兩個實例相隔的路徑越長,相似度越小。

因此,實例x和y之間的屬性相交關(guān)聯(lián)相似度可以表示為:

公式(3)中b為可調(diào)節(jié)參數(shù)。

2.4基于語義關(guān)聯(lián)的綜合語義相似度算法

兩個實例之間可能存在多種語義關(guān)聯(lián),設(shè)路徑關(guān)聯(lián)相似度的權(quán)重為α(0≤α≤1),層次相交關(guān)聯(lián)相似度的權(quán)重為β(0≤β≤1),屬性相交關(guān)聯(lián)相似度的權(quán)重為γ(0≤γ≤1),且α+β+γ=1,則本體中任意兩個實例x和y的綜合語義相似度為:

3 基于語義關(guān)聯(lián)的相似度計算方法的應(yīng)用

3.1在推薦領(lǐng)域的應(yīng)用

常用的推薦方法有兩種,分別是基于內(nèi)容的推薦和協(xié)同過濾推薦。下面介紹語義關(guān)聯(lián)在內(nèi)容推薦和協(xié)同過濾推薦中的應(yīng)用,并分析基于語義關(guān)聯(lián)的實例相似度算法如何改善內(nèi)容推薦的過于專門化問題和協(xié)同過濾推薦的稀疏性問題。

3.1.1在基于內(nèi)容的推薦中的應(yīng)用

基于內(nèi)容的推薦策略的本質(zhì)是計算項目與用戶模型的相似度,向用戶推薦與用戶歷史偏好語義相似度大的項目。

傳統(tǒng)基于內(nèi)容的推薦方法最大缺點在于過于專門化(Overspecialization)。受余弦相似度算法的限制,只有與用戶偏好有相同屬性的內(nèi)容才會被加入最終推薦集呈現(xiàn)給用戶,導(dǎo)致推薦結(jié)果過于專門化。

基于語義關(guān)聯(lián)的方法可以提高推薦結(jié)果的多樣性,改善過于專門化問題。基于語義關(guān)聯(lián)的方法對過于專門化的改善體現(xiàn)在兩個層面:

(1)用戶偏好擴散。根據(jù)本體圖模型中的連通路徑,可以找到與用戶模型中偏好實例存在語義關(guān)聯(lián)的實例,這些實例組成一張網(wǎng)狀圖,從而實現(xiàn)了用戶偏好的擴散。文獻[5]利用擴散算法實現(xiàn)初始節(jié)點的繼承關(guān)聯(lián)擴散和路徑關(guān)聯(lián)擴散,發(fā)現(xiàn)存在內(nèi)在聯(lián)系的結(jié)點,但沒有考慮實例之間的屬性相交關(guān)聯(lián)。文獻[12-13]使用擴散激活技術(shù)(Spreading Activation Technique)根據(jù)路徑關(guān)聯(lián)和相交關(guān)聯(lián)來發(fā)現(xiàn)與用戶偏好有隱藏聯(lián)系的結(jié)點,從而豐富最終的推薦結(jié)果集,但沒有考慮實例之間的層次相交關(guān)聯(lián)。在推薦應(yīng)用中,可以根據(jù)定義4、定義5和定義6對初始節(jié)點進行全面的擴散,以發(fā)現(xiàn)更多與用戶偏好存在語義關(guān)聯(lián)的節(jié)點。

(2)相似度計算。根據(jù)偏好擴散后網(wǎng)狀圖中實例與用戶模型的語義相似度來預(yù)測用戶對該實例的興趣度,并將相似度大于閾值的實例推薦給用戶。

需要注意的是,用戶對網(wǎng)狀圖中某實例的興趣度不僅與該實例與用戶模型的相似度有關(guān),而且與用戶模型中實例的興趣度有關(guān)。用戶模型中實例的興趣度越大,與該實例語義相似度大的實例的興趣度也越大。

設(shè)用戶偏好擴散后的網(wǎng)狀圖中某實例為x,目標(biāo)用戶的用戶模型Pu={(I1,D1),(I2,D2),…,(In,Dn)},其中Di為用戶對第i個實例(1≤i≤n)Ii的興趣度,則用戶對實例x的預(yù)測興趣度為:

通過公式(5)可知,在興趣度預(yù)測時可以綜合考慮實例之間的路徑關(guān)聯(lián)相似度、層次相交關(guān)聯(lián)相似度和屬性相交關(guān)聯(lián)相似度,不僅向用戶推薦與用戶偏好有相同屬性的項目,而且推薦與用戶偏好語義關(guān)聯(lián)的項目,最終提高推薦結(jié)果的多樣性,改善過于專門化問題。

3.1.2在協(xié)同過濾推薦中的應(yīng)用

協(xié)同推薦的本質(zhì)是發(fā)現(xiàn)與目標(biāo)用戶偏好相同的鄰居用戶,將鄰居用戶喜歡的節(jié)目推薦給目標(biāo)用戶,因此鄰居用戶的發(fā)現(xiàn)是核心。鄰居用戶的發(fā)現(xiàn)需要借助用戶偏好之間的相似性來計算。

傳統(tǒng)協(xié)同過濾方法的最大缺點是稀疏性問題。受到用戶相似度算法的限制,只有當(dāng)用戶喜歡更多相同的項目時才表明用戶相似大,因此導(dǎo)致發(fā)現(xiàn)的鄰居用戶較少,產(chǎn)生了稀疏性問題,影響了推薦的質(zhì)量和效率。

基于語義關(guān)聯(lián)的方法可以將項目語義相似度加入用戶相似度算法中,通過對用戶相似度算法加以修正來優(yōu)化最近鄰的形成,最終改善稀疏性問題[3]。

假設(shè)目標(biāo)用戶(Target User)的用戶模型Pu={(I1,DTU1),(I2,DTU2),…,(In,DTUn)},其中Di為用戶對實例Ii(1≤i≤n)的興趣度。目標(biāo)用戶TU的用戶偏好向量可以表示為→VTU=(DTU1,DTU2,…,DTUn),候選鄰居CN(Candidate Neighborhood)的用戶偏好向量可以表示為→VCN=(DCN1,DCN2,…,DCNn)。

傳統(tǒng)方法通過計算目標(biāo)用戶TU和候選鄰居CN之間的余弦相似性選擇最近鄰,然后將最近鄰喜歡的項目推薦給目標(biāo)用戶,余弦相似度算法可以表示為:SimCos(TU,CN)

基于語義關(guān)聯(lián)的方法通過加入項目的語義相似度對用戶向量的點積加以修正,優(yōu)化最近鄰的形成,修正后的公

通過對比分析得出,基于語義關(guān)聯(lián)的相似度可以通過項目的語義相似度改善用戶相似度度量,找出更多的最近鄰,改善稀疏性問題。

3.2在檢索領(lǐng)域的應(yīng)用

傳統(tǒng)的搜索引擎存在兩大問題:一是大都采用基于關(guān)鍵字的相似度匹配方法,由于系統(tǒng)不能理解用戶輸入的查詢信息,導(dǎo)致查全率和查準(zhǔn)率不高;二是沒有對個性化的查詢需求給予重視,不同興趣的用戶使用相同的關(guān)鍵字,查詢結(jié)果完全相同。

針對問題一,基于本體的方法可以將用戶輸入關(guān)鍵詞映射為本體概念或?qū)嵗M行基于概念或?qū)嵗恼Z義檢索,從而幫助系統(tǒng)理解用戶意圖,提高檢索質(zhì)量。針對問題二,可以借助語義關(guān)聯(lián)對用戶本體模型進行語義擴展,滿足用戶的個性化需求,提高查準(zhǔn)率。

下面從查詢詞的映射和用戶模型的語義關(guān)聯(lián)擴展兩個方面,分析語義關(guān)聯(lián)相似度如何通過提高查詢詞映射的準(zhǔn)確率及對用戶模型進行語義擴展來提高查詢的查準(zhǔn)率和查全率。

3.2.1在查詢詞映射中的應(yīng)用

基于本體的檢索需要將用戶輸入的關(guān)鍵詞映射為本體概念或?qū)嵗M行基于概念或?qū)嵗恼Z義檢索,但在映射過程中,由于不能確定用戶意圖,可能產(chǎn)生錯誤的映射。

一般來說,用戶在一次查詢中輸入多個關(guān)鍵詞代表用戶查詢意圖,因此這些關(guān)鍵詞之間存在較強的關(guān)聯(lián)。將n個查詢關(guān)鍵詞映射為本體庫中的n個實例集后,選擇語義相關(guān)度高的實例進行組合,該組合代表用戶正確查詢意圖的可能性也較大[14]。文獻[5]在選擇映射實例時,僅考慮了路徑相似度,用實例之間的最短屬性序列長度代表語義相似度,忽略了層次相交相似度和屬性相交相似度(即在公式(4)中只取α=1,而β=0,γ=0),影響了查全率和查準(zhǔn)率。在具體應(yīng)用中,可以根據(jù)應(yīng)用的需要,對公式4中的各個權(quán)重參數(shù)加以調(diào)整,利用語義關(guān)聯(lián)相似度提高實例映射的準(zhǔn)確率,優(yōu)化用戶輸入,幫助搜索引擎有效推測用戶意圖,最終提高檢索的查準(zhǔn)率。

3.2.2在用戶模型語義擴展中的應(yīng)用

語義關(guān)聯(lián)可以對用戶模型進行語義擴展,從而為不同興趣的用戶提供滿足其個性化需求的搜索服務(wù)。對于用戶模型的表示,可以使用瀏覽歷史中包含的實例來表示用戶模型,如文獻[5]將用戶對網(wǎng)頁的偏好轉(zhuǎn)化為對本體實例的偏好,形成用戶偏好模型。

根據(jù)實例之間的語義關(guān)聯(lián)實現(xiàn)用戶偏好擴散,可以發(fā)現(xiàn)隱含的用戶偏好,并利用實例之間的語義相似度更新實例的興趣度。與基于語義關(guān)聯(lián)的內(nèi)容推薦相似,假設(shè)用戶偏好擴散后的網(wǎng)狀圖中某實例為x,可以根據(jù)公式(5)更新實例x的興趣度,最后對檢索結(jié)果重新排序。因此,與用戶模型相結(jié)合,可以滿足用戶的個性化需求并提高查準(zhǔn)率,利用公式(4)的語義關(guān)聯(lián)相似度對用戶模型進行語義擴展,可以提高查全率。

4 結(jié) 語

本文從屬性序列的角度分析了實例之間的路徑關(guān)聯(lián)、層次相交關(guān)聯(lián)、屬性相交關(guān)聯(lián)對語義相似度的影響,并得出了綜合語義相似度的算法。將該相似度算法應(yīng)用于推薦和檢索中,可以對基于內(nèi)容的推薦中的過于專門化問題、協(xié)同過濾推薦中的稀疏性問題以及檢索中查全率和查準(zhǔn)率不高的問題加以改善。

后續(xù)工作將建立領(lǐng)域本體并設(shè)計對比實驗驗證所提出相似度算法的有效性,并使用定量分析驗證該算法在推薦和檢索質(zhì)量改善方面的效果。

參考文獻

[1]陳沈焰,吳軍華.基于本體的概念語義相似度計算及其應(yīng)用[J].微電子學(xué)與計算機,2009,25(12):96-99.

[2]Fernández Y B,Pazos Arias J J,Nores M L,et al.AVATAR:an improved solution for personalized TV based on semantic inference[J]. Consumer Electronics,IEEE Transactions on,2006,52(1):223-231.

[3]Martín-Vicente M I,Gil-Solla A,ramos-Cabrer M,et al.A semantic approach to improve neighborhood formation in collaborative recommender systems[J].Expert Systems with Applications,2014,41(17):7776-7788.

[4]楊美榮,邵洪雨,史建鋒,等.改進的領(lǐng)域本體概念相似度計算模型研究[J].情報科學(xué),2014,32(5):72-77.

[5]梅翔,孟祥武,陳俊亮,等.一種基于用戶偏好分析的查詢優(yōu)化方法[J].電子與信息學(xué)報,2008,30(1):33-37.

[6]Studer R,Benjamins V R,F(xiàn)ensel D.Knowledge Engineering,Principles and Methods[J].Data and Knowledge Engineering,1998,25(1):161-197.

[7]Anyanwu K,Sheth A.Theρoperator:discovering and ranking associations on the semantic web[J].ACM SIGMOD Record,2002,31(4):42-47.

[8]Anyanwu K,Sheth A.ρ-Queries:enabling querying for semantic associations on the semantic web[C]∥Proceedings of the 12th international conference on World Wide Web.ACM,2003:690-699.

[9]Blanco-Fernández Y,Pazos-Arias J J,Gil-Solla A,et al.A flexible semantic inference methodology to reason about user preferences in knowledge-based recommender systems[J].Knowledge-Based Systems,2008,21(4):305-320.

[10]劉宏哲,須德.基于本體的語義相似度和相關(guān)度計算研究綜述[J].計算機科學(xué),2012,39(2):8-13.

[11]孫海霞,錢慶,成穎.基于本體的語義相似度計算方法研究綜述[J].現(xiàn)代圖書情報技術(shù),2010,26(1):51-56.

[12]Blanco-Fernández Y,López-Nores M,Gil-Solla A,et al.Exploring synergies between content-based filtering and Spreading Activation techniques in knowledge-based recommender systems[J].Information Sciences,2011,181(21):4823-4846.

[13]徐守坤,孫德超,石林,等.基于語義推理的學(xué)習(xí)資源推薦[J].計算機工程與設(shè)計,2014,35(4):1496-1501.

[14]張克狀,劉友華,黃芳,等.一種面向用戶興趣的個性化語義查詢擴展方法[J].現(xiàn)代圖書情報技術(shù),2008,24(8):48 -52.

(本文責(zé)任編輯:郭沫含)

·研究生園地·

Research on Computation Method of Instance Similarity based on Semantic Association and its Application

Liang Shaoxing
(School of Information Management,Wuhan University,Wuhan 430072,China)

〔Abstract〕The effect of information retrieval and recommendation is relative to the similarity computation method.Taking hierarchy relationships and property relationships into account,this paper analyzed the influencing factors of path association similarity,hierarchy join association similarity and property join association similarity according to the characteristics of property sequence in ontology diagram model,and then proposed a similarity computation method between instances.Finally,this paper discussed the applications of this similarity computation method in solving overspecialization problem of content-based recommendation,sparsity problem of collaborative filtering recommendation and recall ratio and precision ratio problems of information retrieval.

〔Key words〕semantic association;similarity computation;ontology;property sequence

作者簡介:梁少星(1990-),女,碩士研究生,研究方向;個性化推薦。

收稿日期:2015-05-14

〔中圖分類號〕G252.2

〔文獻標(biāo)識碼〕A

〔文章編號〕1008-0821(2015)08-0151-06

DOI:10.3969/j.issn.1008-0821.2015.08.030

主站蜘蛛池模板: 国内精自线i品一区202| 国产精女同一区二区三区久| 国产成人高清精品免费| 色首页AV在线| 国产成年女人特黄特色大片免费| 国产成人精品在线| 欧美一区二区精品久久久| 久久免费观看视频| 国产成人精品免费av| 国产性精品| 国产主播喷水| 日韩AV手机在线观看蜜芽| 真实国产乱子伦视频| 2021国产精品自产拍在线观看| 亚洲欧美日韩成人高清在线一区| 亚洲黄网在线| 国产91久久久久久| 欧美 国产 人人视频| 国产精品欧美日本韩免费一区二区三区不卡 | 亚洲男人在线天堂| 久久毛片网| 在线色国产| 1024你懂的国产精品| 永久免费无码日韩视频| 国产精品国产主播在线观看| 日本久久久久久免费网络| 欧美色视频日本| 91视频区| 日本五区在线不卡精品| 亚洲丝袜第一页| 重口调教一区二区视频| 青青草原国产av福利网站| 一本大道AV人久久综合| 1024国产在线| 午夜精品久久久久久久99热下载 | 亚洲有码在线播放| 国产精品无码作爱| 99视频精品在线观看| 99久久精彩视频| 欧美日韩亚洲国产| 91综合色区亚洲熟妇p| 午夜福利免费视频| 波多野结衣中文字幕一区二区| 91久久精品日日躁夜夜躁欧美| 成人毛片免费观看| 亚洲天堂免费在线视频| 亚洲第一区精品日韩在线播放| 一级毛片免费的| 波多野结衣一区二区三区88| 91麻豆国产精品91久久久| 国产精品久久久久久久久久久久| 日韩国产黄色网站| 岛国精品一区免费视频在线观看 | 精品超清无码视频在线观看| 特级aaaaaaaaa毛片免费视频| 国产欧美日韩专区发布| 在线精品亚洲国产| 午夜天堂视频| 久久国产精品嫖妓| 亚洲手机在线| 国产成人精品无码一区二| 欧美日韩国产在线人| 国产成人91精品免费网址在线| 中国一级特黄视频| 性视频久久| 国产国产人在线成免费视频狼人色| 成人在线亚洲| 99久久国产综合精品女同| 日本影院一区| 青青国产视频| 香蕉久人久人青草青草| 国产成人福利在线视老湿机| 粉嫩国产白浆在线观看| 亚洲成a人片在线观看88| 热99精品视频| 国产玖玖玖精品视频| 国产麻豆福利av在线播放| 国产福利不卡视频| 亚洲成人一区二区三区| 日本www在线视频| 久久免费成人| 亚洲视屏在线观看|