李寧靜
(云南大學 信息學院,云南 昆明 650500)
知識圖譜(knowledge graph,KG)[1]通過表示學習可計算,被用作知識查詢、個性化推薦中重要的知識儲備庫,分析和量化KG中的實體間關聯關系是實現和提供這些服務的基礎和關鍵,而KG中的實體之間的關聯度計算是提供這些服務的重要依據[2-4]。KG中實體之間的關聯關系存在不確定性,通過KG結構網絡中已知的實體以及實體之間存在的邊關系,計算KG中實體之間的關聯度,不僅能驗證KG中實體之間已有關系的準確性,還能為預測實體間存在的隱含關系提供可靠依據,進而為KG的知識推理提供支撐技術。
針對KG中實體間關聯關系的表示和推理,文獻[5]通過樣例子圖以子圖同構的方法衡量KG中的實體間關系;文獻[6]基于距離和結構的相關性,提出了一種面向多源KG的實體間關聯度度量標準;文獻[7]將實體和關系嵌入到向量空間,并以向量空間距離判斷實體間的相似性;文獻[8]利用實體的語義上下文作為實體間相似性度量的補充方法,從而評估三元組存在的可能性。上述方法雖然為KG中實體間關聯度的計算方法提供了思路,但并沒有明確地對實體間的關聯關系進行定量描述,且不能有效定量地分析和表示關聯關系存在的不確定性。
基于以上的研究分析,考慮到貝葉斯網(Bayesian network,BN)[9]對于不確定知識表示和推理的有效性,本文通過構建基于KG的BN(knowledge graph based Bayesian network,KBN)來描述KG中實體之間的關聯關系,進而基于KBN的概率推理定量地表示KG中實體之間的關聯關系。根據KG實體間關聯度的計算,可以獲取更為完整和真實的KG。
KG通過三元組描述了現實世界中的實體(entity)及其之間的關系(relation),在結構網絡中利用一條有向邊及其鏈接的兩個實體[10]表示三元組(實體1,關系,實體2),KG中每個三元組表示一個事實,如三元組(“電影A”,“主演”,“演員A”)表示“電影A的主演是演員A”。對于描述特定領域知識的KG,KG中的實體分為核心實體和屬性實體兩類,其中核心實體由其鏈接的屬性實體作知識描述,根據鏈接邊的關系標簽,屬性實體又有具體的劃分。針對KG中不存在鏈接的核心實體和屬性實體,兩者間的不確定性關聯關系是研究的重點,如何計算它們之間的關聯度是本文研究的核心問題。借助已有的關聯關系,通過實體間關聯度的計算,發現核心實體和不存在鏈接的屬性實體之間的關系,是本文的主要工作。
BN是一種描述變量間依賴關系的概率圖模型[11],網絡結構為有向無環圖(directed acyclic graph,DAG),其中節點表示隨機變量,有向邊表示變量之間的依賴關系,同時每個節點的條件概率表(conditional probability table,CPT)表示該節點父節點的狀態概率[12,13]。若已知BN中給定證據變量取值時,通過概率推理可計算出其它變量不同取值的條件概率。BN被廣泛用于不確定知識的學習和推理[9],適用于表示和分析不確定性知識,并能夠對不確定性知識作出快速有效的推理。因此通過構建KBN,可以利用KBN的DAG中的變量表示KG中的實體分類,利用CPT定量描述實體之間的關聯性。
具體而言,本文的主要研究工作包括:
(1)考慮到需要計算關聯度的實體的范圍選擇對實體間關聯度計算效率的影響,本文對KG的圖結構進行剪枝處理,提出了以實體平均權重值為依據的分支限界方法,從而確定KG子圖并縮小推理計算范圍,最終降低實體間關聯度計算的時間復雜度。
(2)考慮KG中實體關聯的不確定性和關聯度度量的有效性,本文基于剪枝后的KG構建KBN,提出基于KG的KBN構建方法,其中KBN的構建包括DAG構建和CPT計算;進而利用KBN的概率推理作為KG中實體間關聯度的定量依據,提出基于KBN的KG中實體之間關聯度的計算方法。
(3)基于FB15k[14]數據集,本文實現并測試了KBN構建和實體間關聯度計算方法的有效性。
KG定義請參見文獻[15],其中對于GK的實體集合VK,U={U1,U2,…,Um} 表示核心實體的集合,Oi={o1,o2,…,ok}(1≤i≤m) 表示核心實體Ui在GK中對應的屬性實體集合,因此Ui可以由Oi來特定標識。
例如,圖1是根據現實世界中的電影數據信息,構建的一個有關電影領域的KG。電影領域KG的核心實體為電影,其中電影屬性實體又有具體的分類,主要包括“演員”、“導演”、“電影類型”和“編劇”等類型。針對圖1中的KG,“電影B”的主演是“演員B”,而另一部“電影A”與“電影B”具有相同的導演和電影類型,則“演員B”很有可能也是“電影A”的主演,即兩者之間的關聯關系存在不確定性。本文通過已有的實體與實體間關系,計算“電影A”與“演員B”的關聯度,為目標實體組(“演員B”,“電影A”)是否存在關聯提供定量的依據(即虛線邊是否真實存在)。

圖1 簡化的KG
KG中實體間關聯度的計算時間復雜度,與目標實體組為中心的范圍選擇有關,為此本文對KG的規模與結構進行預處理,具體步驟為:①提取KG的d步子圖,其實現方法見定義1;②在d步子圖的基礎上引出實體平均權重值value(vi)的概念,其計算方法見定義2;③通過分支限界算法提取以目標實體組為核心的KG核心子圖(central sub-graph,CSG),并以核心子圖作為構建KBN的初始結構,其具體實現方法見2.1節。
定義1Gd是GK的d步可達子圖,其中Gd滿足以下條件:①弱連接;②包含以目標實體組為起點d步內可達的所有實體及其連接邊(包含目標實體),d為設置的路徑長度。
例如,設置d=2,圖2則為圖1的d步可達子圖,并以此作為之后計算實體平均權重值和獲取GK核心子圖的依據。

圖2 d=2的Gd
KG中出現頻率低的關系更能度量實體之間的相似性[5],同時實體節點度[15]也是衡量實體重要性的有效指標。因此本文引出實體平均權重值的概念,實體的重要程度可由節點度和其連接邊的逆邊標簽頻率[5]綜合反映。實體平均權重值越大,說明該實體在圖結構中的重要程度越高,以此作為之后剪枝工作的依據,這樣能保證KG的規模縮減是有效的。
定義2 基于Gd的實體vi的平均權重值value(vi),反映實體vi在圖結構中的重要程度,其計算公式如式(1)所示
(1)
ief(e)=log(|E(G)|/#label(e))
(2)
其中,ief(e) 為逆邊標簽頻率,其表示邊標簽在Gd中出現的頻率越小,則該邊標簽越重要;Ei為與實體vi相連接的邊的集合, ∑ief(e) 表示邊集合Ei中所有邊e的逆邊標簽頻率值之和,Ci為實體vi的節點度,即與實體vi相連的邊數之和;ief(e) 的計算公式如式(2), |E(G)| 為Gd中的邊總數, #label(e) 為Gd中與邊e有著相同標簽的邊數。根據圖2的各實體value(vi) 值計算見表1。

表1 Gd的value(vi) 值計算結果
定義3 KBN:KBN用一個二元組G=(GB,θ) 表示,其中:
(1)GB=(XB,EB) 為KBN的DAG結構,XB={X1,X2,…,Xm} 為變量集合,其中每個變量分別對應KG中的一種實體的分類;EB為有向邊集合,其中
(2)θ={p(Xi|Pa(Xi))}, (Xi∈XB) 為條件概率分布的集合,由各變量CPT中的概率參數值構成。
針對目標實體組(核心實體,屬性實體)的關聯度計算,核心實體可以由其鏈接的屬性實體唯一表示,因此本文構建屬性實體之間依賴關系的KBN,其中根據邊標簽可以將屬性實體再作具體的分類,每個分類對應KBN中的各個變量。對于圖1中的電影領域KG而言,針對目標實體組(“電影A”,“演員B”),通過構建電影屬性類實體間關系的KBN,圖1中的實體“演員B”對應KBN中的“演員”變量的特定取值,核心實體“電影A”可以由電影屬性實體“導演A”和“動作片”來標識,即KBN中“導演”與“電影類型”這兩個變量的特定取值。因此,目標實體組的關聯度可以定量地表示為條件概率p(“演員”=演員B |“導演”=導演A,“電影類型”=動作片)。
本文提出基于Gd和value(vi)值的KBN構建方法,首先基于GK生成Gd并計算value(vi)值,以此獲取CSG,并基于CSG作為初始結構構建KBN的DAG。進而利用DAG和抽取得到的數據集D計算得到CPT,從而完成KBN的構建。
定義4 CSG: 核心子圖(central sub-graph,CSG),表示為剪枝后最優的Gd子圖,即目標評分函數Scoremax(Gd)為最大且同時滿足①包含不少于Nmin個實體;②Scoremax(Gd)不小于閾值E。
CSG的獲取由分支限界算法[16]實現,其目的是從Gd中獲取基于目標實體組的最優結構,并同時縮減Gd的規模。因此,基于各實體value(vi)值的計算和CSG的定義4,本文通過分支限界算法對Gd進行實體范圍的縮減,從而獲取Gd的最優子結構(即CSG),保證GK優化的有效性,并以此作為構造KBN的初始結構。具體思想與算法1 如下:
其中,W表示Gd中所有實體的value(vi)值之和;Nmax表示最多要選的實體總數(包括目標實體);Nmin表示最少要選的實體數(包括目標實體);W’表示最少要選的實體的value(vi)值之和;分支限界算法的目標函數見式(3),SWi的值取0或1(0表示該實體沒選,1表示該實體選上),在約束條件的前提下,盡可能找到value(vi)值之和最大的子圖
(3)
算法1: 分支限界算法
輸入:Gd:GK的k步子圖
輸出: {SW1,SW2, …,SWn}
(1) 初始化,構造一個空的最大堆H, 初始一個子集樹T
(2) 計算每個實體的value(vi)值,W值
(3)best←0,i←1,j←1,tempW←0,Wi←0,n←Gd的實體數
(4)WHILEi≠n+1DO//子集樹的構建過程
(5)IFi≤tTHEN//t為目標實體組中的實體個數
(6)tempW←tempW+value(vi);Wi←Wi+value(vi)
(7)best←best+value(vi);SWi←1;i←i+1;j←j+1
(8)ENDIF
(9)IF(j≤Nmax) and (n-i+j≥Nmin) and (tempW+(W-Wi)≥W’)THEN
(10)IFbest (11)best←tempW+value(vi);Wi←Wi+value(vi);j←j+1 (12) InsertToHeap(H,i+1,tempW+value(vi), 1) //構建左子樹 (13)ENDIF (14)upbound←0 (15)FORs←i+1TonDO (16)upbound←upbound+value(vi) (17)ENDFOR (18)IF(upbound≥Wi) and (n-i+j-2≥n′)THEN (19) InsertToHeap(H,i+1,upbound, 0) //構建右子樹 (20)ENDIF (21)enode←removeMaxFromHeap(H);i←enode.level (22)ENDWHILE (23)FORi←nDOWNTOt+1DO (24)IFenode.leftchild=1THENSWi←1 (25)ELSESWi←0 (26)ENDIF (27)enode←enode.parent (28)ENDFOR (29)Return{SW1,SW2, …,SWn} 在算法1的步驟(5)-步驟(8)中,本文將目標實體構造作為樹的根節點,因為最后的子圖結構中目標實體必須保留。步驟(10)-步驟(13)中,考慮選擇第i個實體,即當前節點的左孩子。步驟(14)-步驟(20)中,根據計算可能的最大上界值upbound來判斷是否產生右孩子。步驟(18)用來判斷右孩子的產生是否會有最優解。步驟(21)中,將最大堆H中的根節點移除,最大堆中可以得到下一個待拓展節點。步驟(23)-步驟(29)中,通過生成的路徑中從葉子節點到根節點,由下往上層遍歷,獲取最優子集 {SW1,SW2,…,SWn}, 即最終CSG的圖結構。 由圖2的Gd作為算法1的輸入,通過表1計算得到的實體value(vi)值,剪枝過程和最終得到的GK對應的CSG,如圖3所示。 圖3 剪枝得到的CSG KBN的DAG構建包括如下3個方面的問題:①確定變量節點之間是否存在邊;②確定存在邊的變量節點之間邊的方向;③構建DAG的過程中保證不出現環。 針對問題①,基于獲取的CSG得到KG中各實體間的鏈接關系,若CSG中不同的屬性類實體之間存在可達路徑,則認為對應變量節點之間存在邊。針對問題①,基于value(vi)值的計算式(1),以KBN中變量對應的不同取值實體平均權重值value(vi)之和N作為其重要程度依據,若N(Xi)>N(Xj), 即表示邊應由Xi指向Xj,N值計算公式如式(4)所示 N(Xi)=∑value(vi) (4) 針對問題③,通過N值計算確定各變量節點間的鏈接關系,并以鄰接矩陣的方式存儲。之后任選一個節點進行廣度優先搜索,若存在某個節點被訪問兩次,則說明該路徑存在回路,因此將最后一個遍歷的節點與上一節點的鄰接值置為0即可。最后得到的鄰接矩陣即為目標DAG。算法2描述了上述思想。 算法2: 構建KBN的DAG 輸入:Xi: 構建DAG的變量節點 vaule(vi): 實體vi的實體平均權重值 輸出:GB←(XB,EB): KBN的DAG結構 (1)EB←{} (2)FORi←1DOWNTOn-1DO (3)FORj←i+1DOWNTOnDO (4)IFXi與Xj對應的取值實體間存在可達路徑 THEN (5)IFN(Xi)>N(Xj)THEN (6)EB←EB∪{Xi,Xj} (7)ELSEEB←EB∪{Xj,Xi} (8) 將Xi和Xj對應的鄰接值置為1 (9)ENDIF (10)ENDIF (11)ENDFOR (12)ENDFOR (13) 以BFS遍歷鄰接矩陣, 避免環路產生 (14)ReturnGB←(XB,EB) 例如,假設KBN的變量X1、X2、X3和X4分別對應GK中的電影屬性的具體分類“演員”、“導演”、“電影類型”、“編劇”,由圖3的CSG圖結構可知存在路徑如(“編劇A”,“電影A”,“演員A”),則變量X1和變量X4之間存在邊;已知KBN中“演員”變量對應的不同取值對應屬性實體“演員A”和“演員B”,通過value(vi)值可得到N(“演員”)=value(“演員A”)+value(“演員B”)=2.52,N(“編劇”)=value(“編劇A”)+value(“編劇B”)=5.16,N(“編劇”)>N(“演員”), 即KBN中變量“編劇”為變量“演員”的父節點,邊由變量X4指向變量X1。DAG構建過程如圖4所示。 圖4 KBN的DAG構建 本文中目標實體組(核心實體,屬性實體)的關聯度計算,是基于GK中已有的實體及實體間關系。因此為了構建屬性類實體的KBN,本節基于KG的三元組抽取KBN中變量的取值,構成數據集D,從而計算KBN的CPT。 表2 數據集D 基于已構建的DAG和數據集D,本文采用似然估計[13]的方法來計算KBN中每個變量節點的概率參數表,從而最終得到KBN,最終得到的KBN如圖5所示。 圖5 構建后的KBN BN的概率推理是指利用BN的結構及其條件概率表,在給定證據后進行某些節點取值概率的計算。然而,BN的精確推理具有指數時間,其中推理的時間復雜度與節點數和節點的取值個數呈正相關,所以精確推理不適用于大規模的KG。因此,本文利用BN的近似推理算法,針對KG中實體間關聯存在的不確定性,基于KBN的近似推理定量地描述實體之間的關聯度。Gibbs采樣是眾多近似推理算法中應用最為廣泛的一種,它是一種簡單的馬爾可夫鏈蒙特卡羅算法[17](Markov chain Monte Carlo,MCMC)。 本文基于Gibbs采樣進行概率推理,針對目標實體組,將能在GK中唯一標識目標電影實體的其它電影屬性實體作為證據變量節點的取值,通過Gibbs采樣可以得到查詢變量節點在特定取值下的概率值,以此定量地表示目標實體間可能存在的不確定性關系,并作為KG中目標實體間的關聯度。算法3給出了具體描述[15]。 算法3: 基于Gibbs采樣的KBN近似推理 輸入: KBNGB←(XB,EB) E,證據變量 //即能唯一標識目標實體組中Ui的屬性實體分類 e,證據變量E的取值 //具體的屬性實體 c,GB的當前狀態 q,查詢變量 //目標實體組中的屬性實體oi s,采樣總次數;m,q值為1的樣本數量 輸出:p(q=1|e) (1)m←0 (2)隨機生成一個樣本d0, 并與狀態c一致 (3)FORk←1TOsDO (4) 計算當前狀態dk-1下的被選變量的概率值 (5) 隨機從Z中選擇一個非證據變量Xi (6)B←p(Xi=0|DMB(Xi))+p(Xi=1|DMB(Xi)) //DMB(Xi)為MB(Xi) 中各變量在當前狀態d下的值 (7) 通過p(Xi|DMB(Xi)) 對Xi采樣 (8) 隨機產生rk∈[0,B], 用下面公式確定Xi的值 (9) 用抽樣結果覆蓋dk-1中的Xi值 (10)ENDFOR (11)FORk←1TOsDO (13)m←m+1 (14)ENDIF (15)ENDFOR (16)Returnp(q=1|e) //最終的條件概率值 利用KBN近似推理算法3,可以得到p(Xj=1|Xi=1,Xs=1) 的值,即給定證據變量及其取值Xi=1,Xs=1的情況下,可得查詢變量Xj=1的條件概率值。由于核心實體可以由其它屬性實體唯一標識,核心實體與屬性實體間不確定性關聯關系即可轉換成屬性實體間的關系表示,因此通過描述屬性實體間依賴關系的KBN的概率推理,即可實現核心實體與屬性實體間不確定性關聯關系的定量推理與計算。本文中KG的目標實體組(核心實體,屬性實體)的關聯度即為條件概率p值。給定閾值ε(0<ε<1), 若p值≥ε,則核心實體存在與該屬性實體真實的關聯關系,從而獲取了更加完整真實的KG。 例如,針對目標實體組(“電影A”,“演員B”),選擇圖5中KBN的X2和X3作為證據變量節點,然后取X2=“導演A”,X3=“動作片”的情況下, 計算p(X1=“演員B”|X2=“導演A”,X3=“動作片”), 即“電影A”與“演員B”的關聯度。假設當前節點的狀態是 [X1=“演員B”,X2=“導演A”,X3=“動作片”,X4=“編劇A”], 在當前狀態下,通過X4馬爾可夫覆蓋中變量在當前狀態下的值來對非證據變量節點X4進行采樣,經過計算便可以得到p(X4=“編劇A”|X1=“演員B”,X2=“導演A”,X3=“動作片”)=1和p(X4=“編劇B”|X1=“演員B”,X2=“導演A”,X3=“動作片”)=0。 假設生成的隨機數為0.5,那么采樣結果為X4=“編劇B”, 同時生成新的狀態 [X1=“演員B”,X2=“導演A”,X3=“動作片”,X4=“編劇B”]。 若采樣次數為400,其中X1=“演員B” 的次數為320,則p(X1=“演員B”|X2=“導演A”,X3=“動作片”)=0.6, 即“演員B”與“電影A”的關聯度為0.6。若ε=0.5,則目標實體間的鏈接真實存在。 本文測試了KBN構建效率。同時在封閉世界下,實現互信息[18]方法作為對比實驗,進而直接測試本文基于KBN的KG實體間關聯度計算方法的有效性。基于OpenKE[19]平臺實現基于TransE[20]和TransR[21]的鏈接預測方法,進而間接測試本文基于KBN的KG實體間關聯度計算方法的有效性。實驗環境如下:Intel?CoreTMi5 3.40 GHz處理器,24 GB內存,Windows10操作系統,以PyCharm2019.3.1 x64為開發平臺,MySQL存儲KBN的CPT,使用Python語言編寫程序。本文使用FB15k數據集,作為測試數據集,其中數據集的實體、關系及三元組數據劃分信息見表3。其中,本文針對數據集中的電影屬性實體對應的標簽關系(relation),構建了2-relation、3-relation、5-relation的KG,其中不同關系個數的KG統計信息見表4。 表3 實驗數據集的實體、關系及三元組個數統計 表4 不同關系個數的KG統計信息 本文利用訓練集和驗證集中的三元組構建電影領域相關的KG,之后通過本文所提出的方法構建KBN,最后針對測試集中的三元組計算實體間的關聯度。構建好的KG中已有邊鏈接的實體間關聯度都大于等于ε,是本文討論的前提。 為了測試構建KBN的效率,從測試數據集中選取了不同的對應電影屬性實體的標簽關系個數(實體節點個數也不同)的KG,并分別測試了對應的是否包含數據庫I/O開銷的KBN構建時間,如圖6所示。可以看出,構建KBN的時間隨著實體數的增加基本呈線性增長趨勢,但增長趨勢逐漸減緩。 圖6 構建KBN的效率 互信息被廣泛應用于文本信息處理等領域[22],常用于描述兩個變量之間的關聯程度。本文實驗中,針對測試數據集抽取出的同一個KG,基于互信息的KG中實體間關聯關系的度量方法作為實驗的對比方法,進而直接驗證本文KG中實體間關聯度計算方法的有效性。在本實驗中,測試集中實體間的關聯關系是真實、正確的,并以之作為測試的基礎。在同一個閾值ε的前提下,通過兩種方法分別計算得到對應的關聯度,若關聯度值大于ε,則說明所計算的實體間具有關聯關系,并以此為依據對比測試集中的三元組數據,將預測正確的三元組個數/測試集中的三元組個數,從而得到兩種計算方法的正確率。 實驗中,在不同比例的訓練集下測試兩種方法的正確率,訓練集比例不同,意味著KG的規模也不同,測試結果如圖7所示。可以看出兩種關聯度計算方法的正確率都在0.6以上,同時隨著訓練集比例的增加,兩者的正確率都趨于固定的范圍值,其中基于KBN的實體間關聯度計算方法的正確率略優于基于互信息的實體間關聯度計算方法,這直接反映了本文提出方法的高效性和有效性。 圖7 不同訓練集比例下的關聯度計算正確率 本文實驗中,實體間關聯度的計算可以作為KG中不確定性關系存在的依據。如果本文方法中計算得到的關聯度值大于ε,則目標實體組中存在邊鏈接。通過與KG已有的鏈接預測方法的類比,即可間接驗證實體間關聯度計算的有效性。因此,針對測試數據集抽取出的同一個KG,本文使用基于OpenKE平臺得到基于TransE、TransR的鏈接預測方法作為對比方法。設置閾值ε,若關聯度值大于ε,則說明KG中實體間關系真實存在,將關聯度值大于ε的三元組記為正,否則記為負。隨后通過對測試集中的數據隨機替換實體構造錯誤三元組,正確三元組被預測為正記為TP,錯誤三元組被預測為正記為FP,正確三元組被預測為負記為FN。最后以關聯度為鏈接預測的依據在不同比例的訓練集下測試本文方法的有效性。本文選擇準確率(Precision)、召回率(Recall)和F值作為衡量實體間關聯度計算方法有效性的實驗指標。 實驗中,測試各方法在不同比例訓練集下的3個指標,結果如圖8、圖9和圖10所示。從圖8和圖9可以看出,隨著訓練集比例的增加,根據KBN推理計算得到的關聯度為依據的鏈接預測方法,Precision和Recall指標逐漸接近并略優于TransE方法。從圖10可以看出,各方法的F值普遍在0.5以上。實驗結果在一定程度上說明了本文提出基于KBN概率推理的KG實體間關聯度計算方法的有效性。 圖8 KG實體間關聯度計算方法的準確率 圖9 KG實體間關聯度計算方法的召回率 圖10 KG實體間關聯度計算方法的F值 綜上,在真實數據集FB15k下,通過與現有的相關方法進行實驗對比,本文所提出的基于KBN的實體間關聯度計算方法在模型構建和關聯度計算方面都有較好的表現,從而驗證了本文所提方法的可行性。 本文針對KG中實體間存在的關聯性,提出一種基于概率推理的KG中實體間關聯度的計算方法,從而為KG中實體間關聯強度的量化和推理提供了一種思路,并為KG的知識補全和鏈接預測提供了依據,但仍是KG中實體關系定量計算的初步探索。實驗結果在一定程度上驗證了所提出思路的可行性,但在鏈接預測對比實驗中的準確率、召回率和F值仍與TransR方法有一定的差距,各實驗指標仍有待提高。本文僅從現有的KG實體考慮,并未考慮外部新增數據的融合,因此未來的工作將考慮融合外部數據,從而提高KG知識表示和學習的時效性和全面性。
2.2 DAG構建
(vi為變量Xi各取值對應的屬性實體)
2.3 數據集抽取和CPT計算



3 基于KBN概率推理的KG中實體間關聯度計算

4 實驗結果和分析


4.1 KBN的構建效率

4.2 實體間關聯度計算的有效性測試




5 結束語