基于邊擾動的鏈接預測解釋方法

2025-02-28 00:00:00陳耿靖郭躬德林世水

計算機應用研究 2025年2期

摘要：多數鏈接預測模型是解釋性較差的黑盒模型，因此不少學者提出了針對鏈接預測的解釋方法，但這些方法存在著解釋的目標模型單一、缺乏泛化能力、解釋結果準確率不足等缺陷。為彌補這些不足，提出一種基于邊擾動的鏈接預測的解釋方法。首先利用廣度優先搜索得到從頭實體到尾實體的所有路徑，隨后搜索路徑所經過實體的鄰居節點，形成待解釋三元組的訓練子圖；然后采用邊擾動的方式在訓練子圖上重新訓練嵌入模型，計算每條邊對預測結果的影響程度；最后通過雙向的束搜索得到對預測結果影響程度最大的路徑，作為待解釋三元組的解釋路徑。實驗表明，該方法在公共數據集上的性能超過了大多數的鏈接預測解釋方法，ACC相較于最先進的方法提升了2.3%，AUPR提升了1.9%。同時在生物醫學數據集上針對使用鏈接預測技術的藥物重定位任務進行結果的解釋實驗，其解釋體現了良好的可理解性、啟發性。提出了一種不依賴于特定模型且有效的解釋方法，該方法通過邊擾動和路徑搜索得到解釋路徑，使結果的解釋更加直觀和易于理解，同時能夠為不同領域的知識圖譜應用提供支持。

關鍵詞：知識圖譜；鏈接預測；可解釋性；模型無關性

中圖分類號： TP18 文獻標志碼： A 文章編號： 1001-3695（2025）02-014-0425-06

doi： 10.19734/j.issn.1001-3695.2024.07.0287

Edge perturbation-based link prediction interpretation

Chen Gengjing¹， Guo Gongde¹^’， Lin Shishui²

（1.College of Computer amp; Cyber Security， Fujian Normal University， Fuzhou 350117， China; 2.Dept. of Orthopedic Surgery， Shengli Clinical Medical College of Fujian Medical University， Fuzhou University Affiliated Provincial Hospital， Fuzhou 350001， China）

Abstract：Most link prediction models are black-box models with poor interpretability. Many scholars have proposed interpretability methods for link prediction. However， these methods often have limitations such as being tailored to a single target model， lacking generalizability， and having insufficient accuracy in the interpretation results. To address these shortcomings， this paper proposed a link prediction interpretation method based on edge perturbation. Firstly， the method used breadth-first search to obtain all paths from the head entity to the tail entity and then search for the neighboring nodes of the entities in these paths to form a training subgraph for the target triplet. Then， the method applied edge perturbation to the subgraph and retrained the embedding model to calculate the influence of each edge on the prediction result. Finally， bidirectional beam search identified the path with the greatest influence on the prediction result， which served as the explanation path for the target triplet. Experiments show that the proposed method outperforms most link prediction interpretation methods on public datasets， improving accuracy （ACC） by 2.3% and area under the precision-recall curve （AUPR） by 1.9% compared to the state-of-the-art methods. Additionally， interpretation experiments on biomedical datasets for the task of drug repurposing using link prediction techniques demonstrate good understandability and inspiration. The main contribution of this paper is the proposal of an effective interpretation method that does not depend on a specific model， which obtains the interpretation paths through edge perturbation and path search， making the interpretation of the results more intuitive and easier to understand， while providing support for knowledge graph applications in different domains.

Key words：knowledge graph（KG）; link prediction; interpretability; model independence

0 引言

知識圖譜（KG）是對事實的結構化表示^［1^］，由實體、關系和語義描述組成。在資源描述框架下，知識圖譜可以用（頭實體；關系；尾實體）或（主語；謂語；賓語）形式的事實三元組表示。隨著知識圖譜的廣泛應用，大型知識圖譜的構建和維護變得至關重要。然而，現實中的知識圖譜往往是稀疏的，尤其是一些大型的知識圖譜，其圖結構可能更加稀疏。為了自動補全這些大型的知識圖譜，鏈接預測任務一直是數據挖掘領域中一項十分熱門的研究。鏈接預測任務主要通過圖結構中的已知信息來預測一些潛在或是缺失的三元組關系，借此來完善知識圖譜。

由于芯片算力迅速增長，深度學習模型進入了飛速發展時代，尤其在語音識別、機器視覺、自然語言理解等領域。受益于前者，鏈接預測的研究趨勢逐漸從傳統方法^［2^］向深度學習模型^［³^］轉變。但有著巨大參數量與計算量的深度學習模型使得人們更加難以具體地了解模型的決策過程，這種“黑盒”特性限制了它們廣泛應用在對公平性、隱私性和安全性要求較高的領域中^［4^］。例如在金融領域中，利用知識圖譜所構建的推薦系統^［⁵^］，不合適的推薦選項會帶來因為精度不足而導致的利益損失，同時數據安全性也會受到挑戰^［⁶^］。而在智能醫療中，采用知識圖譜構建的專家問診系統一旦無法對診斷的病情給出合理的判斷依據，將無法讓醫護人員與病人信服。

1 相關工作

近年來，學者們逐漸關注到可解釋性對理解知識圖譜推理結果能起到的巨大幫助，知識圖譜當中的信息不但可以用來推理、預測，更可以用來解釋模型所得到的結果，以輔助科研人員開展一些創新性的研究。Xiong等人^［7^］使用馬爾可夫決策過程找到有價值的推理路徑，并將推理路徑作為預測結果的解釋。Xian等人^［8^］通過從粗到細的神經符號來生成推理路徑，作為推薦結果的解釋。Luo等人^［9^］通過深度神經網絡參數化解釋的生成過程，使得其可以集體解釋多個實例來提供對GNN模型全局性的理解，但也會使得泛化能力更容易受到訓練數據集質量和多樣性的影響，如果訓練數據不能充分代表實際應用中的圖結構，那么生成的解釋可能不夠準確或全面。Yuan等人^［10^］通過生成能夠最大化特定預測類別的圖模式來解釋模型的預測結果，因此這種方法也是為了提供對GNN模型的全局性理解，但它依賴于圖規則以確保生成圖的質量，而這些規則需要針對不同的應用領域進行定制，泛用性有待提升。Ying等人^［11^］通過最大化互信息來量化預測概率的變化，為任何基于圖神經網絡的模型提供解釋，因為它是通過優化任務來識別子圖結構和節點特征的小子集，解釋的可讀性不強且性能表現依賴于GNN模型的內部結構和參數。姚俊萍等人^［12^］則是將知識圖譜轉換為單關系圖后，利用GNNExplai-ner^［11^］生成鏈接預測結果的解釋子圖，但是由于其在轉換單關系圖時丟棄一部分的信息，所以生成的結果連通性較差，可讀性不佳。

雖然已有了一些對深度學習模型進行解釋的方法，但現有方法都存在一些不足。首先是對模型的限制，部分方法大多是對特定模型的預測結果進行解釋，如GNN模型，即泛用性不強，無法對其他的鏈接預測模型進行應用。其次，大部分方法都是針對圖分類任務所設計的，得到的結果多為離散的子圖，其解釋性、可讀性稍弱于頭尾實體之間的路徑。最后，一些利用強化學習的方法所得到的解釋高度依賴于所選路徑的相關性和準確性，一旦預測的結果有誤，也會影響生成的解釋。不同于上述工作，本文提出了一個基于邊擾動的鏈接預測解釋方法。該方法是一個模型無關性的方法，能夠應用于大多數的鏈接預測模型，同時針對知識圖譜的方向性、稀疏性，能夠給出一個在頭尾節點之間的路徑作為解釋。經測試，本文方法在準確率上優于目前大多數的預測解釋方法，且可有效地應用于藥物重定位領域，為醫藥人員的工作提供一定程度的輔助與啟示。

2 方法

2.1 問題定義

一般而言，知識圖譜G={E，V，F}，E表示連接兩個節點邊的集合，V表示圖中節點的集合，F是事實的集合，通過（h，r，t）三元組的形式存儲，h表示頭實體，r表示關系，t表示尾實體。當給定一個知識圖譜嵌入模型M時，它將會對三元組（h，r，t）給出一個置信度的分數s（h，r，t）=M（e_h，e_r，e_t），其中e_h是頭實體h的嵌入，e_r是關系r的嵌入，e_t是尾實體t的嵌入。對于知識圖譜中沒有直接鏈接的兩個實體h_a和h_b，知識圖譜嵌入模型M將給出這兩個實體之間具有關系r_a的置信度。因此在進行解釋工作前，對知識圖譜作出如下假設：

a）針對知識圖譜當中的每一個關系r_i∈R，都存在一個逆關系r^-1_i∈R，使得（h_i，r_i，t_i）與（t_i，r^-1_i，h_i）的語義相同。如在生物醫學知識圖譜中，（colistin，may treat，cholangitis）與（cholangitis，may be treated by， colistin）有著相同的語義，都表示克利斯汀（colistin）可以治愈膽管炎（cholangitis）。

b）（h，r，t）的解釋I（h，r，t）與其語義相同、關系互逆的（t，r^-1，h）的解釋I（t，r^-1，h）是等價的，兩者都可以反映出相同的語義，即I（h，r，t，） I（t，r^-1，h）。

c）當頭實體h和尾實體t確定時，它們之間的關系r唯一的。

對于知識圖譜G中不存在直接關聯的有序實體對（h，t），可通過嵌入模型M給出這兩個實體之間具有關系r的三元組（h，r，t），h與t之間可通過多條多跳的路徑將其連接起來。三元組（h，r，t）的解釋工作就是尋找對模型給出預測結果正向引導最強的一條路徑，將其作為預測結果的解釋I（h，r，t）。

2.2 核心思想

傳統因果關系指的是在基于一系列變量X=（x₁，x₂，…，x_n}對預測目標Y使用函數f（·）進行預測時，假如|f（{x₁，x₂，…，x_n}）-Y|lt;|f（{x₁，x₂，…，x_n}＼x_i）-Y|，即預測目標Y時去除變量x_i導致了誤差的增加，則可認為x_i與目標Y存在因果關系。Lin等人^［13^］將傳統因果關系拓展到了圖分類的解釋任務，如果在網絡當中刪除一個節點或者邊，能夠明顯地干擾預測結果、顯著地降低預測結果的置信度，那么所刪除的節點或者邊就與結果有著一定的因果關系。但由于知識圖譜中的數據具備依賴性、關聯性，直接采用這種思想所得到可能會有偏差，所以本文提出了一個基于邊擾動的鏈接預測解釋方法（edge perturbation-based link prediction interpretation， EP-LPI），將因果關系的思想進行拓展以解釋鏈接預測的結果。文獻［14，15］的實驗證明，頭尾實體周圍的鄰域信息將會影響鏈接預測任務的精度，即如果某個鄰域信息的三元組對鏈接預測結果有顯著的提升作用，可以認為該三元組與預測結果具有因果關系。因此在對知識圖譜的鏈接預測結果進行因果分析時，首先定義邊的重要度：當給定一個已訓練的知識圖譜嵌入模型和一個知識圖譜的實例G^c，嵌入模型計算三元組（h，r，t）的置信度記為δ_{（h，r，t）}_∈G^c，在知識圖譜實例中刪除邊e_j后，（h，r，t）的置信度記為δ_{（h，r，t）}_∈G^c_＼{ej}，其中e_j∈G^c。通過這兩個定義，可以量化e_j對目標嵌入模型，得到三元組（h，r，t）置信度的因果貢獻，即可以理解為e_j的重要度。更準確地說，e_j的重要度定義為模型所給出置信度的改變，如式（1）所示。

Δ_δ，ej=δ_{（h，r，t）}_∈G^c_＼{ej}-δ_{（h，r，t）}_∈G^c（1）

為了計算δ_{（h，r，t）}_∈G^c和δ_{（h，r，t）}_∈G^c_＼{ej}，首先訓練知識圖譜嵌入模型M，然后在G^c和不包括邊e_j的G^c＼{e_j}上分別計算（h，r，t）置信度，這兩者的置信度如式（2）（3）所示。

δ_{（h，r，t）}_∈G^c=M（G^c，e_h，e_r，e_t）（2）

δ_{（h，r，t）}_∈G^c_＼{ej}=M（G^c＼{e_j}，e_h′，e_r′，e_t′）（3）

當給定計算圖中邊的因果貢獻后，可以相應地對邊進行排序，選擇最相關的若干條邊組成從h到t的一條路徑作為（h，r，t）預測結果的解釋路徑。但由于在實際應用時計算圖中所有邊的重要度會產生大量的計算開銷，所以EP-LPI采用貪心算法在頭尾節點之間雙向搜索重要度最高的若干條邊，將這些邊組成鏈接預測結果的解釋。EP-LPI中尋找解釋路徑的算法流程如圖1所示。

由于大型知識圖譜存在完備性不高、圖結構較稀疏的缺點，所以如果不限制對于（h，r，t）所產生的解釋長度，所得到的解釋路徑的可讀性將大大降低。同時，每一條邊的重要度并不是獨立的，例如，由于環路的存在，某個節點的1跳鄰居也可能是同一節點的2跳鄰居，在實際應用時進一步合并各種圖規則以保證路徑的連通性、可讀性。如在圖1中，atopic dermatitis、allergic rhinitis、seborrheic dermatitis這三個節點可能存在雙向的關系，即形成環路，當搜索從節點atopic dermatitis到節點cyclosporine的最優路徑時，有可能得到一個冗余的路徑，因此在圖中去除了環路以避免循環引用。

2.3 解釋搜索算法

本文利用貪心算法與邊的重要度設計了一種尋找鏈接預測結果解釋的算法。首先利用廣度優先搜索的方式從頭實體h出發，逐跳查找與當前實體所連接的邊，計算這些邊的重要度，并根據重要度進行降序排序。為了縮小搜索空間，只選擇重要度最高的k條邊所連接的節點作為下一條的目標，直到解釋路徑達到長度l。

算法1 解釋路徑搜索算法

輸入：知識圖譜G^c；三元組（h，r，t）；知識圖譜嵌入模型M；解釋路徑長度l、k。

輸出：長度為l的解釋路徑P。

初始化隊列Q，集合P

在G^c上訓練模型M

Q.push（h） //將頭節點壓入隊列Q

while Q不為空：

s=Q.pop（）

P.pop（） //彈出不合適的路徑

初始化數組H

for e∈{（s，r_i，t_j）|r_i∈E，t_j∈V}：

將e從G^c內移除，重新訓練模型M，得到（h，r，t）新的嵌入表示（e_h′，e_r′，e_t′）

Δ_δ，e=M（G^c，e_h，e_r，e_t）＼-M（G^c＼e，e_h，e_r，e_t）

//計算e邊的重要度

H.push（map（e，Δ_δ，e）） //將（e，Δ_δ，e）組成映射，壓入數組H中

end for

sort（H） //對數組H進行降序排序

for i in（1，k）

if e not in P

P.push（e） //將邊e作為候選，壓入鏈接解釋路徑P中

Q.push（e.tail） //將邊e所連接的尾實體壓入隊列Q

if （len（P）=l）//如果長度滿足要求，就返回找到的解釋路徑

return P

end if

end for

通常知識圖譜的數據不完整且圖結構較為稀疏，從頭實體到尾實體單向搜索所得到的解釋路徑可能無法滿足所設定的長度要求，但（h，r，t）的解釋與其語義相同、關系互逆的（t，r^-1，h）的解釋是等價的，所以采用一種雙向搜索的方式來更好地得到所需要的解釋路徑，從尾實體到頭實體再運用一次算法1求得解釋路徑，最后根據路徑的平均重要度選取較高的路徑作為對（h，r，t）的解釋。具體流程如算法2所示。

算法2 雙向搜索算法

輸入：需要進行解釋的三元組（h，r，t）。

輸出：解釋路徑I。

pathForward=findExplanation（G^c，h，r，t）

//根據算法1計算（h，r，t）的解釋路徑

fI=calculate（pathForward）//根據正向的解釋路徑計算平均重要度

pathBackward=findExplanation（G^c，t，r^-1，h）

//根據算法1計算（t，r^-1，h）的解釋路徑

bI=calculate（pathBackward）

//根據反向的解釋路徑計算平均重要度

if（fIgt;bI）： //選擇平均重要度的解釋路徑作為最后的解釋路徑

return pathForward

else

return pathBackward

end if

2.4 子圖構建策略

當知識圖譜數量龐大、含有較多的實體時，在整個知識圖譜上對嵌入模型進行微調以適應每次修改的變化會浪費較多的算力與時間，這種做法不切實際。因為鏈接預測所需要的信息大部分是由頭尾節點附近的語義信息所提供的^［16^］，所以為了有效地減少模型重新訓練的成本，本文設計了一種基于子圖的嵌入重新訓練策略。

對于給定三元組（h，r，t），構建屬于該事實的訓練子圖過程如下：首先通過廣度優先搜索算法搜索所有從頭實體h到尾實體t且長度小于l的路徑P_h_→t={p₁，p₂，…，p_m}，合并路徑上的所有節點V_h_→t=V_p1∪V_p2∪…∪V_pm，將節點集合V_h_→t與節點間所連接的邊E_h_→t構建屬于該三元組的主要子圖g₁；然后遍歷完整的知識圖譜，搜索所有與節點集合V_h_→t相連接的節點V_h_→t′={v_i|（v_i，v_j）∈G，v_j∈V_h_→t}與連接兩者的邊E_h_→t′={e_i|（v_i，v_j）∈G，v_j∈V_h_→t，e_i∈E}，其中（v_i，v_j）表示在知識圖譜G中存在的邊將v_i和v_j相連，將節點集合V_h_→t′與節點間所連接的邊E_h_→t′構建屬于該三元組的衍生子圖g₂；最后，將主要子圖與衍生子圖進行合并，得到了用于微調嵌入模型的訓練子圖g_train=g₁∪g₂。訓練子圖如圖2所示。

2.5 評價指標

本文參照目前大多數解釋性任務的實驗設置，將該任務轉換為了二分類任務進行評價。因此采用三種常見的二分類指標來評估本文方法的性能。

a）準確率（accuracy）：表示模型正確預測的樣本占總樣本的比例，如式（4）所示。

accuracy=TP+TNTP+FP+TN+FN（4）

b）接收器工作特征曲線下面積 AUROC（area under the ROC curve）：這是根據真陽性率（TPR）和假陽性率（FPR）的變化得到的曲線下的面積，用來評估模型對于不同閾值下的分類能力。AUROC 值越接近1，說明模型能更好地區分正例和負例，具有更好的分類性能，如式（7）所示。

c）精確回憶曲線下面積 AUPR（area under precision/recall curve）：PR 曲線繪制了精確率（precision）和召回率（recall）之間的關系。AUPR 表示 PR 曲線下方的面積，用來評估模型在不同召回率下的精確度。AUPR 值越接近1，說明模型在保持較高召回率的同時，具有更高的精確率，即模型的預測結果更加可信，如式（10）所示。

3 實驗和結果

本章主要分析EP-LPI方法的有效性與兼容性，判斷其是否適用于各類的知識圖譜嵌入模型。

3.1 數據集

為了對解釋性能力進行評估，選取了由文獻［17］所整理的Family-rr數據集。它是一個包含有多個家庭成員之間親情關系的知識圖譜數據集，利用該文獻所提出的RuLES工具，首先提取出了數據集中具備“mother”關系的鏈接路徑作為本文評估的ground-truth。但本文方法考慮到三元組所對應的逆關系三元組之間的路徑也會影響到對三元組進行解釋，因此也提取出“son”和“daughter”關系的鏈接路徑作為評估ground-truth的補充。本文對Family-rr數據集進行了預處理，確保了每一個三元組（h，r，t）都存在對應的逆關系三元組（t，r^-1，h）。

同時，為了檢驗本文方法的實際應用效果，在生物醫學信息本體系統（biomedical informatics ontology system， BIOS）^［18^］數據庫上進行測試，BIOS是一個收錄了2 848萬醫學概念、5 456萬醫學術語、1.12億條醫學三元組的知識圖譜，本文從數據庫中篩選一部分醫藥信息構成用于解釋藥物重定位的數據集。數據集信息如表1所示。

3.2 實驗設置

為了檢驗本文方法的EP-LPI的性能，選取了目前先進的六種解釋性算法進行對比。

a）PGPR^［19^］。這是一種基于強化學習的解釋方法，該方法設計了一個合理的獎勵策略、剪枝操作和多跳評分函數，然后利用圖的搜索算法搜索出評分最高的路徑作為鏈接預測的解釋。

b）ELPE^［20^］。使用 graph Transformer^［21^］的變體作為編碼器來歸納聚合鄰域信息，然后使用強化學習方法作為解碼器來預測頭部和尾部實體之間的推理路徑。

c）CRIAGE^［22^］。通過使用敏感性分析的方法，確定對預測鏈路最有影響力的事實。另外，還評估了模型對添加虛假事實的敏感性。

d）CAFE^［8^］。從用戶配置文件中獲取用戶行為信息，并作為一種粗略的指導，然后在該指導下，利用細粒度的路徑搜索算法推導出解釋路徑。

e）KGEP^［23^］。首先利用擾動的思想來搜索最關鍵的實體，然后搜索實體之間最重要的邊來得到解釋路徑。

f）PaGE-Link^［24^］：首先通過剪枝操作刪除節點周圍的部分信息，然后借助掩碼學習的方式尋找出較為重要的邊組成解釋路徑。

數據集按照9∶0.5∶0.5的比例劃分訓練集、測試集和驗證集。本文選取RotatE^［25^］作為本文方法中的知識圖譜嵌入模型，并在訓練集和驗證集上訓練知識圖譜的實體嵌入向量和關系嵌入向量。訓練RotatE模型時，使用Adam優化器，學習率設置在{0.5，0.1，0.01，0.001}，使用xavier初始化的方式初始化實體嵌入向量和關系嵌入向量，且兩者的維度都設置為256，batch_size設置為128，epoch設置為1 000。在對嵌入向量進行微調時，將使用已經訓練好的模型參數，epoch設置為40，batch_size設置為1，使得模型能根據子圖進行準確的微調。

3.3 對比實驗

本文與上述六種方法在Family-rr數據集進行了性能對比，結果如表2所示。可以看到，EP-LPI與基線模型相比，在ACC上提升了1.5%，在AUPR上提升了1.4%。

PGPR、ELPE和CAFE模型這三者都是采用強化學習的方式來指導知識圖譜的路徑推理。雖然PGPR所設計的軟獎勵策略和用戶條件行動剪枝策略可以提高知識圖譜推理的效果，但由于知識圖譜稀疏性，當實體或關系缺乏足夠的數據支持，就會導致獎勵信號無法有效到達目標節點，解釋路徑的正確率也會下降。ELPE則是一個結合了特征表示學習和推理的聯合框架，它的重點在于對新興實體進行歸納表示學習，因為新興實體在知識圖譜中的信息較少，所以學習到的表示可能不夠準確或上下文信息不恰當，路徑推理的性能就會受到限制，生成解釋的精度也會下降。而CAFE借助用戶檔案來引導路徑搜索過程，得出推理路徑，但在搜索過程中同時考慮了由用戶檔案所得到的用戶行為信息，因此在解釋性的精度上要優于純粹的強化學習方法。當知識圖譜中添加或移除一個事實時，CRIAGE使用一階泰勒展開來近似估計目標事實的預測分數變化，但這種近似可能無法準確反映實際的嵌入變化。KGEP則是使用了敏感性的分析找出對鏈接預測影響最大的實體，但是在搜索時忽略了知識圖譜的稀疏性與方向性。PaGE-Link中刪除實體周圍鄰居信息的操作雖然使得圖的理解、搜索變得更簡單，但也可能導致關鍵信息的丟失、解釋結果精度的降低。而EP-LPI則是利用重要性來搜索對預測結果影響最大的邊，但由于考慮到了雙向的路徑，所以性能相比KGEP有所提升。同時，由于本文所設計的子圖構建策略是針對每一個三元組構建一個更加精細的上下文子圖，對使用了全局訓練的嵌入參數進行微調操作，相比采用強化學習的方法能更好地得到解釋路徑。

3.4 模型無關性

為了驗證EP-LPI是否能夠適配不同的知識圖譜嵌入模型，選取了多個較為經典的嵌入模型進行測試，分別是TransE^［26^］、RotatE、DistMult^［27^］、ComplEx^［28^］。在訓練TransE、DistMult和ComplEx 時，使用了與訓練RotatE一樣的參數設置，其性能結果如圖3所示。從圖3可以看到，所提方法能夠較好地適配不同的知識圖譜嵌入模型，四個嵌入模型的ACC、AUC、AUPR指標都較為接近。

3.5 時間復雜度

EP-LPI的時間復雜度只與知識圖譜的規模以及待計算重要性的邊的數量有關。當給定一個知識圖譜G={E，V，F}以及待解釋的三元組（h，r，t）時，假設頭實體h和尾實體t之間的最長路徑的長度為L，路徑的分支數為K，那么在第一跳和最后一跳時需要計算的邊的數量為K，路徑中間的節點所計算的邊數為K²，單向搜索時需要計算的邊的數量則為2K+（L-2）·K²。由于采用了雙向搜索的策略，所以整體的計算量為4K+2（L-2）·K²。

模型的訓練時間和微調時間是一次性的時間成本，當為任何給定的三元組實例（h，r，t）生成解釋時，將會均攤所耗費的時間成本，因此在計算時間開銷上可以舍去這一項。

3.6 參數分析

為了獲取方法中各個嵌入模型的最佳參數，探索了不同的特征向量維度對實驗結果的影響。具體的實驗結果如圖4和5所示。依舊是對較為經典的4個嵌入模型進行測試，分別將特征維度設置為32、64、128、256。從圖4可以看出，隨著嵌入維度的增加，方法的正確率也在上升，尤其是從128維增加到256維時，正確率提升的幅度最為明顯。這說明，當嵌入維度增加時，所提方法能夠更好地學習到知識圖譜當中的實體信息和關系信息。

但從圖5也可看出，隨著嵌入維度的增加，AUC提升的效果并不如ACC一樣明顯，甚至隨著維度的上升，還有下降的趨勢，說明維度過大時會產生大量的冗余信息，對模型造成負面影響。

3.7 實際應用：藥物重定位

藥物重定位指的是對已經用于臨床治療的藥物探索新的適用癥或用途，現有的大部分工作都是在知識圖譜上進行鏈接預測任務，來推測重定位的候選藥物。為了檢驗本文方法的實際應用效果，在BIOS數據集上進行藥物重定位任務的解釋工作。根據其得到的結果，隨機選取了4個重定位藥物-疾病的解釋路徑進行人工查驗，解釋結果如圖6所示。

特應性皮炎（atopic dermatitis）和單純性苔蘚（lichen simplex）癥狀相似，而他克莫司（tacrolimus）是一種免疫抑制劑，可以通過抑制免疫系統的反應來減輕單純性苔蘚的癥狀，因此他克莫司也可以治愈特應性皮炎。同樣地，幼兒特應性皮炎與成年的特應性皮炎癥狀相似，環孢菌素（cyclosporine）作為治療幼兒特應性皮炎的藥物，也可以用來治特應性皮炎。哌拉西林（piperacillin）主要用于治療革蘭陰性細菌引起的感染，如膽管炎，而萬古霉素（vancomycin）與哌拉西林是在住院感染時常使用的抗生素組合治療方案，因此萬古霉素也可以用于治療膽管炎（cholangitis）。賽妥珠單抗（certolizumab）和英夫利西單抗（infliximab）藥效相似，而英夫利西單抗則是一種用于治療炎癥性腸病（inflammatory bowel disease，IBD）的藥物，因此賽妥珠單抗也可以用于治療炎癥性腸病。

4 結束語

本文提出了一種基于邊擾動的鏈接預測解釋方法，與主要側重某一種鏈接預測模型的解釋任務的類似工作不同，本文方法具備模型無關性，且預測結果有著良好的精度。構建出三元組的主要子圖后，通過邊的重要性進行雙向搜索，選擇最重要的邊構成預測結果的解釋路徑。藥物重定位的解釋實驗也表明，本文方法能夠有效地給出模型推測出重定位藥物的原因，本文隨機選擇的四個重定位藥物-疾病解釋路徑都具備著較好的可讀性、啟示性。

借助邊擾動的操作來確定邊的重要性，使得本文方法能夠適用于大多數的鏈接預測模型，同時考慮到知識圖譜的稀疏性，采用雙向搜索的策略則避免了生成的解釋路徑可讀性較差。但本文方法在對解釋路徑的分析方面也存在著局限性，目前的分析主要依靠與規則提取出的ground-truth進行比對，本質上還是一種定性的評價，缺乏對解釋結果的量化評估指標，因此只能依靠人工對解釋路徑進行查驗、分析。后續可從邏輯規則的角度出發，對搜索到的解釋路徑進行量化分析，以評估其價值。

現有的鏈接預測方法大多只提供了預測結果，而沒有給出相應的原因，但從本文所設計的實驗可以看出，本文方法可以有效地尋找到對模型預測結果最重要的一條路徑，且針對藥物重定位的案例分析，也可看出所得到的解釋路徑是合理有效的，能為醫療工作者提供一定的參考價值，提升預測結果的可信度。

參考文獻：

［1］Ji Shaoxiong， Pan Shirui， Cambria E， et al. A survey on knowledge graphs： representation， acquisition， and applications ［J］. IEEE Trans on Neural Networks and Learning Systems， 2021， 33（2）： 494-514.

［2］趙博，王宇嘉，倪驥. 知識圖譜的增強CP分解鏈接預測方法［J］. 計算機應用研究， 2023， 40（5）： 1396-1401. （Zhao Bo， Wang Yujia， Ni Ji. Enhanced canonical polyadic decomposition link prediction embedding method of knowledge graph ［J］. Application Research of Computers， 2023， 40（5）： 1396-1401.）

［3］Baghershahi P， Hosseini R， Moradi H. Self-attention presents low-dimensional knowledge graph embeddings for link prediction ［J］. Knowledge-Based Systems， 2023， 260： article ID 110124.

［4］Doshi-Velez F， Kim B. Towards a rigorous science of interpretable machine learning ［EB/OL］. （2017-02-28）. https：//arxiv. org/abs/1702. 08608.

［5］張波，趙鵬，張金金，等. 基于用戶潛在興趣的知識感知傳播推薦算法［J］. 計算機應用研究， 2022， 39（9）： 2615-2620. （Zhang Bo， Zhao Peng， Zhang Jinjin， et al. Knowledge-aware propagation recommendation algorithm based on user’s potential interest ［J］. Application Research of Computers， 2022， 39（9）： 2615-2620.）

［6］Kim B， Khanna R， Koyejo O O. Examples are not enough， learn to criticize！ Criticism for interpretability ［J］. Advances in Neural Information Processing Systems， 2016， 29： 2288-2296.

［7］Xiong W， Hoang T， Wang W Y. DeepPath： a reinforcement learning method for knowledge graph reasoning ［EB/OL］. （2017-07-20）. https：//arxiv. org/abs/1702. 08608.

［8］Xian Yikun， Fu Zuohui， Zhao Handong， et al. CAFE： coarse-to-fine neural symbolic reasoning for explainable recommendation ［C］// Proc of the 29th ACM International Conference on Information amp; Knowledge Management. New York： ACM Press， 2020： 1645-1654.

［9］Luo Dongsheng， Cheng Wei， Xu Dongkuan， et al. Parameterized explainer for graph neural network ［J］. Advances in Neural Information Processing Systems， 2020， 33： 19620-19631.

［10］Yuan Hao， Tang Jiliang， Hu Xia， et al. XGNN： towards model-level explanations of graph neural networks ［C］// Proc of the 26th ACM SIGKDD International Conference on Knowledge Discovery amp; Data Mining. New York： ACM Press， 2020： 430-438.

［11］Ying Z， Bourgeois D， You Jiaxuan， et al. GNNExplainer： generating explanations for graph neural networks ［J］. Advances in Neural Information Processing Systems， 2019， 32： 9244-9255.

［12］姚俊萍，袁聰，李曉軍，等. 面向知識圖譜鏈接預測任務的解釋子圖生成模型［J］. 計算機應用研究， 2024， 41（2）： 375-380. （Yao Junping， Yuan Cong， Li Xiaojun， et al. Interpretive subgraph generation model for knowledge graph link prediction task ［J］. App-lication Research of Computers， 2024， 41（2）： 375-380.）

［13］Lin Wanyu， Lan Hao， Li Baochun. Generative causal explanations for graph neural networks ［C］// Proc of the 38th International Conference on Machine Learning. New York： ACM Press， 2021： 6666-6679.

［14］Shang Chao， Tang Yun， Huang Jing， et al. End-to-end structure-aware convolutional networks for knowledge base completion ［C］// Proc of AAAI Conference on Artificial Intelligence. New York： ACM Press， 2019： 3060-3067.

［15］Schlichtkrull M， Kipf T N， Bloem P， et al. Modeling relational data with graph convolutional networks ［C］// Proc of the 15th International Conference on Semantic Web. Berlin： Springer， 2018： 593-607.

［16］Zhang Muhan， Chen Yixin. Link prediction based on graph neural networks ［J］. Advances in Neural Information Processing Systems， 2018， 31： 5171-5181.

［17］Ho V T， Stepanova D， Gad-Elrab M H， et al. Rule learning from knowledge graphs guided by embedding models ［C］// Proc of the 17th International Semantic Web Conference on Semantic Web. Berlin： Springer， 2018： 72-90.

［18］Yu Sheng， Yuan Zheng， Xia Jun， et al. BIOS： an algorithmically generated biomedical knowledge graph ［EB/OL］. （2022-03-18）. https：//arxiv. org/abs/2203. 09975

［19］Xian Yikun， Fu Zuohui， Muthukrishnan S， et al. Reinforcement knowledge graph reasoning for explainable recommendation ［C］// Proc of the 42nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York： ACM Press， 2019： 285-294.

［20］Bhowmik R， de Melo G. Explainable link prediction for emerging entities in knowledge graphs ［C］// Proc of the 19th International Semantic Web Conference on Semantic Web. Berlin： Springer， 2020： 39-55.

［21］Yun S， Jeong M， Kim R， et al. Graph transformer networks ［J］. Advances in Neural Information Processing Systems， 2019， 32： 11983-11993.

［22］Pezeshkpour P， Tian Yifan， Singh S. Investigating robustness and interpretability of link prediction via adversarial modifications ［EB/OL］. （2019-03-02）. https：//arxiv. org/abs/1905. 00563.

［23］潘小琴. 基于可解釋性知識圖譜的藥物重定位［D］. 湖南：湖南大學， 2022. （Pan Xiaoqin. Drug repositioning based on interpretable knowledge graph［D］. Hunan： Hunan University， 2022.）

［24］Zhang Shichang， Zhang J， Song Xiang， et al. PaGE-Link： path-based graph neural network explanation for heterogeneous link prediction ［C］// Proc of ACM Web Conference. New York： ACM Press， 2023： 3784-3793.

［25］Sun Zhiqing， Deng Zhihong， Nie Jianyun， et al. RotatE： knowledge graph embedding by relational rotation in complex space ［EB/OL］. （2019-02-26）. https：//arxiv. org/abs/1902. 10197.

［26］Bordes A， Usunier N， Garcia-Duran A， et al. Translating embeddings for modeling multi-relational data ［J］. Advances in Neural Information Processing Systems， 2013， 26： 2787-2795.

［27］Yang Bishan， Yih W， He Xiaodong， et al. Embedding entities and relations for learning and inference in knowledge bases ［EB/OL］. （2014-12-20）. https：//arxiv. org/abs/1412. 6575.

［28］Trouillon T， Welbl J， Riedel S， et al. Complex embeddings for simple link prediction ［C］// Proc of International Conference on Machine Learning. New York： ACM Press， 2016： 2071-2080.

計算機應用研究2025年2期

計算機應用研究的其它文章: 下期要目; 融合音頻內容、風格和情感特征的人臉動畫生成方法; 基于多層次圖拓撲對比細化的動作識別; 基于擴散模型微調的局部定制圖像編輯算法; 基于偏移過濾與未知特征強化的開放世界目標檢測; 基于潛在有價值樣本挖掘的半監督三維目標檢測