杜博 萬國佳 紀穎



摘 要:知識圖譜以圖的方式承載著結構化的人類知識。作為將知識整合進入人工智能系統的媒介,知識圖譜的研究日益流行。知識圖譜在眾多人工智能相關的應用上嶄露頭角,例如問答系統、信息檢索、自然語言處理、推薦系統等。然而,傳統的深度學習不能很好地處理知識圖譜這類非歐式數據。隨著圖神經網絡的快速發展,幾何深度學習成為建模非歐式數據的重要理論。本文以幾何深度學習的視角,以圖神經網絡為重點,總結了近期基于圖神經網絡的知識圖譜關鍵技術研究進展。具體地,本文總結了知識圖譜中知識獲取、知識表示、知識推理這三個較為核心的研究領域,并展望了未來的研究方向和前景,探討知識圖譜在航空航天軍事上的潛在應用。
關鍵詞: 知識圖譜; 幾何深度學習; 人工智能; 圖神經網絡; 知識推理
中圖分類號: TJ760;TP18文獻標識碼:A文章編號: 1673-5048(2020)03-0001-10
0 引言
知識代表人類解決問題過程中所啟發產生的思考和行為模式。將知識整合進人工智能(Artificial Intelligence)系統可以提高AI解決復雜任務的能力。 近年來,作為一種結構化人類知識的形式,知識圖譜(Knowledge Graph)引起了學術界和業界的極大關注[1]。知識圖譜是事實的結構化表示,由實體、關系抽象為圖結構。實體可以是現實世界中的對象和抽象概念,關系表示實體之間的關系,實體的語義描述及其關系包含具有明確定義的類型和屬性[2]。
圖1展示了一個基于百科的
航空兵器知識圖譜的例子。實體以節點的形式,被關系以有向邊的形式串聯成圖的結構。從一個實體到另外一個實體,可以得到一條事實三元組。例如(洛克希德·馬丁公司,生產,F22)。大量三元組的集合又可稱為知識庫(Knowledge Base)。常見的知識圖譜有谷歌知識圖譜[3],Freebase[4],中國Hownet等。
近年來,以CNN為代表的深度學習模型取得了巨大突破。一系列神經網絡模型在人臉識別、語音識別、機器翻譯、計算機視覺及圖像分析[5-6]成功落地。然而,與傳統的歐幾里德結構式數據不同,知識圖譜的數據形式是高度非歐的。圖片、文字、音頻等歐式數據可以以網格化的矩陣存儲和表示[7-8],如圖2所示。歐式數據可以利用CNN,RNN,LSTM學習數據點鄰居的隱式特征,然而非歐數據卻不能很好地學習。知識圖譜非歐性質意味著
不存在諸如全局參數化、通用坐標系、向量空間結構或平移不變性之類的屬性[9],因而傳統的深度學習模型難以學習實體、關系間的幾何拓撲特征。
幾何深度學習(Geometric Deep Learning)[10]由圖靈獎獲得者LeCun在2016年提出,該理論指出
非歐數據的學習依賴于數據分布的流形學習和圖結構學習。近期,圖神經網絡(Graph Neural Network)[11]的研究成為幾何深度學習中最活躍的一支研究方向。圖神經網絡的核心在于實現圖數據上的類似于傳統深度學習的操作,例如卷積、池化等,從而實現網絡結構的學習。通過層次化堆疊這些操作,深度學習模型進一步地實現了圖上的節點分類、鏈接預測、節點聚類、排序等任務。
圖神經網絡可以有效地建模知識圖譜,廣泛地促進了大部分研究方向的發展,例如關系抽取、實體抽取、知識表示學習、知識圖譜補全、知識推理等。
本文從幾何深度學習的角度出發,總結近期基于圖神經網絡,流形學習的知識圖譜技術的相關研究進展,從而展望知識圖譜未來發展的趨勢和挑戰,并對知識圖譜在航空航天軍事上的潛在應用進行初步探討。
1 概覽
1.1 知識圖譜發展
結構化的知識表示方法在人工智能的研究中有很長的歷史。MYCIN[12]建立了基于規則的醫學診斷專家系統。后來,隨著Web技術的發展,這種結構化的知識也可以被資源描述框架(RDF)和Web本體語言(OWL)描述,并成為語義網的重要標準。 隨后,發布了許多開放式知識庫或本體,例如WordNet,DBpedia,YAGO和Freebase[4]。到2012年,谷歌首次提出了知識圖譜的概念,其發展的Knowledge Vault[3]知識圖譜系統特別適用于解決與實體相關的智能問答問題,由此誕生一種全新的信息檢索模式。近年來,知識圖譜進一步發展,研究者提出了諸多知識圖譜驅動的智能問答、商品推薦、數據挖掘范式,展現了知識圖譜廣闊的應用前景。
1.2 符號及定義
1.2.1 知識圖譜定義
知識圖譜是一個有向圖G=(ε, R, E),其中ε是實體構成的集合,R是關系集合,E是從頭實體s指向尾實體o的邊的集合,由三元組(s,r,o)描述。一個三元組也稱為一個事實。知識圖譜是一種多關系圖,其中實體和關系均可綁定復雜的屬性信息。
1.2.2 圖卷積神經網絡
本文主要的圖卷積網絡基于空域的半監督圖卷積算子[13],定義如下:
Hl+1=σ(D-12A^D-12HlW)
其中: Hl指第l層的隱層表示,當l=0時,為初始輸入的屬性信息;A^表示加入了自環的圖鄰接矩陣; W表示可學習的權重矩陣。
1.2.3 知識圖譜嵌入表示
1.2.4 知識圖譜推理
在三個查詢模式中(s, r, ?), (s, ?, o), (?, r, o)給定一個查詢,知識圖譜推理旨在通過一條推理鏈條來預測?元素。這條推理鏈條如e1r1e2…rkek+1。如果k=1,便是單步推理,若k>1則為多步推理。
1.2.5 本文常用符號表
本文用字母的粗體表示其對應的向量或者矩陣,例如e是實體e的對應表示向量。
1.3 知識圖譜研究分類
本文重點關注知識圖譜中的知識獲取、知識圖譜表示、知識圖譜推理及補全三個核心研究領域。
2 知識獲取
知識獲取是構建知識圖譜的第一步,指自動地從無結構或半結構化的文本、Web數據中提取到結構化的知識,存儲在數據庫中。涉及到的關鍵技術有實體抽取、關系抽取、知識加工等。
2.1 實體抽取
實體抽取又被稱為命名實體識別,指在文本中標注或者提取關鍵的實體,例如人物、地點、組織、時間等,如圖3所示。早期的實體抽取方法基于手寫規則。這種方法雖然在特定領域的數據中識別準確率較高,但是需要耗費大量專家知識來人為設計有效規則。
近期實體抽取工作聚焦于數據驅動的方法,如機器學習、深度學習等。LSTM-CNN[14]通過學習字母級別和詞級別的語義特征和編碼匹配部分詞典,進行NER任務。Lmaple等人[15]提出一種通過堆疊雙向LSTM層和CRF層的神經網絡結構,在主要的數據集中實現了對特征工程方法的超越。MGNER[16]集成框架具有各種粒度的實體位置檢測以及基于嵌套和非重疊命名實體的基于注意力的實體分類方法。Yadav[17]在字母級別及詞級別的架構基礎上,加入了詞綴信息的構建。
上述方法均為基于深度學習的網絡構架,未考慮詞義間的空間拓撲關系。將NER任務抽象為一個圖的節點分類任務。根據類似思想,Cui 等人[18]提出基于GNN方法來避免中文NER任務中漢字歧義的問題。通過詞典來構建圖,從而對詞義進行建模。這個模型可以捕捉NER過程中的非序列依賴關系。與之不同,Ding 等人[19]提出一種在地名詞典上構建多有向圖的方法,實現中文NER任務中有效利用地名信息。Sui 等人[20]提出協同圖網絡模型來利用詞匯知識進行中文NER,在各數據集上達到了SOTA效果。
2.2 關系抽取
關系抽取是建立大規模知識圖譜的關鍵任務,其作用是從大量實體標記完成的文本數據中識別實體之間的關聯關系,抽取事實或者事件。通過關系抽取,文本中的實體可以被關聯起來,形成知識的網絡結構。早期的關系是通過語法規則和人工設計的語義規則進行抽取。這些方法與基于規則的學習方式相同,需要大量領域專家知識和腦力勞動。近期關系抽取的方法重點關注半監督、無監督及遠程監督的關系抽取模型,如圖4所示。Bootstrapping 方法利用大量未標記的詞典和種子實例,來學習關系抽取的模式。第一個Bootstrapping 為Brin提出的DIPRE(Dual Iterative Pattern Relation Expansion)[21]。Sun 和 Grishman 提出基于主動學習的關系抽取方法LGCo-Testing[22]。Qian等人[23]提出一種雙語言主動學習方法。隨著深度學習的迅猛發展,早期一些基于CNN的監督學習方法被研究[24]。這些方法需要手工在詞典里進行標注。隨著Word2vec[25]的誕生,大量自然語言處理任務開始應用預訓練詞向量對文本進行建模。雖然遠程監督[26]比詞向量的概念早,但是正因為詞向量而取得突破。Zeng 等人[27-28]先后在訓練CNN網絡中引入預訓練詞向量,Maxpooling,Piecewise Pooling實現多實例的遠程關系分類。隨后,一些基于Attention機制[29],RNN[30],LSTM[31],Transformer[32]的關系分類方法也被提出。
上述方法都是將文本作為一維序列數據進行建模,然而實體間的聯系是多對多的關系,因此使用GNN來進行關系間的推理十分合適。近期Zhu 等人[33]提出了基于GNN的關系抽取模型GP-GNN。GP-GNN通過文本序列中的實體,構建全連接圖,然后分別通過邊編碼模塊進行關系的分類。Zhang [34]等人提出一個基于知識圖譜嵌入的少樣本關系抽取方法,基于GCN學習知識圖譜的嵌入表示。在關系抽取過程中,語法依存樹通??梢砸胝Z法規則,從而提升模型性能,但是如果語法依存樹過于復雜,則需要進行減枝。Zhang 等人[34]提出一種基于GCN學習的依存樹減枝模型。
2.3 知識融合
通過實體抽取和關系抽取后得到的知識圖譜,包含結構化的實體、關系、屬性信息及事實。但是初步的信息抽取過程產生的知識圖譜仍然存在很多冗余和錯誤信息。知識加工即指對知識圖譜中的知識進行清理、整合,提高知識的質量,形成層次化和邏輯化的高可用性知識圖譜。
2.3.1 實體鏈接
實體鏈接,又稱為實體消歧,旨在將文本中出現的指代鏈接至具體的實體。例如,“愛因斯坦獲得了1921年的諾貝爾獎”,“愛因斯坦”這個指代應該被鏈接到“阿爾伯特·愛因斯坦”這個實體。由于深度學習模型的優良泛化性能和避免人工特征等優勢,近期的實體鏈接模型均基于神經網絡模型。Yamada 等人[35]將詞義和實體一同嵌入至連續空間中,通過判斷詞義和實體的相似度進行實體消歧。Gupta 等人[36]則進一步融合多元信息,由實體屬性、實體類型等來學習詞義的語義特征。這兩種方法僅僅局部地學習詞語和實體的語義特征,不能實現集體實體鏈接。為處理這個問題,Nguyen 等人[37]提出了基于詞向量CNN編碼局部語義和RNN編碼全局實體共現的框架。但是基于全局模型的方法通常需要近似優化技術,例如隨機游走、減枝等。這些方法不可微分,因此不能用反向傳播來優化模型。然而,GCN可以全局地學習實體和詞語之間的關系。由此,Cao 等人[38] 提出了基于GCN的NCEL模型,實現對實體圖的編碼。Xin 等人[39]進一步使用圖注意力網絡來集成局部和全局特征進行判別表示。
2.3.2 實體對齊
實體對齊指在多個異構知識圖譜中,對齊某個實體,以融合相同或類似的知識。形式化描述為:給定兩個實體集合ε1和ε2,實體對齊目標為找到一個對齊集合A={(e1, e2)∈ε1×ε2|e1≡e2}。基于嵌入的實體對齊會計算實體對的相似度,從而判定兩個實體是否等價。IPTransE [40]將所有實體映射到一個統一的空間,通過翻譯模型e1+r(ε1ε2)-e2、線性轉換模型M(ε1ε2)e1-e2和共享實體參數,迭代地去求解累計誤差。BootEA[41]提出一個Bootstrapping方法以增量訓練方式進行實體對齊。MultiKE[42]同樣基于嵌入的方法,但是同時學習實體的名稱和實體屬性嵌入,通過設計的跨知識圖譜的推理方法進行實體的對齊。
上述方法的基本思想都是基于同一個框架的跨語言知識聯合學習,這需要平衡兩個損失函數。如果要引入屬性信息,還需要設計額外的框架,而GCN可以有效地解決這個問題。Wang 等人[43]提出利用GCN進行跨語言的知識圖譜實體對齊。隨后Cao 等人[44]也同樣提出用GCN來進行實體對齊任務,不過他們設計的是多通道GCN,具有更好的魯棒性。Xu 等人[45]將跨語言知識圖譜的對齊任務抽象為圖匹配問題,然后利用圖注意力網絡來構建模型。
3 知識圖譜表示學習
知識圖譜是一種大規模的稀疏有向圖,因此如何在計算過程中對知識圖譜中的要素進行合理的表示是知識計算的核心問題。傳統的基于RDF,OWL語言的離散表示方式會帶來數據稀疏的問題,同時計算效率較低。近期以深度學習為代表的表示學習技術在圖像、語音等任務上取得突破。其核心在于利用神經網絡學習數據的低維連續實值向量或矩陣。
本節重點綜述近期知識圖譜表示算法,并以幾何深度學習的視角分析其學習過程。
3.1 基于歐式空間的嵌入表示
TransE是諸多翻譯模型的鼻祖,其將實體和關系嵌入至p范數空間。給定一個事實(s,r,o),那么該模型假設頭實體向量經關系向量平移后,等價于尾實體s+r≈o,因此其距離函數為
f(s,r,o)=s+r-op
通常嵌入空間為2范數空間,即歐式空間。那么實體間的距離便決定了實體之間的相似度。盡管TransE[46]是一個簡單且高效的算法,但是其簡單的嵌入距離函數不能表達復雜的語義關系,這讓TransE在處理1-N,N-1,N-N等多對多關系時表現較差。隨后,TransR[47],TransH[48]分別對其嵌入的空間做了改進。TransR認為應該將實體和關系分別嵌入至兩個空間,如圖5所示。用一個轉移矩陣來關聯兩個嵌入空間,其距離函數為
3.2 基于非歐空間的嵌入表示
上節探討了基于歐式空間的低維嵌入表示, 然而歐式空間仍然不足以表達實體和關系間復雜的關系,因此很多研究者將視線轉移到了一些非歐空間的嵌入學習。
TransA [50]選擇將實體和關系嵌入至馬氏距離空間:
TransG [51],KG2E[52]等將實體和關系視為服從高斯分布的隨機變量,以KL散度來度量隨機變量的相似度。
特別地,TransG進一步考慮高斯混合模型來對關系進行建模,從而解決翻譯模型中的多語義問題。
ManifoldE[53]提出基于流形學習的嵌入框架,如圖6所示。該方法是一個可以將之前翻譯模型點式建模的方法拓展為流形式建模,從而解決之前模型在代數系統病態的問題。該方法考慮了兩個流形系統: 球形和超平面形。
TorusE[54]指出,TransE的平移相似性假設與其正則化沖突。為了解決TransE這個問題,作者將實體和關系嵌入至環面上,而環面則屬于是緊李群,從而可以更加致密地表示嵌入向量,并且避免正則化。
RotatE[55]通過歐拉恒等式,提出一個酉復數,可以被視為在復數超平面上的一個旋轉操作。根據這個原理,作者定義一個旋轉操作將實體和關系向量嵌入至復數空間,實現對稱關系、 非對稱關系、 逆關系、 復合關系的建模。
3.3 線性/雙線性模型
RESCAL[56]是一個較早的雙線性模型,學習實體和關系的隱層特征。其得分函數定義如下:
istMult[57]是隨后用對角矩陣簡化了RESCAL模型,其得分函數如下:
f(s,r,o)=sTMro
此模型雖然在當時取得了較好的效果,但是卻不能對非對稱關系進行建模。隨后HolE[58]結合了RESCAL的表達力和DistMult的簡化能力,其定義了一個循環相關二元運算:
[s*o]i=∑d-1k=0[s]k·[o](k+i)mod d
其得分函數可以對非對稱及對稱關系進行建模:
f(s,r,o)=rT(s*o)
ComplEx[59]將實體和關系嵌入這復數空間拓展了DistMult。由于實體和關系的復數表示,該方法可以
對非關系進行建模,同時獲得更好的表達力[60]。
f(s,r,o)=Re(sTdiag(r)o)
TuckER[61]提出將知識圖譜視為一個張量,通過進行張量的TuckER分解,得到對實體和關系的隱層表示。作者還指出, RESCAL,DistMult,ComplEx是TuckER的特殊情形。
3.4 神經網絡模型
Dong 等人[3]提出用多層感知機來學習實體和關系向量的隱式特征。其得分函數如下:
f(s,r,o)=wTtanh(M1s+M2r+M3o)
ConvE [62]利用2D CNN對拼接實體和關系向量提取特征,證明了CNN也可以學習到實體和關系之間的非線性關聯特征,從而進行知識圖譜補全。其得分函數為
f(s,r,o)=σ(ves(σ[Ms; Mr]·ω))W)t
隨后ConvKB[63]在ConvE的基礎上,引入經典翻譯模型的語義平移相似性。其得分函數如下:
f(s,r,o)=concat(σ([s,r,o]·ω))·W
3.5 圖神經網絡模型
Welling課題組在提出GCN[13]之后,緊接著在知識圖譜上提出了RGCN[64],將GCN拓展到了多關系圖的學習任務上。其編碼器的定義如下:
其中xli為第l層的隱層表示,N ri是節點周圍的鄰居節點集合。整個圖卷積以消息傳遞機制進行實現。
RGCN使用與DistMult相同的解碼器。
SACN[65]將ConvE和GCN融合起來,實現結構可感知的端到端模型。
4 知識圖譜推理
知識的一個特性就是“知識+知識=新的知識”,因此基于知識圖譜的推理非常重要。在許多知識圖譜相關的應用中,需要基于知識圖譜已有的知識,推理得到未知的知識,提高智能系統對于實體、關系間的聯想預測能力。同時知識圖譜的另一個重要特點是不完全性。因此,如何基于已有知識,補全知識圖譜,以達到知識圖譜的自我更新和演化。
4.1 傳統推理方法
早期在專家系統或者知識庫中進行推理是基于規則的推理。這些規則以一階邏輯的方式進行描述。例如,在NELL[66]中,其知識推理模塊基于一階關系學習的方式。通過人工篩選的邏輯或者規則,即可進行部署用于獲取、補全新的知識。Bühmann[67]提出知識庫上的頻繁原子模式挖掘方法。在具體知識庫中查詢相關匹配數據記錄,根據正確性統計的得分判斷新知識的真偽。Pujara[68]提出基于本體約束的分塊概率軟邏輯推理方法。
傳統的知識推理方法主要建立在規則、統計、本體上。這些方法準確率較高,解釋性也很好,但是這些方法的可計算性較差,不能端到端進行知識的推理。同時,推理規則的設計篩選依賴于專家知識。面對不同領域,或者更大規模的知識圖譜時,其泛化性較差。
4.2 知識圖譜單步推理
知識圖譜的單步推理指基于已觀測的知識,推出事實三元組中的缺失成分。例如(s,?,o)型為給定頭尾實體,推理這兩個實體可能存在的關系。(?,r,o)或者(s,r,?)是給定一個實體,推理可能匹配的實體。這種任務也被稱為知識圖譜的鏈接預測。
4.2.1 基于分布式表示模型
上述的知識表示模型均以鏈接預測的形式進行模型的評估。因此知識表示學習得到的分布式向量,可以直接進行知識推理。在分布式表示學習過程中,會定義一個得分函數f(s,r,o),用于計算給定事實存在的可能性分數:
y(s,r,o)=σ(f(s,r,o))
通常,這種對預測基于開放世界假設,即認為知識圖譜中未記錄的知識是不確定的。因此,其優化通常是對排序損失函數[46]進行優化:
在推理過程中,根據候選的實體或關系,計算事實的得分函數置信度,學習一個閾值來判斷事實是否存在。
基于分布式表示的模型還有一個特點就是可以靈活地融合其他信息。Krompaβ[69]將實體的類型信息融入至嵌入模型中。Long [70]配合詞向量方法,進行知識圖譜推理。Xie [71]利用預訓練的圖像向量來融入實體的圖像信息。這些方法都基于對額外信息的嵌入表示學習。
4.2.2 混合規則的推理模型
盡管分布式表示的推理模型的可計算性好,但是其很大程度上缺乏解釋性。因此Wang 等人[72]提出以整形線性規劃(ILP)的方式將邏輯規則和物理規則融入至分布式表示模型中,提高模型的可解釋性。Demeester 等人[73]在關系嵌入學習中加入一階邏輯約束作為正則項,并提出序學習概念,用于獲取偏序關系的學習。具體來說,如果一個關系r1能夠推出r2 , 那么讓r2的關系向量的每一維比r1小。該約束可以得到全局一致的關系表示。
4.2.3 基于圖神經網絡的推理模型
前文提到的RGCN可以有效地學習知識圖譜中實體和關系的拓撲特征。目前基于圖神經網絡的知識圖譜推理模型均基于自編碼機結構,即分為編碼器和解碼器。RGCN的解碼器基于DistMult,定義如下:
f(s,r,o)=sTRro
SACN[65]在加權GCN的編碼器的基礎上,進一步擴展了編碼器。其解碼器為Conv-TransE結構,在解碼過程中融入翻譯魔性的語義平移相似性。
上述公式構成了一個核向量M(s,r)=[mc(s,r,o),…,mc(s,r,Fl-1)]。由此可以定義得分函數:
4.3 知識圖譜多步推理
單步推理可以視為知識推理k=1時的情形。多步推理不僅在問答系統上扮演重要的角色,同時可以給出知識推理的過程。例如從“(梅西,效力于,巴塞羅那俱樂部,屬于,西班牙甲級聯賽)”這一條鏈條中推理得出(梅西,效力于,西班牙甲級聯賽)。反之,多步推理可以通過(梅西,效力于,西班牙甲級聯賽)推斷(梅西,效力于,巴塞羅那俱樂部,屬于,西班牙甲級聯賽)的可能性。
4.3.1 基于路徑的多步推理
路徑指在知識圖譜中遍歷一條從一個實體到另外一個實體的序列。Lao[74]提出PRA算法,其利用隨機游走,在多關系圖上進行遍歷路徑模式。接著將挖掘到的路徑模式作為特征向量。利用邏輯回歸進行關系分類。隨后Lao[75]進一步拓展了PRA算法,提出了受限和加權隨機游走的路徑產生方式。Liu [76]提出了層次化的隨機游走模型HiRi在大規模的知識圖譜上進行學習。HiRi 中的隨機游走分為兩層:上層基于PRA,旨在學習全局的路徑特征;下層用于抽取子圖的局部特征。
4.3.2 基于分布式表示的多步推理
盡管大部分的分布式表示主要關注實現單步推理,但是通過路徑約束,分布式表示也可以實現多步推理。Guu[77]將多步推理視為一個在知識圖譜向量空間的組合問題。直接建模中間關系,加入實體的向量分布正則項,然后學習多步的關系模式。Lin [78]提出基于TransE的多步關系約束的PTransE。該方法認為推理路徑上關系的轉移為加和、 連乘等操作形式,然后將特定操作組合后的路徑作為得分函數的輸入,從而對多步推理的路徑進行建模。
4.3.3 基于強化學習的多步推理
多步推理是一個序列決策問題,因此可以用強化學習來學習這個過程?;诓呗缘膹娀瘜W習的智能體通過知識圖譜環境之間的交互來學習推理路徑[79]。DeepPath[80]是首先提出的基于強化學習的多步推理模型。但是其只能在給定兩個實體的情況下去推測中間的關系鏈。MINERVA[81]改進了這一點,并將LSTM引入至策略函數中,用于編碼序列歷史信息。M-Walk[82]引入了蒙特卡羅樹搜索到強化學習模型的搜索推理路徑中,有效降低了路徑稀疏問題,同時其歷史信息由RNN來編碼。Multi-Hop[83]指出強化學習過程的獎賞函數需要人為定義。為了解決這個問題,該方法提出了一個可學習的獎賞函數,從而可以自適應地調節路徑的探索, 同時其還在策略選擇時采用了類似Dropout的技術。
4.3.4 基于圖神經網絡的多步推理
圖神經網絡展現了對序列數據的建模能力。Xu[84]提出了基于圖神經網絡的序列建模方法—Graph2seq。該方法利用GCN將輸入的圖映射為一個向量,然后利用LSTM將隱藏表示解碼為一條序列。Venkatakrishnan[85]在同期提出了Graph2seq。該方法將圖表示為一條有限時間序列,通過不限制表示的維數,可以自由地擴展圖的屬性維數和節點維數。同時該方法是可逆的,可以實現從圖到序列,也可以從序列到圖。
此外,問答系統的多跳推理問題也可以基于圖神經網絡建模。Qiu[86]提出動態圖網絡(DFGN),實現基于文本的問答。該方法在文檔上構建動態圖網絡,然后利用動態圖網絡進行多跳推理。
5 知識圖譜的典型應用
豐富的結構化知識可以有效協助AI系統,但是如何將知識整合進面向真實需求的應用仍然是一個挑戰。
5.1 自然語言理解
人類語言是由情緒表達和事實表達組成。因此知識感知的語言理解將更好地幫助AI系統理解語言的背景事實。Logan[87]提出基于知識圖譜的語言模型。該方法可以學習到未出現在語料庫中的詞義。
ERNIE[88]利用知識圖譜來增強BERT的訓練效果。
5.2 問答系統
問答系統是人類和AI對話的重要組成部分,其目的在于可以根據提問做出相應回答。而知識圖譜也可以理解為一個大規模的常識庫,因此, 知識圖譜可以簡化問答的模式,即在知識圖譜上進行推理。問答系統目前已經成功應用在智能客服、語音助手等業務場景,例如蘋果Siri、小米公司的小愛同學等。
5.3 推薦系統
推薦系統指在電子購物過程中,服務端通過用戶的喜好推薦用戶的潛在購買目標。目前基于用戶歷史信息的協同過濾算法得到了廣泛的研究,在各大電商、視頻、信息流推薦中取得了巨大的經濟效益。然而,推薦系統需要解決稀疏性問題和冷啟動問題。將知識圖譜集成為外部信息,可使推薦系統具有常識推理能力。
5.4 信息檢索
在信息檢索領域知識圖譜起著非常重要的作用。Google公司基于其Knowledge Vault有效提高了搜索場景的準確率和交互性。當查詢被輸入至搜索引擎時,搜索引擎可以利用知識圖譜推理得出精確回答,同時在搜索結果的右側顯示該查詢的深層信息。其他類似的還有百度的中文知識圖譜搜索、搜狗的知立方等。
6 研究展望
近年來,知識圖譜引發了巨大的關注,大量的工作發展了知識圖譜相關理論和技術。然而,目前對知識圖譜研究和認知離它的愿景還有較大距離,仍有許多挑戰和亟待解決的問題。
6.1 復雜推理
目前,面向知識圖譜的推理已經大量啟用分布式表示學習方法。用于知識表示和推理的數值計算,需要連續的向量空間來捕獲實體和關系的語義。然而基于嵌入的方法在復雜的邏輯推理上仍有局限性。該類方法需要精心設計嵌入的空間來捕捉實體和關系的語義特征,這在一定程度上仍然是耗費大量專家腦力的。隨著GNN的研究迅猛發展,人們對圖的拓撲特征學習認識更加深入,基于圖神經網絡的研究會進一步發展知識圖譜技術。其中所需要面對的最大問題是如何處理知識圖譜的異質性。
值得進一步探討關系路徑和符號邏輯的兩個方向。諸如循環關系路徑編碼、基于GNN的消息傳遞、基于增強學習的路徑查找和推理等一些有前途的方法,對于處理復雜的推理有廣闊的研究前景。
6.2 規模性
通用型知識圖譜通常會包含海量的事實和實體。因此如何將現有的知識圖譜方法推廣到大規模知識圖譜是這些方法能夠得到應用的前提。一方面,可以從神經網絡減枝、網絡結構搜索等方法,改善目前的知識獲取、知識推理算法; 另一方面,需要在研究新的方法時考慮知識圖譜的規模性。
6.3 多源信息融合及多模態學習
知識圖譜中的屬性信息為異構數據,如文本、圖片、音頻、視頻等。通過融合多種屬性信息,可以彌補稀疏知識的學習問題。同時,通過多模態數據的學習,可以進一步拓展知識圖譜的應用,例如從知識圖譜到圖片,知識圖譜到視頻等。
6.4 知識圖譜的隱私保護
知識圖譜的構建過程需要耗費大量資源,各個公司出于對數據保護的需求,很難共享構建知識圖譜, 因此,如何在基于數據保護的情況下,構建跨越數據孤島的知識圖譜是值得探討的問題。聯邦學習[89]正是解決這個問題的重要研究方向。聯邦學習的目標是在保證數據隱私安全及合法合規的基礎上,實現共同建模,跨越數據孤島,提升AI模型的效果。
7 知識圖譜與航空軍事
隨著現代軍事信息化的發展,在航空領域涉及到海量的軍事大數據。因此,如何有效將這些軍事數據進行結構化,是知識圖譜在航空軍事應用的核心問題?;谲娛轮R賦能的人工智能系統,可以有效提高軍事決策的智能性和便捷性。例如,可以通過航空軍事知識圖譜,建立航空武器裝備的百科知識圖譜,或者基于航空領域知識圖譜的問答系統,方便用于軍事教學、航空對抗訓練等; 建立基于知識圖譜的航空戰斗態勢研判系統,可以輔助指揮員在特定場景內分析戰場態勢,并通過典型示例簡單直觀和合理的演示戰場態勢,協助進行多軍種,復雜戰場的聯合作戰; 還可以基于知識的目標識別和目標追蹤技術,在空域、 海域、 陸域中識別重要單位??傊诤娇哲娛轮?,仍鮮有知識圖譜應用的相關研究,亟需多學科交叉,填補研究空白。
8 結 束 語
隨著AI技術研究的持續發展,深度學習更加關注數據的幾何特征,幾何深度學習應運而生。圖神經網絡的興起引發廣泛的研究興趣。而知識圖譜作為典型的異構圖數據,在圖神經網絡的發展受益匪淺。本文基于幾何深度學習的視角,重點關注圖神經網絡和低維嵌入的空間幾何特征,總結了近期知識圖譜關鍵技術中知識獲取,知識表示和知識推理的重點研究。大量的研究表明圖神經網絡在知識圖譜上有廣闊的前景。然而,目前此方向的研究仍處于發展階段,許多潛在的研究問題都值得以圖神經網絡的方式去探索。相信知識圖譜將在未來的航空軍事領域扮演重要角色。
參考文獻:
[1] 徐增林,盛泳潘,賀麗榮,等. 知識圖譜技術綜述[J]. 電子科技大學學報,2016,45(4):589-606.
Xu Zenglin,Sheng Yongpan,He Lirong,et al.Review on Know-ledge Graph Techniques[J].Journal of University of Electronic Science and Technology of China,2016,45(4):589-606.(in Chinese)
[2] 劉嶠,李楊,段宏,等. 知識圖譜構建技術綜述[J]. 計算機研究與發展,2016,53(3):582-600.
Liu Qiao,Li Yang,Duan Hong,et al.Knowledge Graph Construction Techniques[J].Journal of Computer Research and Development,2016,53(3): 582-600.(in Chinese)
[3] Dong X,Gabrilovich E,Heitz G,et al. Knowledge Vault:A Web- Scale Approach to Probabilistic Knowledge Fusion[C]∥Proceedings of the 20th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2014:601-610.
[4] Bollacker K D,Evans C,Paritosh P,et al. Freebase:A Collaboratively Created Graph Database for Structuring Human Knowledge[C]∥ Proceedings of the ACM SIGMOD International Conference on Management of Data,2008.
[5] Wang Z,Jiang J J,Wu Y,et al. Learning Sparse and Identity-Preserved Hidden Attributes for Person Re-Identification[J]. IEEE Transactions on Image Processing,2019,29(1):2013-2025.
[6] Wang Z,Hu R M,Liang C,et al. Zero-Shot Person Re-Identification via Cross-View Consistency[J]. IEEE Transactions on Multimedia,2015,18(2):260-272.
[7] Kansal K,Subramanyam A V,Wang Z,et al. SDL:Spectrum-Disentangled Representation Learning for Visible-Infrared Person Re-Identification[J/OL]. IEEE Transactions on Circuits and Systems for Video Technology.DOI:10.1109/tcsvt.2019.2963721.
[8] Wang Z,Hu R M,Chen C,et al. Person Reidentification via Discrepancy Matrix and Matrix Metric[J]. IEEE Transactions on Cybernetics,2018,48(10):3006-3020.
[9] Zeng Z L,Wang Z X,Wang Z,et al. Illumination-Adaptive Person Re-Identification[EB/OL].(2019-05-11)[2020-03-04]. https: ∥arxiv.org/pdf/1905.04525v1.pdf.
[10] Bronstein M M,Bruna J,LeCun Y,et al. Geometric Deep Lear-ning:Going Beyond Euclidean Data[J]. IEEE Signal Processing Magazine,2017,34(4):18-42.
[11] Wu Z H,Pan S R,Chen F W,et al. A Comprehensive Survey on Graph Neural Networks[EB/OL]. (2019-12-04)[2020-03-04]. https: ∥arxiv.org/pdf/1901.00596.pdf.
[12] Shortliffe E H,Davis R,Axline S G,et al. Computer-Based Consultations in Clinical Therapeutics:Explanation and Rule Acquisition Capabilities of the MYCIN System[J]. Computers and Biomedical Research,1975,8(4):303-320.
[13] Kipf T N,Welling M. Semi-Supervised Classification with Graph Convolutional Networks[EB/OL]. (2017-02-22)[2020-03-04]. https: ∥arxiv.org/pdf/1609.02907.pdf.
[14] Chiu J P C,Nichols E. Named Entity Recognition with Bidirectional LSTM-CNNs[J]. Transactions of the Association for Computational Linguistics,2016,4:357-370.
[15] Lample G,Ballesteros M,Subramanian S,et al. Neural Architectures for Named Entity Recognition[EB/OL]. (2016-04-07)[2020-03-04]. https: ∥arxiv.org/pdf/1603.01360.pdf.
[16] Xia C Y,Zhang C W,Yang T,et al. Multi-Grained Named Entity Recognition[EB/OL]. (2019-01-20) [2020-03-04]. https: ∥arxiv.org/pdf/1906.08449.pdf.
[17] Yadav V,Sharp R,Bethard S. Deep Affix Features Improve Neural Named Entity Recognizers[C]∥Proceedings of the Seventh Joint Conference on Lexical and Computational Semantics,2018: 167-172.
[18] Gui T,Zou Y C,Zhang Q,et al. A Lexicon-Based Graph Neural Network for Chinese NER[C]∥Proceedings of the 2019 Conference on EMNLP and the 9th IJCNLP,2019.
[19] Ding R X,Xie P J,Zhang X Y,et al. A Neural Multi-Digraph Model for Chinese NER with Gazetteers[C]∥Proceedings of the 57th ACL,2019.
[20] Sui D B,Chen Y B,Liu K,et al. Leverage Lexical Knowledge for Chinese Named Entity Recognition via Collaborative Graph Network[C]∥Proceedings of the 2019 Conference on EMNLP and the 9th IJCNLP,2019: 3830-3840.
[21] Brin S. Extracting Patterns and Relations from the World Wide Web[M]. The World Wide Web and Databases, Springer Berlin Heidelberg, 1998: 172-183.
[22] Sun A,Grishman R. Active Learning for Relation Type Extension with Local and Global Data Views[C]∥Proceedings of the 21st ACM International CIKM, 2012:1105-1112.
[23] Qian L H,Hui H T,Hu Y N,et al. Bilingual Active Learning for Relation Classification via Pseudo Parallel Corpora[C]∥ Proceedings of the 52nd ACL, 2014:582-592.
[24] Liu C Y,Sun W B,Chao W H,et al. Convolution Neural Network for Relation Extraction[C]∥International Conference on Advanced Data Mining and Applications, 2013:231-242.
[25] Mikolov T,Sutskever I,Chen K,et al. Distributed Representations of Words and Phrases and Their Compositionality[C]∥ Neural Information Processing Systems,2013:3111-3119.
[26] Riedel S,Yao L M,Mccallum A. Modeling Relations and Their Mentions without Labeled Text[C]∥Joint European Conference on Machine Learning and Knowledge Discovery in Databases,Barcelona, Spain, 2010: 148-163.
[27] Zeng D J,Liu K,Lai S W,et al. Relation Classification via Convolutional Deep Neural Network[C]∥25th International Conference on Computational linguistics, Dublin, Ireland, 2014:2335- 2344.
[28] Zeng D J,Liu K,Chen Y B,et al. Distant Supervision for Relation Extraction via Piecewise Convolutional Neural Networks[C]∥Proceedings of the Conference on EMNLP,2015.
[29] Zhou P,Shi W,Tian J,et al. Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classification[C]∥Proceedings of the 54th ACL,2016: 207-212.
[30] Vu N T,Adel H,Gupta P,et al. Combining Recurrent and Convolutional Neural Networks for Relation Classification[EB/OL]. (2016-05-24) [2020-03-04]. https: ∥arxiv.org/pdf/1605.07333.pdf.
[31] Miwa M,Bansal M. End-to-End Relation Extraction Using LSTM on Sequences and Tree Structures[EB/OL]. (2016-06-08) [2020-03-04]. https: ∥arxiv.org/pdf/1601.00770.pdf.
[32] Du J H,Han J G,Way A,et al. Multi-Level Structured Self-Attentions for Distantly Supervised Relation Extraction[EB/OL]. (2018-09-03) [2020-03-04]. https: ∥arxiv.org/pdf/1809.00699.pdf.
[33] Zhu H,Lin Y K,Liu Z Y,et al. Graph Neural Networks with Generated Parameters for Relation Extraction[EB/OL]. (2019-02-02) [2020-03-04]. https: ∥arxiv.org/pdf/1902.00756.pdf.
[34] Zhang Y H,Qi P,Manning C D. Graph Convolution over Pruned Dependency Trees Improves Relation Extraction[EB/OL].(2018-09-26)[2020-03-04]. https: ∥arxiv.org/pdf/1809.10185.pdf.
[35] Yamada I,Shindo H,Takeda H,et al. Joint Learning of the Embedding of Words and Entities for Named Entity Disambiguation[C]∥Proceedings of the 20th SIGNLL Conference on Computational Natural Language Learning,2016.
[36] Gupta N,Singh S,Roth D. Entity Linking via Joint Encoding of Types,Descriptions,and Context[C]∥Proceedings of the Conference on Empirical Methods in Natural Language Processing,2017.
[37] Nguyen T H,Fauceglia N R,Muro M R,et al. Joint Learning of Local and Global Features for Entity Linking via Neural Networks[C]∥Proceedings of the 26th International Conference on Computational Linguistics,2016: 2310-2320.
[38] Cao Y X,Hou L,Li J Z,et al. Neural Collective Entity Linking[C]∥Proceedings of the 27th International Conference on Computational Linguistics,2018: 675-686.
[39] Xin K X,Hua W,Liu Y,et al. Entity Disambiguation Based on Parse Tree Neighbours on Graph Attention Network[C]∥ Proceedings of the 20th International Conference on Web Information Systems Engineering,2019: 523-537.
[55] Sun Z Q,Deng Z H,Nie J Y,et al. RotatE:Knowledge Graph Embedding by Relational Rotation in Complex Space[EB/OL]. (2019-02-26)[2020-03-04]. https: ∥arxiv.org/pdf/1902.10197.pdf.
[56] Nickel M,Tresp V,Kriegel H P. A Three-Way Model for Collective Learning on Multi-Relational Data[C]∥Proceedings of the 28th ICML,2011.
[57] Yang B S,Yih W T,He X D,et al. Embedding Entities and Relations for Learning and Inference in Knowledge Bases[EB/OL]. (2015-08-29) [2020-03-04]. https: ∥arxiv.org/pdf/1412.6575.pdf.
[58] Nickel M,Rosasco L,Poggio T. Holographic Embeddings of Knowledge Graphs[C]∥ Proceedings of the Thirtieth AAAI Conference on Artificial Intelligence,2016: 1955-1961.
[59] Trouillon T,Welbl J,Riedel S,et al. Complex Embeddings for Simple Link Prediction[C]∥ Proceedings of the 33rd ICML,2016:2071-2080.
[60] Wan G J,Du B,Pan S R,et al. Adaptive Knowledge Subgraph Ensemble for Robust and Trustworthy Knowledge Graph Completion[J]. World Wide Web,2020, 23(1):471-490.
[61] Trouillon T,Dance C R,Gaussier ,et al. Knowledge Graph Completion via Complex Tensor Factorization[J]. Journal of Machine Learning Research,2017,18 (130): 1-38.
[62] Dettmers T,Minervini P,Stenetorp P,et al. Convolutional 2D Knowledge Graph Embeddings[C]∥ Proceedings of the Thirty-Second AAAI Conference on Artificial Intelligence,2018: 1811-1818.
[63] Nguyen D Q,Nguyen T D,Phung D. A Novel Embedding Model for Knowledge Base Completion Based on Convolutional Neural Network[C]∥Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics:Human Language Technologies,2018: 327-333.
[64] Schlichtkrull M,Kipf T N,Bloem P,et al. Modeling Relational Data with Graph Convolutional Networks[C]∥European Semantic Web Conference:The Semantic Web, 2018: 593-607.
[65] Shang C,Tang Y,Huang J,et al. End-to-End Structure-Aware Convolutional Networks for Knowledge Base Completion[C]∥Proceedings of the Thirty-Third AAAI Conference on Artificial Intelligence,2019: 3060-3067.
[66] Carlson A,Betteridge J,Kisiel B,et al. Toward an Architecture for Never-Ending Language Learning[C]∥ Proceedings of the Twenty-Fourth AAAI Conference on Artificial Intelligence,2010.
[67] Bühmann Lorenz,Lehmann Jens. Pattern Based Knowledge Base Enrichment[C]∥International Semantic Web Conference:The Semantic Web,2013:33-48.
[68] Pujara J,Miao H,Getoor L,et al. Ontology-Aware Partitioning for Knowledge Graph Identification[C] ∥Proceedings of the Workshop on Automated Knowledge Base Construction,2013: 19-24.
[69] Krompaβ D,Baier S,Tresp V. Type-Constrained Representation Learning in Knowledge Graphs[C]∥International Semantic Web Conference:The Semantic Web,2015: 640-655.
[70] Long T,Lowe R,Cheung J C K,et al. Leveraging Lexical Resources for Learning Entity Embeddings in Multi-Relational Data[EB/OL].(2016-05-18) [2020-03-04]. https: ∥arxiv.org/pdf/1605.05416v1.pdf.
[71] Xie R B,Liu Z Y,Luan H B,et al. Image-Embodied Knowledge Representation Learning[EB/OL].(2017-05-22)[2020-03-04]. https: ∥arxiv.org/pdf/1609.07028v2.pdf.
[72] Wang Q,Wang B,Guo L. Knowledge Base Completion Using Embeddings and Rules[C]∥ Proceedings of the 24th IJCAI,2015:1859-1865.
[73] Demeester T,Rocktschel T,Riedel S. Regularizing Relation Representations by First-Order Implications[C]∥ Proceedings of the 5th Workshop on Automated Knowledge Base Construction, 2016.
[74] Lao N,Cohen W W. Relational Retrieval Using a Combination of Path-Constrained Random Walks[J]. Machine Learning,2010,81(1):53-67.
[75] Lao N,Mitchell T,Cohen W W. Random Walk Inference and Learning in a Large Scale Knowledge Base[C]∥Proceedings of the Conference on EMNLP,2011:529-539.
[76] Liu Q,Jiang L Y,Han M H,et al. Hierarchical Random Walk Inference in Knowledge Graphs[C]∥Proceedings of the 39th International ACM SIGIR Conference on Research and Development in Information Retrieval,2016:445-454.
[77] Guu K,Miller J,Liang P. Traversing Knowledge Graphs in Vector Space[EB/OL].(2015-08-19)[2020-03-04]. https: ∥arxiv.org/pdf/1506.01094.pdf.
[78] Lin Y K,Liu Z Y,Luan H B,et al. Modeling Relation Paths for Representation Learning of Knowledge Bases[C]∥Proceedings of the Conference on EMNLP,2015: 705-714.
[79] Wan G J,Du B,Pan S R,et al. Reinforcement Learning Based Meta-Path Discovery in Large-Scale Heterogeneous Information Networks[C]∥ The Thirty-Fourth AAAI Conference on Artificial Intelligence, 2020.
[80] Xiong W H,Hoang T,Wang W Y. DeepPath:A Reinforcement Learning Method for Knowledge Graph Reasoning[C]∥Proceedings of the Conference on EMNLP,2017: 575-584.
[81] Das R,Dhuliawala S,Zaheer M,et al. Go for a Walk and Arrive at the Answer:Reasoning over Paths in Knowledge Bases Using Reinforcement Learning[EB/OL]. (2018-11-30) [2020-03-04]. https: ∥arxiv.org/pdf/1711.05851.pdf.
[82] Shen Y L,Chen J S,Huang P S,et al. M-Walk:Learning to Walk over Graphs Using Monte Carlo Tree Search[C]∥ Confe-rence on NeuIPS, 2018: 6786-6797.
[83] Lin X V,Socher R,Xiong C M. Multi-Hop Knowledge Graph Reasoning with Reward Shaping[C]∥Proceedings of the Confe-rence on Empirical Methods in Natural Language Processing,2018.
[84] Xu K,Wu L F,Wang Z G,et al. Graph2seq:Graph to Sequence Learning with Attention-Based Neural Networks[EB/OL].(2018-12-03)[2020-03-04]. https: ∥arxiv.org/pdf/1804.00823.pdf.
[85] Venkatakrishnan S B,Alizadeh M,Viswanath P. Graph2seq:Scalable Learning Dynamics for Graphs[EB/OL].(2018-10-09)[2020-03-04]. https: ∥arxiv.org/pdf/1802.04948.pdf.
[86] Qiu L,Xiao Y X,Qu Y R,et al. Dynamically Fused Graph Network for Multi-Hop Reasoning[C]∥Proceedings of the 57th ACL,2019: 6140-6150.
[87] Logan R,Liu N F,Peters M E,et al. Baracks Wife Hillary:Using Knowledge Graphs for Fact-Aware Language Modeling[C]∥Proceedings of the 57th ACL,2019:5962-5971.
[88] Zhang Z Y,Han X,Liu Z Y,et al. ERNIE:Enhanced Language Representation with Informative Entities[C]∥Proceedings of the 57th ACL,2019: 1441-1451.
[89] Yang Q,Liu Y,Chen T J,et al. Federated Machine Learning:Concept and Applications[J]. ACM Transactions on Intelligent Systems and Technology (TIST),2019,10(2):1-19.
A Review of Knowledge Graph Techniques from
the View of Geometric Deep Learning
DuBo1,2*,Wan Guojia1,2,Ji Ying1,2
(1. School of Computer Science, Wuhan University, Wuhan 430072,China;
2. Artificial Intelligence Institute, Wuhan University,Wuhan430072, China)
Abstract:Knowledge Graphs carry structured human knowledge in the term of graph. As a medium for incorporating knowledge into Artificial Intelligence systems, the study of knowledge graph is becoming increasingly popular. knowledge graphs have been being emerging in many AI-related applications, such as question answering systems, information retrieval, natural language processing, recommendation systems, etc. However, the traditional deep learning approaches fail to handle non-European data such as knowledge graphs. With the rapid development of graph neural networks, geometric deep learning has become an important theory for modeling non-European data. From the perspective of geometric deep learning and focusing on graph neural networks, this paper summarizes the recent research progress on key knowledge graph techniques based on graph neural networks. Specifically, this paper summarizes the three core research fields of knowledge acquisition, knowledge representation, and knowledge reasoning on knowledge graphs, and discuss future research directions and prospects.
Key words:knowledge graph; geometric deep learning; artificial intelligence; graph neural network; knowledge reasoning
收稿日期: 2020-03-04
基金項目: 國家自然科學基金項目(61822113); 國家重點研發計劃(2018YFA060550); 湖北省自然科學基金項目(2018CFA050); 湖北省科技廳重大專項(2019AEA170)
作者簡介: 杜博(1986-),男,教授,博士生導師,國家自然科學基金優秀青年科學基金獲得者,研究方向是人工智能、機器視覺、知識圖譜。
E-mail: dubo@whu.edu.cn
引用格式: 杜博,萬國佳,紀穎. 基于幾何深度學習的知識圖譜關鍵技術研究進展[ J].
航空兵器,2020, 27( 3): 1-10.
Du Bo, Wan Guojia, Ji Ying. A Review of Knowledge Graph Techniques from the View of Geometric Deep Learning[ J]. Aero Weaponry,2020, 27( 3): 1-10.( in Chinese)