999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于可微神經計算機和貝葉斯網絡的知識推理方法

2021-03-07 05:16:02孫建強許少華
計算機應用 2021年2期
關鍵詞:記憶實驗信息

孫建強,許少華

(山東科技大學計算機科學與工程學院,山東青島 266590)

(*通信作者電子郵箱sunjianqiangv@outlook.com)

0 引言

人工智能(Artificial Intelligence,AI)的發展大致可分為三個層次:計算智能、感知智能和認知智能。人工智能的終極目標是實現通用人工智能(Artificial General Intelligence,AGI)[1]。現階段,機器對海量數據的處理得益于其高性能的運算能力,機器的計算智能已遠超人類水平。感知智能是機器對語音、圖像等進行感知的能力,例如在畫面中可以識別出客體信號,已基本達到甚至超過了人類水平。認知智能對人工智能提出了更高要求,機器需要具有人類智能水平,具有解釋數據、解釋過程、解釋現象的能力,從而對問題進行推理、規劃、創作,得到正確的決策判斷[2-3]。

知識圖譜(Knowledge Graph,KG)被認為是人工智能由感知智能通向認知智能的基石,其中很大的原因在于KG 強大的語義理解能力和知識推理能力[4]。KG 可將知識以機器可讀的方式進行結構化,基于語義表達解決實際問題,但它不能處理知識的不確定性。貝葉斯網絡(Bayesian Network,BN)通過置信度,以概率表示知識的不確定性,并結合圖論,展現了其在知識推理方面解決不確定性問題和處理非完整性信息的優勢[5]。

人工神經網絡(Artificial Neural Network,ANN)具有強大的學習能力和泛化能力,被廣泛應用于知識推理領域[6]。針對KG 中許多隱藏事實未能挖掘的問題,文獻[7]中提出了一種神經張量網絡(Neural Tensor Network,NTN)模型,對發現實體間隱藏關系具有良好效果;但其計算復雜度非常高,且在稀疏KG 上的效果較差。文獻[8]中提出了投影嵌入(Embedding Projection,ProjE)模型,對模型參數規模進行了優化,降低了計算復雜度;但它對實體和關系嵌入向量預處理的效果存在很大的依賴。針對神經網絡有限的存儲記憶能力,基于輔助存儲的推理受到了研究者的重視。文獻[9]中提出了隱性推理網(Implicit ReasoNets,IRN)模型,使用共享記憶部件存儲記憶信息,通過對共享記憶組件的讀取來隱式地進行推理;但IRN 模型無法對記憶信息進行即時寫入或修改。文獻[10]中提出了神經圖靈機(Neural Turing Machine,NTM)模型,模擬馮諾依曼體系,將深度神經網絡和輔助存儲分別視為中央處理器和內存,為推理功能提供了記憶基礎;但NTM無法避免多個存儲單元互相干擾,而且無法釋放存儲單元。文獻[11]中提出的可微神經計算機(Differentiable Neural Computer,DNC)在NTM 基礎上對存儲管理方式進行了改進,而且時序記憶鏈接的加入使得DNC 可以跳躍讀取或更新記憶信息;但同其他神經網絡模型一樣,DNC無法對數據不確定性進行處理。針對現有方法有限的記憶能力無法很好對KG中隱含信息進行挖掘和KG 無法處理不確定知識的問題,提出一種可微神經計算機(DNC)和貝葉斯網絡(BN)相結合的推理方法DNC-BN,并通過實驗驗證了DNC-BN的推理效果。

本文的主要工作是:

1)將具有長期記憶功能的可微神經計算機應用到KG 推理領域,以解決KG推理中隱含信息挖掘不充分的問題;

2)提出了DNC-BN 方法,模擬人腦推理過程,把人工神經網絡、輔助存儲和不確定性推理相結合,通過引入BN 處理數據不確定性,使用極大似然估計計算實體概率參數,量化了實體關系真實存在的可能性。

1 相關工作

1.1 知識圖譜

KG 的概念[12]于2012 年由谷歌公司提出,其本質為具有圖數據結構的知識庫,可以認為KG 由語義網絡(Semantic Network,SN)[4]發展而來。KG 最初用于增強搜索引擎的智能化,由于包含了豐富的語義關聯和知識結構,可為學習和研究提供有價值的數據信息。如圖1所示,可視化KG展示了2019新型冠狀病毒與宿主、基因和蛋白等的關系。

圖1 KG示意圖Fig.1 Schematic diagram of KG

KG 可以使用事實三元組(頭實體,關系,尾實體)來形式化表示事物及其之間關系,例如事實三元組(2019 新型冠狀病毒,宿主實體,人類)中,頭實體和尾實體分別為“2019 新型冠狀病毒”和“人類”,兩者之間的關系為“宿主實體”。

目前大部分的開放KG 并非很完善,大量的隱含信息亟待挖掘。KG 的不完整性對其可發揮的作用產生了一定的制約,因此,如何挖掘隱含信息,對KG 中的知識進行完善是一項重要的研究問題[13]。知識圖譜補全(Knowledge Graph Completion,KGC)技術可以預測殘缺信息,挖掘隱含數據,為解決KG 不完整性問題提供了重要支持。KGC 技術中,最重要的方法就是面向KG的知識推理[14]。

1.2 可微神經計算機

ANN 處理數據時,計算和存儲并不是分開的,而是通過網絡參數和網絡結構混合在一起,它對存儲需求的處理有限,并不能隨著任務存儲需求的增長對存儲進行靈活的更迭。DNC則提供了解決問題的一種思路。

DNC 可以視為ANN 和外部存儲矩陣的結合,即主要由控制器和記憶體組成[10,15]。和其他神經網絡相比,DNC 可選擇性地對存儲進行讀寫,并迭代地修改存儲數據。利用記憶體存儲矩陣,DNC可以獲取推理隱含信息,存儲推理過程中的重要數據,通過模擬人腦的推理過程,提高了推理效率。DNC的核心是控制器,其本質是ANN,相當于計算機系統中的處理器。記憶體大大提高了DNC 的記憶能力,是DNC 的創新之處。DNC的模型結構見圖2。

圖2 DNC結構Fig.2 Structure of DNC

控制器和記憶體的交互對DNC 具有重要意義。控制器可選擇性將記憶信息寫入記憶體,并對寫入的位置進行確定。控制器可以更新一個位置的記憶信息,并對信息是否釋放作出決定。控制器還可以從記憶體的多個位置進行讀取,關聯時序鏈接記錄了記憶信息被存儲的順序。

因此,DNC在具有長期記憶功能的同時,還可以靈活地對記憶信息進行更新,本文提出的方法將DNC 引入到KG 推理領域中,對推理和隱含信息的挖掘具有重要作用。

1.3 概率圖模型

概率圖模型(Probabilistic Graphical Model,PGM)由文獻[16]提出,它結合了概率論和圖論,通過構建圖來表達問題中變量的聯合概率分布,是不確定性推理問題的重要工具。

BN 是PGM 的一種,理論基礎為貝葉斯法則[5]。BN 可形式化表示為BN(G,θ),其中網絡拓撲結構G為有向無環圖(Directed Acyclic Graph,DAG),圖中節點為隨機變量,包括已知變量、隱含變量以及未知參數等,節點之間的連線表示隨機變量間的條件依賴,θ定量描述這種依賴,并通過條件概率表(Conditional Probability Table,CPT)表示。BN 運用不確定性推理原理,模擬人類推理過程中的因果關系,避免了數據的過擬合以及主觀因素造成的偏差,可以出色地處理挖掘數據中潛在知識的問題[17]。

2 DNC-BN模型結構

本文提出的DNC-BN 模型主要由控制器、記憶體、BN 等組成,輸入數據形式為已預處理為編碼數據的事實三元組。輸入數據在控制器中處理得到的記憶信息被寫入到記憶體中,控制器和記憶體之間的交互通過讀寫頭完成。控制器處理后的三元組數據再由BN計算實體節點之間的概率參數,推理實體之間存在關系的可能性,最終輸出補全的三元組數據。DNC-BN模型整體架構和數據處理流程如圖3所示。

圖3 DNC-BN模型總體架構Fig.3 Overall structure of DNC-BN model

2.1 控制器

控制器是模型的核心。在t時刻,控制器從數據集中接收輸入向量xt,在記憶體存儲矩陣Mt-1中獲取R個讀向量,經過控制器網絡處理,得到輸出向量yt。令

控制器網絡可以選擇任何結構的神經網絡,本文使用長短時記憶(Long Short-Term Memory,LSTM)網絡作為控制器網絡[18]。在t時刻,控制器網絡l層輸出值為:

在每一時刻,控制器網絡都計算得到一個網絡輸出向量υt和一個交互向量ξt,其中交互向量用來參數化t時刻控制器和記憶體的交互:

控制器通過在計算圖中創建循環將信息傳遞回來[19],進而得到υt等。計算圖可如圖4簡要展示。

圖4 控制器計算圖Fig.4 Computation graph of controller

最后,控制器輸出向量為:

這種設計使控制器通過加強對記憶體存儲矩陣的依賴調節其輸出決策。

2.2 讀寫頭和記憶體

如圖5 所示,控制器通過讀寫頭對記憶體中的數據進行操作。

圖5 控制器通過讀寫頭與記憶體的交互Fig.5 Interaction between controller with memory through read and write heads

讀取或寫入的位置由相應的權重決定,N個位置上允許權重的集合是RN中標準單純形的非負象限:

其中:°表示Hadamard乘積;E為N×M的全1矩陣。

DNC的尋址機制是多種結合的:在記憶體中寫入數據時,使用了基于內容的尋址和動態尋址;在記憶體中讀取數據時,使用了基于內容的尋址和時序記憶鏈接來獲取位置。

2.2.1 基于內容的尋址

在存儲矩陣M上進行內容查找操作定義為:

其中:向量k為查找鍵;β為鍵強度參數;D()為余弦相似度,用來作為內容相似性的評估函數。

C(M,k,β) ∈SN定義了存儲位置上的歸一化概率分布。SN是約束向量,被定義為標準(N-1)-單純形:

2.2.2 動態尋址

動態尋址是通過釋放列表φt實現的。釋放列表記錄了記憶體中空閑的存儲位置,控制器對記憶體中數據進行改動后,釋放列表也隨之更新。

在寫入數據之前,控制器為讀取頭i分配釋放門參數用來判斷最近讀取的位置信息是否被釋放。ψt為保留向量,表示位置信息不會被釋放的程度:

ut表示t時刻的存儲使用向量,u0=0,

得到ut的值,對各個存儲位置的使用情況進行升序排列,可以對釋放列表進行更新。φt[1]記錄了利用率最低的存儲位置。排序操作使得順序有變動的位置產生不連續性,在計算梯度時,由于產生的不連續性對學習無關,故將其忽略。

2.2.3 寫入權重

定義分配權重at,用來產生新分配的寫入位置:

控制器對新分配的位置可選擇寫入或不寫入。首先,定義寫內容權重:

2.2.4 讀取權重

對于讀取頭i,定義讀內容權重

2.3 時序記憶鏈接

時序記憶鏈接保存了記憶體位置寫入順序的信息,被表示為Lt。Lt[i,j]表示位置i在寫入位置j后被寫入的程度,而且Lt的每行每列都可定義位置權重。

其中,pt為優先權重,pt[i]表示位置i被最后寫入的程度:

對于讀取頭i,定義反向權重和前向權重:

2.4 貝葉斯網絡

BN 可有效表達節點間的條件獨立性。節點n1,n2,…,nd的聯合概率分布為:

其中pai為ni的父節點集。模型訓練的過程為參數估計的過程,本文使用極大似然估計計算網絡各個節點的概率參數。參數θt唯一確定PB(pai|ni),為方便表達,記PB(pai|ni)為PB(pai|θi)。參數θi對pai的似然是:

參數θi的極大似然估計為:

通過控制器網絡對KG 三元組數據處理,記憶體對記憶信息的存儲和更迭以及BN對不確定性信息的分析,本文模型對三元組數據進行推理,實現KG的補全。

3 實驗與結果分析

3.1 實驗數據

本文實驗使用公開數據集WN18RR[20]和FB15k-237[21]來評估模型性能。WN18RR 和FB15k-237 分別為WordNet 子集WN18 和Freebase 子集FB15k 的修訂數據集。WordNet 是一個基于認知語言學的大規模英語詞匯語義知識圖譜,WN18包含了其中的18 個關系和40 943 個實體;Freebase 是一個開放性的大規模鏈接數據庫,FB15k 包含了其中的1 345 個關系和14 951個實體。WN18和FB15k存在測試集泄漏問題,即測試集中包含有可由訓練集中三元組翻轉得到的用例,這就使得實驗模型極易取得較優結果。WN18RR 和FB15k-237 將訓練集和測試集中的反向關系三元組數據進行了處理,解決了測試集泄漏的問題。WN18RR 和FB15k-237 基本情況統計如表1所示。

表1 數據集的基本情況統計Tab.1 Basic statistics of datasets

WN18RR 和FB15k-237 數據集都由多文件組成,其中train、valid、test 文件分別代表訓練集文件、驗證集文件、測試集文件,每個文件的第一行標注了樣本的個數,其余每行的樣本為三元組格式,以編碼數據存儲,且都保持(頭實體,尾實體,關系)的順序。entity2id 文件保存了所有實體及其對應的id編碼,relation2id文件保存了所有關系及其對應的id編碼。

3.2 實驗參數設置

本文模型實驗參數的設置參考了文獻[11],并通過驗證集對部分參數進行微調。其中控制器網絡選擇為LSTM,隱藏層設置為256 個神經元,使用均值為0、方差為0.1 的高斯分布初始化可更新參數。為提高收斂速度,優化算法選擇為RMSProp,其中學習率設置為1× 10-4,模糊因子設置為1×10-10。記憶體中,設置64 個存儲位置,每個位置的寬度設置為256,用于存儲控制器處理生成的記憶信息。模型設置了2個讀頭和1 個寫頭用于控制器和記憶體之間記憶信息的交互。BN 使用極大似然估計計算網絡各個實體節點的概率參數,并使用貝葉斯打分函數對實體之間的關系進行評估。

3.3 拷貝任務

拷貝任務可以作為一種健全性檢查對動態存儲分配進行測試,并通過可視化對實驗過程進行分析。如圖6(a)和(b)所示(圖的橫向表示時間步,縱向表示存儲位置),在數據集中隨機選擇若干條序列作為輸入,并在記憶體中按輸入順序進行召回創建為輸出序列。在召回階段,不再提供輸入,從而確保網絡將所有序列存儲到了記憶體中。通過設置較少的存儲位置,來測試動態存儲分配和存儲位置重用等。如圖6(c)和(d)所示,相同的存儲位置被重復使用。同時,結合圖6(e)和(f),可以看出在讀取階段,釋放門處于活躍狀態,這意味著存儲位置在被讀取之后會被立即釋放;在寫入階段,分配門處于活躍狀態,這表明被釋放的位置可以重新使用。

圖6(g)給出了一個錯誤分配情況,第9 個位置未能正確地更新,導致其余的序列在后面的時間步中都不可以使用這些存儲位置。

圖6 拷貝任務可視化Fig.6 Visualization of copy task

3.4 結果分析

為了評估本文模型各組成部分對實驗性能的影響,本文先進行消融實驗;為了評估本文模型的綜合推理性能,本文模型與TransE[22]模型、ConvE[20]模型及DistMult[23]模型進行了對比實驗。

本文實驗環境為JetBrains PyCharm 2018.3,64 位Windows 10 操作系統,使用了開源機器學習平臺TensorFlow;硬件配置為Intel Core i5-4 210 CPU @2.4 GHz,8 GB物理內存。

對于每一個測試三元組,使用數據集中所有實體分別替換要推理的實體,如對于測試三元組(hei,tei,teli),若需要推理hei,則需要構造三元組(he1,tei,teli),(he2,tei,teli),…,(hen,tei,teli),其中he1,he2,…,hen∈E,n為實體總數,每一個構造出的三元組都有對應的得分。

實驗評估指標使用Mean Rank 及Hits@10,其中Mean Rank 代表正確實體在得分排名中的平均位次,Hits@10 代表正確實體在前十排名中的比例。因此,Mean Rank 取得較低值、Hits@10取得較大值是理想的結果。

消融實驗在WN18RR 數據集上進行,結果如表2 所示。從表2 中可以看出,當添加了BN 后,推理效果有較為明顯的提升,這表明BN 對隱含信息的推理產生了效果;而在LSTM基礎上使用記憶體,即DNC的提升效果明顯更好;同時,DNCBN 較僅使用DNC 的提升效果不如在LSTM 上使用BN 的提升效果明顯,也表明記憶體的引入對增強方法的推理能力起到了更大的作用。

本文DNC-BN模型同其他推理模型在WN18RR和FB15k-237 上的對比實驗結果如表3 所示。同TransE、DistMult、ConvE 相比,本文模型在WN18RR 上Mean Rank 至少提前了769,Hits@10至少提高了0.8個百分點;在FB15k-237 上,Mean Rank 至少提前了42,Hits@10至少提高了1.8個百分點。

可以看出,本文模型在Mean Rank 上的性能較對比模型提升明顯,這一結果表明,知識圖譜推理過程中,考慮對記憶信息的存儲和利用以及對不確定性的處理,可以更好地挖掘潛在信息,提升推理效果。

表2 在WN18RR上的消融實驗結果Tab.2 Results of ablation experiment on WN18RR

表3 DNC-BN同其他模型在WN18RR和FB15k-237上的Mean Rank 和Hits@10對比實驗結果Tab.3 Comparison of Mean Rank and Hits@10 between DNC-BN and other models on WN18RR and FB15K-237

4 結語

本文提出的DNC-BN 模型基于可微神經計算機(DNC)和貝葉斯網絡(BN),遵循認知智能的思想,使用人工神經網絡作為控制器對數據進行處理,將記憶信息存儲在記憶體,通過讀寫頭進行交互,并結合不確定性理論,對知識圖譜進行推理。在數據集WN18RR 和FB15k-237 上的實驗結果表明,本文模型所具有的輔助存儲及不確定性推理等提升了推理結果排名,展現了良好的推理效果。同多層LSTM 類似,堆疊型DNC 在原理上可以增加模型的學習和推理能力,研究堆疊型DNC的知識推理效果,是下一步將要開展的工作。

猜你喜歡
記憶實驗信息
記一次有趣的實驗
做個怪怪長實驗
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
記憶中的他們
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
兒時的記憶(四)
兒時的記憶(四)
記憶翻新
海外文摘(2016年4期)2016-04-15 22:28:55
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 国产高清自拍视频| 欧美精品伊人久久| 中文字幕 91| 国产浮力第一页永久地址 | 国产精品极品美女自在线| 91久久偷偷做嫩草影院电| 青青青视频91在线 | 亚洲精品在线91| 国产伦片中文免费观看| 成人伊人色一区二区三区| 日本在线国产| 欧美在线精品怡红院| 2020极品精品国产| 日韩视频福利| 久久精品丝袜| 五月激情婷婷综合| 58av国产精品| 在线综合亚洲欧美网站| 亚欧成人无码AV在线播放| 婷婷久久综合九色综合88| 精品久久久久久成人AV| 91福利在线观看视频| 永久毛片在线播| 91口爆吞精国产对白第三集| 97国产在线视频| 成年人国产网站| 亚洲人成日本在线观看| 亚洲高清在线天堂精品| 久久香蕉欧美精品| 日韩在线播放欧美字幕| 亚洲精品va| 国产成人精品视频一区视频二区| 亚洲一区第一页| 日本精品视频| 五月天丁香婷婷综合久久| 在线观看国产黄色| 国产成本人片免费a∨短片| 亚洲天堂777| 看av免费毛片手机播放| 亚洲一级色| 久久精品丝袜| 日韩精品资源| 亚洲精品在线观看91| 国产chinese男男gay视频网| a级免费视频| 试看120秒男女啪啪免费| 777国产精品永久免费观看| 国产亚洲精品97AA片在线播放| 亚洲精品福利视频| 免费啪啪网址| 欧美国产视频| 免费在线不卡视频| 欧美有码在线| 亚洲香蕉在线| 重口调教一区二区视频| 国内毛片视频| 国产91在线|中文| 国产色爱av资源综合区| 日韩大片免费观看视频播放| 日韩欧美国产区| 亚洲Av激情网五月天| 国产欧美日韩一区二区视频在线| 人人艹人人爽| 日本国产精品一区久久久| 日韩在线永久免费播放| 国产激情第一页| 亚洲人成电影在线播放| 亚洲综合色区在线播放2019| 福利小视频在线播放| 国产黄色片在线看| 国产va在线观看| 无套av在线| 在线观看91精品国产剧情免费| 日本a∨在线观看| 2018日日摸夜夜添狠狠躁| 成人在线天堂| 精品无码国产一区二区三区AV| 亚洲一区毛片| 在线欧美日韩| 中文无码精品A∨在线观看不卡| 国产成人精品2021欧美日韩| 奇米影视狠狠精品7777|