楊波 廖怡茗



摘?要:[目的/意義]構建企業風險知識圖譜,是對大數據環境下企業知識資源的有效組織和利用。針對現有企業知識圖譜多為知識的靜態映射問題,本文引入時間維度來刻畫企業風險事件的動態性、突發性和時效性等演化特征。[方法/過程]經過企業風險知識的信息抽取、知識融合、本體構建以及動態知識推理等環節,自底向上系統性地構建了企業動態風險知識圖譜。在企業風險知識融合階段,針對企業領域數據集實體樣本的不平衡分類問題,本文提出ResNet動態知識推理方法改進了Multi-Net模型的損失平衡函數。[結果/結論]實驗表明該知識推理方法能夠有效提高實體預測和關系預測的準確性,對于企業領域知識具有良好的適用性,最后本文將該知識圖譜應用于一個智能問答系統。
關鍵詞:企業動態風險;知識圖譜;知識融合;動態知識推理
DOI:10.3969/j.issn.1008-0821.2021.03.011
〔中圖分類號〕G203?〔文獻標識碼〕A?〔文章編號〕1008-0821(2021)03-0110-11
Research?on?the?Construction?and?Application?of
Knowledge?Graph?for?Enterprise?Dynamic?Risk
Yang?Bo?Liao?Yiming
(School?of?Information?Management,Jiangxi?University?of?Finance?and?Economics,Nanchang?330013,China)
Abstract:[Purpose/Significance]Constructing?an?enterprise?risk?knowledge?graph?is?an?effective?organization?and?utilization?of?enterprise?knowledge?resources?in?a?big?data?environment.Aiming?at?the?problem?of?static?mapping?of?existing?enterprise?knowledge?graphs,this?paper?introduces?the?time?dimension?to?describe?the?evolutionary?characteristics?of?enterprise?risk?events?such?as?dynamics,suddenness?and?timeliness.[Method/Process]Through?information?extraction,knowledge?fusion,ontology?construction?and?dynamic?knowledge?reasoning?of?enterprise?risk?knowledge,a?bottom-up?enterprise?dynamic?risk?knowledge?graph?was?systematically?constructed.In?the?enterprise?risk?knowledge?fusion?link,aiming?at?the?imbalanced?classification?problem?of?the?entity?samples?of?the?enterprise?domain?data?set,this?paper?proposed?the?ResNet?dynamic?knowledge?reasoning?method?to?improve?the?loss?balance?function?of?the?Multi-Net?model.[Result/Conclusion]Experiments?showed?that?the?new?model?could?effectively?improve?the?accuracy?of?entity?prediction?and?relationship?prediction,which?had?good?applicability?to?enterprise?domain?knowledge.Finally,the?knowledge?graph?was?applied?to?an?intelligent?question?answering?system.
Key?words:enterprise?dynamic?risk;knowledge?graph;knowledge?fusion;dynamic?knowledge?reasoning
隨著Web技術普及和社會信息化程度的提高,Web技術正向著基于知識互聯的語義Web方向發展,信息的多變性、異構性和自治性使得人們難以從海量信息中獲取所需目標資源[1]。知識圖譜以其強大的語義處理能力和開放互聯能力,讓大數據環境下的知識資源組織和管理更為高效,能夠有效解決智能搜索、智能問答、個性化推薦等基于知識的推理和決策問題。知識圖譜(Knowledge?Graph)的概念最早在2012年由谷歌正式提出,是用于增強其搜索引擎功能的知識庫,在智能搜索、情報分析、社交網絡、深度問答以及垂直行業[2-3]等領域取得了廣泛的應用,此后各互聯網公司也紛紛推出各自的知識圖譜產品。當前,國內外研究人員開發了諸多高質量大規模開放知識圖譜,包括DBpedia、Yago、BabelNet、ConceptNet以及Microsoft?Concept?Graph[3]等通用知識圖譜,以及阿里巴巴電商知識圖譜、Linked?Life?Data醫療項目和Kensho投資咨詢等垂直領域知識圖譜[4]。
大數據環境下,企業風險管理面臨信息爆炸的難題,企業風險知識涉及經濟、產業、投資等覆蓋全行業的相關知識,知識圖譜在企業商業活動、創投咨詢及證券等金融領域具有重要價值,廣泛應用于挖掘潛在客戶、反欺詐、內審內控、失聯客戶管理以及風險識別和預警等業務[5-6]。例如,建立行業、企業、客戶的實體關聯關系,根據貸款信息、行業信息建立關系挖掘模型,及時預測高風險行業及風險事件,企業可以盡早規避系統性風險;在風險預警中,構建基于企業現金流、經營信息等屬性值的實體關聯,通過深度學習方法對屬性值以及其衍生指標進行實時監控,可以完善企業的風險預警系統。因此,研究企業風險知識圖譜具有重要實踐價值和理論意義,是對金融領域知識圖譜的進一步探索和完善。
企業風險事件往往具有動態性、突發性和時效性等演化特征,與其發生時間密切相關,在構建企業風險知識圖譜時加入時間信息,對于管理層把控決策風向標至關重要。目前已有學者構建了金融領域知識圖譜,但是面向企業風險的知識圖譜研究仍相對匱乏,且多數只集中于某一特定環節,如面向企業知識圖譜的中文命名實體識別[7]、實體鏈接[8]、關系抽取[9-10]等技術過程。盡管陳曉軍等[11]系統地研究了企業風險知識圖譜,并通過智能問答實現了對知識圖譜地檢索和利用,但僅僅構建了一個靜態的企業知識圖譜,缺乏利用時間信息推理知識圖譜的演化過程,且未考慮到風險知識的動態特征。領域知識圖譜相對于通用知識圖譜來說,知識的廣度、深度和粒度都有更加嚴格的要求,企業風險知識的一個顯著特征是高度動態性,其知識圖譜的構建便需要結合風險知識的時效性。有鑒于此,本文面向企業動態風險引入時間維度,從信息獲取、知識融合、本體構建和動態知識推理4個環節自底向上構建企業風險知識圖譜,并基于該企業動態風險知識圖譜構建了一個智能問答系統,以可視化的圖譜形式實現用戶對企業風險信息的動態把控。
1?相關工作
構建面向企業動態風險的垂直領域知識圖譜,不僅要基于面向企業風險管理的領域知識,也需采用有效的動態圖譜構建技術模型。本節將介紹企業風險知識圖譜以及動態知識圖譜構建方法的相關研究。
1.1?企業風險知識圖譜研究現狀
企業知識圖譜是指關注于企業信息和關系的垂直領域知識圖譜[10],屬于金融領域,具有巨大的商業價值,目前國內關于金融領域特別是企業風險領域的知識圖譜研究仍有待展開。王超[7]在經典的BiLSTM-CRF命名實體識別模型的基礎上融入Self-Attention機制,提出SA-BiLSTM-CRF模型,將其應用于標注語料較少的企業領域,提出適用于企業領域的命名實體識別系統,并基于此完成了企業圖譜的構建,具有一定的工程應用價值。劉波[8]提出了一個結合上下文匹配和知識庫信息檢索策略的實體指稱擴展方法,根據候選實體消歧和實體生成方法設計了一個實體鏈接系統,最后使用Neo4j將其應用到企業領域知識圖譜的構建中。孫晨等[9]針對企業知識圖譜在關系抽取效果上的局限性,提出給予分類的中文實體關系抽取方法,使用最大熵模型構建更為完整的企業知識圖譜。吳錦鈺[10]提出BiGRU-CNN和BiGRU-Incep兩種基于深度學習的關系抽取模型,并通過注意力機制給不同實例句子分配權重以提高實體關系抽取的準確率,構建了一個小型的企業圖譜。然而,這些研究都只關注于知識圖譜構建的某一環節而缺少全面性,也忽略了時間信息對風險演化的影響。
在風控場景中,企業圖譜可以探查包括客戶風險、競爭風險、政策風險以及市場風險等在內的企業外部風險,提供探究企業內外主體及關系鏈的工具,能夠對行業熱點、政策和關聯企業等進行智能分析和風險預警,目前國內發展比較成熟的有阿里云企業圖譜、百度云企業圖譜和海致企業圖譜[11]。在風險識別方面,馬海波[12]結合企業基本屬性和企業歷史風險中的特征信息,構建企業關聯信息知識圖譜,通過分析企業節點和低信用列表實體節點的關系特征,提高了企業風險識別的能力。一些金融機構如浦發銀行等也將知識圖譜應用于風險預測中,但是企業風險知識圖譜的工業級應用研究處于初步階段,如何系統而又全面地構建風險知識圖譜,提高企業風險管理中領域知識利用效率仍有待探索。
1.2?動態知識圖譜研究現狀
傳統知識圖譜被認為是對多關系數據的靜態映射,而基于事件的交互知識除了有多關系性外,還具有復雜的時間動態特征,引起了眾多學者的廣泛關注,近年來融合時間維度信息來構建動態知識圖譜的研究也逐漸興起。Trivedi?R等[13]采用隨時間推移的非線性演化的實體表示形式,提出包含時間邊沿的深度進化知識網絡圖(Know-Evolve),有效地預測了事實的發生概率或復發時間,但無法解決并發事件的推理難題。
一些學者還關注于研究基于時間信息進行建模的方法。García-Durán等[14]提出時序知識的補全方法(Temporal-Aware?Version?of?Trans?E,TA-Trans?E),利用遞歸神經網絡學習關系類型的時間信息表示,緩解了知識在時間表達上的稀疏性和異質性。Leblay?J等[15]提出推演知識圖譜的時序方法(Temporal?TransE,TTransE),采用時間間隔注釋實體邊緣以反映實體關系時間維度的一致性,同時預測了未注釋邊緣時間有效性的任務。Dasgupta?S?S等[16]考慮知識圖譜中的關系事實通常表現出時間動態特征,提出基于超平面的時間感知知識圖譜嵌入方法(Hyperplane-Based?Temporally?Aware?Knowledge?Graph?Embedding,HyTE),通過把每個時間戳與相應的超平面相關聯,將時間合并到實體關系空間中。Liu?J等[17]為了彌補演化知識圖譜模態表征和算法的不足,提出進化知識圖譜(Evolve?Knowledge?Graph,EvolveKG),揭示了跨時間知識交互以及所需的存儲和計算性能,利用歷史影響力來預測未來的知識。然而這些動態推理模型都是對單個時間點的處理,沒有捕捉到事實的時間相關性,只能對某個時間戳的知識圖譜進行處理。
為了實現在全時間域內對實體節點之間的時間、多關系和并發交互進行建模,Jin?W等[18]提出對復雜事件序列進行建模的循環事件網絡(Recurrent?Event?Network,RE-NET),解決了對多個時間點高并發事件的推理難題,以及隨著時間的推移進行多步知識推理。在此基礎上,為了進一步提高動態圖譜在多關系對應下的推理能力,陳浩等[19]改進了RE-NET的鄰近聚合器,提出多關系循環事件的動態知識圖譜推理方法(Dynamic?Knowledge?Graph?Inference?Based?on?Multiple?Relation?Cyclic?Events,Multi-Net),通過增強對同時間戳內多個關系實體的聚合能力,提高了實體關系預測和實體消歧的精準度。綜上所述,目前對于動態知識圖譜的時間維度建模、時序知識推理的相關研究已取得了不同程度的進展,然而這些方法主要針對大規模通用知識圖譜,對于垂直領域特別是企業風險知識圖譜的適用性仍有待探究。
2?企業動態風險知識圖譜構建
知識圖譜主要有自頂向下(Top-down)和自底向上(Bottom-up)兩種技術構建方式[2]。自底向上的構建方式首先對實體進行歸納組織形成底層的概念,逐步向上抽取形成上層的概念[4],即從一些開放鏈接數據中提取實體,選擇置信度較高的實體加入知識庫中,再構建頂層的本體概念模式[2]。隨著知識抽取和知識加工技術的不斷成熟,目前大多數知識圖譜采用自底向上的方式構建,例如微軟的Satori知識庫和Google的Knowledge?Vault,都是基于公開的海量網頁數據自動抽取資源來獲取知識[20]。
垂直領域知識具有極強的專業性,主要針對專業領域或行業的特定數據資源,同時考慮企業風險知識體系缺乏完備性的特點,本文采用自底向上的方式[20]構建知識圖譜,企業風險知識圖譜的技術架構如圖1所示,主要由4個步驟構成,分別是信息抽取、知識融合、企業本體構建和動態知識推理。
2.1?信息抽取
信息抽取是知識圖譜構建的首要環節,解決如何從多源異構信息中自動抽取出候選知識單元的問題,其中面向文本的信息抽取一般包括命名實體識別和關系抽取兩個任務。本文選取的實驗數據來自人民日報標注語料庫,再通過百科數據得到企業基本信息對原始語料庫進行補充;此外該語料庫屬于新聞領域,而企業風險知識圖譜的構建重點關注于人物及企業領域的實體,于是又選擇爬取到的3?461條企業新聞對已有數據集進行擴充。首先過濾和篩選了數據集中的冗余和不相關信息,再對這些半結構化和非結構化的風險數據進行抽取。
1)命名實體識別。命名實體識別又稱實體抽取,是指從非結構化或半結構化的文本信息中提取出多種指定類別的實體,其識別質量對于后續實體鏈接和合并的效率影響極大,是信息抽取中最關鍵和基礎的環節。企業領域命名實體識別主要關注于人名、機構名和地名實體等專有名詞,以及與動態風險密切相關的時間實體信息,特別是公司名稱、縮略詞、企業專有名詞等的識別。
根據命名實體識別技術的發展脈絡,命名實體識別的方法可以分為:基于規則、基于詞典、基于統計和基于深度學習4類?;谝巹t的命名實體識別可以根據不同行業的文本數據,制定出與該行業特點最適用的規則模型,但是可移植性較差,過于依賴具體領域、語言和文本風格;基于詞典的方法根據文本在預先構建的詞典中的匹配結果來識別領域實體,由于詞典收錄實體完備性不足且難以更新,一般與基于規則或基于統計的方法結合使用;基于統計的常用方法有隱馬爾科夫鏈模型和條件隨機場模型等,前者沒有考慮實際文本處理中的上下文語義問題,對于領域標注的性能不高,條件隨機場模型則需要使用標注好的語料訓練模型。由于企業風險知識圖譜的構建對知識的準確率有更高的要求,且企業領域的規范語料標注較少,本文采用基于遷移學習的SA-BiLSTM-CRF模型[7]識別企業領域實體,遷移學習可以使得范圍更廣泛的語料數據在企業領域得到較好的識別效果。
經典的BiLSTM-CRF命名實體識別模型包括Embedding層、BiLSTM編碼器和CRF層,其中LSTM網絡在處理長語句序列中較遠距離的依賴特征時,經過多時間步驟的累積才能實現特征間的聯系,于是加入Self-Attention機制縮短距離來提高這些依賴特征的利用效果,模型結構如圖2所示。其中X={x1,x2,…,xn}是由n個中文字符組成的輸入序列;經過Embedding層字符嵌入后,E={Ec,Ep}分別表示字向量Ec,以及兼顧語句中詞序信息的位置向量Ep;字符向量分別以正向和反向順序輸入LSTM網絡,得到含有上下文信息的特征Hi=[i,i];其次在Self-Attention層中通過Softmax函數歸一化,再加權求和得到含有正反語義信息的輸出H′i=[i,i,i,i];CRF層的作用在于解決有依賴關系的標簽分類問題,輸出與輸入序列等長的標簽序列Y={y1,y2,…,yn},最后使用BIEO標注體系對各實體進行標注。
值得注意的是,企業領域語料標注較少,人民日報語料庫屬于新聞類標注語料庫,直接使用會導致一些企業領域特征在新聞領域的局限下被忽略,本文通過遷移學習來優化上述深度學習模型。對于提取人名、地名、機構名的實體識別來說,企業和新聞領域的數據有極大的相似性,以新聞領域為源領域,企業領域為目標領域,首先使用人民日報語料庫的新聞語料進行預訓練,再基于百科網頁爬取到的1?429條企業領域標注數據進行訓練,將前者的SA-BiLSTM-CRF模型的參數訓練結果分別遷移到后者模型的Embedding層和CRF層上,形成4個參數各異的對比實驗。從表1的實驗結果來看,人民日報語料庫與企業領域數據存在一定程度上的相似性,遷移學習能夠有效提升SA-BiLSTM-CRF模型的實體識別效果。
2)企業實體關系抽取。命名實體識別之后的企業領域實體是離散的,為了得到企業實體間的關聯關系,通過關系抽取則可以獲取語義信息;企業的屬性一般包括創始人、董事長、高管、成立年份、城市等,通常也將企業屬性作為實體關系的一種,因此還需從企業百科網頁的基本信息中對各企業進行屬性抽取。此外動態知識圖譜的實體關系應當包含時序信息,吳錦鈺提出的BiGRU-CNN和BiGRU-Incep關系抽取方法[10]不僅注重時序信息的提取,而且關注于位置信息的提取,本文分別采用了這兩種模型進行實驗和比較。在進行關系特征提取時,將語料句法特征與實體特征相結合,首先把輸入的關系實例語句轉化為二維特征向量作為主要輸入特征,同時將實體特征如實體的長度、位置、上下文等特征輸入到Softmax分類器進行特征融合,最終輸出Softmax概率最大的節點即為抽取得到的實體關系。
實體關系一般與前后實體形成“<實體1><關系><實體2>”結構的知識三元組存儲到知識庫中,實體屬性則通過
2.2?知識融合
經過信息抽取,獲取了企業實體和實體間的關系、屬性以及部分時間信息,盡管優化的深度學習模型在實體識別和關系抽取中都存在優勢,這些結果還可能包含大量的冗余和沖突信息,同時為了提升知識的邏輯性和層次性,有必要對知識進行融合,刪除錯誤和冗余的知識,消歧矛盾和沖突知識,從而達到提升企業風險知識質量的目的,其中實體鏈接和知識合并是知識融合的兩個主要任務。
1)實體鏈接。實體鏈接是指將從文本中抽取到的企業實體對象,鏈接到企業知識庫中所對應的、指向現實世界同一事實的命名實體[20]。由于企業領域實體指稱復雜多樣,如“阿里巴巴集團”和“阿里巴巴(中國)有限公司”指向同一實體,此外來源于網絡的語料和百科數據不規范,通過實體鏈接則可以有效解決企業實體指稱的多樣性和歧義性。目前實體鏈接的算法主要有無監督的和有監督的,無監督的算法一般基于字典匹配或者相似度計算,對數據的規范化程度要求較高,企業領域實體數據復雜且不規范,于是采用融合卷積神經網絡(CNN)和余弦相似度[8]的有監督算法進行企業實體鏈接。
融合CNN和余弦相似度的實體鏈接模型結構主要分為:輸入層、CNN表示層、匹配層和輸出層。根據實體命名識別的結果,首先對語料數據進行預處理,把以縮寫、簡稱、別名等存在的企業實體進行查詢修正,使用上下文匹配和知識庫信息檢索策略對實體指稱進行擴展,得到標準的實體名稱集合M={M1,M2,…,MN},并基于匹配規則[8]的方法生成候選實體集C={C1,C2,…,CN},使用Google開發的開源計算工具Word2Vec對候選實體集的詞向量化作為模型的輸入。其次通過CNN表示層計算語義特征,將原始的高維文本特征,映射到低維的語義空間向量中,輸出一個概念向量,再使用經典的余弦相似度算法完成對實體概念向量的匹配。為了提高實體排序算法的性能,引入空實體判別機制,若候選實體集為空則認為不存在歧義實體,對于候選實體排序結果設定閾值,若相似度小于該閾值也判定為空實體,最后與不使用空實體判別機制的實驗進行了對比。表3所示的實驗結果表明,與單一的候選實體消歧算法相比,空實體判別能夠有效提升模型的準確率和召回率。
2)知識合并。人民日報語料庫以及企業新聞數據屬于半結構化和非結構化的文本數據,除此之外第三方知識庫和已有的結構化數據可以擴展現有知識庫,于是選取百度百科、維基百科中文版和互動百科知識庫中的部分企業網頁信息,爬取網頁源代碼中Title=“同義詞”的標簽獲取同義詞作為候選實體集,對其進行實體消歧后得到了企業的屬性信息,再將這些知識元素經實體鏈接后加入到了企業風險知識庫,實現了結構化風險知識的合并。
2.3?本體構建
知識圖譜從邏輯上可以劃分為數據層和模式層[20],知識融合后得到了一系列正確的企業領域的基本事實表達,然而事實本身并不等同于知識,為了獲取具有邏輯結構的知識體系,還需要進行本體構建來建立模式層的概念模板,借助本體庫來規范企業實體、關系以及實體的屬性和類型等對象之間的聯系。目前常用的本體構建工具主要有可視化手工構建和半自動化構建兩類,尚未出現自動化的構建工具,其中基于Java語言的Jena推理機[22]提供了通過程序調用算法半自動化地構建本體的方法,Jena推理機能夠存儲大規模的RDF數據,同時提供處理OWL本體語言和RDFS本體的API,大大提高了本體構建的效率。數據驅動的半自動化本體構建過程[2]主要可以分為3個階段:①概念的并列關系計算;②實體的上下位關系抽取,主要是實體隸屬關系(HasA)的抽取,例如淘寶網和阿里巴巴集團之間屬于隸屬關系;③生成本體,一般采用層次聚類[23]的方法,對各層次的抽象概念進行聚類并指定公共上位詞來構建本體結構。
3?基于動態知識圖譜的智能問答應用
企業動態風險知識圖譜實現了對融合時間信息的企業風險知識的關聯與整合,是對風險知識專業化和結構化的語義表示,然而通過關鍵詞搜索知識圖譜的結果,用戶還不能獲得與風險防控密切相關的有效信息,因此本文將企業動態風險知識圖譜應用于風險知識智能問答系統,進一步提升用戶獲取目標知識的針對性和準確性。問答系統對用戶問題的自然語言理解程度決定了系統生成答案的準確性,多輪問答機制通過多次追問的策略補充用戶問題所缺失的語義系統信息,幫助系統更準確地理解用戶意圖。本文采用多輪自動問答系統框架[26]構建了基于企業動態風險知識圖譜的智能問答系統,主要包括問題理解、知識圖譜查詢和問答生成3個模塊,該系統的框架如圖8所示。
如圖8所示,問題理解模塊旨在將非結構化的問題文本轉化為結構化的語義表示。本文首先使用Jieba分詞對輸入的問句文本進行中文分詞和詞性標注,以及日期和數值處理等一系列預處理,如將“今天”一詞轉化為系統當日時間“2020年7月18日”;其次進行風險事件識別,風險事件實例一般分為4類:研發風險、管理者認知風險、產品適應性風險和社會網絡風險;意圖識別是指對問句文本中用戶提問意圖的識別,與后續生成問答結果直接對應;本體屬性識別則是對問句文本中實體屬性和屬性值的識別。例如,輸入問句“2020年8月14日,餓了么逼迫商戶二選一遭20戶商家聯名舉報,市場監督管理局會罰款多少?”,所識別到的實體為“餓了么”“商戶”和“市場監督管理局”,實體關系和風險事件時間為<舉報><2020年8月14日>,風險事件實例為管理者認知風險,意圖識別結果為罰款結果,蘊含的屬性為餓了么平臺的“商戶數量”,屬性值為“20”。知識圖譜查詢模塊按照預定義的Cypher查詢模板,輸入問題理解中所識別的風險事件、問題意圖、實體屬性和屬性值進行查詢;再對查詢到的子圖譜進行結果計算,通過將問句文本中識別到的實體屬性集合與子圖譜依次計算差集來完成。若用戶輸入的問句文本語義完整,并且查詢結果符合答案閾值,則直接將查詢結果返回給用戶,否則通過Cypher查詢模板對用戶進行缺失語義信息的追問。
本文通過Django實現對該智能問答系統的問答結果可視化。Django提供的Model-View-Controller開發框架無需第三方庫和工具便可以創建網站,是一個功能較為全面的Python?Web開發框架。圖9所示為該智能問答系統輸入“與阿里巴巴創始人相關的風險關聯關系有哪些”等問題的可視化界面。
4?結?語
針對現有企業風險知識圖譜的構建方法大多為靜態知識映射,缺乏對企業風險的時間動態特征建模,本文將時間信息融入企業知識圖譜構建。本文詳細闡述了自底向上構建面向企業動態風險知識圖譜的完整過程,首先對企業風險領域的語料文本進行信息抽取;其次通過實體鏈接和知識合并技術,將抽取到的命名實體、關系和日期或時間信息進行知識融合,并構建了企業風險領域本體;針對企業領域數據集實體樣本的不平衡分類問題,本文提出的Multi-Net(ResNet)動態知識推理方法改進了原模型的損失平衡函數,實驗表明該方法能夠有效提高實體預測和關系預測的準確性;最后構建了企業動態風險知識圖譜,并將該知識圖譜應用于智能問答系統。本研究僅僅是面向企業動態風險知識圖譜構建的初步探索,對于模型中知識隨時間演化、轉移的完善還需進一步研究。
參考文獻
[1]謝能付.基于語義Web技術的知識融合和同步方法研究[D].北京:中國科學院研究生院(計算技術研究所),2006.
[2]徐增林,盛泳潘,賀麗榮,等.知識圖譜技術綜述[J].電子科技大學學報,2016,45(4):589-606.
[3]漆桂林,高桓,吳天星.知識圖譜研究進展[J].情報工程,2017,3(1):4-25.
[4]王昊奮,漆桂林,陳華鈞.知識圖譜:方法、實踐與應用[M].北京:電子工業出版社,2019.
[5]姜淵,黃樺,趙奕.知識圖譜在金融行業的應用展望[J].金融電子化,2016,(9):87.
[6]雷豐羽.知識圖譜在金融信貸領域的應用[J].現代商業,2018,(10):89-90.
[7]王超.面向企業圖譜構建的中文命名實體識別技術研究[D].南京:東南大學,2019.
[8]劉波.面向企業圖譜的實體鏈接技術的研究[D].南京:東南大學,2019.
[9]孫晨,付英男,程文亮,等.面向企業知識圖譜構建的中文實體關系抽取[J].華東師范大學學報:自然科學版,2018,(3):55-66.
[10]吳錦鈺.面向企業圖譜構建的關系抽取技術研究[D].南京:東南大學,2019.
[11]陳曉軍,向陽.企業風險知識圖譜的構建及應用[J/OL].計算機科學:1-11.http://kns.cnki.net/kcms/detail/50.1075.TP.20200721.1547.078.html,2020-07-28.
[12]馬海波.面向風控的企業關聯信息知識圖譜構建與應用研究[D].北京:北京工業大學,2019.
[13]Trivedi?R,Dai?H,Wang?Y,et?al.Know-Evolve:Deep?Temporal?Reasoning?for?Dynamic?Knowledge?Graphs[J].2017.
[14]García-Durán,Alberto,Dumani?S,et?al.Learning?Sequence?Encoders?for?Temporal?Knowledge?Graph?Completion[J].2018.
[15]Leblay?J,Chekol?M?W.Deriving?Validity?Time?in?Knowledge?Graph[C]//Companion?of?the?the?Web?Conference,2018:1771-1776.
[16]Dasgupta?S?S,Ray?S?N,Talukdar?P.HyTE:Hyperplane-based?Temporally?Aware?Knowledge?Graph?Embedding[C]//Proceedings?of?the?2018?Conference?on?Empirical?Methods?in?Natural?Language?Processing,2018.
[17]Liu?J,Zhang?Q,Fu?L,et?al.Evolving?Knowledge?Graphs[C]//IEEE?INFOCOM?2019-IEEE?Conference?on?Computer?Communications.IEEE,2019.
[18]Jin?W,Jiang?H,Qu?M,et?al.Recurrent?Event?Network:Global?Structure?Inference?over?Temporal?Knowledge?Graph[J].2019.
[19]陳浩,李永強,馮遠靜.基于多關系循環事件的動態知識圖譜推理[J].模式識別與人工智能,2020,33(4):337-343.
[20]劉嶠,李楊,段宏,等.知識圖譜構建技術綜述[J].計算機研究與發展,2016,53(3):582-600.
[21]任飛亮,沈繼坤,孫賓賓,等.從文本中構建領域本體技術綜述[J].計算機學報,2019,42(3):654-676.
[22]王向前,張寶隆,李慧宗.本體研究綜述[J].情報雜志,2016,35(6):163-170.
[23]Wang?C,Danilevsky?M,Desai?N,et?al.A?Phrase?Mining?Framework?for?Recursive?Construction?of?a?Topical?Hierarchy[C]//Proc?of?the?19th?ACM?SIGKDD?Int?Conf?on?Knowledge?Discovery?and?Data?Mining.New?York:ACM,2013:437-445.
[24]黃慶康,宋愷濤,陸建峰.應用于不平衡多分類問題的損失平衡函數[J].智能系統學報,2019,14(5):953-958.
[25]Bordes?A,Usunier?N,Garcia-Duran?A,et?al.Translating?Embeddings?for?Modeling?Multi-relational?Data//Burges?C?J?C,Bottou?L,Welling?M,et?al.,eds.Advances?in?Neural?Information?Processing?Systems?26.Cambridge,USA:The?MIT?Press,2013:2787-2795.
[26]陳金菊,王義真,歐石燕.基于道路法規知識圖譜的多輪自動問答研究[J].現代情報,2020,40(8):98-110,120.
[27]劉良.基于領域知識圖譜的智能問答關鍵技術研究[D].成都:電子科技大學,2020.
(責任編輯:孫國雷)