中圖分類號:TP18 文獻標識碼:A 文章編號:2096-4706(2025)16-0120-06
Research on Evolution and Integration Trends of Knowledge Graphs with Emerging Technologies
AO Ruoyao
(School of Cultural Heritage and Information Management, Shanghai University, Shanghai 2oo444, China)
Abstract: This paper systematically combs through the progressof theevolution ofknowledge graph and its integration with theemerging technologiesofLargeLanguage Models,vectordatabases,andagents,imingtoprovideatheoreticalfameworkand practical directionforthefuturedevelopmentofknowledgegraphFrstlytheevolutionofkowledgegraphisdiscussedbytaking multidimensioalpsptive,cdingtelicatiooeodgengeactestdataeprsetatobtly the progressof itscutting-edge interactions withLLMs,vectordatabasesand intelligencesareexplored.Thedevelopmentof knowledgegraphsshowsashiftfomgeneraltovertical,fromstatic todynamic,andfromsingletomultiple.Future knowledge graphresearchshould paymoreatentiontotheconstructionofdynamic knowledge graphs,thefusionofmultimodalLLMs,andthe realizationofinteractions wihemergngtechologies,soatoadapttotenedsoftheAificialIntellgenceandBigDataera.
Keywords: Knowledge Graph; Artificial Intelligence; Large Language Model; vector database
0 引言
自2012年谷歌公司正式提出知識圖譜(KnowledgeGraph,KG)這一搜索技術以來,該技術便在信息技術領域逐漸占據核心地位。知識圖譜推動了語義搜索、智能問答和個性化推薦等應用的發展,受到國家層面的高度重視,在國務院2017年發布的《新一代人工智能發展規劃》明確提出要建設知識圖譜,2021年發布的《“十四五”文物保護和科技創新規劃》再次強調其重要性。同時隨著人工智能和大數據技術的迅猛發展,知識圖譜實現了從單一到多元、從人工構建到自動化構建、從手動更新到實時更新和從簡單知識推理到復雜知識推理的技術演進。
鑒于此,本文嘗試撰寫此方面的研究述評,從多維視角梳理知識圖譜的演變歷程,包括圖譜應用范圍、知識變化特性和數據表現形式視角下的演變探討其與大數據、大模型、向量數據庫和智能體的前沿交互。最后對知識圖譜目前的進展進行總結,并對其未來發展方向提供可參考的建議。
1知識圖譜的演變進展
為深入探討知識圖譜的演變歷程與發展趨勢,需從多維視角全面理解其復雜性與適應性。本章節從應用范圍、知識演化特性與數據呈現形式三個維度闡述知識圖譜的演變。
1.1 應用放范圍由一般到垂直
在圖譜應用范圍視角下,知識圖譜實現了從一般到垂直、從通用到領域、從寬泛覆蓋到深度專業化的演變。自知識圖譜被提出后,通用知識圖譜應運而生,其相較于領域知識圖譜,其知識面與覆蓋面較廣、體量更大。此外,Aminer、MAG、OAG、上交大AceKG、TechKG、S2ORC、SWRC、SPAR、Scopus等眾多通用學術知識圖譜也充分展現了其在知識服務領域的廣泛應用和深遠影響。
而構建不同行業、企業的領域知識圖譜,可以對各領域內部提供知識化服務。本文列舉了金融、醫學、電商、搜索、安全等幾個熱門領域中規模較大的知識圖譜項目,如表1所示。
表1熱門領域知識圖譜項目

1.2知識變化特由靜態到動態
在知識變化特性視角下,知識圖譜實現了從靜態到動態、從單一狀態到時序演進、從事件孤立到事理關聯的演變。
知識圖譜三元組有利于靜態知識的表示,但現實世界中的知識持續變化,衍生出靜態圖譜和動態圖譜,其中靜態圖譜因知識時效性而受限制,而動態圖譜仍不斷收集和更新知識以保證時效性[1]。隨著對知識時效性和歷史脈絡的需求增加,時序圖譜應運而生,通過為三元組添加時間戳記錄知識演變,記錄知識隨時間的演變過程,使圖譜能夠捕捉和表達隨時間變化的數據和事件。同時,為更好地理解和分析事件之間的復雜關系,事理圖譜被引入,它專注于事件之間的邏輯和因果關系,為復雜事件的分析和理解提供新視角。
為幫助研究者更好地選擇合適的知識圖譜類型,故對靜態圖譜、動態圖譜、時序圖譜和事理圖譜這四種圖譜的獨特優勢和適用領域進行簡要對比,如表2所示。
表2知識變化特性視角下的四種知識圖譜比較

(續表)

1.3數據表現形式由單一到多元
在數據表現形式視角下,知識圖譜實現了從單一模態到多模態融合、從文本中心到多媒體集成和從單一視角到多維度展現的演變。大量知識以非結構化和半結構化的形式不斷涌現,圖像、視瀕、音頻等多模態數據開始受研究人員廣泛關注,推動知識圖譜向多模態化發展[2],本文對單模態知識圖譜和多模態知識圖譜的不同特點和優勢進行對比,如表3所示。
表3模態知識圖譜特點比較

2知識圖譜與大模型的互促發展
隨著DeepSeek熱度飆升,文心一言、Kimi、豆包等通用大模型更加頻繁地出現在大眾面前。目前,除了微軟設計的GraphRAG算法,大模型與知識圖譜之間的交互主要依賴API接入實現知識橋梁的搭建,知識圖譜通過參與大模型的訓練環節與推理階段,互相增強性能。
2.1知識圖譜對大模型的增強作用
知識圖譜對知識表達的一致性、數據的結構化特性和知識更新的動態性等特征,可用于增強大模型預
訓練、微調和知識推理環節,同時提升大模型的可解釋性,本文對這四個方面涉及的技術進行簡單梳理,如表4所示。
表4知識圖譜增強大模型各環節

2.2大模型對知識圖譜的反哺作用
利用大模型預訓練能力,將先驗知識引入到知識圖譜的表示學習中,提高知識圖譜的表達能力和泛化能力。
2.2.1用大模型增強知識圖譜構建
大模型提升知識圖譜構建過程中各個環節的完成效率,比如本體構建、信息抽取、知識圖譜補全等。如LRN[3考慮了標簽之間的內在和外在的依賴關系,通過使用BERT模型對上下文和實體進行編碼、進行演繹和歸納推理。何喜軍等[為提高專利知識圖譜構建的自動化水平,建立專利領域詞典以實現語料自動化標注,提出基于BERT-BiLSTM-CRF模型的語義實體識別方法。
同時,AIGC技術可以幫助實現自動化圖譜構建,比如知識摘要和關鍵詞的提取、拓展知識圖譜節點等。
早期基于ChatGPT對BEAR知識圖譜進行開發,主要通過提示ChatGPT來對非結構化數據進行自動化地知識抽取。之后Kommineni等[5]使用ChatGPT-3.5來進行信息提取,通過訓練生成能力問題來完成知識抽取、本體構建。
2.2.2用大模型增強知識圖譜問答
利用大模型的語言理解和推理能力,對知識圖譜中的實體和關系進行復雜的推理和推斷。Kim等提出了一個名為KG-GPT的通用框架,利用大模型進行知識圖譜的推理任務,通過在知識圖譜的事實驗證和知識圖譜問答的基準上進行評估。而LangChain可以為大模型的開發利用提供有力地支持,實現知識圖譜與大模型之間的鏈接。張鶴譯等[添加了基于BERT的文本過濾器對問題進行過濾,可以對大模型回答問題的范圍進行微調,并且使用LangChain+LLM的方法,生成更具備專業知識的回答。
2.3知識圖譜與大模型的協同增強
從本質上來講,知識圖譜和大模型都可以視為對知識的一種表達方式:大模型以參數形式表達知識,是對知識的一種隱式、非確定性的表達;而知識圖譜是以文字形式表達知識,是對知識一種顯式、確定性的表達。它們共同推動了人工智能系統在理解、推理和生成方面的性能提升,例如KnowledGPT將大模型與各種知識庫連接起來,支持知識的檢索和存儲,解決復雜問題解答、實體鏈接歧義以及有限的知識表示形式等問題。因此,知識圖譜和大模型在知識表達方面具有天然的互補性。中醫藥方領域圖譜[實現了與大模型雙向鏈接,展示系統問答、圖譜數據易讀化、自然語言回答結構化的效果。Kalo等[提出了基于大模型和知識圖譜的KnowlyBERT混合查詢問答系統,只需要少量的訓練數據,可以將查詢精度提高 30% 。
3向量數據庫與知識圖譜集成
向量數據庫是一種基于數學向量空間的數據存儲和查詢系統,可以通過這項技術來解決多模態知識圖譜在知識融合中的難點,也可以通過這項技術實現對大模型進行提示優化或微調訓練,主要體現在以下三個部分中。
3.1 嵌入模型優化知識融合
向量數據庫利用嵌入技術,將非結構化數據轉化為結構化的向量表示,并在低維矢量空間中存儲,同時在嵌入過程中會引入領域中的大模型。目前已有研究者基于嵌入方式對知識圖譜嵌入模型進行系統的分類,如表5所示。
表5知識圖譜嵌入模型匯總

3.2模態數據相似度探索
向量數據庫的優勢在于對多模態數據相似度的高效處理,無論是文本、圖像還是音頻,向量圖數據庫都能夠通過向量化手段,實現跨模態數據的相似度查詢和分析,本文對其進行了優勢與應用范圍上的簡單對比(如表6所示)。
表6常見相似度度量方法對比

3.3構建高效檢索增強
結合向量數據庫與知識圖譜技術,可以構建出高效的檢索增強框架(RAG)。首先使用向量索引技術,如局部敏感哈希(LSH)或乘積量化(PQ),對各節點與其相似的若干向量所對應的節點建立邊[0];再通過高效的相似性搜索算法,如基于圖的鄰近搜索或向量數據庫最近鄰搜索,檢索查詢相關信息。
在此基礎上,利用知識圖譜的語義豐富性提取實體和關系、查詢上下文。通過圖神經網絡來增強實體表示,使其能夠捕捉復雜的實體關系。最后,生成式大模型能夠根據檢索結果和知識圖譜中的背景知識,生成精準且富有洞察力的響應。比如李巍等[1實現了基于大模型和知識召回的知識檢索增強生成模式,通過結合知識圖譜的豐富語義和大模型的強大生成能力,提高準確性。又如GraphRAG利用知識圖譜的結構化特性,提供更全面的上下文信息,同時結合大模型進行檢索增強,幫助用戶獲得更智能、更精準的搜索結果。
4智能體與知識圖譜的創新融合
在人工智能的演進歷程中,智能體作為一種以大模型為驅動的、能夠自主規劃并在多次迭代中采取行動以達成目標的人工智能實體,正逐漸引起各界學者的關注。目前,諸如ChatGPT的GPTStore、字節跳動的Coze、月之暗面的 Kimi+ 以及百度的文心智能體平臺等,均以其先進的工作機制,特別是記憶機制的引入,減少了人工干預,提升了智能體的自主性和效率。
4.1智能體與知識圖譜的深度融合
智能體與知識圖譜的交互融合,主要體現在知識圖譜輔助智能體推理和智能體輔助知識圖譜挖掘兩個相輔相成的方面:
一是智能體利用知識圖譜中豐富的結構化知識,為自身提供決策支持,并顯著增強理解和推理能力。智能體在進行知識計算時,需要融合AI模型與機理模型,可以通過知識圖譜進行表征,將知識與觀測數據聯合建模,實現更精準的識別與推理。如Lee等[12]提出了一種基于知識圖譜的遺傳模糊智能體的人機智能協同學習方法,該智能體利用知識圖譜結構來表示與人類學習相關的特定知識領域,并采用遺傳模糊學習機制來構建個性化學習模型。
二是智能體輔助知識圖譜進行更智能化的知識挖掘與探索。通過記憶、自我進化和動態生成三個核心步驟不斷對復雜問題進行迭代反饋與改進,提升自身推理能力,輔助知識圖譜不斷完善其知識架構、實現知識有效重組。如Li等[13提出一個多智能體協助學習系統Mcore,通過挖掘用戶的高層次興趣來提高模型性能,適用于大型知識圖譜。
4.2智能體框架與知識圖譜的交互應用
智能體的運行框架可以從感知、規劃、行動和記憶四個方面展開,在多樣化環境中,智能體通過感知并處理多模態信息,確定合理的規劃器后,其行動組件將負責執行由規劃器制定的決策,同時將其轉化為行動,最后對以上行動反復實施并將這些行動及其結果長期記憶。
如今智能體框架能夠在大模型的基礎上實現對知識圖譜推理能力更進一步智能性質的強化,例如Jiang等[14]提出的KG-Agent自主智能框架,集成了大模型、多功能工具箱、基于知識圖譜的執行器和知識存儲器,并通過迭代機制自主選擇工具并更新內存,以實現對知識圖譜的高效推理。
然而,現有的集成大模型和知識圖譜的方法在解決大模型相關問題的過程中,往往忽略了知識圖譜豐富的認知潛力。為解決這個問題,Sun等[15]引入了觀察驅動的智能體(ODA),通過全局觀察整合了知識圖譜推理能力,并通過觀察、行動和反思的循環范式增強了推理能力,同時針對觀測過程中知識的指數級爆炸,創新性地設計了一種遞歸觀測機制。
5結論
隨著DeepSeek的熱度爆發,大模型已深度融入大眾生活。而目前知識圖譜的研究已經較為深入,同時隨著大模型的不斷優化,學界已經出現爭論:知識圖譜是否會“趕不上潮流”。而從本文來看,知識圖譜與新生代技術是相互促進、融合的發展趨勢,知識圖譜作為一種關鍵的信息技術,其研究與應用正不斷拓展與深化。隨著技術的不斷進步和應用場景的日益豐富,知識圖譜無疑將在推動社會信息化、智能化發展中發揮更加重要的作用。
對于未來的發展,可以從多模態大模型與新型技術的融合著手更加深入的研究,如多模態指令微調(M-IT)、多模態上下文學習(M-ICL)、多模態思維鏈(M-CoT)以及LLM輔助的視覺推理(LAVR)等關鍵技術,研究難點多存在于多模態間的映射關系更為復雜,該方向研究前景廣闊。
奓兮乂默:[1] JIANG X,XU C,SHEN Y,et al. On the Evolution
of Knowledge Graphs: A Survey and Perspective [J/OL].
arXiv:2310.04835v3 [cs.A1].[2025-01-21].https://arxiv.org/
abs/2310.04835v3.[2]陳佳云,徐向英,章永龍,等.多模態知識圖譜在農
業中的研究進展[J].農業大數據學報,2022,4(3):126-
134.[3] LIU Q,LINH,XIAO X,et al. Fine-Grained Entity
Typing via Label Reasoning[C]//Proceedings of the 2021
Conference on Empirical Methods in Natural Language Processing.
Punta Cana:2021:4611-4622.[4] 何喜軍,張佑,孟雪,等.專利供需知識圖譜半自動
化構建及應用[J].情報雜志,2023,42(3):139-150.[5]KOMMINENIVK,KONIG-RIESB,SAMUEL
S.From Human Experts to Machines:An LLM Supported
Approach to Ontology and Knowledge Graph Construction [J/
OL].arXiv:2403.08345 [cs.CL]. (2024-05-13).htps://rxiv.org/
abs/2403.08345.[6] KIM J,KWON Y,JO Y,et al. KG-GPT:A General
Framework for Reasoning on Knowledge Graphs Using Large
Language Models [J/OL].arXiv:2310.11220 [cs.CL].(2023-10-17).
https://arxiv.org/abs/2310.11220.[7]張鶴譯,王鑫,韓立帆,等.大語言模型融合知識圖
譜的問答系統研究[J].計算機科學與探索,2023,17(10):
2377-2388.[8]KALOJC,FICHTELL,EHLERP,etal.
KnowlyBERT: Hybrid Query Answering over Language
Models and Knowledge Graphs [C]//Proceedings of the 19th
International Semantic Web Conference (ISWC).Athens :
Springer,2020:1-16.[9]馬恒志,錢育蓉,冷洪勇,等.知識圖譜嵌入研究進
展綜述[J].計算機工程,2025,51(2):18-34.[10] JEGOU H,DOUZE M,SCHMID C.Product
Quantization for Nearest Neighbor Search [J].IEEE Transactions
onPattern Analysis and Machine Intelligence,2011,33(1):
117-128.[11]李巍,李樹元.基于大語言模型和知識圖譜的數字孿
生流域知識平臺設計[J].海河水利,2023(12):75-78.[12] LEE C S,WANG MH,CHEN CY,et al. Knowledge
Graph-Based Genetic Fuzzy Agent for Human Intelligence and Machine
Co-Learming [C]/2023 IEEE Intemational Conference on Fuzzy Systems
(FUZZ).Wellington:IEEE,2023:793-799.
[13]LIX,SHENY,CHENL.MCore:Multi-Agent
Collaborative Learning for Knowledge-Graph-Enhanced
Recommendation [C]//2o21 IEEE International Conferenceon
DataMining(ICDM).Auckland:IEEE,2021:330-339.
[14]JIANGJ,ZHOUK,ZHAOWX,etal.KG
Agent: An Efficient Autonomous Agent Framework for Complex
ReasoningoverKnowledgeGraph[C]//WWW'25:Proceedings
oftheACMonWebConference2025.NewYork:AssociationforComputingMachinery,2025:98-108.
[15]SUNL,TAOZ,LIY,etal.ODA:ObservationDrivenAgentfor IntegratingLLMsand KnowledgeGraphs[J/ OL].arXiv:2404.07677 [cs.CL]. (2024-06-04) .https://arxiv.org/ abs/2404.07677.
作者簡介:敖若瑤(2001—),女,漢族,江西新余人,碩士研究生在讀,研究方向:知識組織、數字人文。