999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

國內外知識圖譜發展趨勢和研究熱點演變分析

2021-07-14 08:28:20張玉柳云南師范大學信息學院
圖書館理論與實踐 2021年4期
關鍵詞:方法研究

張玉柳,趙 波(云南師范大學 信息學院)

2019年,國際人工智能與教育大會指出:“面對人工智能對教育帶來的機遇,我國要深入開展智能教育應用戰略研究,探索智能教育的發展戰略、標準規范以及推進路徑”[1]。祝智庭等認為,智能教育是智慧教育的實踐路徑[2]。特別是在智慧教育的實現過程中,知識的語義搜索、個性化學習推薦系統、學習者畫像構建等都依賴大規模知識圖譜的發展。而知識圖譜作為人工智能領域重要的發展方向,又是未來“人工智能+教育”發展的重要依托。在如今知識大爆炸的時代,知識的重要性日益顯著,人們越來越重視知識之間的關聯,知識圖譜具有非常高效的語義處理功能,能夠直觀、清晰地展示出知識之間的復雜聯系,實現對知識結構關系的清晰圖示[3]。伴隨著人工智能、大數據及深度學習的發展,知識圖譜取得了新的研究進展,從最開始的Google智能搜索引擎,到現在的大數據分析、聊天機器人、個性化教育、推薦系統,都與知識圖譜有著千絲萬縷的關系。

知識圖譜作為人工智能時代國內外快速發展的跨學科研究領域,正確分析與梳理其研究熱點和前沿趨勢對未來推進多領域研究與創新具有重大意義。

1 數據來源和研究方法

(1)數據來源。以“知識圖譜”為主題在CNKI進行檢索,共獲得文獻2,332篇,時間跨度為2005—2019年。剔除與知識圖譜主題無關的文獻后,獲得317篇關于國內知識圖譜研究的文獻。在Web of Science數據庫中,選擇TS=(“Knowledge Graph”or“Knowledge Visualization”),時間跨度為1996—2019年,對文獻進行篩選后,獲得1,210篇關于國外知識圖譜研究的文獻。

(2)研究方法。本研究利用科學引文數據可視化分析軟件CiteSpace和書目共現分析系統BICOMB,通過引文分析與關鍵詞共現可視化分析探究國內外知識圖譜的研究熱點與未來的研究趨勢。

2 知識圖譜的發展脈絡

研究主體的研究規模以及分布狀況常被用來反映一個研究領域是否受學術群體的關注和認同。文獻數量的時序變化是某領域發展趨勢的重要衡量指標,在BICOMB軟件的提取界面以“年代”為關鍵字段分別統計國內外知識圖譜研究文獻的數量(見圖1)。國內外文獻量曲線擬合指數函數分別為y=0.027e0.2481x、y=2.043e0.1321x,且曲線擬合程度都比較高,均超過了0.8,在一定程度上說明未來國內外知識圖譜的相關研究文獻將會與日俱增。

圖1 國內外知識圖譜研究文獻的數量分布

由圖1可知,國內知識圖譜研究晚于國外,但就研究的趨緩階段、高潮階段來說國內外基本一致。筆者通過對已有研究文獻的梳理發現,國內關于利用知識圖譜對多領域進行文獻可視化分析的文獻數量所占比例較大,導致部分研究者在知識圖譜自身發展態勢的研究中的數據源選擇存在些許偏差,分析出的主題熱點大多聚集在科學知識圖譜應用方面。科學知識圖譜是一種展示科學知識發展進程與結構關系的圖形可視化技術,它涵蓋知識可視化和文獻計量分析等方法。如,張妮[4]、夏立新[5]等都是從理論研究、文獻計量方法、文獻可視化工具與應用領域方面揭示知識圖譜研究的發展軌跡與熱點演變,關鍵構建技術領域卻無一涉及。而國外主要側重于知識圖譜構建技術的研究,目前,國外對知識圖譜研究比國內的相關研究更為深入。

2.1 國內知識圖譜研究

(1)萌芽階段(2005—2010年)。2005年,陳悅等發表了國內第一篇與知識圖譜相關的文獻——《悄然興起的科學知識圖譜》。截至2019年10月29日,該文獻被引用量達到696次,是我國知識圖譜領域的開篇之作。據研究可知,此階段側重于知識圖譜的理論研究。

(2)穩定深化階段(2010—2015年)。該階段的論文數量持續增長,知識圖譜開始被多學科領域的專家學者關注。2012年,國內上線了首個關于搜索引擎的中文知識圖譜“知立方”[6]。2013年,第一屆中文知識圖譜研討會在杭州召開,探討了中文知識圖譜的構建技術與策略等核心問題[7]。這一時期,知識圖譜研究偏向于應用層面,呈現出穩定深化態勢。

(3)繁榮發展階段(2015—至今)。該階段知識圖譜的應用領域越發廣泛,發文量大幅激增,將知識圖譜研究推向高潮,同時伴隨著人工智能、大數據的發展,知識圖譜取得了更高層次的研究進展。2019年10月20日,北京理工大學和復旦大學聯合發起2019年“知識圖譜前沿技術論壇”,旨在加強知識圖譜技術在智能領域的普及和應用[8]。目前,我國知識圖譜正處于一個飛躍式發展階段。

2.2 國外知識圖譜研究

(1)萌芽階段(1955-1977年)。1955年,加菲爾德開創了利用引文索引進行檢索文獻的思路[9];1965年,普賴斯創新性地提出了“論文之間錯綜復雜的引證關系會形成各種大大小小的網絡……各種引證關系形成的網絡可以聚類……”,為科學計量學界打開了一扇新的大門[10];1968年,Quillian提出了語義網絡,它能夠將知識通過概念聯系起來進行知識表示[11]。目前,語義網絡在人工智能領域被普遍的應用。

(2)穩定深化階段(1977-2012年)。1977年,費根鮑姆提出了知識工程的概念,認為知識工程是應用人工智能的原理和方法,為那些需要專家知識才能解決的應用難題提供求解的手段[12]。1970-1990年是知識工程的白熱化發展階段,研究者認為專家系統是一種利用知識表示和推理技術去處理那些只有領域專家才能解決問題的計算機程序[13]。同期,本體的概念被引入,成為當時表示客觀世界知識的應用方式。1998年,蒂姆·伯納斯·李建設性地提出Semantic Web的概念,萬維網聯盟(W3C)在此基礎上進一步提出萬維網上的知識描述規范,使得知識從密閉邁向開放[14]。2001年,維基百科正式發起多語言百科全書協作計劃[15],經用戶自由訪問進行編輯,是群體智能知識的典型代表。

(3)繁榮階段(2012年—至今)。2012年,Google提出“知識圖譜”[16],體現了大規模知識圖譜在智能搜索引擎中的強化應用。大規模網絡知識獲取的典型代表DBpedia[17]、Freebase[18]就是在維基百科結構化知識庫的基礎上構建起來的。隨著人工智能的深入發展,人工智能逐漸進入到認知智能的階段,促進了知識圖譜領域相關構建技術的發展。

3 知識圖譜研究主題分布

3.1 關鍵詞分析

研究采用CiteSpace生成國內關鍵詞共現圖譜,選擇Pathfinder網絡算法用于簡化網絡,突出重要的結構特征。網絡的結構主要由參數r決定,三角不等式關系為:

在公式(1)中,i和j節點之間的鏈路權重以wij表示,nk和nk+1節點之間的鏈路權重以wnknk+1表示,r表示閔可夫斯基(Minkowski)距離。除“知識圖譜”外,位于前10的高頻關鍵詞包括:鏈接預測(81)、表示學習(56)、深度學習(40)、本體(39)、人工智能(38)、實體識別(33)、三元組分類(32)、知識圖譜補全(32)、實體分類(31)、transE(30)。

國外研究文獻的關鍵詞共現圖譜除“Knowledge Graph”外,位于前10的高頻關鍵詞包括:Ontology(52)、Knowledge Visualization(52)、Visualization(40)、Semantic Web(33)、Knowledge Graph Embedding(28)、Knowledge Representation(21)、Neural Network(16)、Link Prediction(16)、Dbpedia(15)、Recommender System(14)。

從詞頻波動可以看出,國內外知識圖譜關鍵詞頻次過渡均平緩下滑,說明研究者的關注熱點比較集聚,側重于研究知識抽取、知識表示、知識推理和知識圖譜補全等知識圖譜構建的關鍵技術。

3.2 聚類分析

關鍵詞聚類能清晰揭示出某研究領域的主題熱點,本研究聚類提取采用似然比算法。

圖2 國內研究文獻的關鍵詞聚類圖

國外研究文獻的關鍵詞聚類圖譜如圖3所示,Q值=0.55,S值=0.7309,說明聚類結果合理且令人信服。聚類分別為知識可視化(聚類#0 Knowledge Visualization)、知識表示(聚類#1 Knowledge Representation)、深度學習(聚類#2 Deep Learning)、神經網絡(聚類#3 Neural Networks)。其中知識可視化聚類出現的頻次最高,說明國外知識圖譜的研究重心側重于此。

圖3 國外研究文獻的關鍵詞聚類圖

對國內外研究文獻的高頻關鍵詞進行聚類分析,可將研究熱點子群分布進行歸納,聚類結果見表1、表2。由表1可知,國內主要從知識表示、可視化分析、知識抽取、本體建模、應用、知識推理等方面對知識圖譜進行研究;國外主要從知識可視化、知識表示、深度學習等方面對知識圖譜進行研究。

表1 國內研究文獻的高頻關鍵詞聚類子群(部分)

表2 國外研究文獻的高頻關鍵詞聚類子群(部分)

3.3 研究熱點分析

根據國內外知識圖譜研究文獻的高頻關鍵詞的聚類分析可知,該研究領域熱點主要集中在知識圖譜的關鍵構建與實際應用方面,具體可以歸納為以下幾個方面。

(1)本體建模。本體建模是一種描述特定領域知識圖譜中知識的概念模板與骨架[19]。本體包含實體層和概念層,知識圖譜在此基礎上增加實體的信息,以充盈圖譜。當前主流的本體構建模式大多是在領域現有本體庫的基礎上采用自動化構建方法拓展生成。目前,大量的領域本體為第二代互聯網發展提供了強有力的支持,中國科學院計算所若干實驗室以及美國斯坦福大學知識系統實驗室都在對本體建模等進行相關研究。此外,本體也常被用來為知識圖譜定義“Schema”(一個領域的概念類型以及這些類型的屬性)。

(2)知識表示。知識表示是研究客觀世界各類知識如何表示成計算機或者方便機器識別和理解的形式,大多以RDF三元組來描述實體之間的關系,對知識數據進行設計和定義,并用以支持知識的存儲與更新,確保上層構建的使用和計算。近年來,隨著深度學習的發展,面向知識庫中的實體、概念和關系進行表示的知識表示學習成為了主流。Tang等提出了一種具有實體描述、層次類型和文本關系信息的多源知識表示學習(MKRL)模型,實驗結果表明多源信息對知識補全任務的有效性[20]。此外,融合跨媒體元素的知識表示、融合時空維度的知識表示也是未來研究的方向。

(3)知識抽取。知識抽取是以實體抽取、事件抽取、關系抽取等形成的研究熱點,它是從非結構化、半結構化與結構化的數據中以自動或者半自動的方式抽取實體、關系以及屬性等信息的技術。①實體抽取方法大致分為基于規則與詞典的方法、基于遷移學習的方法以及基于統計機器學習的方法三類。基于規則的方法依賴專家編寫規則,浪費許多人力且規則的擴展性差。彭敏龍等提出僅利用未標記的數據和命名實體字典執行命名實體識別的方法,大大降低了對詞典質量的要求。基于遷移學習的實體抽取主要是面向開放域的抽取,包括跨域、跨應用、跨語言三種模式。基于統計機器學習的方法是采用數據進行訓練、測試后再進行實體識別[21]。②事件抽取是從數據中抽取事件信息,進行事件觸發詞的檢測與分類、事件元素的識別,包含時間、地點、參與對象等元素,并以結構化和語義化的形式展現。常用方法有基于規則的方法、基于知識庫的方法、基于機器學習的方法、基于深度學習的方法以及基于強化學習的方法。基于規則的方法需要資深專家定義好語義框架用來表示事件的抽取方式;基于知識庫的方法如劉樹林等提出利用FrameNet自動檢測事件的方法,提高事件抽取的性能[22];基于機器學習的方法主要利用自然語言處理工具,根據分類任務進行事件抽取;基于深度學習的方法有Joint Model[23]方式等;基于強化學習的方法是將強化學習的思想用于事件抽取,有學者研究了生成對抗式模仿學習的事件提取,提出了一種基于模仿學習框架進行的逆強化學習[24]。③關系抽取是從多領域原始數據中提取實體與實體之間的語義關系,將實體關聯起來,逐步形成知識網狀結構。關系抽取過程中經常會運用大量監督學習方法。鄭孫聰等提出了一種可以將聯合提取任務轉換為標注問題,研究了不同的端到端模型以直接提取實體及其關系,而無需分別識別實體和關系[25]。隨著研究的深入,國內外對于關系抽取還有許多極具建設性的挑戰,如資源缺乏、面向開放域、跨語言等方面的知識抽取等。

(4)知識推理。知識推理是指在現有知識的完善程度上,進一步通過各種方法挖掘隱含的知識,能夠從現有知識庫中發現或新增知識,建立實體之間新的關聯,以此拓展知識圖譜的知識覆蓋面。知識推理可以對實體間的關系、屬性以及本體的概念層次框架等進行更深層次的推理。但是研究者們很難列舉出全部的推理規則,知識的推理規則大致可以分為以下三類。①基于邏輯的推理包括一階謂詞邏輯、描述邏輯以及規則等。Lu等提出了ORBO算法,降低了算法的時間復雜度,提高了推理效率[26]。②基于統計的推理大多集中在機器學習和統計學習方面,如馬爾可夫邏輯網、貝葉斯推斷等。王坤等從理論上推導了隱馬爾科夫異分布模型的貝葉斯估計方法,以實證分析比較了模型的貝葉斯估計值和真實值的差異,驗證了其可靠性[27]。③在基于圖的推理中,路徑排序算法、不完備知識庫的關聯規則挖掘較為典型。隨著圖神經網絡的發展,張仲偉等分析了基于神經網絡的知識推理方法[28],這種方法的推理能力和泛化能力更強,對知識庫中實體關聯和文本信息的利用率更高,推理效果更好。

(5)科學知識圖譜。2005年,陳悅等首次將“科學知識圖譜”概念引入國內[29],隨后便得到了研究者的廣泛關注。我國多個領域均有涉及利用科學知識圖譜對文獻進行分析,以探究領域的發展趨勢,相關文獻也呈激增之勢。科學知識圖譜是在科學計量學的基礎上發展衍生的,它涵蓋了計算機科學、信息計量學和圖形學等多種學科理論。目前,我國對于科學知識圖譜的研究大多在理論、分析方法、分析工具及其應用等方面。

(6)知識圖譜的應用。知識圖譜的應用領域隨著不同時期研究主題的變化而變化,整體趨勢呈現多元化、社會化的特點。如在教育領域,崔京菁等構建了基于知識圖譜的翻轉課堂教學模式,推動了教學研究的發展[30];余勝泉等研發了基于育人知識圖譜的“AI好老師”個性化育人助理系統[31]。目前,知識圖譜在智能問答、可視化決策、推薦系統、語義搜索等應用中發揮著越來越重要的價值。

4 知識圖譜未來研究趨勢探析

4.1 知識圖譜到認知圖譜的進階

近幾年,中國計算機大會舉行了以“認知圖譜與推理”為主題的論壇,深入探討了如何構建高質量的大規模認知圖譜(Cognitive Graph),并列舉智能推理、認知智能等與知識圖譜結合應用的實例。如,阿里為改變電商業務中推薦不精確、重復推薦、缺乏新意等問題,提出構建大規模電商認知圖譜,將用戶需求映射為圖譜中的節點,將這些點和電商領域內外的相關知識關聯起來,使得商品更好地滿足用戶的需求[32]。“認知”技術是整個人工智能研發中繞不開的關鍵技術,認知智能的應用抓手是智能解釋,認知圖譜可以促進這種“解釋”。如,基于用戶認知的智能推薦系統充分抓住用戶心理,能夠為用戶進行最滿意的推薦。把知識圖譜與認知智能相結合,形成認知圖譜,這樣的圖譜先有“認知”,再有“推理”,能夠提升用戶對智能推薦的滿意程度。

在教育領域,建構主義學習理論認為,學習是學習者根據自己的經驗,對外部信息進行主動選擇、加工和處理的過程[33]。自2011年提出學習分析技術之后,研究者開始依托具有強大語義處理能力的知識圖譜開展學習分析的教育研究。目前,素質教育最大的局限性就是學生認知超載,學生常常因教學活動、探究過程的復雜性而感到不堪重負。認知負荷理論認為,只有將認知負荷控制在工作記憶所能承載的范圍之內,有效學習才能得以順利實現[34]。如何降低認知負荷、設置學生學習的復雜梯度和學習路徑是一個關鍵問題。基于知識圖譜的個性化學習推薦能夠準確把握學習者對知識的認知基礎,構建學習者的認知圖譜,自動監測學習遷移,通過序列感知的智能推薦為學生提供最適合自己的學習路徑,形成個性化學習環境,有效降低學習負荷。如,唐燁偉等構建了一種基于學習者畫像的精準個性化學習路徑規劃框架,以滿足學生個性化學習需求[35]。知識圖譜以高效的方式向認知圖譜進階,能夠促進認知智能時代教育領域更進一步的發展。

4.2 知識圖譜構建平臺

知識圖譜當前正在從通用知識圖譜向行業知識圖譜的應用拓展。業界亟需一種能夠支持知識圖譜構建的平臺,以構建領域知識圖譜。實踐發現,構建特定領域知識圖譜時,需要與領域專家磨合定制領域知識圖譜的Schema。Chen等提出了一種自動化構建方法,能夠全面考慮知識復雜梯度以及前驅后繼關系[36]。但不論是人工構建方法還是自動化構建方法,在構建過程中都存在依賴專家經驗、費時費力等問題。此外,在知識圖譜的構建過程中主要針對可編碼、可量化的顯性知識,在很多情況下沒有考慮隱性知識,進而因數據模式的變化帶來較高的維護成本,研究者無法構建出“十全十美”的知識圖譜來滿足變化的需求,這就要求知識圖譜能夠較易更新與擴展。

2019年3月20日,中國電子技術標準化研究院向IEEE標準協會提報的標準提案《知識圖譜架構》正式獲批立項[37]。隨著信息服務向知識服務的轉變,相關機構和專家應根據知識圖譜構建的相關方法學構建一個完善、高效的知識圖譜平臺,提升構建的效率,且能夠以低人工投入構建出高質量的知識圖譜應用。

4.3 知識圖譜的測試評估

現階段,知識圖譜有待向標準化趨勢發展,乃至提升整個行業的知識管理和應用水平,但是知識圖譜的測試認證相關研究還面臨著測試與評估的環節眾多、方法缺失、標準空白等問題。通用知識圖譜和領域知識圖譜的實際應用效果或者構建圖譜的模式是否有效,必須經得起科學的評判標準檢驗。

國內外多數機構均在嘗試研究對知識圖譜的測試評估。如,2019年全國知識圖譜與語義計算大會發布關于知識圖譜的主題測評任務[38],對知識圖譜領域的學術成果與產業需求進行探討,促進其技術發展。美國倫斯勒理工學院Tetherless World Constellation研究所則專注研制知識圖譜測評系統[39],對多源異構知識圖譜中存在的顯性錯誤或者隱性缺陷進行檢測和評估。未來,應建立健全知識圖譜標準符合性測試評估體系和知識質量評估技術指標,以提高知識圖譜的標準化應用,讓知識圖譜成為教育領域提高教學質量的工具,這已經成為認知智能時代教育信息化發展的重要措施。

4.4 知識圖譜關鍵技術的發展突破

知識圖譜是人工智能領域頗受關注的發展方向,但其核心技術方面還存在許多瓶頸。如,如何精確獲取知識之間的關聯進行關系抽取,如何解決多源異構的歧義、噪聲,如何開展面向開放域、跨語言等方向的知識抽取等,這些都是知識圖譜拓展領域應用范圍面臨的難題。此外,基于深度學習的序列標注算法進行高質量的實體識別、基于開放式數據庫的遠程監督學習以及小樣本的抽取和構建問題等,也都尚未與知識圖譜構建及應用領域實現深度融合,技術上都有待突破。

知識圖譜作為一種圖數據結構,亟需通過與自然語言處理、認知科學、超級計算、深度學習、認知計算等技術深度融合,突破知識圖譜領域核心構建的技術瓶頸,健全知識圖譜領域核心技術體系。另外,研究者應重點關注認知科學領域復雜知識類型的探索,以及研究融合跨媒體元素、時空維度的知識表示[39]等都是未來知識圖譜研究需要努力研究的著力點。

猜你喜歡
方法研究
FMS與YBT相關性的實證研究
2020年國內翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
學習方法
EMA伺服控制系統研究
新版C-NCAP側面碰撞假人損傷研究
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 99久久免费精品特色大片| 第一页亚洲| 欧美无遮挡国产欧美另类| YW尤物AV无码国产在线观看| 最新日本中文字幕| 九色视频在线免费观看| 天天视频在线91频| 国产在线拍偷自揄观看视频网站| 亚洲一区第一页| 国产精品刺激对白在线| 1024国产在线| 成人无码一区二区三区视频在线观看 | 91青草视频| 国产永久在线观看| 婷婷中文在线| 人妻无码中文字幕第一区| 亚洲天堂网站在线| www.亚洲国产| 日韩成人午夜| 99热在线只有精品| 91久久精品日日躁夜夜躁欧美| 国产永久在线视频| 欧美精品亚洲二区| A级毛片无码久久精品免费| 国产精品手机视频| 71pao成人国产永久免费视频| 伊人成人在线| 不卡无码网| 中国国产A一级毛片| 国产新AV天堂| 亚洲成A人V欧美综合| 欧美黄网站免费观看| 色婷婷色丁香| 日韩一级二级三级| 国产香蕉97碰碰视频VA碰碰看| 国产精品va| 日韩免费视频播播| 91青青在线视频| 人妻精品久久无码区| 亚洲最大看欧美片网站地址| 一级毛片无毒不卡直接观看| 亚洲性一区| 国产网友愉拍精品视频| 国产午夜精品一区二区三| 五月天综合婷婷| 国产丝袜丝视频在线观看| 国产精品乱偷免费视频| 91亚瑟视频| 国产欧美日韩免费| 在线视频一区二区三区不卡| 亚洲啪啪网| 亚洲视频a| 亚卅精品无码久久毛片乌克兰 | 色成人亚洲| 久久久久久久97| 呦女精品网站| julia中文字幕久久亚洲| 欧美激情综合| 国产网站黄| 人妻中文字幕无码久久一区| 欧美伊人色综合久久天天| 91小视频在线播放| 99热这里只有精品免费国产| 国产欧美视频在线| 无码电影在线观看| 91精品国产91久无码网站| 国产美女精品一区二区| 亚洲高清中文字幕| 久久黄色视频影| 2021国产乱人伦在线播放 | 88av在线| 素人激情视频福利| 欧美性精品不卡在线观看| 青青草国产一区二区三区| 亚洲动漫h| 女人18毛片一级毛片在线 | 99视频精品在线观看| 国产人成在线观看| 天天婬欲婬香婬色婬视频播放| 天天色天天综合| 国产不卡网| 欧美专区在线观看|