999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜對三國歷史戰役的可視化研究

2024-02-19 15:16:36孫宗偉趙莉
南北橋 2024年1期

孫宗偉 趙莉

[摘 要]本文采用知識圖譜構建思想,深入研究三國歷史戰役。知識圖譜利用圖形結構表示和存儲知識,能夠建立大規模的語義網絡,組織實體、關系和屬性。通過構建三國歷史戰役知識圖譜,可以更好地理解和挖掘歷史戰役的關聯性、演變過程和影響因素。本文首先收集大量關于三國歷史戰役的文本數據,包括歷史記錄、史書、百科全書等;其次,運用自然語言處理和信息提取技術對這些數據進行預處理和標注,提取戰役名稱、時間、地點、參與方等關鍵信息;第三,使用基于字向量的Bi-LSTM-CRF模型進行實體識別,能夠準確提取出文本中的戰役實體;最后,構建完成知識圖譜后,設計一個基于知識圖譜的問答系統,用于用戶查詢和獲取三國歷史戰役的相關知識和信息。該系統運用自然語言處理和語義推理技術,能夠準確回答用戶的問題,提供詳細的歷史戰役描述和相關事件的解釋。

[關鍵詞]知識圖譜;三國歷史戰役;問答系統;實體關系抽取;文本數據處理

[中圖分類號]G20 文獻標志碼:A

[項目名稱]國家自然科學基金資助項目“小體積低功耗片上雙向無阻塞貝納斯網絡拓撲架構設計及算法研究”(項目編號:62201338)。

三國時期是中國歷史上一個重要的時期。這段歷史的人物眾多、事件煩雜,在社會、政治、經濟、文化等多個領域產生了廣泛的影響,因此備受歷史愛好者和學者的關注。隨著大數據、人工智能等技術的發展,知識圖譜和可視化技術的應用也為三國歷史的研究提供了新的機會和挑戰[1]。

知識圖譜是將實體、屬性和關系表示為關系網絡的一種方法,呈現實體之間的相互關聯,以直觀的方式呈現。知識圖譜可以用于管理廣播電視行業的媒體內容。通過構建知識圖譜,可以將媒體內容的元數據、關聯信息和語義標簽組織起來,以便更好地管理和索引廣播電視節目、電影、音樂等資源。同時,知識圖譜也可以為后續的數據挖掘和分析提供基礎。可視化技術可以將復雜的數據和知識以圖形化的形式呈現出來,便于人們理解和解釋。

本文旨在基于知識圖譜技術,對三國歷史戰役進行研究,以構建一個包含豐富戰役知識的三國歷史戰役知識圖譜。在本文中,需要首先使用Bi-LSTM-CRF實體識別模型對三國歷史戰役文本數據進行知識提取,以獲得高質量的實體識別結果[2],其次,將實體信息和相關屬性信息加入知識圖譜,以構建一個包含豐富戰役知識的三國歷史戰役知識圖譜;最后,通過使用可視化技術對知識圖譜進行展示和探索。

本文的主要貢獻包括以下三點。第一,構建了一個包含豐富戰役知識的三國歷史戰役知識圖譜;第二,使用Bi-LSTM-CRF實體識別模型對三國歷史戰役文本數據進行預處理和標注,獲得了高質量的實體識別結果;第三,使用可視化技術對知識圖譜進行展示和探索,為深入研究三國歷史及其相關領域內容提供了有力的工具支持。

1 三國歷史戰役命名的實體識別

三國歷史戰役命名實體識別是指在三國歷史戰役文本中,識別出與戰役相關的實體,如人物、地點、時間等。對于構建三國歷史戰役知識圖譜來說,識別出這些實體是基礎和前提,因為只有識別出實體,才能夠進一步識別實體之間的關系,從而建立知識圖譜。

本文采用基于Bi-LSTM-CRF的方式進行命名實體識別。該模型具備自主學習、人工干預低、通用性高等特點,可以在一定程度上提高命名實體識別的準確性和效率。同時,還通過構建領域特定的詞典和規則來進一步提高命名實體識別的準確性和覆蓋范圍。

1.1 文本數據集的獲取

需要收集盡可能多的三國歷史戰役文本,以便訓練機器學習模型并構建知識圖譜。這些文本來源于書籍、文章、論文、中國知網、百度百科、谷歌瀏覽器等。

1.2 基于LTP的文本數據處理

在三國歷史戰役文本數據的處理中,LTP可以作為一個重要的工具,為文本數據的處理提供支持。具體而言,對于三國歷史戰役文本數據中的分詞、詞性標注、命名實體識別、依存句法分析等任務,可以使用LTP提供的相應模塊進行處理。例如,可以使用LTP中的分詞模塊對文本數據進行分詞處理,將文本劃分為一個個詞語,方便后續處理。

命名實體識別模塊可以幫助識別文本中的人名、地名、組織名等實體,并進行標注。依存句法分析模塊可以幫助分析句子中各個詞語之間的依存關系,了解它們在句子中的作用,這對實體關系抽取等任務有很大幫助。

1.3 基于Bi-LSTM-CRF實體識別模型

在自然語言處理中,實體識別是一項至關重要的任務,其主要目的在于從文本中提取出具有特定命名特征的實體,如人名、地名、組織機構名稱等。本文選擇了Bi-LSTM-CRF模型進行實體識別任務。這是因為,本文需要從三國歷史戰役文本中抽取出命名實體,如人名、地名、時間等,這些實體往往存在復雜的上下文關系和依賴關系,因此需要一個能夠較好地捕捉這些關系的模型。另外,三國歷史戰役文本中存在一些不規則的實體,如將領名字中的“張飛”“張翼德”等,因此需要一個能夠處理不規則實體的模型。

1.3.1 字向量表示層

在三國歷史戰役實體識別任務中,字向量表示層需要對三國歷史戰役文本中的每個字進行向量化表示。可以使用預訓練的中文詞向量作為初始參數,然后通過神經網絡在大量的三國歷史戰役文本上進行微調,從而得到適合于三國歷史戰役命名實體識別任務的字向量表示層。通過這種方式,可以有效地提高實體識別模型的準確性和泛化能力。

當使用Bi-LSTM-CRF模型進行實體識別時,通常需要將原始的文本轉換為數字表示,這個數字表示就是由向量組成的矩陣。在字向量表示層中,本實驗使用了詞嵌入技術將每個字轉換為一個高維向量表示。

1.3.2 Bi-LSTM層

在基于知識圖譜對三國歷史戰役的可視化研究論文中,使用了Bi-LSTM-CRF模型來進行命名實體識別。Bi-LSTM層是該模型的核心組成部分,用于對輸入文本進行特征提取。

Bi-LSTM全稱為雙向長短時記憶網絡,是一種能夠捕捉上下文信息的深度神經網絡。Bi-LSTM由兩個LSTM層組成,分別從正序和逆序方向讀取輸入序列。Bi-LSTM可以有效地避免信息流失和梯度消失的問題,提高模型的性能和準確性。

1.3.3 CRF層

CRF層是Bi-LSTM-CRF模型的核心組成部分之一,它用于解決命名實體識別中的標簽序列預測問題。CRF層通過全局歸一化的方式,將標簽序列預測問題轉化為一個最大化條件概率的問題,從而能夠更好地考慮上下文信息。

1.4 實驗結果與分析

1.4.1 實驗數據來源

為了構建三國歷史知識圖譜,需要獲取相關的歷史戰役文本數據。由于目前缺乏該領域研究的數據集,因此本實驗使用了百度百科中的中國歷史事件文本作為實驗數據來源。本實驗首先構建一個三國歷史戰役名集合,該集合包含廣義三國歷史時期的所有戰役,然后再將集合中的每個元素作為搜索詞,在百度搜索引擎中進行文本獲取,所獲得的歷史戰役文本數據包含表格數據和文本數據兩種類型。

1.4.2 實驗數據預處理與標注

當獲得了三國歷史戰役的文本數據之后,需要對其進行預處理和標注,以便后續的模型訓練。以下是處理的步驟。

第一,文本清洗。首先需要對文本進行清洗,去掉一些無用信息,如HTML標簽、圖片等。可以使用Python中的BeautifulSoup庫進行清洗。

第二,分詞。將文本進行分詞,將一段文本劃分成一個個詞語。可以使用中文分詞工具如jieba、LTP,本文采用LTP進行分詞工作。

第三,實體標注。對分詞后的詞語進行實體標注,即標注每個詞語的實體類型,如人名、地名、組織機構名、時間等。可以使用人工標注或者自動標注的方式。常用的自動標注方法包括基于規則、基于統計的方法和深度學習方法。

1.4.3 實驗結果分析

本文的實驗文本數據是根據7∶2∶1進行分割的,其中70 %的數據集用來進行語言模型訓練,20 %的測試集則用于測試模式。采用Bi-LSTM-CRF語言訓練模型進行訓練。

通過實驗結果可得,Bi-LSTM-CRF模型對于全部實體的識別能達到89 %的準確率、召回率和F1值,其中,時間(Time)和人物名稱(Name)的識別效果是最好的。

2 三國歷史戰役實體關系提取

2.1 基于依存句法與語義角色標注的實體關系提取算法

基于依存語句法與語義角色標注的實體關系提取算法是一種常用于自然語言處理領域的算法,它主要基于句子的語義角色和依存句法分析來提取實體之間的關系。在自然語言處理領域,實體關系提取是一個非常重要的任務,因為它可以幫助人們理解文本中實體之間的關系,從而提高文本的理解和利用效率。

該算法是將句子中的每個單詞都與其在句子中的語義角色和依存關系相關聯,然后根據這些信息來推斷實體之間的關系。具體來說,首先,該算法對句子進行依存句法分析,將每個單詞與其在句子中的依存關系相關聯;其次,算法利用語義角色標注的信息,確定每個單詞在句子中的語義角色;最后,算法將所有與實體有關的單詞和它們之間的語義角色和依存關系組合起來,從而確定實體之間的關系。

該算法的優點在于,它利用了句子的語義角色和依存句法信息,能夠準確地確定實體之間的關系。同時,該算法還可以避免一些傳統的實體關系提取算法中的一些缺陷,如歧義性和不確定性等。因此,該算法在自然語言處理領域中得到了廣泛的應用,如信息提取、知識圖譜構建和智能問答系統等方面。

2.2 實體關系抽取算法思路

首先,在本文中,利用依存句法分析的結果來抽取實體之間的關系。對于句子“曹操攻打了劉備的荊州”,就利用依存句法分析器識別出“攻打”為謂詞,“曹操”為主語,“荊州”為賓語,并建立起它們之間的依存關系。然后利用這些信息來抽取實體之間的關系,如將“曹操”和“荊州”之間的關系歸為“攻打”類型。

其次,對語義角色進行標注,在本文中,利用語義角色標注來更準確地識別出實體之間的關系。先將每個實體標注為句子中的一個語義角色,如主語、賓語、施事等。對于句子“劉備在赤壁戰役中戰勝了曹操”,可以標注出“劉備”為主語、“曹操”為賓語、“赤壁戰役”為位置等語義角色。然后利用這些信息來抽取實體之間的關系,如將“劉備”和“曹操”之間的關系歸為“戰勝”類型。

最后,進行實體關系抽取,利用依存關系、語義角色和實體類型等信息,識別出實體之間的關系,并將它們歸類為不同的關系類型。對于句子“關羽在長坂坡單槍匹馬斬殺了華雄”,可以利用依存句法分析和語義角色標注的結果,識別出“關羽”為主語、“長坂坡”為位置、“華雄”為賓語,以及“斬殺”為謂詞和動作角色,然后可以將它們歸類為“斬殺”類型的實體關系。

2.3 算法測試結果分析

在本文中,通過使用哈爾濱工業大學的LTP語言技術平臺對所收集到的三國歷史戰役文本數據集的2734條語句,采用了包括單一語義角色的標注方法和本論文所使用的實體關系抽取對比實驗。

實驗結果顯示,該算法在三國歷史戰役數據集中表現出了很好的抽取效果。其中,在100篇選取的章節中,共抽取出了1648個實體關系,涉及109個不同的實體類型和30種不同的關系類型。具體來說,算法在實體關系抽取的準確率達到了89.59 %,召回率為89.23 %,F1值上達到了89.72 %。

3 基于Neo4j構建知識圖譜

3.1 知識圖譜構建思路及原理

本文采用“自頂向下”模式構建三國歷史戰役知識圖譜模型,依據三國歷史戰役的基本組成要素,確立戰役、陣營、人物三類基本實體,為保證戰役描述的連貫性與完整性,增加時間實體、地點實體與元事件實體,同時定義實體間的相互關系作為實體節點的邊,保存實體間的聯系。

對三國歷史戰役知識圖譜模型進行形式化定義,將三國歷史戰役劃分為“戰役名稱”“主要事件”“戰勝方”“戰敗方”“時間”“戰役地點” 等實體節點,各實體間的相互關系作為實體關系邊,根據關系的類型,分別進行標記,為三國歷史戰役知識圖譜的構建與可視化提供理論模型基礎。

三國歷史戰役知識圖譜,縮寫為ERS。其中,E為三國歷史戰役的實體合集,包括戰役名稱、戰役地點、戰役時間、勝敗方、主要事件;R為三國歷史戰役實體部分的關系合集,代表三國歷史戰役知識圖譜邊的合集;S代表實體、關系、實體的聯系集。

從全面的角度全方位地顯示三國歷史戰役知識,將戰役實體部分劃為六類,分別是三國歷史戰役知識圖譜里的戰役名稱節點,戰勝方節點、戰敗方節點、主要事件節點,時間節點,地點節點。

3.2 問答系統的構建

系統是基于Python實現的,需要配置依賴庫。首先系統會從接口接收問句,問題解析對應問題模板,抽象問題出現的實體,最后轉化為對知識圖譜的查詢,根據查詢結果構造答句返回,然后使用樸素貝葉斯方法進行問句分類,即將前端接收到的問句分類對應到某一類問題,最后根據分析的問句類別,對應使用相應的知識圖譜查詢語句,對知識圖譜進行查詢,返回查詢結果,并根據模板構造成答句。

4 結語

本文成功構建了一個三國歷史戰役知識圖譜,并在問答系統中起到了很大的作用。知識圖譜為問答系統提供了豐富的背景知識和關聯信息,能夠更準確地回答用戶的問題。另外,提出的問答系統構建思路有效地解決了用戶問題的預處理、分類和答案獲取等關鍵問題,為系統的功能實現提供了清晰的指導。通過實驗驗證了問答系統的性能和效果,結果表明該系統能夠高效地回答用戶的問題,并提供準確的相關戰役信息。

參考文獻

[1]索朗次仁. 基于Neo4j的格薩爾王傳人物關系圖數據庫的設計與實現[J]. 信息與電腦(理論版),2021,33(17):146-149.

[2]余宏輝. 三國歷史戰役知識圖譜構建研究[D]. 南昌:江西財經大學,2021.

[3]高瑞卿. 基于知識圖譜的三國問答系統研究與應用[D]. 上海:華東師范大學,2022.

[4]馮俐. 基于Neo4j圖數據庫構建中學語文詩詞知識圖譜[D]. 西安:陜西師范大學,2019.

[5]張宇飛. 河北省旅游景點知識圖譜的構建與應用[D]. 邯鄲:河北工程大學,2020.

[6]張政平. 面向孔子世家譜的知識問答模型研究與應用[D]. 曲阜:曲阜師范大學,2021.

[7]張吉祥,張祥森,武長旭,等. 知識圖譜構建技術綜述[J]. 計算機工程,2022,48(3):23-27.

[作者簡介]孫宗偉,男,江蘇淮安人,上海工程技術大學電子電氣工程學院,碩士,研究方向:人工智能。

趙莉,女,上海人,上海工程技術大學電子電氣工程學院、安徽志國智能科技有限公司,副教授,博士,研究方向:人工智能。

主站蜘蛛池模板: 伊人福利视频| 色香蕉网站| 黄色网页在线观看| 国产精品欧美亚洲韩国日本不卡| 国产一级做美女做受视频| 国产在线视频导航| 亚洲国产精品成人久久综合影院| 日本人真淫视频一区二区三区 | 国产精品久久久久久影院| 欧美日韩国产系列在线观看| 91网址在线播放| 99手机在线视频| 欧美a在线看| 日本a级免费| 成人国产一区二区三区| 91在线播放国产| 亚洲综合婷婷激情| 国产精品黄色片| 国产精品爽爽va在线无码观看 | 熟妇人妻无乱码中文字幕真矢织江| 国内丰满少妇猛烈精品播| 好吊妞欧美视频免费| 少妇精品久久久一区二区三区| 在线观看亚洲天堂| 伊人久久青草青青综合| 免费观看亚洲人成网站| 日韩欧美中文在线| 青青青国产视频手机| 亚洲精品自产拍在线观看APP| 无码精品国产dvd在线观看9久| 亚洲视频免| 欧美专区日韩专区| 国产精品网拍在线| 欧美国产日本高清不卡| 欧美激情网址| 国模在线视频一区二区三区| 国产丝袜91| 午夜高清国产拍精品| 亚洲欧洲自拍拍偷午夜色| 91综合色区亚洲熟妇p| 国产精品视频猛进猛出| 国模沟沟一区二区三区| 亚洲天堂自拍| 亚洲欧美不卡中文字幕| 5555国产在线观看| 欧美国产在线看| 亚洲va视频| 亚洲色图欧美| 亚洲无线一二三四区男男| 亚洲日本一本dvd高清| 国产精品99久久久久久董美香| 国产精品视频第一专区| 亚洲va在线∨a天堂va欧美va| 自偷自拍三级全三级视频| 亚洲系列中文字幕一区二区| 91口爆吞精国产对白第三集| 成人一区专区在线观看| 亚洲成人播放| 在线观看亚洲精品福利片| 91小视频在线观看免费版高清| 成人福利一区二区视频在线| 亚洲丝袜第一页| 欧美成一级| 国产91高清视频| 亚洲成a人片| 国产精品综合久久久| 亚洲区一区| 最新午夜男女福利片视频| 久久亚洲AⅤ无码精品午夜麻豆| 婷婷午夜影院| 中国国产高清免费AV片| 欧美精品在线观看视频| 97视频精品全国免费观看| 国产精品精品视频| 亚洲午夜天堂| 国模在线视频一区二区三区| 午夜视频日本| 国产激情第一页| 99er这里只有精品| 国产真实乱子伦精品视手机观看| 欧美伊人色综合久久天天| 在线看片免费人成视久网下载|