999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于知識圖譜的四大名著人物關系的構建

2021-03-14 00:51:02王家樂宋龍生
現(xiàn)代計算機 2021年36期
關鍵詞:可視化界面數(shù)據(jù)庫

王家樂,宋龍生

(西藏大學信息科學技術學院,拉薩 850000)

0 引言

近年來,隨著人工智能技術的發(fā)展和大數(shù)據(jù)時代的到來,知識圖譜技術得到極大的發(fā)展,大量的知識圖譜被構建出來并廣泛應用在多種場景之中。四大名著作為我國古代杰出的文學作品,里面包含的人物眾多,不同的人物之間又具有錯綜復雜的關系,要想讀懂這幾部經(jīng)典著作,必須將其中的人物關系梳理清楚。

為了解決這個問題,本文利用知識圖譜把四大名著中復雜的人物關系結合在一起。通過問答系統(tǒng)也可以為用戶找出想要獲取的某人的準確信息以及和親屬之間的聯(lián)系,為用戶提供更有價值的深層次信息。

1 系統(tǒng)開發(fā)環(huán)境及相關技術的介紹

1.1 Python

Python 作為一種跨平臺的計算機程序設計語言,Python 語言簡潔易讀、擴展性好容易維護,它不像C 語言那樣對格式的要求嚴謹,它的風格比較隨意,很多的層次結構用空格就可以實現(xiàn),對于開發(fā)者而言比較友好。同時Python 具有很好的可移植性,能夠適應于多種平臺,因此選擇Python語言進行本設計開發(fā)。

1.2 Flask框架

與Python 中常用的框架Django 相比較而言,F(xiàn)lask框架可以定義為一個輕量級的框架,重要的是它顯得簡潔、輕巧而且靈活度高。Flask框架適合做分層比較少、邏輯簡單的項目。本系統(tǒng)中采用Flask框架比較適合。

1.3 圖形數(shù)據(jù)庫Neo4j

圖數(shù)據(jù)庫存儲和查詢數(shù)據(jù)是通過圖這種數(shù)據(jù)結構來實現(xiàn)的[1],數(shù)據(jù)都是以節(jié)點的形式來保存,它是通過指針來說明兩個節(jié)點之間的關系,具有任意性。圖數(shù)據(jù)庫的數(shù)據(jù)存儲方式和查詢方式都是以圖論為基礎的[2]。本文使用圖數(shù)據(jù)庫Neo4j來實現(xiàn)對四大名著人物關系的存儲。

1.4 MySQL數(shù)據(jù)庫

在存儲可視化展示界面和單個人物的事跡與簡介的數(shù)據(jù)時采用MySQL 數(shù)據(jù)庫。MySQL 是一種關系型數(shù)據(jù)庫管理系統(tǒng)[3]。在存儲關系型數(shù)據(jù)時,MySQL仍然是首要的選擇。

1.5 知識圖譜

知識圖譜經(jīng)歷了早期語義網(wǎng)時代的發(fā)展、積累,最后才發(fā)展衍生出了這一概念。知識圖譜有助于提供更好的搜索服務,比如當搜索籃球明星姚明時,搜索引擎不僅會出現(xiàn)查找人物的信息,而且旁邊還會出現(xiàn)他的朋友、妻子、子女等簡要信息。事實上,這種效果就是知識圖譜的功勞,可以理解為知識圖譜的簡單應用。

2 系統(tǒng)整體框架與知識圖譜的構建

2.1 系統(tǒng)的整體框架

本系統(tǒng)采用Flask 框架對整個項目進行交互,還包括網(wǎng)絡爬蟲部分、數(shù)據(jù)處理部分、知識圖譜構建部分、分詞部分和前端展示部分。

2.2 知識圖譜的構建

知識圖譜的構建首先需要大量的數(shù)據(jù)作為支撐,通過結合人工獲取與網(wǎng)絡爬蟲共同得到本系統(tǒng)需要的數(shù)據(jù),在得到大量的數(shù)據(jù)之后,接下來需要對數(shù)據(jù)進行分類。構建知識圖譜的主要方法可以分為兩種:一是自頂向下的構建方式,二是自底向上的構建方式[4]。

目前,在構建知識圖譜時,一般采用自底向上的方式,從網(wǎng)絡中抽取信息[5],這種從下往上將知識進行疊加的方式便于信息的修改。但是在后期的過程中同時使用自頂向下和自底向上構建方法,并將兩種方法的優(yōu)勢結合一起能夠更高效地完成這一階段的工作。

2.3 數(shù)據(jù)的爬取

由于本系統(tǒng)要使用眾多的人物圖片和一些相關信息,所以使用網(wǎng)絡爬蟲技術作為收集數(shù)據(jù)的主要方式。網(wǎng)絡爬蟲伴隨著大數(shù)據(jù)與人工智能時代的來臨而受到越來越多人的重視與青睞。網(wǎng)絡爬蟲是搜索引擎的重要組成部分[6]。通俗的講,爬蟲就是程序代替人們在網(wǎng)頁中獲取想要的信息,用程序替你獲取你想要的信息。

爬蟲的主要步驟分為:分析站點(目標網(wǎng)站)→發(fā)送請求→獲取相應的內(nèi)容→解析網(wǎng)頁→數(shù)據(jù)保存。

2.4 知識抽取

知識抽取的過程包括分詞、實體命名識別、關系抽取以及事件抽取[7]。本系統(tǒng)的分詞工具直接使用的是已經(jīng)比較完善的LTP,因為它集成了分詞和詞性標注等多種方法在里面。

在本系統(tǒng)中用到的實體關系一般是指君臣關系、兄弟關系、同僚關系等。實體命名識別主要是從互聯(lián)網(wǎng)或者文本中發(fā)現(xiàn)有用的人物節(jié)點。除了這種方式外,還有人工獲取,將數(shù)據(jù)同樣整理成三元組的形式進行存儲。之所以加入人工獲取的方式是因為在四大名著的文本中存在有二義性的詞語。但是,本系統(tǒng)中的數(shù)據(jù)關系來源幾乎都是人工整理所得,不存在二義性的問題。

2.5 問答系統(tǒng)架構

(1)數(shù)據(jù)處理部分。原始數(shù)據(jù)來源于關系數(shù)據(jù)庫,需要將數(shù)據(jù)預處理后,導入的圖數(shù)據(jù)庫Neo4j 中。本系統(tǒng)選擇使用Neo4j-import 將大規(guī)模的數(shù)據(jù)導入到Neo4j 數(shù)據(jù)庫中(首先將數(shù)據(jù)Excel轉換成CSV 格式,然后將CSV 格式存放在import文件夾下),最終形成想要的知識庫。

(2)問題分析部分。本系統(tǒng)針對用戶輸入的問題進行模式匹配,識別出實體,進行詞性分析,從而找出人名實體和親屬關系類別。

(3)查詢結果部分。主要的功能分為兩種類型:一種是查詢?nèi)宋锏挠H屬關系,另一種是查詢兩個人物之間是否存在關系。

(4)結果返回部分。如果在圖數(shù)據(jù)庫中能找到答案,就返回相應的節(jié)點和關系展示出圖譜的全貌,如果查找失敗就報錯,查詢兩個人物之間的關系時如果存在關系就會跳轉到答案的界面,沒有則顯示沒有關系,若查找成功還會出現(xiàn)人物對應的圖片與人物簡介。

3 知識圖譜可視化系統(tǒng)與功能實現(xiàn)

在本系統(tǒng)中知識圖譜的可視化主要是前端界面的整體展示,在對整體數(shù)據(jù)進行展示的過程中使用echarts 可視化平臺可以直觀地看到系統(tǒng)中的各類關系和實體以及數(shù)據(jù)的統(tǒng)計。人物檢索主要是以關鍵詞為中心,結果會將和關鍵詞有關系的節(jié)點(實體)連在一起形成一個大的知識網(wǎng)絡,展示在網(wǎng)頁中。

對Neo4j 數(shù)據(jù)庫中數(shù)據(jù)的讀取和前端HTML界面的展示依靠的是Flask框架,進而將數(shù)據(jù)庫中的所有內(nèi)容進行可視化展示。可視化界面還具有搜索單個人物、知識圖譜全貌的展示、查詢?nèi)宋镪P系等功能。

3.1 可視化界面實現(xiàn)

整體系統(tǒng)實現(xiàn)了:①可視化展示;②四大名著知識圖譜全貌展示;③搜索單個人物;④查詢?nèi)宋镏g的關系。

圖1 是可視化界面,顯示了本系統(tǒng)中關系和實體的總數(shù)目,中間部分的圖譜效果是由echarts實現(xiàn),當點擊其中的名字會出現(xiàn)相應內(nèi)容介紹。右側介紹了系統(tǒng)中的主要功能模塊。

圖1 可視化界面展示

3.2 知識圖譜的實現(xiàn)

圖2是數(shù)據(jù)的展示界面。

圖2 四大名著數(shù)據(jù)展示

可以看到四大名著人物關系全貌的一部分,它和在圖形數(shù)據(jù)庫Neo4j 中的效果略同,但是它在前端的展示會顯得清楚、美觀。

3.3 問答系統(tǒng)的實現(xiàn)

關于增添關系的效果,當需要添加兩個人物的關系時,在輸入框中添加兩個人物的,名字和他們之間的關系就可以成功的添加這兩個人的關系。

查找某個人的親屬關系,只要這個關系存在就會顯示親屬的關系圖譜,并且會顯示出對應人物的簡介。

除上述的功能之外,為了使系統(tǒng)中的內(nèi)容更加充實以滿足更多的使用者,加入了四大名著中主要事件的搜索以及主要事件的視頻內(nèi)容。例如:在搜索欄中搜索“武松打虎”,就會與數(shù)據(jù)庫中的內(nèi)容進行匹配,然后出現(xiàn)對應的視頻片段。

4 結語

本文主要論述了基于四大名著的知識圖譜的構建,使用人工獲取和網(wǎng)絡爬蟲在互聯(lián)網(wǎng)上獲取相關資源后,通過對獲取的人物關系進行歸納、整合等操作后整理成三元組的形式,利用Neo4j存儲其中的人物關系,接下來使用Flask框架來實現(xiàn)系統(tǒng)中前后端的交互,最終構建了四大名著人物關系的知識圖譜。不僅有基本的人物圖譜的全部展示,而且加入了類似于大數(shù)據(jù)的前端展示,使得數(shù)據(jù)的可視化效果增強。

猜你喜歡
可視化界面數(shù)據(jù)庫
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
國企黨委前置研究的“四個界面”
當代陜西(2020年13期)2020-08-24 08:22:02
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于FANUC PICTURE的虛擬軸坐標顯示界面開發(fā)方法研究
數(shù)據(jù)庫
財經(jīng)(2017年2期)2017-03-10 14:35:35
人機交互界面發(fā)展趨勢研究
數(shù)據(jù)庫
財經(jīng)(2016年15期)2016-06-03 07:38:02
數(shù)據(jù)庫
財經(jīng)(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 日韩a级片视频| 日韩东京热无码人妻| 免费欧美一级| 久久综合AV免费观看| 久久综合色视频| 精品国产毛片| 无码日韩人妻精品久久蜜桃| 亚洲欧洲免费视频| 国产av色站网站| 成年人久久黄色网站| 国产成人综合在线观看| 午夜欧美理论2019理论| 自拍欧美亚洲| 国产美女91视频| 伊人久综合| 尤物特级无码毛片免费| 无码精品一区二区久久久| 国产成+人+综合+亚洲欧美| 99国产在线视频| 青草娱乐极品免费视频| 欧美黄色网站在线看| 亚洲免费毛片| 青青操国产| 99一级毛片| 先锋资源久久| 97人人做人人爽香蕉精品| 一区二区三区精品视频在线观看| 在线免费亚洲无码视频| 午夜a视频| 2021国产精品自产拍在线| 54pao国产成人免费视频| 国产精品欧美亚洲韩国日本不卡| 视频一本大道香蕉久在线播放| 日本免费a视频| 婷婷综合色| 992tv国产人成在线观看| 婷婷在线网站| 亚洲第一黄色网址| 一区二区三区四区在线| 精品久久777| 国产亚洲日韩av在线| 暴力调教一区二区三区| 亚洲精品高清视频| 国产精品久久久久鬼色| 国产成人1024精品| 国产视频a| 欧美精品色视频| 国产成人乱无码视频| 欧美在线视频不卡第一页| 久99久热只有精品国产15| 日韩无码白| 国产极品美女在线观看| 亚洲成人动漫在线| 国产丝袜丝视频在线观看| 青青久在线视频免费观看| 国产噜噜噜| 在线国产你懂的| 深夜福利视频一区二区| 国产福利一区二区在线观看| 国产在线拍偷自揄拍精品| 亚洲h视频在线| 久爱午夜精品免费视频| 中文字幕色站| 在线国产综合一区二区三区| 国产一区免费在线观看| 九九九九热精品视频| 亚洲女人在线| 青青青视频91在线 | 首页亚洲国产丝袜长腿综合| 99re视频在线| 欧美一区二区精品久久久| 色丁丁毛片在线观看| 大乳丰满人妻中文字幕日本| 国产精品思思热在线| 色欲综合久久中文字幕网| 福利在线免费视频| 色婷婷在线播放| 亚国产欧美在线人成| 国产精品亚洲精品爽爽| 日本午夜网站| 久久这里只有精品66| 亚洲AⅤ波多系列中文字幕|