999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

藏藥知識圖普展示系統研發

2021-09-10 08:36:36尼瑪頓珠洛桑嘎登景麗莎
電子元器件與信息技術 2021年6期
關鍵詞:可視化文本功能

尼瑪頓珠,洛桑嘎登★,景麗莎

(1.西藏大學信息科學技術學院,西藏 拉薩 850000;2.貴州省電子證書有限公司,貴州 貴陽 550081)

0 引言

藏醫藥起源于西藏,有著悠久的發展歷史、鮮明的民族特色、獨特的診療方法、系統的理論體系和浩瀚的文獻典籍,是祖國醫藥學寶庫和中華民族文化的重要組成部分,是我國最為完整、最具影響的民族醫藥學之一[1]。繼承和發展藏醫藥事業對弘揚優秀傳統文化,豐富和發展祖國醫藥學體系,造福各族群眾具有十分重要的意義[2]。“改革開放以來,青海和西藏藏醫藥事業快速發展,為解決慢性病、高原病等發揮了重要作用。但是隨著醫藥衛生事業的快速發展和人民群眾對醫療高科技化、高安全性的需求不斷增長,藏醫藥事業發展面臨許多嚴峻的問題,藏醫藥珍貴文化遺產損毀遺失現象嚴重,古籍文獻損毀和傳統診療技術失傳現象十分突出”[3]。所以,通過信息化手段建立系統的藏藥知識庫迫在眉睫。目前知識圖譜的構建方式主要有“自頂向下”和“自底向上”兩種構建方式[4],最常用的則是“自底向上”這種構建方式,從下往上層層遞進。經查閱相關資料,已有學者研究基于漢語文文本的西藏旅游的知識圖譜,但是基于藏文文本的知識圖譜研究和有關藏藥知識圖譜的研究寥寥無幾。

1 技術實現

1.1 數據獲取

經調研查閱相關資料,目前我國藏醫藥行業專門的門戶網站是中國藏醫藏藥網,雖然這并不是唯一的藏藥網,但相較于其它藏醫藥網,其中對于藏醫藏藥的相關信息記載較為準確與全面,所以本文的數據來源主要依靠的是中國藏醫藏藥網。不僅如此還加入當今網絡爬蟲技術。:

本文通過采用不同的數據檢測、審查、處理、校驗等方法,實現藏藥網全站式爬取數據。網上爬取的原始數據包含很多種數據,比如圖片數據、視頻數據,還有部分的亂碼數據,針對項目需要,對數據進行了清洗,過濾掉無效的信息,刪除重復信息,并將這類數據結構化,存入MySQL數據庫中,方便后續分析使用。

1.2 藏藥實體識別和實體關系抽取

“命名實體識別(Named Entity Recognition,簡稱NER),是指識別文本中具有特定意義的實體,主要包括人名、地名、機構名、專有名詞等”[5]。“通常包括兩部分:(1)實體邊界識別;(2)確定實體類別(人名、地名、機構名或其他)[6]”。實體識別則是一種信息提取技術,指的是在給定的數據里,將自己所需的實體類型選出來的一個過程。“而關系抽取主要任務是從文本中識別出的實體中抽取實體間的語義關系”[7],指的是不同實體之間的相互聯系,因為實體之間并不是相互獨立的,往往存在某種聯系[8]。比如爬取這種一個句子? ?????? ???? ???? ???? ??? ?????? ??? ???? ???????? ????? ??????? ??? ???? ????? ????? ????? ??? ???然后我們通過分詞,然后我們從具有規律的藏醫藥實體的詞庫中的實體對比,并句子中提取出藏醫藥實體,如???????????????藏藥實體。

藏藥實體識別和實體關系抽取是構建藏藥知識圖譜的前期任務。藏藥實體識別的過程主要通過規則匹配識別的方法。具體步驟為,分析大量的實體在文本中的出現規律,比如分析上下文信息。發現很多藏藥實體前后都會很規律的出現幾個詞匯,比如“xxx???”、“? xxx”,另外組成藏藥實體的名稱用詞也有很多規律,比如很多藏藥的名稱中包含數詞,如“? ???? ???? ???? ?”、“? ??? ????? ????? ?”等,歸納了十幾個這樣的規則,并且按照這些規則建立一個詞庫,然后通過規則匹配在爬取的藏文文本中去自動提取藏藥實體,之后在提取結果上進行一次人工校對,最終確定為藏藥實體名稱。分詞和提取關鍵詞的過程如下:

用戶輸入:? ??? ????? ????? ?????? ???? ???? ???? ?? ???? ??????

首先設字典中最長的單詞(max_Len),然后在字符串中取一個跟最大長度一樣的子串,如:取子串“? ??? ????? ??????????”,然后在進行匹配,如果匹配失敗,每次去掉匹配字段的最后面的一個字。直到子串跟詞庫中的某個元素完全匹配為止。最后匹配成功的子串如“? ??? ????? ????? ??”,反復對用戶輸入的字符串進行正向最大匹配算法,然后加到相應的列表或字典中為下一步進行圖譜構建做準備。程序實現藏文分詞和提取關鍵詞實現代碼如圖1所示:

圖1 分詞代碼

實體關系抽取是指從句子中抽取兩個實體之間的關系類別的任務[9]。作為自然語言處理的關鍵性技術,實體關系抽取在信息檢索、知識圖譜、自動問答系統等領域具有廣闊的應用前景。本文主要通過模式匹配的過程主要運用語言學和自然語言處理學的知識,在關系抽取任務之前,通過人工構造實體關系的特征關系詞或規則,并將它們存儲下來。在實體關系抽取任務中,將規則與預處理后的非結構文本相匹配,提取出了三元關系組。

藏藥實體關系抽取主要使用遠程監督方法。具體過程是,首先和實體識別過程類似,通過一系列規則抽取粗略的實體關系,如充分利用藏語中格助詞的規則,比如屬格、施格等,得到部分關系之后,把關系存入數據庫。其次,只要在數據庫中已經存在關系的兩個實體同時出現都認為是這類關系,實驗證明該方法在藏醫藥這類固定領域的文本上取得的效果很好。

2 知識圖譜展示系統實現

通過上述數據獲取、數據清洗、知識抽取、知識存儲等工作基礎上,需對所提取的數據進行整合,整合后的結果用三元組<實體1,關系,實體2>來表示,然后將數據存儲在Neo4j圖形數據庫中。最終通過哈工大語言技術平臺(LTP)技術,對用戶在搜索框中輸入的問題進行分詞、提取關鍵詞,提取實體之間的關系,然后通過實體與實體之間的關系構建它們之間的圖譜關系,并且可視化的方式展示在前端。本文利用neo4j技術,實現了藏藥知識圖譜系統的實現。

2.1 總體功能架構

本設計整體采用Flask框架完成前后端交互,功能可以分為:知識圖譜展示系統、分類可視化、關系展示功能、檢索功能和問答系統。如圖2所示:

圖2 設計總體架構

2.2 藏醫藥分類可視化

用戶根據自己的賬號登陸之后,第一個頁面看到是一個可視化頁面,那個主要功能是把各個藏藥的分類及所占的比例通過柱形圖、餅狀圖、等可視化的效果展示給用戶,進入系統之后的整體效果如圖3所示:

圖3 可視化界面

2.3 藏藥關系檢索功能

用戶可以通過自己在該頁面的搜索框中輸入的內容來查找自己所找藏藥屬于哪個藏藥分類的情況,并且通過圖譜的形式展示給用戶。

2.4 藏藥命名實體識別與問答功能

此頁面針對想要了解的藏醫藥和查詢藏藥,通過在搜索框中輸入藏醫藥有關的問題之后,可以將此藏藥的特點、藥效、物理性質、圖片等內容查詢出來以藏漢兩種語言的形式顯示在平臺上。并且可以對自己輸入的問題會做一個命名實體識別,并把問題當中的地名、機構名、藥名等提取出來并作數據庫中的查找出相應的藥物的信息及,它屬于的藏藥分類關系。

3 結束語

本文利用數據爬蟲技術獲取數據,經過數據清洗,知識抽取,知識存儲等過程構建了一定規模的藏藥知識庫,在采用結構化知識組織存儲的基礎上實現了知識圖譜展示系統。該系統包含藏藥知識分類功能、關系展示功能、知識檢索功能和藏藥知識問答等功能。雖然本項目實現了有關藏藥的知識圖譜展示系統,但是在數據量和數據范圍上僅限于常見的藏藥領域,下一步需要從藥物的構成成分、藥物的研制流程、藥物的發展脈絡等方面繼續收集數據,做一個數據更全,信息更豐富的圖譜展示平臺,并應用于藏醫知識教學和研究的實際應用中。

猜你喜歡
可視化文本功能
也談詩的“功能”
中華詩詞(2022年6期)2022-12-31 06:41:24
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
在808DA上文本顯示的改善
“融評”:黨媒評論的可視化創新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
關于非首都功能疏解的幾點思考
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
中西醫結合治療甲狀腺功能亢進癥31例
主站蜘蛛池模板: 精品福利网| 伊人查蕉在线观看国产精品| 国产一区成人| 日韩欧美国产成人| 午夜啪啪网| 性激烈欧美三级在线播放| 欧美在线精品怡红院| 精品国产一区91在线| 国产精品偷伦在线观看| 国产精品视频系列专区| 热re99久久精品国99热| 玖玖精品在线| 九九热视频精品在线| 国产精品成人观看视频国产| 色悠久久久| 亚洲国产成人久久精品软件| 中文字幕av一区二区三区欲色| 永久在线精品免费视频观看| 欧美一区二区三区香蕉视| 性视频一区| 欧美一级高清片欧美国产欧美| 91丨九色丨首页在线播放| 亚洲欧洲国产成人综合不卡| 国产成人精品第一区二区| 亚洲精品男人天堂| 午夜色综合| 中文精品久久久久国产网址 | 亚洲免费三区| 欧美亚洲综合免费精品高清在线观看| 亚洲黄网视频| 成人亚洲视频| 欧美不卡二区| 亚洲一区波多野结衣二区三区| 欧美在线中文字幕| 2021国产精品自拍| 国产jizz| 亚洲青涩在线| 真人高潮娇喘嗯啊在线观看| 亚洲大尺度在线| 综合色天天| 99伊人精品| 国产高清在线观看| 国产成人AV男人的天堂| 99福利视频导航| 欧美一区中文字幕| 国产呦精品一区二区三区网站| 在线观看国产一区二区三区99| 久久人搡人人玩人妻精品| 91丝袜美腿高跟国产极品老师| 激情综合图区| 国产日韩欧美视频| 国产日韩AV高潮在线| 欧美一级大片在线观看| 看你懂的巨臀中文字幕一区二区| 亚洲精选高清无码| 中文一区二区视频| 午夜国产大片免费观看| 亚洲无线视频| 亚洲香蕉久久| 亚洲天堂日韩在线| jizz国产视频| 77777亚洲午夜久久多人| 2019年国产精品自拍不卡| 亚洲人成网站色7799在线播放| 国产麻豆另类AV| 2022国产无码在线| 亚洲国产精品无码AV| 亚洲av无码成人专区| 欧美精品在线视频观看| 91麻豆精品国产91久久久久| 欧美在线黄| 久久亚洲国产一区二区| 91精品视频播放| 国产H片无码不卡在线视频| 久久频这里精品99香蕉久网址| av一区二区三区高清久久| 欧美人与性动交a欧美精品| 欧美成人手机在线观看网址| www.99在线观看| 免费xxxxx在线观看网站| 国产亚洲精品91| 成人福利免费在线观看|