999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

COVID19知識(shí)圖譜構(gòu)建與應(yīng)用研究

2021-12-08 13:30:40楊帥王小紅趙志剛潘景山武魯

楊帥 王小紅 趙志剛 潘景山 武魯

摘要: 為方便科研人員了解COVID19的致病機(jī)理、人體免疫、藥物治療和疫苗研發(fā)等科研動(dòng)態(tài),本文對(duì)COVID19知識(shí)圖譜進(jìn)行構(gòu)建與應(yīng)用研究。采用半自動(dòng)化知識(shí)圖譜構(gòu)建方法,設(shè)計(jì)構(gòu)建流程,搭建COVID19知識(shí)圖譜模式層。從核心醫(yī)學(xué)期刊、核心中醫(yī)藥期刊、權(quán)威藥物數(shù)據(jù)庫及百科等數(shù)據(jù)源獲取數(shù)據(jù),并采用爬蟲爬取和人工結(jié)合的方法進(jìn)行數(shù)據(jù)獲取、解析和存儲(chǔ)工作。同時(shí),基于Neo4J構(gòu)建COVID19科學(xué)文獻(xiàn)知識(shí)圖譜、中藥治療知識(shí)圖譜和西藥治療知識(shí)圖譜,并實(shí)現(xiàn)知識(shí)圖譜的融合。為保證知識(shí)圖譜的質(zhì)量,對(duì)知識(shí)圖譜三元組進(jìn)行統(tǒng)計(jì)與校驗(yàn),實(shí)現(xiàn)知識(shí)圖譜質(zhì)量控制,并在COVID19知識(shí)圖譜的數(shù)據(jù)基礎(chǔ)上,進(jìn)行中藥方劑頻次分析、中藥材頻次分析、中藥有效成分頻次分析及西藥研究熱度分析。分析結(jié)果表明,麻杏石甘湯、疏風(fēng)解毒膠囊、連花清瘟方是中醫(yī)臨床中常用于治療新冠肺炎的中藥方劑;而Remdesivir、Chloroquine、Darunavir是研究熱度最高的新冠臨床治療西藥。說明COVID19知識(shí)圖譜在中藥有效成分挖掘、中藥方劑潛在作用機(jī)制研究、藥物相互作用等方面都具有研究?jī)r(jià)值。該研究在弘揚(yáng)傳統(tǒng)中醫(yī)藥文化、推進(jìn)中醫(yī)現(xiàn)代化、探索中藥方劑的有效成分和潛在作用機(jī)制等方面具有重要意義。

關(guān)鍵詞:新型冠狀病毒肺炎; 知識(shí)圖譜; 本體; 知識(shí)融合; 質(zhì)量評(píng)價(jià); 可視化分析

中圖分類號(hào): TP182; R181.3 文獻(xiàn)標(biāo)識(shí)碼: A

基金項(xiàng)目: 山東省自然科學(xué)基金項(xiàng)目(ZR2020MF145);山東省重點(diǎn)研發(fā)計(jì)劃(2019JZZY010113);國家發(fā)改委重大工程(Z135060000070)

2019年12月以來,全球新型冠狀病毒(corona virus disease 2019,COVID19)疫情肆虐,造成了嚴(yán)重的社會(huì)和經(jīng)濟(jì)損失。截止2021年8月19日,全球累計(jì)確診2.1億人、死亡440萬人。面對(duì)如此嚴(yán)峻的疫情,世界各國的科研人員對(duì)COVID19展開了深入研究。知識(shí)圖譜由Google公司2012年提出,旨在實(shí)現(xiàn)關(guān)系數(shù)據(jù)的存儲(chǔ)與表示,已廣泛應(yīng)用于數(shù)據(jù)檢索、關(guān)系推理等方面。目前,醫(yī)療醫(yī)藥領(lǐng)域已構(gòu)建一系列知識(shí)圖譜[1],例如:蛋白質(zhì)相互作用知識(shí)圖譜、中醫(yī)藥知識(shí)圖譜[2]等。由于在COVID19抗疫過程中暴露出缺乏數(shù)據(jù)支撐的問題,而知識(shí)圖譜在抗疫大數(shù)據(jù)支撐、藥物推薦、病患軌跡跟蹤等方面發(fā)揮著不可替代的作用。國內(nèi)多家機(jī)構(gòu)相繼發(fā)布了多個(gè)新冠病毒知識(shí)圖譜;OpenKG共享了多個(gè)COVID19知識(shí)圖譜[35],涵蓋診療、臨床、英雄、物資等方面,而其在COVID19科學(xué)文獻(xiàn)和藥物治療等方面鮮有涉及。清華大學(xué)AMiner和智譜AI團(tuán)隊(duì)合作完成了COKG19,其數(shù)據(jù)規(guī)模大、且涵蓋眾多知識(shí)領(lǐng)域,但在知識(shí)粒度方面有待細(xì)化。基于此,為了便于科研人員探究COVID19的最新進(jìn)展,了解COVID19的致病機(jī)理、臨床研究、人體免疫、疫苗研發(fā)和藥物治療等科研動(dòng)態(tài),本文研制了COVID19知識(shí)圖譜。COVID19知識(shí)圖譜由COVID19科學(xué)文獻(xiàn)知識(shí)圖譜、西藥治療知識(shí)圖譜和中藥治療知識(shí)圖譜3部分融合組成,給出了COVID19命名、起源、傳播、致病機(jī)理、預(yù)防、臨床研究、人體免疫等方面的知識(shí),可以為醫(yī)護(hù)人員提供臨床治療藍(lán)本、推薦藥物治療方案。同時(shí),圖譜收集了國內(nèi)中醫(yī)藥治療COVID19的治療方案,對(duì)于弘揚(yáng)傳統(tǒng)中醫(yī)藥文化、推進(jìn)中醫(yī)現(xiàn)代化、探索中藥方劑的有效成分和潛在作用機(jī)制等方面都具有重要意義。

1知識(shí)圖譜構(gòu)建

1.1總體流程

COVID19知識(shí)圖譜涵蓋科學(xué)文獻(xiàn)、中藥治療、西藥治療等方面的知識(shí),數(shù)據(jù)異構(gòu),且來源廣泛,因此本文采用半自動(dòng)化知識(shí)圖譜構(gòu)建方法[6]。COVID19知識(shí)圖譜構(gòu)建流程如圖1所示。

首先進(jìn)行數(shù)據(jù)獲取和知識(shí)融合[7],通過數(shù)據(jù)爬取和文件解析方法,獲取有效數(shù)據(jù)并進(jìn)行知識(shí)融合;其次基于獲取數(shù)據(jù)進(jìn)行本體設(shè)計(jì)[8];再次參照各本體進(jìn)行知識(shí)圖譜構(gòu)建和融合,分別構(gòu)建COVID19科學(xué)文獻(xiàn)知識(shí)圖譜、西藥治療知識(shí)圖譜和中藥治療知識(shí)圖譜,并進(jìn)行知識(shí)圖譜融合,形成COVID19知識(shí)圖譜;最后進(jìn)行知識(shí)圖譜質(zhì)量評(píng)價(jià)[9],借助知識(shí)圖譜質(zhì)量評(píng)價(jià)方法,實(shí)現(xiàn)對(duì)COVID19知識(shí)圖譜的數(shù)據(jù)質(zhì)量控制。

1.2本體框架設(shè)計(jì)

本體框架設(shè)計(jì)主要包括確定構(gòu)建目標(biāo)和構(gòu)建模式層。COVID19知識(shí)圖譜的構(gòu)建目標(biāo)是集成高質(zhì)量的COVID19科學(xué)文獻(xiàn)知識(shí),面向科研人員提供高效便捷的知識(shí)共享服務(wù);COVID19知識(shí)圖譜的模式層包括COVID19科學(xué)文獻(xiàn)、中藥治療、西藥治療3大類,參照本體及本體間關(guān)系的設(shè)計(jì)需求,細(xì)化各個(gè)子類,知識(shí)圖譜結(jié)構(gòu)如圖2所示。

圖2中,白色框表示知識(shí)圖譜,藍(lán)色框表示本體,綠色框表示屬性,黃色框表示本體中的對(duì)象。COVID19科學(xué)文獻(xiàn)是指頂級(jí)醫(yī)學(xué)期刊收錄的學(xué)術(shù)論文,其本體包含論文、知識(shí)類別、科研人員、科研機(jī)構(gòu)和學(xué)術(shù)期刊等5個(gè)子類。其中,知識(shí)類別是對(duì)每篇文獻(xiàn)所屬知識(shí)領(lǐng)域的劃分,具體包含病毒起源、病毒傳播、命名、臨床研究、人體免疫、疫苗研發(fā)、藥物治療、致病機(jī)理等34個(gè)知識(shí)類別。中藥治療是指臨床治療新冠病患時(shí)使用的中藥處方,其本體包含中藥方劑、中藥相關(guān)文獻(xiàn)、中藥材、中藥有效成分等4個(gè)子類,其中,中藥材是中藥方劑的成分,中藥有效成分是中藥材的有效藥物成分;西藥治療是指臨床治療新冠患者時(shí)使用的西藥,其本體包含西藥和西藥相關(guān)論文2個(gè)子類。其中,西藥相關(guān)論文是指藥物在研發(fā)、臨床過程中發(fā)表的論文。文中涉及的本體數(shù)據(jù)均進(jìn)行了人工審核,以保證數(shù)據(jù)質(zhì)量。

1.3數(shù)據(jù)獲取和知識(shí)融合

1.3.1數(shù)據(jù)來源

由于缺乏開源、結(jié)構(gòu)化、細(xì)粒度且符合構(gòu)建需求的數(shù)據(jù),COVID19知識(shí)圖譜需要從核心醫(yī)學(xué)期刊、核心中醫(yī)藥期刊、權(quán)威藥物數(shù)據(jù)庫及百科等數(shù)據(jù)源獲取數(shù)據(jù),數(shù)據(jù)大多是半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)[10]。

1)COVID19科學(xué)文獻(xiàn)數(shù)據(jù)來源。COVID19科學(xué)文獻(xiàn)數(shù)據(jù)來源主要是世界頂級(jí)醫(yī)學(xué)期刊的論文,COVID19科學(xué)文獻(xiàn)數(shù)據(jù)來源如表1所示。預(yù)印版主要有arxiv、biorxiv、medRxiv等,Cell及其子刊包含Cell、Cell Discovery、cell research等期刊,Nature及其子刊包含Nature、Nature Medicine等期刊,Lancet及其子刊包含Lancet、The Lancet Infectious Diseases等期刊。總體上,頂級(jí)醫(yī)學(xué)期刊的數(shù)據(jù)源占比達(dá)56%,高質(zhì)量的數(shù)據(jù)來源保證了知識(shí)圖譜的質(zhì)量。

2)西藥數(shù)據(jù)來源。西藥數(shù)據(jù)主要來源于DrugBank(版本5.1.7,20200702版)數(shù)據(jù)庫,其為阿爾伯塔大學(xué)運(yùn)維的一個(gè)生物信息學(xué)和化學(xué)信息學(xué)數(shù)據(jù)庫[11],包含13 791種藥物條目,其中有2 653種經(jīng)批準(zhǔn)的小分子藥物、1 417種經(jīng)批準(zhǔn)的生物技術(shù)(蛋白質(zhì)\肽)藥物、131種營(yíng)養(yǎng)品和6 451種實(shí)驗(yàn)藥物。為了應(yīng)對(duì)COVID19疫情,DrugBank設(shè)計(jì)了COVID19專欄,面向科學(xué)界提供當(dāng)前用于臨床治療COVID19藥物信息,諸如Remdesivir、Ritonavir、Chloroquine等新冠臨床治療藥物都涵蓋其中。

3)中藥數(shù)據(jù)來源。中藥數(shù)據(jù)來源主要是《中草藥》、《中藥材》雜志及百科數(shù)據(jù)。《中藥材》雜志是經(jīng)國家科委和新聞出版署批準(zhǔn)出版的國內(nèi)外公開發(fā)行的國家級(jí)中藥科技學(xué)術(shù)性刊物,由天津藥物研究院和中國藥學(xué)會(huì)共同主辦。百度百科是國內(nèi)知名的中文百科類知識(shí)庫,其醫(yī)學(xué)條目由領(lǐng)域?qū)<摇⒏鞔筢t(yī)藥研究所合作編輯,所涵蓋的醫(yī)學(xué)條目可信度高、數(shù)據(jù)完整。本文主要篩選了《中草藥》、《中藥材》雜志發(fā)表的中藥治療COVID19方劑、中藥方劑有效成分挖掘方面的文獻(xiàn)數(shù)據(jù)。中藥方劑、藥材和中藥有效成分的細(xì)粒度信息來源于百科數(shù)據(jù)。

1.3.2數(shù)據(jù)獲取

針對(duì)半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),本研究采用自動(dòng)化和半自動(dòng)化結(jié)合的方法[12]獲取數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)(例如:權(quán)威醫(yī)學(xué)期刊文獻(xiàn)、中藥文獻(xiàn))來源廣泛,且多為PDF格式,采用爬蟲爬取和人工結(jié)合的方法進(jìn)行數(shù)據(jù)獲取和存儲(chǔ)工作。結(jié)構(gòu)化數(shù)據(jù)(例如:DrugBank數(shù)據(jù)、百科數(shù)據(jù))采用爬蟲爬取和程序解析的數(shù)據(jù)獲取方法。

1.3.3數(shù)據(jù)解析

對(duì)于OWL和XML格式的本體文件,一般采用Jena、Owlready2等工具進(jìn)行解析,提取本體文件中的實(shí)體、屬性、實(shí)體間關(guān)系數(shù)據(jù)。本文的數(shù)據(jù)源為科學(xué)文獻(xiàn)、數(shù)據(jù)庫和百科數(shù)據(jù),不包含本體文件,未采用以上本體解析工具。對(duì)于結(jié)構(gòu)化數(shù)據(jù),本文基于Python編寫解析程序,進(jìn)行數(shù)據(jù)解析、數(shù)據(jù)清洗、格式規(guī)范工作。對(duì)于非結(jié)構(gòu)化數(shù)據(jù),由于PDF解析技術(shù)發(fā)展水平的限制,為保證數(shù)據(jù)質(zhì)量,出于數(shù)據(jù)準(zhǔn)確性的考慮,本研究采用人工方法解析PDF數(shù)據(jù),并借助領(lǐng)域?qū)<胰斯ぬ崛∮行畔ⅰ?/p>

1.3.4知識(shí)融合

通過以上方法獲得的多源異構(gòu)數(shù)據(jù),需要進(jìn)行知識(shí)融合。為了提高知識(shí)圖譜的數(shù)據(jù)質(zhì)量,采用人工方法進(jìn)行知識(shí)融合[13]。首先通過實(shí)體鏈接,解決多源異構(gòu)數(shù)據(jù)中的實(shí)體沖突問題,將表示同一對(duì)象的多個(gè)實(shí)體歸并為具有全局唯一標(biāo)識(shí)的實(shí)體對(duì)象[14]。其次通過知識(shí)合并,將多個(gè)來源描述同一實(shí)體的知識(shí)合并在一起。

在COVID19知識(shí)圖譜構(gòu)建過程中對(duì)中藥方劑、中藥材、學(xué)術(shù)期刊、科研機(jī)構(gòu)等實(shí)體進(jìn)行數(shù)據(jù)規(guī)范和實(shí)體鏈接工作。新英格蘭醫(yī)學(xué)雜志實(shí)體在不同的數(shù)據(jù)源具備不同的名稱,例如:新愛爾蘭醫(yī)學(xué)雜志(the new england journal of medicine,NEJM),需要進(jìn)行實(shí)體對(duì)齊,避免歧義,實(shí)體與對(duì)齊實(shí)體如表2所示。

由于同種中藥材經(jīng)過不同方法處理會(huì)產(chǎn)生多種衍生藥材,同類中藥方劑由于制劑方法、藥材成分的細(xì)微差異會(huì)衍生出不同的中藥產(chǎn)品,需要加以區(qū)分。例如:藿香正氣水、藿香正氣口服液、藿香正氣散藥效一致,藥材成分大致相同,卻是不同的中藥產(chǎn)品。半夏曲、生半夏、清半夏、姜半夏、法半夏都是由半夏制備而成,炮制方法不同,具備不同功效。

本文采用“實(shí)體子實(shí)體”知識(shí)融合方法,實(shí)體子實(shí)體知識(shí)融合如表3所示。例如:連花清瘟方、連花清

瘟膠囊、連花清瘟片、連花清瘟顆粒是同一中藥方劑的不同衍生產(chǎn)品,藥材成分、藥效和適應(yīng)癥基本相同,僅在制劑工藝和藥劑狀態(tài)上有差別,為保留多個(gè)連花清瘟產(chǎn)品的差異性,并保持產(chǎn)品間的共性,本文采用“實(shí)體子實(shí)體”知識(shí)融合方法,實(shí)現(xiàn)了中藥方劑及其衍生產(chǎn)品、中藥材及其衍生藥材的實(shí)體對(duì)齊與知識(shí)融合。

1.4知識(shí)圖譜構(gòu)建與融合

本研究基于Neo4J,構(gòu)建COVID19知識(shí)圖譜。圖譜包括COVID19科學(xué)文獻(xiàn)知識(shí)圖譜、中藥治療知識(shí)圖譜、西藥治療知識(shí)圖譜3部分。中藥治療和西藥治療均屬于“藥物治療”的范疇。本研究將中藥治療知識(shí)圖譜和西藥治療知識(shí)圖譜作為“藥物治療”知識(shí)類別的子類,從而實(shí)現(xiàn)知識(shí)圖譜的融合,知識(shí)圖譜融合如圖3所示。

1.5知識(shí)圖譜質(zhì)量評(píng)價(jià)

知識(shí)圖譜在構(gòu)建過程中難免出現(xiàn)錯(cuò)誤[15],為了保證COVID19知識(shí)圖譜的質(zhì)量,本研究通過人工抽樣檢測(cè)的方法實(shí)現(xiàn)知識(shí)圖譜中三元組質(zhì)量的校驗(yàn)[16],并制定抽樣策略如下:

1)西藥治療數(shù)據(jù)取自DrugBank的結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)質(zhì)量高,隨機(jī)采樣1/10,人工校驗(yàn)其實(shí)體及屬性有無錯(cuò)誤。

2)中藥治療數(shù)據(jù)來源于科學(xué)文獻(xiàn),該數(shù)據(jù)在解析過程中更易產(chǎn)生錯(cuò)誤,隨機(jī)采樣3/10進(jìn)行校驗(yàn)。

3)COVID19科學(xué)文獻(xiàn)數(shù)據(jù)體量大,數(shù)據(jù)源質(zhì)量可靠,隨機(jī)采樣1/10進(jìn)行校驗(yàn)。

本研究按以上方式采樣348條三元組。為了得到準(zhǔn)確的質(zhì)量評(píng)價(jià)結(jié)果,將以上數(shù)據(jù)分發(fā)給6人檢驗(yàn),檢驗(yàn)者都是具備專業(yè)背景的人員,且對(duì)COVID19知識(shí)圖譜很了解,檢驗(yàn)結(jié)果有質(zhì)量保障[17]。采樣標(biāo)注后得到的準(zhǔn)確率為96.38%,因此本文構(gòu)建的知識(shí)圖譜具有質(zhì)量保證。

2知識(shí)圖譜可視化與數(shù)據(jù)分析

2.1知識(shí)圖譜可視化展示

對(duì)COVID19知識(shí)圖譜的西藥治療、中藥治療和COVID19科學(xué)文獻(xiàn)等3種類別三元組數(shù)量進(jìn)行統(tǒng)計(jì),知識(shí)圖譜三元組數(shù)量統(tǒng)計(jì)如表4所示。

COVID19知識(shí)圖譜收錄了376篇國際頂級(jí)醫(yī)學(xué)期刊文獻(xiàn)、93篇中醫(yī)藥核心期刊文獻(xiàn)、136篇西藥治療科學(xué)文獻(xiàn),同時(shí)還包含文獻(xiàn)的PDF源文件、文獻(xiàn)摘要、中文概要、關(guān)鍵詞、文獻(xiàn)鏈接、相關(guān)科研報(bào)道等內(nèi)容。此外,還收錄了40種中藥方劑、112味中藥材、86個(gè)中藥有效成分、32種西藥、324名科研人員、62類學(xué)術(shù)期刊、193個(gè)科研機(jī)構(gòu)的數(shù)據(jù),并對(duì)以上數(shù)據(jù)進(jìn)行了細(xì)粒度化處理。其中,40種中藥方劑是已發(fā)表的論文、用于預(yù)防或治療輕癥新冠肺炎患者的中藥,112味中藥材是40種中藥方劑的藥材成分,86個(gè)中藥有效成分是文獻(xiàn)中已實(shí)驗(yàn)證明的。COVID19知識(shí)圖譜的可視化如圖4所示。

2.2知識(shí)圖譜數(shù)據(jù)分析

本研究在COVID19知識(shí)圖譜的數(shù)據(jù)基礎(chǔ)上進(jìn)行了中藥方劑頻次分析、中藥材頻次分析、中藥有效成分頻次分析和西藥研究熱度分析。中藥方劑頻次分析如圖5所示。由圖5可以看出,麻杏石甘湯[18]、疏風(fēng)解毒膠囊、達(dá)原飲、金花清感顆粒、連花清瘟方、清肺排毒湯、小柴胡湯、玉屏風(fēng)散是中醫(yī)臨床中常用于治療新冠肺炎的中藥方劑。在最常見的中藥材中,用于治療新冠肺炎的中藥方劑有甘草、黃岑、連翹、蒼術(shù)、柴胡、厚樸、茯苓和金銀花,中藥材頻次分析如圖6所示。針對(duì)新冠肺炎,最有效的中藥有效成分包括槲皮素[19]、山奈酚、黃岑素、刺芒柄花素、漢黃岑素、β谷甾醇、尼泊爾鳶尾異黃酮、豆甾醇、異鼠李素、木犀草素等,中藥有效成分頻次分析如圖7所示。

在治療新冠肺炎方面,Remdesivir[20]、Chloroquine、Darunavir、Favipiravir、Umifenovir、Bevacizumab是研究熱度最高的新冠臨床治療西藥。此外,COVID19知識(shí)圖譜在中藥有效成分挖掘、中藥方劑潛在作用機(jī)制研究、藥物相互作用等方面都具有研究?jī)r(jià)值。

3結(jié)束語

本文主要對(duì)COVID19知識(shí)圖譜構(gòu)建與應(yīng)用進(jìn)行研究,該研究提供了新型冠狀病毒肺炎本體建模藍(lán)本,為多模態(tài)、海量COVID19數(shù)據(jù)的組織與存儲(chǔ)提供了模式支撐,也為下階段的COVID19知識(shí)智能問答、COVID19科學(xué)文獻(xiàn)細(xì)粒度分類、中藥有效成分挖掘等應(yīng)用研究提供了數(shù)據(jù)支持,其在COVID19科學(xué)研究、科學(xué)抗疫等方面都具備積極作用。同時(shí),本文工作也存在數(shù)據(jù)體量偏小、自動(dòng)化程度較低等問題,需要在今后的工作中擴(kuò)大知識(shí)圖譜規(guī)模、細(xì)化知識(shí)粒度、提高自動(dòng)化構(gòu)建水平。

參考文獻(xiàn):

[1]Schmidt E, Birney E, Croft D, et al. Reactomea knowledgebase of human biological pathways[C]∥On the Move to Meaningful Internet Systems 2006: OTM 2006 Workshops pt. 1; Lecture Notes in Computer Science. European Bioinformatlss Institute (EMBLEBI), Wellcome Trust Genome Campus, Hinxeon, Cambridgeshire, CBIO ISD, UK, 2006: 710719.

[2]阮彤, 孫程琳, 王昊奮, 等. 中醫(yī)藥知識(shí)圖譜構(gòu)建與應(yīng)用[J]. 醫(yī)學(xué)信息學(xué)雜志, 2016, 37(4): 813.

[3]蔣秉川, 游雄, 李科, 等. 利用地理知識(shí)圖譜的COVID19疫情態(tài)勢(shì)交互式可視分析[J]. 武漢大學(xué)學(xué)報(bào), 2020, 45(6): 836845.

[4]陳曉慧, 劉俊楠, 徐立, 等. COVID19病例活動(dòng)知識(shí)圖譜構(gòu)建——以鄭州市為例[J]. 武漢大學(xué)學(xué)報(bào): 信息科學(xué)版, 2020, 45(6): 816825.

[5]向軍毅, 胡慧君, 劉宇, 等. COVID19物資知識(shí)圖譜的構(gòu)建[J]. 武漢大學(xué)學(xué)報(bào): 理學(xué)版, 2020, 66(5): 409417.

[6]Luo Z W, Xie R, Chen W, et al. Automatic domain terminology extraction and its evaluation for domain knowledge graph construction[J]. Web Intelligence and Agent Systems, 2018, 16(3): 173185.

[7]阮彤, 王夢(mèng)婕, 王昊奮, 等. 垂直知識(shí)圖譜的構(gòu)建與應(yīng)用研究[J]. 知識(shí)管理論壇, 2016, 1(3): 226234.

[8]Nadeau D, Sekine S. A survey of named entity recognition and classification[J]. Lingvisticae Investigationes, 2007, 30(1): 326.

[9]Zhao Y, Li Z Q, Deng W, et al. Learning entity type structured embeddings with trustworthiness on noisy knowledge graphs[J]. KnowledgeBased Systems, 2021, 215(3): 106630106639.

[10]Guo Q Y, Zhuang F Z, Qin C, et al. A survey on knowledge graphbased recommender systems[J]. Scientia Sinica Informationis, 2020, 50(7): 937953.

[11]Marcheggiani D, Titov I. Discretestate variational autoencoders for joint discovery and factorization of relations[J]. Transactions of the Association for Computational Linguistics, 2016, 4(2): 231244.

[12]Jung K, Kim K I, Jain A K. Text information extraction in images and video: a survey[J]. Pattern Recognition, 2004, 37(5): 977997.

[13]楊一帆, 馬進(jìn), 王海濤, 等. 基于簡(jiǎn)介文本的中文人物關(guān)系圖譜屬性補(bǔ)全與糾錯(cuò)[J]. 中國科學(xué), 2020, 50(7): 10031018.

[14]Chang C H, Kayed M, Girgis M R, et al. A survey of web information extraction systems[J]. IEEE Transactions on Knowledge and Data Engineering, 2006, 18(10): 14111428.

[15]Wang Q, Chang L. An intelligent maximum power extraction algorithm for inverterbased variable speed wind turbine systems[J]. IEEE Transactions on Power Electronics, 2004, 19(5): 12421249.

[16]Rozenfeld B, Feldman R. Selfsupervised relation extraction from the Web[J]. Knowledge and Information Systems, 2008, 17(1): 1733.

[17]Xu K, Feng Y S, Huang S F, et al. Semantic relation classification via convolutional neural networks with simple negative sampling[J]. Computer Science, 2015, 71(7): 941949.

[18]樊冬麗, 廖慶文, 鄢丹, 等. 基于生物熱力學(xué)表達(dá)的麻黃湯和麻杏石甘湯的寒熱藥性比較[J]. 中國中藥雜志, 2007, 32(5): 421424.

[19]王春, 吳秋華, 王志, 等. 槲皮素與牛血清白蛋白相互作用的研究[J]. 光譜學(xué)與光譜分析, 2006, 26(9): 16721675.

[20]Eastman R T, Roth J S, Brimacombe K R, et al. Remdesivir: A review of its discovery and development leading to emergency use authorization for treatment of COVID19\[J\]. ACS Central Science, 2020, 6(5): 672683.

作者簡(jiǎn)介: 楊帥(1992),男,碩士,研究實(shí)習(xí)員,主要研究方向?yàn)閳D神經(jīng)網(wǎng)絡(luò)、知識(shí)圖譜和藥物研發(fā)。

通信作者: 趙志剛(1980),男,碩士,副研究員,主要研究方向?yàn)榇髷?shù)據(jù)和知識(shí)圖譜。Email: zhaozhg@sdas.org

Research on the Construction and Application of COVID19 Knowledge Graph

YANG Shuai, WANG Xiaohong, ZHAO Zhigang, PAN Jingshan, WU Lu

(Qilu University of Technology (Shandong Academy of Sciences),

Shandong Computer Science Center(National Supercomputer Center in Jinan), Jinan 250000, China)

Abstract: ?In order to facilitate scientific researchers to understand the pathogenic mechanism of COVID19, human immunity, drug treatment and vaccine development and other scientific research trends, this article constructs and applies research on the COVID19 knowledge graph. The semiautomated knowledge graph construction method is used to design the construction process and build the COVID19 knowledge graph model layer. We obtain data from data sources such as core medical journals, core traditional Chinese medicine journals, authoritative drug databases and encyclopedias, and use crawler crawling and artificial combination methods for data acquisition, analysis and storage. At the same time, based on Neo4J, we construct a knowledge graph of COVID19 scientific literature, a knowledge graph of traditional Chinese medicine treatment, and a knowledge graph of western medicine treatment, and realize the integration of knowledge graphs. In order to ensure the quality of the knowledge graph, the knowledge graph triples are counted and verified to achieve the quality control of the knowledge graph, and on the basis of the data of the COVID19 knowledge graph, the frequency analysis of traditional Chinese medicine prescriptions, the frequency analysis of traditional Chinese medicine materials, and the effectiveness of traditional Chinese medicine are carried out. Component frequency analysis and western medicine research popularity analysis. The analysis results show that Maxing Shigan Decoction, Shufeng Jiedu Capsules, and Lianhua Qingwen Decoction are commonly used in traditional Chinese medicine to treat new coronary pneumonia; ?and Remdesivir, Chloroquine, and Darunavir are the most researched Western medicines for the clinical treatment of new crowns. It shows that the COVID19 knowledge graph has research value in the mining of active ingredients of Chinese medicine, the study of the potential mechanism of Chinese medicine prescriptions, and drug interactions. The research is of great significance in promoting the culture of traditional Chinese medicine, advancing the modernization of Chinese medicine, and exploring the effective ingredients and potential mechanisms of Chinese medicine prescriptions.

Key words: covid19; knowledge graph; ontology; knowledge fusion; quality evaluation; visual analysis

主站蜘蛛池模板: 色综合天天综合中文网| 成人亚洲国产| 国产精品分类视频分类一区| 国产日韩欧美黄色片免费观看| 成人精品午夜福利在线播放| 免费看黄片一区二区三区| 国产精品片在线观看手机版 | 国产精品自在线天天看片| 草逼视频国产| 亚洲不卡无码av中文字幕| 萌白酱国产一区二区| 国产乱子伦视频三区| www.狠狠| 亚洲色图欧美在线| 欧美日韩国产高清一区二区三区| AV无码一区二区三区四区| 精品福利国产| 亚洲色图欧美在线| 国产成人精品一区二区三区| 精品综合久久久久久97| 亚洲高清中文字幕| 国产高潮流白浆视频| 亚洲无码精彩视频在线观看| 午夜国产小视频| 国产91线观看| 被公侵犯人妻少妇一区二区三区| 久99久热只有精品国产15| 91精品国产自产在线老师啪l| 2020最新国产精品视频| 美女国产在线| 一级毛片高清| 国内精品久久久久鸭| 精品国产福利在线| 亚洲精品欧美日韩在线| 亚洲精品免费网站| 国产免费羞羞视频| 成年A级毛片| 51国产偷自视频区视频手机观看| 国产一线在线| 午夜激情婷婷| 日韩一区二区在线电影| 亚洲综合色婷婷中文字幕| 毛片基地美国正在播放亚洲| 国产在线98福利播放视频免费| 国产精品美女免费视频大全| 91人妻日韩人妻无码专区精品| a毛片免费看| 中文字幕66页| 国产精品嫩草影院av| 亚洲区欧美区| 日本一本正道综合久久dvd| 亚洲午夜国产片在线观看| 日韩一区精品视频一区二区| 黄色网址免费在线| 无码视频国产精品一区二区| 日韩无码精品人妻| 久视频免费精品6| 亚洲天堂视频在线免费观看| 日韩一级二级三级| 亚洲成AV人手机在线观看网站| 免费看一级毛片波多结衣| 亚洲精品国产自在现线最新| 国产精品香蕉在线| 19国产精品麻豆免费观看| 亚洲91精品视频| 国产波多野结衣中文在线播放| 中文字幕欧美日韩| 欧美午夜在线视频| 国产男女XX00免费观看| 亚洲欧美人成人让影院| 亚洲国产欧美目韩成人综合| 性视频久久| 无码AV高清毛片中国一级毛片| 欧美成人日韩| 国产女人水多毛片18| 精品人妻AV区| 一区二区偷拍美女撒尿视频| 污网站在线观看视频| 国产亚洲成AⅤ人片在线观看| 中文字幕 日韩 欧美| 欧美精品综合视频一区二区| 啪啪永久免费av|