999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

本體在生物醫(yī)學領域中應用研究熱點分析*

2019-02-28 07:43:18呂少妮
醫(yī)學信息學雜志 2019年1期
關鍵詞:語義概念研究

張 慶 呂少妮 軒 揚

(濟寧醫(yī)學院醫(yī)學信息工程學院 日照 276826) (濟寧醫(yī)學院管理學院 日照276826)

1 引言

本體最初是哲學領域概念,是對現(xiàn)實世界真實存在所做出的客觀描述,20世紀90年代本體概念被引入人工智能、圖書情報和知識工程等領域[1]。本體是共享概念模型明確形式化規(guī)范說明[2]。由于生物醫(yī)學領域龐大的概念和復雜的概念關系,應用本體表示知識概念進行知識組織顯得尤為重要。本文對Medline數(shù)據(jù)庫收錄的有關本體在生物醫(yī)學領域應用的論文中的高頻主題詞進行共現(xiàn)聚類分析,總結(jié)研究熱點并對其進行分析。

2 數(shù)據(jù)來源與方法

2.1 數(shù)據(jù)來源

數(shù)據(jù)來源于Medline數(shù)據(jù)庫。檢索策略為(ontology[Title] OR ontologies[Title]) AND medline[sb] AND ("2000/01/01"[PDAT]: "2017/12/31"[PDAT]),共得到相關文獻1 810篇。

2.2 方法

以XML格式套錄檢索結(jié)果,利用書目共現(xiàn)分析系統(tǒng)BICOMB[3]統(tǒng)計并抽取文獻記錄中的主要主題詞與副主題詞,按照出現(xiàn)頻次由高到低進行排序,選取頻次≥22的47個主題詞/副主題詞作為高頻詞。其中出現(xiàn)頻次最高的前3位主題詞/副主題詞分別為:受控詞表、計算生物學/方法、軟件。47個高頻詞占所有與生物醫(yī)學本體相關主題詞的累計比例為49.46%。對高頻詞在每篇文獻記錄中出現(xiàn)情況進行統(tǒng)計,形成高頻詞詞篇矩陣。將詞篇矩陣輸入gCLUTO軟件,采用系統(tǒng)聚類法對所得詞篇矩陣進行聚類分析,結(jié)果可以反映出高頻詞之間的親疏關系,根據(jù)高頻主題詞聚類結(jié)果以及主題詞之間的語義關系總結(jié)出本體在生物醫(yī)學領域中應用的研究熱點。

3 結(jié)果

本體研究高頻主題詞共現(xiàn)聚類結(jié)果,見圖1。其中橫軸代表文獻,縱軸代表聚類的主題詞/副主題詞。兩詞聚集到一起的距離越短,關系越密切。

圖1 生物醫(yī)學領域本體研究高頻主題詞共現(xiàn)聚類

首先,根據(jù)每類高頻詞的含義及其之間的語義關系總結(jié)出每類主題詞所代表的研究熱點,即生物醫(yī)學領域本體的研究熱點,如主題詞蛋白質(zhì)數(shù)據(jù)庫(Protein Databases)和蛋白質(zhì)/分類(Proteins/classification)距離較近,關系密切,先聚成一類;蛋白質(zhì)/代謝(Proteins/metabolism)再與前面兩個詞合成一類,依此類推。通過分析這些主題詞的語義關系能得出其所代表的類團含義標簽,綜合各個類別的類標簽可以得出該主題的研究熱點。其次,利用gCLUTO軟件計算各類成員對聚類貢獻率的指標(描述度和區(qū)分度),選擇對每類形成貢獻最大的來源文獻作為表示該類內(nèi)容的類標簽文獻[4]。通常選取描述度分值最高者作為該類的類標簽文獻,然后再對文獻內(nèi)容進一步分析,進而闡釋該類研究方向的具體內(nèi)容。類成員聚類貢獻率指標,見圖2。

圖2 類成員對聚類貢獻率指標

4 分析

4.1 概述

通過對Medline收錄的8年生物醫(yī)學領域本體研究文獻的高頻主題詞和副主題詞進行共現(xiàn)聚類分析,可將該領域的研究熱點分為4大方面、8個主題。

4.2 本體在生物信息學中的應用

4.2.1 生物醫(yī)學本體在蛋白質(zhì)組學研究中的應用 包括主題詞Sequence Analysis,Protein/methods,Proteins/chemistry,Proteins/metabolism,Proteins/classification,Protein Databases。對蛋白質(zhì)數(shù)據(jù)集進行功能注釋分析對于解釋高通量蛋白質(zhì)組學的結(jié)果至關重要。生物醫(yī)學本體正在成為蛋白質(zhì)組學研究中的關鍵工具,用于蛋白質(zhì)序列注釋,預測蛋白質(zhì)功能等。研究內(nèi)容包括引入遺傳相似性算法來尋找一組語義相似的基因本體術語,開發(fā)基于基因本體的蛋白質(zhì)序列注釋工具[5];利用間接蛋白質(zhì)相互作用來預測基因本體中蛋白質(zhì)的功能[6];利用基因本體和肽片段的幾何聚類解析蛋白質(zhì)中的功能重要區(qū)段[7]等。

4.2.2 生物醫(yī)學本體在基因組學中的研究 該類涉及的主題詞包括Oligonucleotide Array Sequence Analysis/methods,Gene Expression Profiling/methods,Software,User-computer Interface。在生物醫(yī)學本體中,基因本體(Gene Ontology,GO)已成為其中一種強有力的生物信息組織和加工工具。由于其被設計為物種中性,GO非常適合跨物種使用,這意味著來自模式生物的功能注釋可以轉(zhuǎn)移到新測序物種中的推斷的直向同源物中。即GO可以為具有未注釋基因組的物種提供基因注釋信息。研究內(nèi)容包括與基因本體相關聯(lián)的軟件或應用程序的開發(fā)與應用,諸如GO:TermFinder、JProGO、ChipInfo,用于提取基因注釋和基因本體信息以進行微陣列分析[8-12]等。

4.2.3 本體在計算生物學中的研究 包括主題詞Molecular Sequence Annotation/methods,Gene Ontology,Genetic Databases,Computational Biology/methods,Algorithms,Molecular Sequence Annotation,Gene Expression Profiling,Proteins/genetics。利用本體來描述生物實體時可以通過對實體注釋的含義相似性來評估兩個實體之間的相關程度。語義相似性已成為驗證生物醫(yī)學研究結(jié)果的有用工具,如基因聚類、基因表達數(shù)據(jù)分析,分子相互作用的預測和驗證以及疾病基因優(yōu)先級。研究內(nèi)容主要基于基因本體應用信息的語義相似度計算方法,獲取不同基因產(chǎn)物生物特征的相似度。如基于本體語義相似性的功能分析工具A-DaGO-Fun[13];基于基因本體評估蛋白質(zhì)功能相似度[14];利用基因本體注釋評估基因表達數(shù)據(jù)的聚類算法,用于解釋基因表達數(shù)據(jù)以揭示共享共同功能屬性的基因組[15];基于基因本體注釋的相似性預測蛋白質(zhì)-蛋白質(zhì)的相互作用[16]。

4.3 本體在臨床醫(yī)學領域中的應用

4.3.1 本體在臨床決策支持系統(tǒng)中的應用 涉及的主題詞包括Practice Guidelines as Topic,Clinical Decision Support Systems,Biological Models,Genomics/methods。研究內(nèi)容為開發(fā)本體用于臨床實踐指南及藥物基因組學知識表示。如通過開發(fā)乳腺癌本體、基于指南要素模型以及患者本體在初級保健機構(gòu)進行乳腺癌后續(xù)干預的臨床決策支持系統(tǒng)[17];開發(fā)網(wǎng)絡本體語言(Web Ontology Language,OWL)和利用自動推理方法表示、分析和使用藥物基因組學數(shù)據(jù),使患者與臨床上適當?shù)乃幬锘蚪M學指南和臨床決策支持信息相匹配[18];本體及其解決問題的方法在開發(fā)可共享臨床指南中的應用,通過促進指南獲取和執(zhí)行,提高日常護理中可共享指南和決策支持系統(tǒng)的接受度[19]。

4.3.2 本體在分子生物學領域的應用 包括主題詞Phenotype,Biological Ontologies,Data Mining/methods,Theoretical Models。研究內(nèi)容為通過生物醫(yī)學本體查詢和推斷表型以用于臨床基因診斷[20-21]。如根據(jù)患者表型對給定的一組基因進行排序。該算法通過在與每個基因相關的表型描述符和描述患者的表型描述符之間計算語義相似性來對基因進行排序。表型描述符術語取自人類表型本體(Human Phentypic Ontology,HPO),語義相似性源自每個術語的信息內(nèi)容,可以相對于患者表型特征在基因列表內(nèi)高度排列致病基因,以減少臨床基因診斷的工作量[22]。又如結(jié)合開放生物醫(yī)學本體(Open Biomedical Ontology,OBO)、自閉癥本體與美國國立自閉癥研究數(shù)據(jù)庫(National Database for Autison Research,NDAR),采用描述邏輯和基于規(guī)則的推理方法,從特定主題數(shù)據(jù)推斷出高級表型抽象,有助于研究人員進行數(shù)據(jù)分析[23]。

4.4 本體在醫(yī)學信息學中的應用

4.4.1 與本體相關的術語詞表研究 涉及的主題詞包括Internet,Terminology as Topic,Genes,Controlled Vocabulary。本體是受控程度最為嚴格、結(jié)構(gòu)化程序最高的一種詞表,是知識表示的強大工具。領域本體描述的是特定領域中的概念與概念之間的關系,提供專業(yè)學科領域中概念的詞表以及概念間的關系,能夠合理有效地進行領域知識的表示。該類研究內(nèi)容為構(gòu)建詞匯表供研究人員在研究過程中訪問、瀏覽和利用。如開發(fā)健康術語/本體門戶(HeTOP)提供對健康術語和本體的輕松訪問并可進行醫(yī)學教學[24];通過編譯Gene Ontologies生成描述分子生物學領域的結(jié)構(gòu)化詞匯表并將其應用于基因組表達分析中[25]。

4.4.2 本體在異構(gòu)數(shù)據(jù)整合方面的應用 包含主題詞Systematized Nomenclature of Medicine、Semantics、Medical Informatics / methods。獨立開發(fā)、結(jié)構(gòu)各異的生物學數(shù)據(jù)庫散落分布限制研究人員的具體研究。通過本體中的標準化術語不同數(shù)據(jù)集合的元數(shù)據(jù)可以被注釋并進行術語統(tǒng)一,進而消除異質(zhì)性,實現(xiàn)數(shù)據(jù)整合。該類研究內(nèi)容主要體現(xiàn)在通過本體概念之間的簡單術語匹配來解決整合異構(gòu)知識源的問題[26-27]。如在“Ontology Patterns-based Transformation of Clinical Information”一文中作者提出一種靈活的轉(zhuǎn)換方法,使用語義內(nèi)容模式來指導源數(shù)據(jù)和目標域本體之間的映射。作為用例,該文展示如何使用SemanticHealthNet中提出的語義內(nèi)容模式來轉(zhuǎn)換有關藥物管理的異構(gòu)數(shù)據(jù)[28]。

4.5 本體在人工智能中的應用

包括主題詞Factual Databases,Database Management Systems,Information Storage and Retrieval/methods,Documentation/methods,Natural Language Processing,Pattern Recognition,Automated/methods,Artificial Intelligence。生物醫(yī)學文獻數(shù)量迅猛增長,僅依靠人工檢索閱讀會消耗大量時間,利用人工智能的方法能夠有效地從生物醫(yī)學數(shù)據(jù)庫中提取相關知識進行研究進而提出新的實驗假設,得到新的科學結(jié)論。本體在人工智能中的應用主要體現(xiàn)在利用本體中的概念以及概念與概念之間的關系,根據(jù)現(xiàn)用概念自動預測新概念,結(jié)合算法自動實現(xiàn)多級注釋、自動文本分類及聚類[29-31]。

5 結(jié)語

近年來本體廣泛應用于生物醫(yī)學研究中,為學科領域中的類和關系提供標準標識符以及主題領域詞匯表,描述本體中類間關系含義的元數(shù)據(jù),機器可讀的公理和定義,便于計算機訪問理解,使其能夠?qū)崿F(xiàn)便于數(shù)據(jù)集成、數(shù)據(jù)訪問和分析的應用程序。通過對高頻主題詞進行聚類分析,可以總結(jié)出本體在生物醫(yī)學領域中的應用主要集中在生物信息學、臨床醫(yī)學、醫(yī)學信息學、人工智能4個方面。生物醫(yī)學領域具有龐大的概念體系和復雜的概念關系,使得本體對于該領域的重要性遠遠大于其他信息學領域。隨著生物醫(yī)學領域的發(fā)展,本體將會被大量地用于知識和數(shù)據(jù)的表達與分析中,向更高的覆蓋范圍、形式和整合方向發(fā)展。

猜你喜歡
語義概念研究
FMS與YBT相關性的實證研究
Birdie Cup Coffee豐盛里概念店
遼代千人邑研究述論
語言與語義
幾樣概念店
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統(tǒng)研究
學習集合概念『四步走』
聚焦集合的概念及應用
“上”與“下”語義的不對稱性及其認知闡釋
主站蜘蛛池模板: 高清欧美性猛交XXXX黑人猛交 | 国产精品网拍在线| 久久永久视频| 欧美www在线观看| 操操操综合网| 国产成年无码AⅤ片在线| 亚洲中文字幕手机在线第一页| 91久久偷偷做嫩草影院电| 日韩精品毛片人妻AV不卡| 玩两个丰满老熟女久久网| 亚洲视频四区| 国产人前露出系列视频| 免费av一区二区三区在线| 国产区精品高清在线观看| 人妻少妇乱子伦精品无码专区毛片| 永久在线播放| 暴力调教一区二区三区| 手机在线看片不卡中文字幕| 综合色亚洲| 在线播放国产99re| 國產尤物AV尤物在線觀看| 91啪在线| 亚洲欧美日本国产综合在线| 国产精品无码影视久久久久久久| 天天色综网| 中文字幕人成人乱码亚洲电影| 欧美一区二区三区香蕉视| 免费亚洲成人| 日韩高清在线观看不卡一区二区 | 这里只有精品国产| 国产性猛交XXXX免费看| 国产精品区视频中文字幕| 亚洲美女视频一区| 中文成人在线| 在线视频97| 成人免费午间影院在线观看| 国产交换配偶在线视频| 日韩无码黄色网站| 亚洲v日韩v欧美在线观看| 国产精品视频导航| 97在线免费| 久草视频一区| 欧美翘臀一区二区三区| 欧美成人h精品网站| 免费中文字幕一级毛片| 污视频日本| 少妇露出福利视频| 毛片大全免费观看| www.av男人.com| 国产精品人成在线播放| 亚洲经典在线中文字幕| 亚洲第一页在线观看| 国产SUV精品一区二区6| 久久久精品国产亚洲AV日韩| 国产精品永久久久久| 午夜一区二区三区| 欧美另类一区| 成年人视频一区二区| 精品自拍视频在线观看| 久久国产乱子伦视频无卡顿| 久久精品娱乐亚洲领先| 日韩小视频网站hq| 亚洲天堂免费| 91精品亚洲| 久久精品无码专区免费| 在线观看国产精品日本不卡网| 青青青国产视频| 精品国产黑色丝袜高跟鞋| 国产69精品久久| 69综合网| 一本久道久久综合多人| 天天做天天爱天天爽综合区| 欧美成人国产| 国产欧美视频在线| 国产第一页免费浮力影院| 亚洲精品欧美重口| 一本色道久久88综合日韩精品| 亚洲高清中文字幕| 亚洲成av人无码综合在线观看| 国产中文在线亚洲精品官网| 精品无码国产一区二区三区AV| 99re视频在线|