999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

文本挖掘在藥物靶位研究中的應用

2017-03-21 10:49:46
中華醫學圖書情報雜志 2017年3期
關鍵詞:數據庫文本信息

現代新藥開發與研究的關鍵,首先是尋找和篩選藥物靶位(drug target)。藥物靶位是指機體內具有藥效功能并且能被藥物作用的生物大分子物質,如某些蛋白質和核酸等。文本挖掘是目前發現潛在藥物靶位的新興手段之一,目前大多數文章都是通過定性和舉例來闡述文本挖掘技術在藥物靶位領域的研究成果。本文通過構建詞篇矩陣等數學模型,以聚類方式更加直觀和科學地定量闡述了自1999-2015年該領域的發展情況,希望對相關領域的研究人員選擇參考文獻和研究方向有所幫助。

1 資料來源與方法

首先對該領域高被引論文進行同被引聚類分析。按照圖1所示流程,以((TS=drug target*) OR (TS=drug delivery system)) AND (TS=text mining))為檢索式在Web of Science中SCI核心文獻集進行檢索,共下載88篇相關文獻,里面包含了4 415篇參考文獻。

圖1 利用文本挖掘技術進行藥物靶位研究進展的定量分析流程

利用書目共現分析系統(Bibliographic Item Co-Occurrence Matrix Builder2.01, BICOMB2.01)對參考文獻被引頻次進行統計后,將被引頻次高于5次的文獻作為高被引論文,使用gCLUTO聚類軟件對高被引論文進行同被引聚類分析,得到5個類別(圖2)

綜合評估文獻數量和同類文獻的緊密程度,對高被引論文的標題和摘要進行了人工分析和歸納(表1),總結出自1999-2015年該領域的研究狀況,并就每類文獻語義內容進行了分析和梳理。

圖2 高被引論文聚類分析結果

表1 高被引論文聚類結果

(續表1)

2 結果與分析

結合軟件輸出內容,我們將各類別按照學科領域的知識體系重新排列,將文本挖掘在藥物靶位研究中的應用分成總體趨勢、理論基礎、主要方法和主要資源4個方面,具體內容如下。

2.1 當前藥物靶位研究的總體趨勢

綜合分析cluster 0后,發現當前藥物靶位研究有兩個明顯的趨勢:一是通過新藥檢測分析抗腫瘤藥的相關靶位,即將各種化學物質與標準的腫瘤治療藥物放在一起,通過它們之間的聯系進行靶位挖掘;二是多學科結合,通過計算機和專家配合進行藥物研究[2]。Yoo Kyung Jeong等人使用第一種途徑,結合PubMed和ClinicalTrials數據庫中的抗腫瘤藥物相關文獻進行綜合分析,發現不同的化學物質和標準治療藥物放在一起時,可以發現新的藥物靶位[1]。該方法很大程度上節約了藥物研究的成本和降低了開發的風險。

2.2 文本挖掘預測藥物靶位的理論基礎

基于cluster 1中Predicting new molecular targets for known drugs(預測已知藥物的新分子靶位)[3]和Drug target identification using side-effect similarity(基于藥物副作用相似性的靶位識別)[4]兩篇高被引文獻的關注方向,總結出利用文本挖掘預測藥物靶位有兩種常用的方法:一是通過化學結構相似性進行預測,二是通過藥物副作用相似性進行靶位識別。如Fechete, R等人研究糖尿病腎病的分子途徑、生物標記物和識別藥物靶位時,就基于第一種理論基礎進行了深入研究。他們構建了人類相關蛋白、基因的結構相似性網絡,分析后得出了約1 000個基因與糖尿病腎病病理和臨床特征相關[17]。

2.3 利用文本挖掘技術預測藥物靶位的主要方法

針對cluster 2分析后,我們發現網絡分析是預測藥物靶位的主要方法,通過網絡的構建可以更加清晰、有效地揭示藥物靶位和致病基因間可能存在的聯系,從而預測新的藥物靶位,為進一步靶向治療提供理論支持。其中,網絡藥理學(Network pharmacology)是常用的藥物發掘范式,多用于尋找新的藥物靶位和發掘相應藥物結構、活性間的關系。也可用于保持藥物屬性前提下新主導范式的構建,進而實現藥物的概念性設計[5]。在人類疾病研究過程中,人類疾病網絡常用于挖掘疾病和基因間的潛在聯系[7]。同時,網絡分析依賴于一些平臺提供的數據,如化合物-蛋白質交互平臺STITCH[8]中提供的超過30,000個小分子化合物和來自近1 133個物種的260萬個蛋白質之間的相互作用的數據,就可用于交互式檢索或大規模數據分析。Vazquez等人開發了可用于研究藥物毒性和蛋白-疾病-化合物網絡分析的程序[18],使網絡分析更加智能化和高效化。

2.4 文本挖掘在藥物靶位研究領域主要利用的資源

2.4.1 常用數據庫

在cluster 3 中,我們總結出兩個研究常用的數據庫Drugbank和OMIM。其中Drugbank是藥物學領域十分重要的數據庫,提供了豐富的生物學信息和化學信息、藥物數據(如藥理和制藥信息)與藥物靶位(即序列、結構和通路)的詳細信息,包含有8 206條藥物條目(涵蓋了美國食品和藥物管理局批準的小分子藥物、生物技術藥品(如蛋白質/肽)、保健品和超過6 000個實驗藥物)[19]。

人類孟德爾遺傳數據庫OMIM(網絡版)是一個關于人類基因和遺傳變異的數據庫,主要著眼于人類遺傳疾病[12]。包括了文本信息和相關參考信息、序列紀錄、圖譜,提供了相關數據庫的跨庫檢索功能,內容上涵蓋了已知的遺傳病、相應遺傳基因及其決定的性狀。除了簡略描述各種疾病的臨床特征、鑒別診斷、治療與預防外,還提供了已知的相關致病基因的連鎖關系、染色體定位、組成結構、功能和一些實驗動物模型的數據。其中以OMIM數據庫、基因圖譜、OMIM 疾病基因圖譜利用最為廣泛。蛋白質-蛋白質相互作用的信息,可用來研究癌癥的體細胞突變、遺傳重疊現象和預測癌癥的高風險位點。

2.4.2 重要軟件工具

經過對cluster 4中文獻標題、摘要的總結,得出常用的軟件工具主要有Cytoscape[13],Pharmspresso[14],RelEx[16],SuperTarget and Matador[15]。Cytoscape用于構建生物分子相互作用的網絡模型,它能將生物分子的相互作用圖形化顯示并進行分析和編輯,多用于研究基因表達、DNA損傷、基因關聯性等[13];Pharmspresso是一個提取藥物基因組學概念和關系的文本挖掘工具,可協助識別重要的藥物基因組學概念等相關信息,側重于基因組學概念的命名體識別和抽取[14];一站式數據倉庫SuperTarget集成了藥品相關的醫療信息,包括藥物副作用、藥物代謝通路和藥物靶位、臨床指征等,方便了研究者進行查詢;Matador是一個蛋白-化學物資源交互平臺。相比之下,DrugBank通常只包含蛋白質或藥物相互作用的主要模式,而Matador則包含盡可能多的蛋白、藥物間直接和間接的交互信息。例如,在探究一個藥物代謝物和基因表達之間的關系時,利用Matador中相應的交互信息可以將盡可能多的相關研究對象組合在一起進行討論[15]。

3 討論

隨著算法和技術的不斷發展,文本挖掘技術在藥物靶位領域的應用也更加廣泛和深入。結合高被引論文的最新引用文獻,我們對上述研究領域的未來可能發展方向進行如下預測。

藥物研究在未來可能趨向于利用整合后的臨床試驗數據和現有軟件處理后的二次信息,即通過多個軟件的相互結合來抽取更加貼切的信息集。例如,實驗人員利用臨床試驗數據結合文本挖掘,對激酶抑制劑的不良事件進行預測,通過挖掘抑制效力不同的多個激酶和人類疾病間潛在聯系,從而為臨床診療做出一定指導[20]。

目前藥物靶位挖掘主要使用網絡分析的方法。未來研究主要有3個可能發展方向:一是通過分子分類來探索潛在藥物靶位[21];二是根據蛋白可以直接或間接影響藥物間相互作用的理論基礎,探索脫靶藥物和其下游藥物的反應[22]以及它們之間的潛在聯系,這可能成為個性化醫療發展的又一新方向;三是將文本挖掘的信息與化學結構信息進行整合,實現全面的可視化表達。如通過由高到低的分子建模來搭建分子相互作用框架,以此來揭示信號分子、代謝通路的層次結構,從而獲得新的范式[23],或是構建藥物靶位圖譜,使人類疾病的潛在靶位得以更加直觀和準確的呈現[24]。

我們推測今后幾年數據庫的數據優化也將成為研究者關注的一大方向,人們將更加致力于提高數據的質量、降低噪音。DrugBank數據庫中提供了藥物/化學數據、藥物靶位和蛋白質數據的字段檢索,近年又添加了許多新的數據字段,如食物-藥物相互作用、藥物之間的相互作用等[9],未來也將不斷更新數據庫中的字段以滿足研究需要。

藥物靶位挖掘的研究工具的開發也將隨著學科發展逐步細化。當前研究分析主要依賴于一些平臺提供的數據,如STITCH就是一個典型的用于檢索化合物-蛋白質交互關系的平臺[8];接下來更多具有針對性的工具和平臺將應用于藥物靶位領域,如專門針對腸道藥物[25]或者針對于心臟疾病藥物的靶位預測工具。此外,將有更多科學家致力于開發用于臨床藥物-基因相互作用的軟件[26],以滿足臨床工作者進行精準治療的需求。

4 結論

當前該領域的研究主要以藥物靶位間化學結構相似性和副作用相似性作為理論基礎,通過復雜網絡分析的方法,結合大量藥物數據資源來進行靶位預測。研究人員主要利用Cytoscape[13]、Pharmspresso[14]、RelEx[16]、SuperTarget and Matador[15]幾個軟件,以DrugBank、OMIM為主要數據來源進行潛在藥物靶位的發掘。

通過分析推測該領域未來的發展方向將文本挖掘的結果與臨床實踐相互結合,綜合利用各類挖掘軟件工具,通過范式、網絡的可視化分析,對相應藥理實驗結果做出合理解釋,預測潛在的藥物靶位,為藥物研制提供指導性意見,切實為藥物生物學和臨床醫學提供幫助,以真正推動精準醫療的進一步發展。

猜你喜歡
數據庫文本信息
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 综合亚洲网| 狠狠久久综合伊人不卡| 精品伊人久久久香线蕉| 99九九成人免费视频精品| 亚洲国产成人无码AV在线影院L| 老司国产精品视频91| 国产成人综合日韩精品无码首页| a级毛片在线免费观看| 国产精品手机在线观看你懂的 | 国产亚洲欧美另类一区二区| 国产污视频在线观看| 无码免费的亚洲视频| 亚洲精品视频免费观看| 中文字幕一区二区视频| 国模视频一区二区| 国内a级毛片| 亚洲成肉网| 久久大香伊蕉在人线观看热2| 精品国产美女福到在线直播| 亚洲一区二区黄色| 91美女视频在线| 一级毛片免费高清视频| 在线观看亚洲国产| 亚洲综合极品香蕉久久网| 亚洲欧美日韩中文字幕在线一区| 亚洲天堂视频在线观看| 亚洲精品国产首次亮相| 91亚洲视频下载| 久久综合色天堂av| 在线无码私拍| 免费高清a毛片| 国内精品伊人久久久久7777人| 国产精品网拍在线| 中文字幕无线码一区| 亚洲婷婷在线视频| 人妻夜夜爽天天爽| 91人妻日韩人妻无码专区精品| 伊在人亚洲香蕉精品播放| 亚洲精品无码AV电影在线播放| 国产后式a一视频| 亚洲AⅤ综合在线欧美一区| 免费观看精品视频999| 看国产一级毛片| 亚洲AV无码乱码在线观看代蜜桃| 久久免费精品琪琪| 亚洲无线一二三四区男男| 成人午夜视频免费看欧美| 2021国产精品自拍| 亚洲中文在线看视频一区| 国产美女一级毛片| 2022国产无码在线| 大香伊人久久| 香蕉伊思人视频| 亚洲 欧美 日韩综合一区| 久久久久久午夜精品| 999精品色在线观看| 国产精品免费电影| 亚洲欧美色中文字幕| 精品国产自在在线在线观看| 国产亚洲精品91| 欧美日韩第二页| 日韩国产高清无码| 99视频全部免费| 国产成本人片免费a∨短片| 日韩在线播放欧美字幕| 亚洲精品成人福利在线电影| 亚洲第一国产综合| 免费毛片视频| 久久一色本道亚洲| 国产精品欧美激情| 伊人色在线视频| 91成人免费观看| 亚洲欧洲自拍拍偷午夜色| 欧美日韩免费| 欧美精品影院| 天堂在线www网亚洲| 伊人久久精品亚洲午夜| 一级毛片在线播放| 久久伊人久久亚洲综合| 国产成人亚洲精品蜜芽影院| 免费a级毛片视频| 国产激情无码一区二区APP|