999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

中藥網絡藥理學研究流程及代表性數據庫工具△

2021-08-05 09:41:30王鳳雪高宇劉海波
中國現代中藥 2021年6期
關鍵詞:中藥數據庫信息

王鳳雪,高宇,劉海波

中國醫學科學院 北京協和醫學院 藥用植物研究所,北京 100193

中藥是在傳統醫藥理論的指導下,經過加工炮制后應用于臨床的藥物,包括植物藥、動物藥和礦物藥。中藥在中國及日本、韓國等東亞和東南亞地區應用十分廣泛,在預防、治療疾病,養生等方面發揮著重要的作用。雖然中藥的應用廣泛,但由于其“多成分、多靶點”的作用特點,在分子水平上通過實驗手段闡明其作用機制仍存在很大的技術困難,這一情況嚴重阻礙了中藥的現代化研究進程。網絡藥理學方法的引入使這一困境得到了很大的改觀。網絡藥理學由英國藥理學家Hopkins于2007年提出,該學科以系統生物學思想和數據為基礎,通過網絡方法解析藥物、靶點和疾病之間的相互關系,根據分析結果研發和設計具有多種藥理學效應的藥物[1]。網絡藥理學屬于系統生物學、生物信息學和高通量組學分析的藥理學分支學科[2-4]。近年來,網絡藥理學被廣泛應用于中藥方劑及單體對疾病的藥理作用及其機制研究[5-7]、復方新適應證發現[8]和網絡毒理學研究[9]等。以“network pharmacology/網絡藥理學”為主題在PubMed和中國知網(CNKI)上進行檢索,近10年來關于網絡藥理學的文章發表情況見圖1。由圖1可以看出,網絡藥理學研究呈現逐年上升的趨勢。

圖1 近10年網絡藥理學相關文章發表情況

本文以網絡藥理學研究流程為基礎,重點介紹關于中藥化合物收集、化合物和疾病靶點預測、基因富集分析等技術環節的代表性數據庫,對各數據信息平臺的特點進行比較,為后續中藥網絡藥理學的研究提供參考。

1 中藥網絡藥理學研究一般流程

網絡藥理學通過構建網絡來解釋中藥多成分、多靶點的協同作用,經過多年發展,已經形成了一條基本的研究流程(圖2)。以研究中藥復方或單味藥的藥理作用和作用機制為例,其網絡藥理學研究的一般流程包括以下幾個技術環節:1)活性成分收集和篩選;2)活性成分作用靶點的預測;3)收集相關疾病的靶點群;4)將疾病靶點與化合物靶點進行整合,獲得復方或單味藥成分針對某種疾病的作用靶點信息;5)網絡構建和基因富集分析。為了確保數據的全面性和準確性,在每一環節,通常會在多個數據庫進行檢索,之后進行數據合并去重,在此基礎上,進行后續的研究。

2 中藥活性成分數據庫

除了少數礦物藥之外,絕大多數中藥含有多種化學成分,其中的活性化合物是治療疾病的主要因素。活性化合物與人體內靶點產生相互作用,從而產生治療疾病的效果。因此活性化合物的獲取作為中藥網絡藥理學的第一步,對于中藥作用機制研究具有重要意義。

2.1 中藥系統藥理學數據庫與分析平臺(TCMSP)

TCMSP(http://tcmspw.com/tcmsp.php)[10]是1個融合了藥物化學、藥動學、藥物-靶標-疾病網絡的藥理學平臺。該數據庫的資源整合了TTD、PharmGKB[11]及PubChem[12]數據庫的相關信息,包括化學成分、靶點和藥物靶點網絡。截至2014年,TCMSP收集了《中華人民共和國藥典》(以下簡稱《中國藥典》)2010年版中的499味植物藥及每味中藥的化學成分(29 000余個)。該數據庫最大的特點是針對每個化合物提供了較全面的人體吸收、分布、代謝、排泄(ADME)評價數據,涉及口服生物利用度[13]、藥物相似度[14]、腸上皮細胞通透性、血腦屏障、水溶性等天然化合物的藥動學特性,同時提供了潛在活性分子的靶標及其疾病信息。因此,用戶可以選擇具有良好藥物相似性和ADME性質的化合物進行進一步研究。

2.2 中醫藥整合藥理學研究平臺(TCMIP)

TCMIP v2.0(http://www.tcmip.cn/TCMIP/index. php/Home/Login/login.html)[15]是以中醫藥百科全書在線數據庫(ETCM)為數據資源,采用人工智能和數據挖掘等方法構建的關于中藥材、中藥方劑、中藥成分、成分靶點和疾病的數據庫,包含402種中藥、3959種方劑和7284種中藥成分。對每一味中藥的信息都有詳細的記載,包括性味歸經、涉及的靶點和疾病、成分及成分對應的靶點等信息。TCMIP數據庫對中藥成分也進行了詳細的記載,包括化合物的結構,相對分子質量,藥物的吸收、分布、代謝、排泄和毒性(ADMET)和相關參考文獻等信息,同時可以鏈接到PubChem和ChEMBL數據庫。

圖2 中藥網絡藥理學研究的一般流程

2.3 BATMAN-TCM

BATMAN-TCM(Bioinformatics Analysis Tool for Molecular Mechanism of Traditional Chinese Medicine,http://bionet.ncpsb.org/batman-tcm/)數據庫[16]基于TCMID數據庫中的方劑-中藥-成分關聯數據,已知的藥物/成分靶點來自DrugBank、京都基因與基因組百科全書(KEGG)和TTD數據庫,用戶可以提交中藥的拼音名稱、英文名稱或拉丁文名稱,獲得每味中藥的化學成分及成分的潛在靶點,并可以獲得對這些靶點的功能分析結果,包括基因本體(GO)、KEGG通路及OMIM/TTD疾病富集分析結果。除此以外,也允許用戶同時輸入多個中藥方劑/中藥/化合物列表進行比較或組合分析,幫助用戶通過分子和整體的水平了解中藥。

2.4 TCM Database@Taiwan

TCM Database@Taiwan(http://tcm.cmu.edu. tw/)數據庫[17]是目前世界上最大的非商業中藥小分子數據庫,包含來自453種不同草藥、動物和礦物中藥配方的20 000種成分。數據庫中每個純化合物的cdx(2D)和Tripos mol2(3D)格式可供下載和虛擬篩選。中藥成分的二維和三維結構由ChemBioOffice 2008構建,并利用ChemBioOffice計算了其物理化學性質,包括脂水分配系數和極性表面積。

2.5 TCMID

TCMID(Traditional Chinese Medicine Integrated Database,http://www.megabionet.org /tcmid/)數據庫[18-19]包括6個數據領域,即復方、草藥、組分、靶點、藥物和疾病。數據庫信息是通過文獻挖掘和引用其他數據庫信息匯集而來,化學成分信息由TCM Database @Taiwan及《中藥百科全書》獲得。數據庫通過將中藥組分和疾病數據庫(如DrugBank、OMIM和PubChem等)相鏈接的方式將藥物組分信息與疾病建立聯系。

網絡藥理學研究中常用的中藥活性成分數據庫及其特點見表1。

表1 網絡藥理學研究中常用的中藥活性成分數據庫特點

3 化合物靶點預測數據庫

化合物的靶點信息由藥理實驗和計算預測2方面來源構成。由于高通量篩選技術的發展,天然產物藥理活性數據總量大幅度增加,并由PubChem等數據庫收集,較容易獲取。雖然有假陽性數據存在,但這類數據總體上可靠性較高。但是,實驗方法無法提供全面的藥理活性檢測,通過計算預測方法可以彌補實驗的不足,基于化合物的結構信息,通過分子對接、定量構效分析或者藥效團等方法,可以預測化合物的活性。不同類型的數據庫對上述2種類型的活性數據側重點有所不同。

3.1 STITCH

STITCH(Search Tool for Interactions of Chemical,http://stitch.embl.de/)數據庫[20-21]包含已知的和預測的化學組分與蛋白的相互關系信息,這些關系包括直接的(物理作用的)和間接的(功能的)聯系。STITCH數據庫信息豐富,由39萬種小分子和260萬種蛋白的相互關系組成。該數據庫的最大優勢是海量數據和結構相似性的可比較功能。可以通過輸入組分的化學分子結構,確定分子結構相似的化學組分。這些相似結構的化學組分的靶點可以考慮是待確定的化學組分的推定靶點。STITCH數據庫的數據來源為計算機預測、物種間的知識轉換、其他數據庫的整合及文本發掘。

3.2 TTD

TTD(Therapeutic Target Database,http://db.idrblab.net/ttd/)數據庫[22]可提供有關藥物、靶點、疾病和通路的信息,目前的版本更新于2019年11月,收集了37 316個藥物,其中包括2649個準許藥物、9465個臨床試驗藥物、5059個專利藥物及20 143個實驗藥物,共對應3419個靶點。用戶可以通過靶點、藥物、疾病和生物標志物搜索數據庫,也可以使用藥物相似性搜索工具預測沒有靶點信息的化合物的靶點。相似性搜索基于Tanimoto相似性搜索方法。查詢化合物可以通過其MOL、SDF或SMILES格式輸入,然后該工具列出其類似化合物和相應的Tanimoto相似性分數。具有最高得分的化合物的靶點可以被預測為查詢化合物的靶點。

3.3 SEA

SEA(Similarity Ensemble Approach,http://sea.bkslab.org/)數據庫[23]根據蛋白質配體的化學相似性,對蛋白質進行定量分組和關聯,65 000個配體被注釋成一系列的藥物靶點。利用配體拓撲結構計算各組間的相似度,根據化學相似性映射藥理學的相似性。對于單個化合物,用戶可以通過化合物的SMILES碼進行檢索;對于多個化合物,可以通過ZINC ID或SMILES碼進行檢索,結果會根據相似度(MaxTC)和P值進行排序,用戶可以免費下載檢索結果進行后續的研究[24]。

3.4 SwissTargetPrediction

SwissTargetPrediction(http://www.swisstargetpr ediction. ch/)數據庫基于結構相似原理,通過反向篩選預測小分子的蛋白質靶標[25-26]。利用該數據庫可在已知靶點的大約370 000個活性化合物中找出與查詢的化合物最相似的分子。SwissTargetPrediction模型是通過對已知活性物質的各種大小相關子集進行多重邏輯回歸擬合來訓練的。在逆向篩選中,Combined-Score可以計算出任何查詢的分子,假定其具有生物活性,那么就可以計算出這個分子針對特定蛋白質的概率。Combined-Score>0.5,則預測這些分子很可能具有共同的蛋白質靶點。由于分子的二維和三維描述是互補的,這種基于配體的雙重評分的反向篩選,在預測各種測試集中的大分子靶點方面表現出了較高的性能。

3.5 ChEMBL

ChEMBL(https://www.ebi.ac.uk/chembl/)數據庫[27-28]為在線的免費數據庫,靶點及化合物的生物活性數據來源于大量文獻,數據可靠并能查到數據來源。目前,該數據庫共收集了13 377個靶點、200多萬個化合物、超過1500萬條生物活性信息。用戶可以通過SMILES碼、名稱、分子結構及序列等快速查詢到某個靶點或化合物的信息,也可以查詢某個化合物在哪些靶點上進行過生物活性測試并得到相關數據。

靶點預測的準確性在整個研究的過程中起著至關重要的作用,靶點預測的準確性越高,后續研究才越可靠。網絡藥理學研究中常用的化合物靶點預測數據庫及其特點見表2。

表2 網絡藥理學研究中常用的化合物靶點預測數據庫特點

4 疾病靶點相關數據庫

疾病的發生受到基因、生活方式和環境等多種因素的影響,尋找到與疾病相關的靶點蛋白,有助于對疾病進行更有效的治療。因此,為了更好地研究和治療疾病,出現了許多關于疾病相關蛋白的數據庫。

4.1 GeneCards

GeneCards(https://www.genecards.org/)數據庫[29]是一個綜合數據庫,提供了關于所有注釋和預測的人類基因的全面、用戶友好型信息。該數據庫自動整合了約150個網絡來源的以基因為中心的數據,包括基因組、轉錄組、蛋白組、遺傳、臨床和功能信息。基因名稱包含官方名和別名。GeneCards還整合了其他網絡數據庫對基因的描述。

4.2 OMIM

OMIM(Online Mendelian Inheritance in Man,https://omim.org/)在線數據庫[30]于1985年創建,是一個不斷更新的人類孟德爾遺傳病的數據庫。OMIM數據庫包含了已知的遺傳病和超過15 000個基因的信息,是關于人類基因和遺傳表型關系的權威數據庫。每個OMIM條目都有一個基因確定的表型和/或基因的全文摘要,并有許多鏈接到其他基因數據庫。OMIM為免費的數據庫,而且可以及時將更新的信息通知用戶。

4.3 DisGeNET

DisGeNET(https://www.disgenet.org/)數據庫[31]包含了疾病與關聯基因和突變位點的信息。最初在2010年作為一個Cytoscape插件出現[32],在過去的幾年里,DisGeNET已經發展成不同的格式和工具,可以通過一系列生物信息學工具使用數據庫,如web接口、Cytoscape應用程序、RDF SPARQL終端、R包和編寫的腳本等。目前,DisGeNET(v6.0)包含628 685個基因-疾病關聯(GDAs),即17 549個基因與24 166種疾病、失調、性狀、臨床或異常人類表型之間的關聯,以及210 498個變異-疾病關聯(VDAs),即117 337個變異與10 358種疾病、性狀和表型之間的關聯。

4.4 NCBI-gene

NCBI-gene數據庫是NCBI數據庫中一個用于檢索不同物種基因信息的數據庫。用戶可以通過基因名、文獻的PMID或疾病名稱進行檢索。對于每個基因,NCBI-gene都有詳細的記載,包括別名、其他數據庫的相關鏈接、在DNA上的位置、上下游基因、參考文獻和相關的疾病信息等多種詳細的信息。用戶可以對檢索結果進行二次篩選得到需要的信息,可以將數據免費下載到本地。

疾病靶點數據庫數量很多,網絡藥理學研究中常用的疾病靶點數據庫及其特點見表3。

表3 網絡藥理學研究中常用的疾病靶點數據庫特點

5 基因富集分析數據庫

基因富集分析是指對靶蛋白進行功能富集分析和信號通路分析。基因富集分析是網絡藥理學研究中一個重要的環節,將富集到的生物功能和信號通路與疾病和活性化合物聯系起來,按照中藥-活性化合物-靶點/通路-疾病的主線闡明中藥治療疾病的機制。

5.1 DAVID

DAVID(https://david.ncifcrf.gov/tools.jsp)數據庫[33-34]是一個全面的功能注釋工具,上傳基因或蛋白列表后,使用DAVID的功能注釋工具對基因進行注釋。該工具從生物途徑、GO、蛋白質-蛋白質相互作用(PPI)、疾病關聯和文獻等方面為基因提供了豐富的分析。DAVID功能注釋聚類工具基于不同注釋項中基因的共同關聯,可以將相似、冗余、異構的注釋項分組成注釋組。

5.2 KEGG

KEGG(https://www.genome.jp/kegg/)數據庫[35]是一個綜合性的網站,每日更新,并向用戶免費提供信息。KEGG通過對生物學過程進行計算機化處理,構建模塊并繪制圖表,從而對基因的功能進行系統化的分析。KEGG由系統信息、基因組信息和化學信息3類數據庫組成,可細分為pathway、disease、module等18個主要的數據庫。其中,應用最為廣泛的KEGG pathway數據庫是通過KEGG pathway mapping(一種基因組富集分析),作為用戶數據集生物解讀的參考知識庫[36]。KEGG的顯著特點就是具有強大的圖形功能,利用圖形而不是文字來介紹代謝途徑及各通路之間的關系,這樣可以使研究者能夠對其所要研究的代謝途徑有直觀全面的了解。

5.3 GO

GO(Gene Ontology,http://geneontology.org/)數據庫[37-38]是目前世界上最大的基因功能信息資源。GO的注釋針對基因產物,即1個基因編碼的RNA或蛋白產物,1個基因可以編碼不同性質的產物。GO從3個方面描述基因產物,即生物過程、細胞成分和分子功能[39]。生物過程是指基因或基因產物參與的生物目標;細胞成分是指細胞中基因產物活躍的地方;分子功能是指基因產物的生化活性(包括與配體或結構的特異性結合)。GO具有很廣闊的應用前景,可以用來整合不同生物的基因信息、預測與疾病的相關基因和判斷蛋白結構域的功能等領域。

5.4 Reactome

Reactome(https://reactome.org/)數據庫[40-42]提供信號轉導、運輸、DNA復制、代謝和其他細胞過程的分子細節,目前覆蓋了10 908個蛋白、2362條人類通路和12 986條生物反應等信息,其中通路可分為26種描述正常細胞功能的途徑(如免疫系統、代謝和自噬等)。Reactome數據庫可以將導入的一系列基因按照生物功能的不同生成煙花狀的有向無循環圖,同時可以比較物種間的通路差異,有助于幫助研究者更好地理解通路的作用方式。

5.5 STRING

STRING(https://string-db.org/)數據庫[43-44]主要用于研究PPI網絡。相比于其他PPI數據庫,STRING數據庫覆蓋的信息更多、更全面,目前的版本是11.0,更新于2019年1月19日,涵蓋了5090個物種、2400多萬種蛋白、超過30億個PPI關系。STRING數據庫可以通過蛋白名稱、蛋白序列等多種格式進行檢索,目前的版本還增加了根據蛋白質的差異倍數、對數值或豐度值等進行功能富集分析的模塊。對于單個蛋白,STRING會給出能與該蛋白具有相互作用的蛋白構成的網絡圖,用于挖掘單個蛋白與其他蛋白的相互作用;對于多個蛋白,會得到輸入蛋白間的相互作用圖,用于挖掘多個蛋白的相互作用。同時STRING數據庫也提供了PPI網絡中蛋白的GO和KEGG富集分析的結果。

5.6 Enrichr

Enrichr(http://amp.pharm.mssm.edu/Enrichr/)數據庫[45-46]是一個綜合的基因集合資源,目前共包含102個基因集庫中180 184個帶注釋的基因集。Enrichr檢索結果將多個數據庫進行比較,如ChEA、OMIM、DisGeNET等。Enrichr包括提交模糊集、上傳BED文件、改進的應用程序編程界面及將結果可視化為聚類圖等功能。除了常用的富集分析,還可展示表觀修飾、轉錄因子結合以及疾病和不同細胞類型中的表達。

由于單個基因的研究已經不能滿足研究的需要,研究人員希望通過多個基因發現在生物學過程中起關鍵作用的生物通路,從而揭示生物學過程的分子機制,因此出現了富集分析方法。網絡藥理學研究中常用的基因富集分析數據庫及其特點見表4。

表4 網絡藥理學研究中常用的基因富集分析數據庫特點

6 討論

中醫藥通過辨證論治,從整體水平上對人體機體功能進行調節,從而達到維護機體平衡、治療疾病的目的。由于中藥具有整體性、復雜性的特點,因此對其藥效物質基礎和作用機制的深入研究與化學藥物相比具有較大差異。現有的適用于化學藥的研究方法多以分析思想為主導,這套方法學應用于中藥研究,雖然能發現一些高活性天然產物,但仍不能滿足全面闡釋中藥對人體的系統調節作用的要求。對于復雜體系的研究一直是現代科學技術發展比較緩慢的領域,這種情況長期制約著中藥學的快速發展。系統生物學和網絡藥理學的產生對突破這一瓶頸帶來了希望。

網絡藥理學為中藥研究者提供了系統了解中藥作用機制的新視角。網絡藥理學將傳統化學藥“一藥一靶”的研究思路拓展成為“一藥多靶”和“多成分-多靶標”的研究模式,因此非常適合解決中藥“多成分、多靶點、多途徑”的問題。網絡藥理學可以在分子水平上解釋中藥單味藥及復方的作用機制,因此在中藥藥物發現[47]、毒理學研究[9,48]和中藥配伍規律[49-50]等研究中取得了諸多研究成果,極大地推動了中藥的研究。

網絡藥理學研究方法的實現,必須要有海量的植物化學、藥物化學和系統生物學數據作為支撐。數據量之大,無法通過手工方法處理。因此,必須引入信息學技術和專業軟件,并配合開放數據資源才能實現。其中,信息學相關技術早在20年前就已趨于成熟。而開放數據資源是網絡藥理學發展的最后一塊短板,長期以來一直存在數據質量不高、數據量少、數據孤島等問題,直至最近5年才逐步得到改善。

目前,中藥資源、天然產物、靶點預測和基因富集相關的各種數據庫和信息平臺迅速增加,各信息平臺均有自身的特點和優勢,將這些數據資源介紹給中藥研究人員,幫助研究人員根據自身的需求合理選擇最佳的數據資源,是非常必要的工作。本文對中藥網絡藥理學研究可用的網絡數據資源進行梳理,為研究者正確有效地利用各類開放數據資源提供參考,以促進中藥網絡藥理學方法的推廣。

猜你喜歡
中藥數據庫信息
中藥久煎不能代替二次煎煮
中老年保健(2021年4期)2021-12-01 11:19:40
您知道嗎,沉香也是一味中藥
中老年保健(2021年4期)2021-08-22 07:08:32
中醫,不僅僅有中藥
金橋(2020年7期)2020-08-13 03:07:00
中藥貼敷治療足跟痛
基層中醫藥(2018年6期)2018-08-29 01:20:20
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
主站蜘蛛池模板: 中文字幕av无码不卡免费| 日本精品影院| 日韩成人在线视频| 国产福利免费视频| 亚洲一本大道在线| 一级片免费网站| 五月天久久综合| 青青青亚洲精品国产| 91九色国产porny| 国产精品一线天| 亚洲娇小与黑人巨大交| 97se亚洲综合不卡| 亚洲欧洲日产国产无码AV| 青青草原偷拍视频| 亚洲精品欧美重口| 国产中文在线亚洲精品官网| 少妇精品在线| 91福利在线看| 亚洲国产综合第一精品小说| 欧美成人午夜视频免看| 免费a在线观看播放| 天堂成人在线| 亚洲精品第五页| 亚洲成人黄色在线| 亚洲视屏在线观看| 亚洲国产成人在线| 综合五月天网| 亚洲精品视频免费| 国产精品亚洲αv天堂无码| 国产网站在线看| a级毛片网| 都市激情亚洲综合久久| 欧美激情福利| 美女无遮挡免费网站| 国产成人亚洲精品无码电影| 中国国产高清免费AV片| 国产在线专区| 亚洲欧美日韩另类| 2020国产精品视频| 久久国产精品夜色| 精品自窥自偷在线看| 中文字幕免费播放| 91亚洲视频下载| 久久久久免费精品国产| 伊在人亚洲香蕉精品播放| 免费高清a毛片| 亚洲第一黄片大全| 又大又硬又爽免费视频| 日韩美女福利视频| 成人免费午夜视频| 亚洲侵犯无码网址在线观看| 亚洲日韩国产精品综合在线观看| 另类欧美日韩| 久草视频精品| 国产在线观看成人91| 操美女免费网站| 久久国产拍爱| 99re在线免费视频| 免费三A级毛片视频| 亚洲综合香蕉| 亚洲国产黄色| 国产精品久久久久久久久久久久| 十八禁美女裸体网站| 国产一级小视频| P尤物久久99国产综合精品| 国产欧美高清| 潮喷在线无码白浆| 精品一区二区三区自慰喷水| 全午夜免费一级毛片| 日本不卡在线| 刘亦菲一区二区在线观看| 欧美色香蕉| 成人在线综合| 免费看黄片一区二区三区| 91免费国产高清观看| 欧美成人午夜视频| 综合久久五月天| 国产精品久久久免费视频| 日韩天堂在线观看| 人人爱天天做夜夜爽| 国产精品欧美激情| 中国丰满人妻无码束缚啪啪|