劉方舟 楊 陽 李 萌 杜 昱 張一穎 李逸豪 王 靜 李園白
(中國中醫科學院中醫藥信息研究所,北京,100700)
當歸來源于傘形科當歸屬植物Angelicasinensis(Oliv.)Diels的干燥根[1],又名干歸、馬尾歸、秦哪、秦歸、云歸、馬尾當歸、岷歸等,是中醫臨床最常用的中藥之一,素有“十方九歸”的說法,始載于《神農本草經》,被譽為“血家之圣藥”[2]。當歸廣泛分布于甘肅、四川、陜西、湖北等地[3]。當歸藥材主要有效成分包括揮發油類、有機酸類、多糖、核苷類、腦苷類、氨基酸等多種類型的化合物,由復雜成分體系構成[4]。不同產地當歸藥材所含化合物含量高低各異,而不同化合物可通過多靶點、多途徑對機體綜合調控,進而發揮不同的藥理作用。
課題組前期相關研究成果表明,甘肅產區當歸(以下稱:隴產當歸)中含有高含量揮發油類成分,即該類成分的含量與其他產區比較差異有統計學意義(P<0.05)[5]。當歸揮發油作為當歸的主要藥效成分之一,其組分十分復雜,主要含有藁本內酯、正丁烯內酯、當歸酮等多種成分,具有廣泛的藥理活性[6]。近年來,當歸揮發油在心血管系統、消化系統、呼吸系統、腦神經系統和抗腫瘤方面的相關研究成果不斷涌現[7]。本研究運用網絡藥理學方法探尋隴產當歸的特征性高含量化學成分群-揮發油類成分作用的關鍵靶點和信號通路,預測相關疾病并構建成分-靶點-疾病網絡,為隴產當歸揮發油類成分的藥理作用機制研究提供依據[8-9]。
1.1 軟件與數據庫 應用中藥系統藥理學數據庫與分析平臺(Traditional Chinese Medicine Systems Pharmacology Database and Analysis Platform,TCMSP,http://lsp.nwsuaf.edu.cn/tcmsp.php)、UniProt數據庫(http://www.uniprot.org/)、Pubchem數據庫(https://pubchem.ncbi.nlm.nih.gov/)、STITCH數據庫(http://stitch.embl.de/)、Swiss數據庫(http://www.swisstargetprediction.ch/index.php)、Omicshare數據平臺(https://www.omicshare.com/tools/)、ctd數據庫(Comparative Toxicogenomics Database,http://ctdbase.org/)、Cytoscape 3.7.0軟件。
1.2 獲取化學成分與ADME參數 本研究基于前期實驗結果,針對隴產當歸開展研究,選取其特征性高含量化學成分群藁本內酯(Ligustilide)、正丁基苯酞(3-n-Butylphthalide)、正丁烯基苯酞(3-Butylidenephthalide)作為目標成分,并借助TCMSP獲取目標成分的吸收、分布、代謝、排泄(ADME)參數[10]。
1.3 化學成分潛在靶點預測與篩選 Pubchem數據庫獲取化合物Ligustilide、3-n-Butylphthalide和3-Butylidenephthalide的SMILES格式文件[11],并將其上傳至STITCH數據庫和Swiss數據庫,靶點種類設置為Homo sapiens,獲取靶點后利用UniProt數據庫的UniProtKB功能,設置限定物種Human,輸入靶點名稱以獲取對應基因名稱并進行蛋白名稱矯正,最終得到各化合物相關靶點(Target)、基因(Gene)名稱、UniProt ID、匹配概率(Probability)等結果。
1.4 成分-靶點-疾病網絡構建 Cytoscape 3.7.0軟件構建隴產當歸特征性高含量化學成分群Ligustilide、3-n-Butylphthalide和3-Butylidenephthalide的相關“目標成分-靶點”網絡;將目標成分相關靶點導入CTD數據庫預測相關疾病,選取基因頻數(Annotated Genes Quantity)≥10的疾病,構建“靶點-疾病”網絡。運用Cytoscape-Merge功能合并“目標成分-靶點”與“靶點-疾病”網絡,構建“目標成分-靶點-疾病”網絡,以目標成分、靶點蛋白和疾病為3類節點(Node),節點間相互關系用邊(Edge)表示。再運用Cytoscape-Network Analyzer功能進行網絡拓撲分析,以度(Degree)值反映節點大小,以邊介數(Betweenness)反映邊的粗細。
1.5 基因本體(Gene Ontology,GO)富集分析和京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析 利用UniProt數據庫中Retrieve/ID mapping功能,將所得靶點名稱UniProt ID轉換為Ensembl格式,并以Ensembl基因名形式將活性成分的相關靶點基因列表導入Omicshare數據平臺,進行GO富集分析以預測靶點的功能分布,物種勾選“Homo sapiens genes”,對生物過程(Biological Process)、分子功能(Molecular Function)、細胞組分(Cellular Component)進行全面富集分析,設置P值<0.01;以標準基因名形式將靶點基因導入CTD數據庫,進行通路富集分析,設置P值<0.01,分析結果用以挖掘隴產當歸特征性高含量成分群多維藥理作用機制。
2.1 預測目標成分靶點 本研究選取藁本內酯、正丁基苯酞、正丁烯基苯酞為目標成分。在STITCH數據庫和SWISS數據庫共得到ALOX5、P18054、SLC6A2、HRH3、MAPT、MBNL1等36個靶點。見表1。

表1 隴產當歸特征性高含量成分群潛在靶點
2.2 成分-靶點-疾病網絡構建與分析 按相關靶點基因頻數(Annotated Genes Quantity)由高到低排序,選取基因頻數不小于10的16種疾病,構建目標成分-靶點-疾病網絡模型,網絡節點按網絡節點度(Degree)排序,共包含55個節點(3個目標成分、36個靶點、16種疾病)。見圖1。

圖1 成分-靶點-疾病相互作用網絡
2.3 生物功能與通路分析
2.3.1 GO富集分析 結果顯示,靶點在生物過程中,細胞過程、生物調控和應激反應占比例較大;在分子功能中,分子結合、催化活性和轉運活性作用突出;在細胞組分中,細胞部件、細胞膜、細胞器和膜部件較重要。見圖2。

圖2 目標成分GO富集分析結果
2.3.2 信號通路富集分析 結果顯示,目標成分預測出的36個靶點中有24個靶點(67%)富集得到26條相關信號通路,涉及5種類別:其中與小分子轉運相關的通路有4條,與信號轉導相關的通路有7條,與機體系統相關的通路有6條,與新陳代謝相關的通路有7條,與疾病相關的通路有2條。見表2,圖3~4。

圖3 目標成分相關靶點通路富集分析結果

圖4 成分-靶點-疾病相互作用網絡

表2 目標成分相關通路的分類及信息
中藥材的物質基礎即其所含有效活性成分,從生物學角度來看,藥材原植物品種的形成是基因型與產地環境相互作用的結果。藥材藥效與其產地密切相關,唐代《新修本草》曰:“離其本土,則質同而效異。”[12]不同地域生態系統各異,不同生態系統所孕育藥材在有效成分含量及藥效方面也存在差異[13]。關于藥材所含化合物與其產地的相關性研究,長期以來被中藥資源學領域視為研究熱點,然而針對不同產地藥材藥理學相關的實驗研究很少,究其緣由是中藥化學成分組成十分復雜[14]。不同產地的藥材含有活性成分的含量高低各異,而不同活性成分通過多靶點、多途徑綜合調控,進而發揮不同的藥理作用,因此,開展不同產區藥材藥理學相關研究非常困難,需從不同產區、不同藥理作用多維角度開展大規模的篩選實驗。本課題組前期研究中完成了科研文獻中不同產區當歸藥材成分含量數據的整合,運用主成分分析、聚類分析和單因素方差分析方法進行多指標綜合評價,獲取了隴產當歸的特征性高含量化學成分群。本研究基于網絡藥理學方法尋找不同產區藥材的特征性高含量成分群所對應的靶點、信號通路和疾病,將網絡藥理學的研究方法應用到中藥資源學領域,可解決當前中藥資源學與藥理學領域交叉相關研究面臨的難題,為我國不同產地中藥資源藥理作用機制的相關研究提供有力支撐。
課題組前期研究針對甘肅、四川、湖北、陜西、云南、河北6個產區梔子藥材中的10種化學成分含量數據,綜合運用主成分分析、聚類分析和單因素方差分析方法進行多指標綜合評價,結果顯示:1)甘肅產區當歸中總揮發油含量與其他產區比較差異有統計學意義(P<0.05);2)甘肅產區當歸中揮發油類成分藁本內酯、正丁基苯酞、正丁烯基苯酞含量與其他產區比較差異有統計學意義(P<0.05),構成甘肅當歸的特征性高含量化學成分群。
本研究基于前期實驗結果,針對隴產當歸藥材進行研究,選取其特征性高含量化學成分群藁本內酯、正丁基苯酞、正丁烯基苯酞作為目標成分,利用STITCH和SWISS數據庫預測目標成分相關靶點,并將得到的36個靶點導入CTD數據庫預測相關疾病[15]。結果靶點節點中PLAU、ALOX5、ESR1、AR、CYR19A1、STAT3這6個靶點排次靠前,是網絡中樞紐節點,表明其可能為目標成分作用的核心靶點;疾病節點中,神經系統疾病、心血管疾病、腫瘤、免疫系統疾病以及消化系統疾病的網絡節點度(Degree)值排次靠前,表明隴產當歸藥材特征性高含量成分群藁本內酯、正丁基苯酞、正丁烯基苯酞可能通過LAU、ALOX5、ESR1、AR、CYR19A1、STAT3等36個潛在靶點對神經系統疾病、心血管疾病、腫瘤、免疫系統疾病以及消化系統疾病發揮相關藥理作用。即:在中藥資源學領域,針對隴產當歸梔子藥效學實驗研究,應先從抗神經系統疾病、抗心血管疾病、抗腫瘤、調節免疫系統疾病以及抗消化系統疾病幾方面入手;相關藥理作用機制的實驗研究,可從LAU、ALOX5、ESR1、AR、CYR19A1、STAT3等36個潛在靶點入手。
為進一步深入挖掘隴產當歸特征性高含量化學成分群的多維藥理作用機制,進而為靶點生物功能及信號通路相關實驗研究提供科研依據,本研究還進行了GO富集分析和通路富集分析,結果顯示,靶點基因數目較高的信號通路主要包括:Na+/Cl-神經遞質轉運蛋白(Na+/Cl-Dependent Neurotransmitter Transporters)、SLC介導的跨膜轉運(SLC-Mediated Transmembrane Transport)、5-羥色胺能突觸(Serotonergic Synapse)、花生四烯酸代謝(Arachidonic Acid Metabolism)、白介素信號(Signaling by Interleukins)、催乳素信號通路(Prolactin Signaling Pathway);雌激素信號途徑(Estrogen Signaling Pathway)等。這些信號通路中,Na+/Cl-神經遞質轉運蛋白可通過電化學梯度來驅動神經遞質從突觸攝取到神經元和膠質細胞的細胞質,從而終止突觸傳遞。這些轉運蛋白是治療性和非法化合物的靶點,它們的功能障礙與神經系統的多種疾病有關[16]。SLC介導的跨膜轉運的作用是調節細胞外溶質濃度的水平。在中樞和外周神經系統中,這些轉運蛋白可以調節神經元間的信號轉導,其中一些蛋白質的自然突變與各種神經系統疾病有關[17]。5-羥色胺能突觸在學習記憶、情緒、睡眠、疼痛、運動功能和內分泌等生理功能以及異常情緒、認知等病理狀態中發揮重要作用;花生四烯酸代謝可通過多種途徑影響腫瘤的生長和轉移[18]。白細胞介素信號及催乳素信號通路與免疫系統疾病密切相關[19]。雌激素信號途徑與腫瘤疾病及靶向藥物研究密切相關[20]。
研究結果從網絡藥理學角度揭示了隴產當歸藥材特征性高含量成分群相關靶點、關鍵生物通路以及主要相關疾病,將網絡藥理學相關技術應用到中藥資源學領域的研究中,為我國不同產區中藥材多維藥理機制的相關研究奠定基礎。