辛雨濛,梁桓熙,余悅華,孫震曉*
(北京中醫藥大學生命科學學院,北京 102488)
據世界衛生組織國際癌癥研究機構(International Agency for Research on Cancer,IARC)發布的2020年全球最新癌癥數據顯示,乳腺癌發病率高于肺癌,成為全球第一大癌癥[1-2]。乳腺癌在中醫常歸為“乳癌”“石榴翻花發”“乳巖”“乳石”“乳毒”“奶巖”等。現代中醫治療乳腺癌的原則為補虛益腎,疏肝健脾,行氣養血,其與肝經、脾經、腎經的關系最為密切[3]。
甘草干姜湯來自張仲景《傷寒雜病論》,也在《金匱要略》中有所記載[4]。甘草甘溫而補中益氣,干姜辛溫而溫復脾肺之陽,全方躁烈性不強、藥性平和、具有補中復陽之功,因此可用于脾肺陽虛兼有陰虧的病證[5]。同時甘草或干姜提取物的相關抗腫瘤實驗研究發現:甘草查爾酮B處理MCF-7細胞后可激活p53及其下游效應物p21,然后誘導S期停滯[6];甘草次酸可顯著抑制乳腺癌MDA-MB-231細胞增殖和遷移,可能與抑制ERK1/2通路活化,下調MMP-9蛋白表達有關[7];6-姜酚引起的Notch信號下調(Hes1和CyclinD1基因)導致乳腺癌細胞凋亡[8];異甘草素通過抑制NF-κB信號通路的活化,抑制NF-κB p65入核誘導NCI-H460肺癌細胞凋亡[9]等。但有關甘草干姜湯藥效成分的文獻報道較少,僅楊顏芳等[10]研究了甘草干姜湯中8種關鍵的藥效成分。
近年來,隨著蛋白組學、基因組學、代謝組學等組學理論的快速發展以及系統生物學和生物信息學的應用,網絡藥理學出現在人們的視野里。它通過“疾病-基因-靶點-藥物”的相互作用網絡來系統地分析藥物對疾病的干預和影響[11],進而解釋中藥多種成分在人體內的協同作用。網絡藥理學可以很好的從多成分、多靶點、多途徑來解釋中藥中復雜成分的作用機制,對中醫藥的現代化發展提供了很大的幫助[12]。隨著研究不斷推進,越來越多的三維蛋白質結構得到確認,使具有潛在治療功能的藥物靶標逐漸增多。本文利用網絡藥理學篩選出甘草干姜湯抗乳腺癌可能的作用靶點,并利用文獻報道的甘草干姜湯的8種藥效成分(甘草苷、異甘草苷、甘草素、異甘草素、甘草酸、6-姜酚、6-姜烯酚、8-姜酚)與潛在的關鍵靶點進行分子對接,預測甘草干姜湯產生抗乳腺癌作用潛在的主要活性成分及相關作用靶點,為甘草干姜湯抗乳腺癌作用及機制研究提供數據支持。
登錄中藥系統網絡藥理學數據庫[13](Traditional Chinese Medicine Database and Analysis Platform,TCMSP,http://tcmsp-e.com),設置搜索條目為Herb name。為篩選甘草、干姜的有效化學成分,在搜索條目下分別輸入復方的藥物組成:甘草、干姜。設置篩選條件為OB(口服生物利用度)≥30%、DL(類藥性指數)≥0.18,另外通過文獻調研,將不符合類藥篩選但在甘草、干姜中含量高或具有良好抗腫瘤活性的成分加入成分集。完整復制各中藥符合篩選條件的所有成分于文本文檔中。為篩選LDGD的目標靶點,在輸入界面選擇Related Targets,完整復制各中藥符合篩選條件的所有目標靶點于文本文檔中。數據庫所獲得的藥物有效化學成分及靶點信息應用Drugbank(https://www.drugbank.ca)使其格式標準化。
登錄Genecards人類基因數據庫[14](https://www.genecards.org/)。設置搜索條目為關鍵詞搜索。搜索條目下以breast cancer為關鍵詞篩選,設置物種為人,獲取乳腺癌的疾病靶點。為保證數據的準確性,選擇Relevance score>30的疾病靶點。對數據庫檢索到的疾病靶點進行合并去重,作為最終的疾病靶點來源。
在R語言Bioconductor(https://www.bioconductor.org)網站中安裝VennDiagram程輯包,將1.1與1.2中獲得的復方藥物靶點與疾病靶點數據導入到R軟件,應用Draw Venn Diagrams程序對獲取到的甘草干姜湯藥物靶點與疾病靶點進行匹配,獲得交集基因靶點,并繪制Venn圖。
將1.3中獲取到的交集基因導入到網絡可視化軟件Cytoscape 3.8.0中,構建成分-靶點相互作用網絡。對網絡進行分析,以節度中心性作為評價節點在網絡中重要性的標準。
登錄String數據庫(https://string-db.org)。選擇Multiple proteins,在搜索條目下輸入1.3獲取到的交集基因,限定物種為Homo Sapiens,其余設置保持不變,構建PPI功能蛋白作用網絡,并繪制網絡圖。為篩選核心蛋白,將生成的蛋白相互作用條目Node1、Node2以及Combined-scorce導入到Cytoscape3.8.0,應用Network Analyse插件分析網絡,選擇APP條目下的CytoNCA插件進行網絡分析。
使用R語言對甘草干姜湯抗乳腺癌的作用靶點進行GO功能富集分析。富集內容包括細胞成分(celluar component,CC),生 物 學 過 程(biological process,BP),分子功能(molecular function,MF)。富集條件為PCutoff=0.05且QCutoff=0.05(為P值校訂值,以此為標準進行GO、KEGG分析),其余默認原始設置。在R語言中Bioconductor(https://www.bioconductor.org)網站安裝所需要 的Biocmanager,org.Hs.eg.db,Colorspace,Stringi,ggplot2,DOSE,ClusterProfiler,enrichplot,Pathview等程序包。首先將基因Symbol轉化為基因ID,選擇物種為人,設定閾值為P<0.05,輸出富集結果并繪制條形圖與氣泡圖。
將文獻報道的甘草干姜湯中8種藥效成分和PPI結果中排名靠前的靶點進行分子對接,驗證LDGD中的藥效成分是否能與相關靶點結合。
從PDB(http://www.rcsb.org)數據庫中得到以上靶點的晶體結構,對蛋白結構進行預處理,后續的對接將使用預處理之后的蛋白結構。
本研究中,將與蛋白晶體復合的原配體所在位點初步定義為活性口袋。為了驗證活性口袋的可靠性,先將原配體取出,使用Discovery Studio 2.5中的Libdock功能來將原配體和蛋白進行對接,后選取打分值最高的構象來和原配體本來的構象進行比對,采用計算均方根偏差(root-mean-square deviation,RMSD)的方法,將其結果作為活性口袋是否符合標準的參數。當RMSD≤2.0?時,我們認為用來進行對接的活性口袋能夠良好的重現原配體的作用模式,并記錄原配體與蛋白晶體相互作用的關鍵氨基酸以及打分值,并將原配體打分值的80%設置為閾值[15]。當RMSD>2.0?時,調整活性口袋的坐標,直到RMSD≤2.0?。在確定活性口袋的坐標后,將事先準備好的中藥小分子與上述靶標進行對接,并按照原配體打分值的80%和與原配體相互作用的關鍵氨基酸進行篩選。
通過TCMSP數據庫共收集甘草干姜湯中101個在TCMSP中符合類藥篩選或在甘草、干姜中有報道的成分,將收集的成分對應的靶點進行合并去重處理后,共得到LDGD成分相關靶點220個。
LDGD成分相關靶點有220個;利用Genecards數據庫收集到499個疾病靶點,兩者取交集共得到88個交集靶點,結果如圖1所示,后續會利用交集靶點進行分析。

圖1 LDGD化學成分和乳腺癌關鍵靶點Venn圖
運用Cytoscape 3.8.0中的Import Network插件構建甘草干姜湯化學成分-靶點作用網絡,如圖2所示。
將從2.2中獲得的88個交集基因導入String數據庫,把得到的string_interactions.txt文件導入到Cytoscape 3.8.0,使用Network Analyse插件構建PPI網絡,選擇CytoNCA插件進行網絡拓撲分析,篩選網絡中的關鍵節點,節點代表靶蛋白,邊代表靶蛋白與靶蛋白之間的作用關系,見圖3。LDGD抗乳腺癌核心靶點篩選指標:介度中心性(betweenness centrality),緊密中心性(closeness centrality),節度中心性(degree centrality),特征向量(eigenvector centrality),局部連通性(local average connectivity-based method)。篩選條件:應用R軟件的在線程輯包,對各交集基因的上述篩選指標數值進行測算,各組數值中大于本組中位值的基因予以保留,運行R腳本,篩選核心靶點,將篩選結果按照Degree數值進行排序,篩選出的20個LDGD抗乳腺癌核心靶點結果如表1所示。

圖2 LDGD化學成分和癌癥靶點的作用網絡

圖3 LDGD抗乳腺癌作用潛在靶點的PPI網絡圖

表1 LDGD抗乳腺癌核心靶點拓撲分析結果
LDGD抗乳腺癌核心靶點中關鍵靶點的進一步篩選流程見圖4,將每次PPI網絡中大于中位值的靶點再進按照上述步驟對核心靶點進行篩選,共3次,從圖中結果可知LDGD抗乳腺癌的關鍵靶點為AKT1、MYC、TP53、EGF。

圖4 LDGD抗乳腺癌關鍵靶點的篩選
選取排名前10的富集條目,并根據每個項目的P值、Q值及富集在其上的基因數目繪制條形圖。結果如圖5所示,LDGD抗乳腺癌的功能富集分析結果共得到2 569個GO條目。細胞成分45個,主要有細胞周期蛋白依賴性激酶、質膜筏、核染色質、蛋白激酶復合物、轉錄因子復合體、絲氨酸/蘇氨酸蛋白激酶復合物、膜區、膜微區等。生物學過程2 218個,主要有凋亡信號通路的調節,氧化應激等。分子功能130個,主要有蛋白質絲氨酸/蘇氨酸激酶活性、轉錄因子活性核受體活性、泛素蛋白連接酶結合等。

圖5 甘草干姜湯抗乳腺癌的GO功能富集分析
使用R語言的“Pathview”在線程輯包,對交集基因進行KEGG通路富集分析。選取排名前20的富集通路,根據每個通路的P值、Q值及富集在其上的基因數目繪制氣泡圖,見圖6。
如圖6所示,LDGD抗乳腺癌主要涉及p53、TNF、IL-17、EGFR、細胞凋亡等信號通路。

圖6 LDGD抗乳腺癌的KEGG通路富集圖
以AKT1為關鍵詞檢索PDB數據庫,獲得一個蛋白晶體結構,PDB編號為4EKL,分辨度為2.00?(表2)。以原配體所在位置設置活性口袋,口袋的三維坐標為28.219 521,5.262 347,11.381 138,半徑為9.493 813。原配體打分值為142.655,RMSD值為0.744 1。關 鍵 氨 基 酸 為GLU234,GLU228,GLY159,ALA230。8種成分與活性口袋進行對接,甘草苷、6-姜酚、6-姜烯酚、甘草素、異甘草素、異甘草苷能與活性口袋完成對接(圖7)。以原配體打分值的80%為標準:甘草苷、6-姜酚、6-姜烯酚、甘草素均符合對接標準,且均能與關鍵氨基酸GLU234產生氫鍵或靜電作用。MYC未找到合適的蛋白晶體結構,TP53、EGF均未找到與蛋白晶體結構對應的原配體,因此未列出結果。

表2 甘草干姜湯8種藥效成分與AKT1分子對接結果

圖7 甘草干姜湯藥效成分與靶點AKT1的結合方式
本文利用網絡藥理學旨在篩選出甘草干姜湯抗乳腺癌可能的藥效成分和作用機制,結果表明LDGD抗乳腺癌的潛在關鍵靶點為AKT1、MYC、TP53、EGF;利用GO功能富集分析LDGD抗乳腺癌的生物學過程主要有凋亡信號通路、氧化應激等,與分子功能相關的有蛋白質絲氨酸/蘇氨酸激酶活性、轉錄因子活性核受體活性、泛素蛋白連接酶結合等;通過KEGG通路富集分析LDGD抗乳腺癌主要涉及p53、TNF、IL-17、EGFR、細胞凋亡等信號通路;與AKT1進行分子對接,結果顯示甘草苷、6-姜酚、6-姜烯酚、甘草素與靶點結合較好且打分值較高,并且研究報道甘草苷和6-姜酚在甘草干姜湯中含量較高,為175.68、29.48μg/mL[10],因此這4種成分可能是抗乳腺癌主要活性成分。
由研究報道可知AKT有關通路可發揮調節細胞增殖、細胞凋亡、細胞周期、蛋白質翻譯和代謝等作用[16],原癌基因c-MYC控制細胞增殖與細胞死亡之間的平衡[17],p53通過介導增強子調控參與乳腺癌通路[18-19],EGF可以抑制腫瘤細胞的凋亡[20]。而中藥復方抗腫瘤是一個多靶點多成分共同作用的結果,本文從“疾病-基因-靶點-藥物”的角度出發,預測了甘草干姜湯抗乳腺癌可能的藥效成分和作用機制。但研究結果受限于中藥成分和疾病靶點的研究報道,比如甘草干姜湯藥效成分的研究尚有不足,靶點蛋白晶體結構不準確或沒有原配體等可能導致其抗腫瘤作用成分預測的準確性有所欠缺。應結合實驗研究和臨床研究進一步優化靶點選擇,綜合考慮藥效成分及其含量、與靶點的結合情況等確定主要活性成分,為實驗研究提供指導。