葉松山,劉云鶴,李文濤,夏 穎,趙芷潔若,于建春*
目前,肺癌仍是引起惡性腫瘤相關死亡的主要原因[1],其中非小細胞肺癌(Non-small-cell lung cancer,NSCLC)是主要的病理類型,占肺癌的80%~85%[2],其組織學類型包括腺癌、鱗癌及少見的大細胞肺癌等[3]。約2/3的NSCLC患者確診時已處于中晚期,雖然化療、靶向藥物和免疫治療等可緩解癥狀并提高生活質量,但患者5年生存率仍然很低,同時產生的毒副作用日漸明顯[4],而中藥在治療腫瘤患者發揮增效減毒的治療優勢突顯[5]。中醫理論認為,肺癌由正氣內虛、毒邪外侵加上痰濕內生、氣滯、瘀血等造成,正氣虛損為主要內因,強調扶正培本、補益去邪為治療腫瘤的關鍵所在[6]。黃芪為傳統中藥,味甘性溫,善補脾益肺,具有補氣升陽、固表止汗、利水消腫和脫毒生肌等功效[7]。現代研究表明,黃芪通過促進腫瘤細胞凋亡、抑制增殖和遷移、調節免疫與逆轉耐藥等發揮抗腫瘤作用[8-9],但其具體機制尚未完全闡明。
傳統的“一種疾病、單一藥物、單個基因”的藥物機制研究模式,無法體現中藥及其復方多成分、多靶點、多途徑綜合調節的作用特點。網絡藥理學基于網絡觀點從系統水平識別“疾病—表型—基因—藥物”的多層次關系,揭示中藥不同成分之間的協同效應,與中醫診治疾病的理論和中藥調控機體治療疾病的整體觀相吻合[10-11],目前被廣泛應用于中藥及復方研究中[12-13]。本研究應用網絡藥理學方法構建“黃芪—活性成分—靶點—NSCLC”網絡模型,結合生物信息學研究方法,探索黃芪抗NSCLC的有效活性成分、潛在治療靶點和作用機制,以期闡明黃芪抗NSCLC的物質基礎和分子機制,為進一步深入研究黃芪治療腫瘤提供新的思路。
1.1 材料 所用數據庫:中藥系統藥理學數據庫與分析平臺 (TCMSP,http://tcmspw.com/tcmsp.php)[14],Uniprot (https://www.uniprot.org)[15],GeneCards (https://www.genecards.org)[16],DisGeNET (https://www.disgenet.org)[17],DigSee (http://210.107.182.61./geneSearch)[18],String (https://string-db.org)[19],DAVID (https://david.ncifcrf.gov)[20],UALCAN(http://ualcan.path.uab.edu/index.html)[21],KM plotter (http://kmplot.com//analysis)[22];所用軟件:R軟件(V3.6.2),Perl軟件(V5.28.1),Cytoscape軟件(V3.7.1)。各數據庫檢索時間截止到2020年1月15日。
1.2 方法
1.2.1 黃芪活性成分和作用靶點的篩選與收集 利用TCMSP數據庫檢索“黃芪”,選擇“Ingredients”并設定口服生物利用度(OB)≥30%和類藥性(DL)≥0.18得到黃芪活性成分[23],選擇“Related Targets”獲取黃芪活性成分所有靶點,通過UniProt 數據庫下載人類相關蛋白及對應基因,經Perl腳本轉化得到黃芪活性成分對應的人類基因靶點。
1.2.2 獲取NSCLC相關疾病靶點 以“non-small cell lung cancer”、“non-small cell lung carcinoma”、“NSCLC”為關鍵詞,分別檢索GeneCards、DisGeNET和DigSee數據庫并下載與NSCLC相關基因,合并各數據庫檢索到的前10%基因,去除重復和假陽性基因作為NSCLC相關研究靶點。使用R軟件將“1.2.1”和“1.2.2”項所得靶點基因映射,得到黃芪抗NSCLC的靶點。
1.2.3 構建與分析“黃芪—活性成分—靶點—NSCLC”網絡 將上述數據導入Cytoscape軟件構建“黃芪—活性成分—靶點—NSCLC”關系網絡。網絡中節點(node)表示黃芪、活性成分、靶點基因與NSCLC,邊(edge)表示四者之間的相互關系。網絡拓撲參數使用Network Analyzer插件分析,每個節點的重要性通過拓撲參數自由度(Degree)和介數(Betweenness Centrality)評估,節點自由度和介數越大,說明該節點在網絡中越重要。
1.2.4 靶標蛋白相互作用網絡(PPI)的構建 將靶標蛋白導入String數據庫,物種選擇為“Homo sapiens”,置信度為0.400,獲得蛋白互作關系,下載蛋白相互作用數據并導入Cytoscape軟件繪制蛋白互作(PPI)網絡圖。設定網絡中節點顏色深淺和大小來反映度值(Degree)大小,邊的粗細反映結合率評分(Combine score)高低。
1.2.5 聚類模塊篩選與分析 使用Cytoscape的MCODE插件對PPI 網絡進行聚類分析,篩選功能聚類模塊,根據模塊分析結果,選擇“MCODE Node Status”為“Seed”的靶點作為關鍵靶點。
1.2.6 GO和KEGG富集分析 將核心模塊中的基因導入DAVID數據庫,選擇“Homo sapiens”,下載GO和KEGG富集結果數據。使用R軟件“ggplot2”包,以P<0.05對核心模塊中的基因進行GO與KEGG富集分析和展示。
1.2.7 關鍵基因在NSCLC中的表達情況及生存分析 通過UALCAN和KM plotter數據庫分別分析關鍵基因在NSCLC中的表達及對患者總體生存率(Overall survival,OS)的影響。
2.1 黃芪有效活性成分和作用靶點 TCMSP 數據庫中篩選出16個黃芪有效活性成分和209個靶點,去重后得到97個作用靶點,見表1。

表1 黃芪活性成分和作用靶點情況
2.2 NSCLC相關疾病靶點 檢索獲得NSCLC相關基因820個并與97個黃芪活性成分靶點基因進行映射,除去無對應靶點的活性成分,得到黃芪抗NSCLC靶點44個和有效活性成分9個,見圖1、圖2。

圖1 NSCLC相關基因與黃芪活性成分對應靶點映射
2.3 “黃芪—活性成分—靶點—NSCLC”網絡構建與分析 將黃芪抗NSCLC的有效活性成分和靶點基因導入Cytoscape軟件構建“黃芪—活性成分—靶點—NSCLC”關系網絡,見圖2,該網絡包含55個節點和129條邊(其中黃芪和NSCLC節點各1個,活性成分節點9個,靶點基因節點44個),黃芪活性成分作用于多個靶點,每個靶點也與多種活性成分相關,說明黃芪抗NSCLC的多成分、多靶點和整體協同相互作用的復雜網絡關系。分析網絡拓撲參數,度值在中位數以上的活性成分是槲皮素(Quercetin,Degree 42)、山柰酚(Kaempferol,Degree 14)、刺芒柄花素(Formononetin,Degree 6)和異鼠李素(Isorhamnetin,Degree 6)。

圖2 黃芪—活性成分—靶點—NSCLC互作網絡注:Ingredient A,(3S,8S,9S,10R,13R,14S,17R)-10,13-dimethyl-17-[(2R,5S)-5-propan-2-yloctan-2-yl]-2,3,4,7,8,9,11,12,14,15,16,17-dodecahydro-1H-cyclopenta[a]phenanthren-3-ol;Ingredient B,3,9-di-O-methylnissolin;Ingredient C,7-O-methylisomucronulatol
2.4 靶標蛋白互作網絡(PPI)構建與核心聚類模塊的篩選 將靶標蛋白導入String 數據庫獲取蛋白質互作數據,利用Cytoscape繪制PPI網絡,見圖3,節點為蛋白,邊為蛋白間的關聯,網絡中共44個節點和387個邊。使用MCODE插件得到3個功能聚類模塊(Module),見圖4。模塊1共20個節點和131條邊,得分13.789;模塊2共5個節點和10條邊,得分5.00;模塊3共13個節點和29條邊,得分4.833;根據分析結果得到3個關鍵基因分別是PARP1、GSTP1和ESR2,選擇得分最高的模塊1作為核心模塊進行后續分析。

圖3 黃芪抗NSCLC靶標蛋白相互作用網絡

圖4 功能聚類模塊注:A.Module 1,B.Module 2,C.Module 3
2.5 GO富集和KEGG通路分析 將核心模塊中的20個基因作為黃芪抗NSCLC的潛在靶點進行GO與KEGG富集分析,根據P值排序并選擇部分結果使用氣泡圖或條形圖展示。其中富集到104個生物過程(Biological process,BP),主要參與RNA聚合酶Ⅱ啟動子對轉錄的調控、凋亡過程的負調控、DNA模板轉錄正調控、細胞對DNA損傷的反應、基因表達正調控、細胞對機械刺激和缺氧的反應、對雌二醇的反應、NO生物合成的正調控、成纖維細胞和上皮細胞增殖的正調控、對鈣離子的反應、肽酰-絲氨酸和蛋白質磷酸化的正調控、細胞對IL-1的反應、死亡結構域受體對外源性凋亡信號通路的負調控等,見圖5。富集到細胞組分(Cellular component,CC)11個,主要涉及細胞核、胞漿、脂筏、細胞膜、黏著斑、細胞外間隙、線粒體和染色體端粒區等,見圖6。富集到分子功能(Molecular function,MF)19個,主要是蛋白或同源蛋白結合、蛋白激酶結合和活性、酶結合、轉錄因子結合、組蛋白去乙酰化酶結合、泛素蛋白連接酶結合、蛋白絲氨酸/蘇氨酸激酶活性、NO合酶調節因子活性、參與細胞凋亡過程的半胱氨酸型內肽酶活性、序列特異性DNA結合、MAPK激酶活性和蛋白質異二聚體活性等,見圖7。富集到48條通路,除了涉及NSCLC、胰腺癌、膀胱癌、前列腺癌、結直腸癌和子宮內膜癌等癌癥通路外,還和腫瘤蛋白多糖、PI3K-Akt信號通路、VEGF信號通路、P53信號通路、黏著斑、乙型肝炎、甲狀腺激素信號通路、細胞周期、FoxO信號通路、病毒性心肌炎、催乳素信號途徑、HTLV-I感染、癌癥的中心碳代謝等通路有關,見圖8。

圖5 黃芪抗NSCLC潛在靶點的GO-BP富集分析

圖6 黃芪抗NSCLC潛在靶點的GO-CC富集分析

圖7 黃芪抗NSCLC潛在靶點的GO-MF富集分析

圖8 黃芪抗NSCLC潛在靶點的KEGG通路富集
2.6 關鍵基因在NSCLC中的表達情況及對患者生存的影響 結合UALCAN數據庫分析,發現關鍵基因PARP1、GSTP1和ESR2在肺腺癌(LUAD)及肺鱗癌(LUSC)和正常組織中表達差異均具有統計學意義(P<0.05),3個基因在腫瘤中均為高表達,見圖9;KM Plotter數據庫分析結果顯示,基因表達量會影響患者總體生存率(P<0.05),相比低表達者,3個基因高表達者生存率較低,見圖10,說明PARP1、GSTP1和ESR2低表達是NSCLC的保護因素。

圖9 關鍵基因在正常組織和肺腺癌(LUAD)及肺鱗癌(LUSC)中的表達情況

圖10 關鍵基因表達量對NSCLC患者總體生存(OS)的影響
中醫藥在治療肺癌等惡性腫瘤方面發揮一定優勢,許多具有抗腫瘤作用的中藥成為研究熱點[24]。中醫理論認為“正氣存內,邪不可干”、“邪之所湊,其氣必虛”,肺癌之辨證,多屬氣虛[25]。黃芪作為傳統補氣要藥,中醫臨床常將其單獨或組方用于肺癌等各類癌癥的治療中[26-27]。現代藥理學研究也證實,黃芪含有黃酮類、多糖類及皂苷類等多種抗腫瘤活性成分[8]。從本研究“黃芪—活性成分—靶點—NSCLC”網絡(見圖2)中可以看出黃芪抗癌的多成分和多靶點特征,網絡拓撲分析結果顯示,黃芪抗NSCLC主要的活性成分是槲皮素、山柰酚、刺芒柄花素和異鼠李素。研究表明,槲皮素可通過Stat3/Mcl-1等途徑介導獲得性耐藥細胞PC9/GR凋亡,還可抑制腫瘤組織VEGF和耐藥基因表達、破壞Caspase-3表達抑制肺癌、乳腺癌和肝癌等腫瘤細胞增殖與遷移[28-29]。山柰酚能下調rDNA的轉錄和上游結合因子磷酸化水平來抑制肺腺癌A549細胞的生長與增殖,還可以通過抑制PI3K-Akt途徑、ERK途徑和線粒體凋亡途徑的活化促進腫瘤細胞凋亡和增加輻射敏感性[30-31]。刺芒柄花素可下調CyclinE1表達影響細胞周期來抑制細胞增殖,并調控Bax和Bcl-2表達促使NSCLC細胞凋亡,還可以抑制A549細胞EMT過程[32-33]。異鼠李素能抑制肺癌、乳腺癌和宮頸癌細胞等多種腫瘤細胞的增殖并誘導其凋亡,其可能和細胞自噬過程有關[34-35]。由上可知,黃芪中這些活性成分作用機制與腫瘤的發生發展關系密切,為本研究結果的可靠性提供了有力證據,能為挖掘黃芪潛在抗癌價值提供依據和參考。
從圖3可見,通過構建黃芪抗NSCLC靶標PPI網絡,靶標蛋白之間存在廣泛而復雜的聯系,為了給后續分析提供一個更加明確的方向,我們利用網絡中蛋白之間固有的關系尋找基因簇,挖掘出 PPI 網絡中所存在的3個功能聚類模塊(圖4)。其中核心模塊潛在靶點GO富集結果顯示(圖5~圖7),黃芪抗NSCLC的潛在靶點主要涉及轉錄調控、凋亡調控、細胞對刺激的反應、一氧化氮生物合成、細胞增殖、蛋白質修飾等生物過程,富集的細胞組分主要定位在細胞核、脂筏、胞漿、細胞外間隙、線粒體、染色體端粒區等,主要參與蛋白和酶結合、轉錄因子結合、增殖和凋亡相關激酶活性生物功能,表明黃芪是通過調節細胞增殖與凋亡、分化和遷移、能量代謝和基因表達等多個生物過程與功能發揮抗NSCLC作用,這在機制研究所涉及通路中都有體現。
由圖8可見,KEGG富集主要涉及癌癥通路、P53信號通路、甲狀腺激素信號通路、細胞周期、FoxO信號通路、黏著斑、PI3K-Akt信號通路、VEGF信號通路、癌癥的中心碳代謝等通路,這些通路都與NSCLC的形成與發展密切相關。研究表明,PI3K/Akt 信號通路與腫瘤增殖、生長、遷移和凋亡等密切相關,在多種癌癥包括肺癌中存在異常活化,激活下游信號抑制細胞凋亡,藥物干預可使ERK和p38磷酸化,同時輕度抑制p-JNK表達,從而誘導癌細胞發生凋亡。另有報道顯示,黃芪多糖可通過下調PI3K/Akt信號通路的自噬而發揮抗癌作用[36]。P53信號通路激活可抑制 A549 細胞增殖并促進其凋亡,MiR-93-5p靶向P53調控STAT3信號通路的激活可能是其中的機制之一[37-38]。黏著斑由胞膜外黏附素、膜上整聯蛋白和胞內細胞骨架蛋白等黏附而成,具有信號傳導和機械支持功能,在調控腫瘤上皮間質轉化和侵襲轉移方面起到重要作用[39]。FoxO轉錄因子通過信號轉導和轉錄調控在動物代謝、生理調節和細胞周期等方面起重要作用[40]。Hribal等[41]發現,FoxO1 蛋白在肌肉能量代謝方面發揮關鍵作用,提示黃芪可能通過FoxO通路影響腫瘤細胞能量代謝過程。中心碳代謝不僅是機體能量的主要來源,也提供其他代謝途徑的前體物。細胞代謝在癌癥發生和進展中起到核心作用,中心碳代謝異常導致代謝重編程造成有氧糖酵解和乳酸增加是惡性腫瘤細胞的重要特征,造成關鍵細胞調控通路改變,影響腫瘤的治療效果[42]。本研究富集結果表明,黃芪活性成分的潛在靶點分布于多種生物過程和通路,其協同發揮抗癌作用,這與現代藥理研究結果相互驗證,可以作為后續研究的對象。
為了能夠更準確快捷地找出黃芪抗NSCLC關鍵基因與腫瘤發生發展的相關性,本研究利用整合TCGA和GEO數據庫數據的UALCAN和KM plotter數據庫分析關鍵基因的表達情況及與預后的關系。根據功能聚類模塊篩選出的3個關鍵基因PARP1、GSTP1和ESR2,他們在癌組織中均高表達,且高表達與較差預后相關(圖9、圖10),說明其在NSCLC發生發展中起到重要作用。PARP1基因是堿基切除修復(BER)通路的核心成員之一,在轉移性NSCLC中表達較強,其表達與預后密切相關,除DNA損傷修復機制之外,PARP1還可以通過促進肺腺癌細胞侵襲、抗失巢凋亡、外滲、自我更新以及調節腦微環境等促進肺腺癌向腦和骨的轉移和復發[43-44]。GSTP1是谷胱甘肽S-轉移酶的同工酶,在維持細胞代謝分解致癌物、抗氧化損傷、抑制細胞癌變過程中起著重要作用,與腫瘤的發生密切相關,已有研究證實,GSTP1基因在肺癌組織中高表達量[45]。ESR2基因編碼的雌激素受體蛋白2可以控制細胞信號轉導并調控細胞周期,在腫瘤發展中起重要作用。研究發現,ESR2基因多態性與非吸煙女性肺癌的發生密切相關[46-47],眾多研究也表明,NSCLC組織中ERβ(ESR2)的表達率高于癌旁肺組織及正常肺組織[48]。除此之外,關鍵基因還和黃芪抗NSCLC主要活性成分相互映射,如作用于PARP1的槲皮素,作用于GSTP1的槲皮素和山柰酚,作用于ESR2的刺芒柄花素和異鼠李素,進一步說明了黃芪抗NSCLC的多成分和多靶點交互特性及研究結果的可靠性,提示這3個基因有望作為黃芪抗NSCLC的關鍵靶點應用于臨床實踐。
網絡藥理學和生物信息學能高效快速地挖掘開放數據庫中豐富的實驗和臨床資料。通過整合分析數據,以生物分子為切入點構建與疾病相關分子的作用網絡。從藥物、疾病與靶點間作用的系統性和整體性出發,揭示中藥及復方的藥理作用及機制,進而刻畫中醫藥的整體特征。隨著網絡藥理學和生物信息學的興起,預測黃芪單藥、對藥或復方防治心腦血管疾病、糖尿病和腫瘤等疾病的藥理作用和分子機制研究可以逐步開展[49-52]。對于單一癌種(如黃芪治療肺癌)的潛在靶點和作用機制研究雖然較少,但也取得了一些初步結果[6],與本研究大部分結果一致,說明了本研究結果的可靠性。和以往研究不同的是,本研究一方面對疾病類型進行了細化,重點研究肺癌的最常見類型-NSCLC;另一方面,為了使研究方向更加明確和具有針對性,引入了功能聚類模塊研究,同時通過腫瘤數據庫進行預后分析,增加臨床數據,驗證了本預測的準確性,可為臨床精準用藥提供有力支撐。
網絡藥理學和生物信息學主要依托各種數據庫和技術手段,尚存在一些亟待解決的問題[11,53-54]:①數據庫的準確性和全面性不完善,如數據更新相對滯后,造成所篩選藥物活性成分和靶點數量有限,不能揭示完整的藥理作用;②活性成分和靶點篩選具有一定主觀性,如部分中藥活性成分與靶點相互作用是通過計算機模擬的,二者之間的調控關系不夠明確;③未考慮中藥配伍、用法用量及在體內代謝轉化,不能有效結合藥物動力學和藥效學研究;④臨床疾病數據庫的基因芯片和RNA-seq數據來源于不同的研究,平臺軟件分析數據算法不同,很難進行樣本間準確比較,可能會造成結果存在一定異質性。基于此,為保證研究結果的精準性,可在預測的基礎上深入開展體內外實驗和臨床研究進行驗證。
總之,本研究通過網絡藥理學和生物信息學方法,初步揭示了黃芪抗NSCLC的潛在作用機制和關鍵作用靶點,體現了中藥多成分、多靶點、多通路協同作用的特點,為黃芪抗腫瘤藥理研究及臨床應用奠定了理論依據。同時,還可以利用細胞分子生物學和免疫學等實驗手段進一步驗證,以便深入研究黃芪抗NSCLC的作用機制,為后續研究提供了方向。