許 晶,李冬云,吳潔雅,代 忠,吳俊汎,姚夢丹,侯 麗
(1.北京中醫藥大學東直門醫院,北京 100700;2.北京市朝陽區桓興腫瘤醫院,北京 100023)
胃癌是胃黏膜上皮細胞常見的消化系統惡性腫瘤。在中國,惡性腫瘤中胃癌發病率和死亡率均居第三位[1-2]。2020年全球癌癥數據顯示,胃癌發病率和死亡率在全球惡性腫瘤中分別居第五位和第四位;其中中國胃癌新發病例為48萬例,死亡病例37萬例,約分別占全球的44.04%和48.05%;早期胃癌5年生存率可超過95%,但中國80%患者在診斷時已為晚期,總體5年生存率<50%,治療效果欠佳,且不良反應大,嚴重影響患者身心健康[3-4]。
中醫學認為脾胃虛弱是胃癌發病之關鍵,氣、血、瘀、痰、毒等為重要的病理因素。其治療手段多樣,包括中藥湯劑、中成藥、針灸等,可有效提高患者臨床療效和生活質量,并減輕不良反應,延長生存期。目前,關于中醫藥治療晚期胃癌的機制研究較少,較少從基因、分子等微觀層面闡述其作用機制。數據挖掘技術是利用現代技術從大量數據中獲取有用信息的手段,網絡藥理學可從系統層面展現中藥的活性成分和作用機制。本研究通過數據挖掘方法分析135例晚期胃癌患者的中藥處方規律,綜合運用網絡藥理學和基因芯片技術分析核心處方治療胃癌的關鍵靶點和作用機制,并探索關鍵靶點與胃癌預后的關聯性,以期為中醫藥防治胃癌及新藥研發提供理論指導和依據。
1.1 數據來源 本研究遵循《赫爾辛基宣言》中的倫理準則。收集2015年1月1日至2020年12月31日就診于北京中醫藥大學東直門醫院和北京市桓興腫瘤醫院晚期胃癌患者病歷,并從中篩選出晚期胃癌中醫治療受益人群。此受益人群為接受現代醫學規范化治療與同步中醫藥治療后,生存期超過循證醫學證據下中位生存期的晚期胃癌患者。將2010年ToGA研究中單純化療組的中位生存期11.1個月作為循證醫學的中位生存期,故受益人群定義為Ⅳ期生存時間≥11.1個月的患者[5-6]。
1.2 納入標準 (1)病理診斷明確為胃癌,參照WHO(2019年)《消化系統腫瘤分類》胃癌定義[附錄(二)][7];(2)TNM分期為Ⅳ期,參照UICC及AJCC胃癌TNM分期系統(第8版,2016)[附錄(三)][8];(3)晚期胃癌中醫治療受益人群,即Ⅳ期生存時間≥11.1個月的患者;(4)至少接受1個月的中醫藥湯劑辨證治療;(5)年齡18周歲以上,性別不限。
1.3 排除標準 (1)既往或合并2種及以上原發惡性腫瘤;(2)心、肝、腎等臟器存在嚴重的非腫瘤性疾病;(3)未口服中藥湯劑者;(4)孕期、哺乳期婦女等。
1.4 數據錄入和分析 分析軟件為中國中醫科學院自主研發的中醫傳承計算平臺(TCMICS)V 3.0軟件。首先使用Excel錄入相關病歷信息,規范中醫處方藥名后根據模板錄入處方信息,一人負責信息錄入,兩人負責信息核對,以確保數據準確性。所有納入病歷均選擇錄入患者首次就診時的處方。最后,通過TCMICS V 3.0軟件對藥物頻數和組方規律進行分析。
1.5 篩選核心組合成分和靶點 首先檢索TCMSP數據庫(http://tcmspw.com/tcmsp.php)[9]并以口服生物利用度(OB)>30%和類藥性(DL)>0.18為篩選條件獲得了核心組成藥物的有效活性成分[10],同時檢索中國知網、萬方、維普數據庫和Pubmed數據庫以補充藥物的活性成分,時間截至2021年1月15日。去重后,利用Pubchem數據庫(https://pubchem.ncbi.nlm.nih.gov/)[11]獲得有效化學成分的2D或3D結構,通過將其結構“SDF”格式文件導入Swiss Target Prediction平臺(http://www.swisstargetprediction.ch/)[12]預測活性化合物的潛在靶點,同時結合TCMSP數據庫中的有效成分靶點對所有藥物靶點進行匯總。
1.6 獲取胃癌靶點 以“gastric cancer”為關鍵詞,以“Series”“Expression profiling by array”“Homo sapiens”為限定條件檢索GEO數據庫,截止時間為2021年1月15日,最終得到277個胃癌相關基因芯片。使用GEO2R篩選胃癌和胃正常組織樣本之間的差異表達基因(DEGs),其中|lgFC(fold change)|>1和校正P<0.05為差異有統計學意義。運用limma包和pheatmap繪制DEGs火山圖和熱圖。
1.7 構建相關PPI網絡 首先利用Venn在線數據獲得藥物和疾病共同靶點,STRING數據庫分析蛋白質之間的相互作用,分別獲取疾病DEGs、共同靶點及“有效成分-共同靶點“的PPI網絡。隨后,利用Cytoscape 3.8.1軟件對PPI網絡進行可視化分析,其插件MCODE和Bisogenet被用來識別各PPI網絡中的最顯著modules,參數設置均為默認參數。
1.8 富集分析 通過R軟件的“ggplot2”“clusterProfiler”“enrichplot”等安裝包獲取GO和KEGG富集分析結果,以P<0.05為差異有統計學意義,得到共同靶點的主要生物學過程和可能性較大的通路,并進一步篩選與胃癌相關的信號通路,利用Cytoscape軟件對通路和涉及的基因進行可視化分析。
1.9 關鍵靶點與胃癌關聯性分析 通過Oncomine數據庫和Kaplan-Meier Plotter數據庫進一步探尋關鍵靶點與胃癌預后的關聯性。
2.1 一般資料 本研究最終納入135例患者,其中男性81例,女性54例,男女比例約為3∶2。最大者為85歲(3例),最小者為26歲(1例),平均年齡為59.33歲。平均體質量指數(BMI)為21.13 kg/m2。(見表1)

表1 一般資料
2.2 藥物頻數統計 研究所納入的135份處方涉及251味中藥,藥物頻數前10的中藥依次為黃芪、黨參、半夏、陳皮、茯苓、雞內金、白術、甘草、麥芽、雞血藤。(見表2)

表2 中藥使用頻數分布(頻數≥33)
2.3 藥物性味歸經功效統計 四氣總頻數為2 472,頻數由高到低依次為溫、平、寒、涼、熱,其中溫、平、寒共占94.38%;五味總頻數為3 805,頻數由高到低依次為甘、苦、辛、酸、咸,其中甘、苦、辛共占90.41%。(見表3~4)

表3四氣頻數分布

表4 五味頻數分布
中藥歸經總頻數為6 832,其中脾經頻數最高,其次為肺經、胃經、肝經、腎經、心經等。(見表5)

表5 中藥歸經頻數分布
藥物功效分類總頻數為2 504,頻數最高為補虛類(696),其次為理氣類(234)、清熱類(218)、消食類(197)、化痰止咳平喘類(171)、利水滲濕類(169)等。(見表6)

表6 藥物功效分類
2.4 藥物關聯規則分析 本研究設置支持度為30%,置信度為0.7,得到29個核心組合,其中黃芪與半夏、黃芪與黨參、黨參與半夏、黨參與陳皮等為排名靠前的藥物組合。(見表7)圖1為藥物關系網絡圖。將支持度個數設置為40,置信度≥0.7,得到23個核心關聯組合。(見表8)

表7 高頻藥物組合表(支持度≥0.3,置信度≥0.7)

圖1 藥物網絡關系圖(支持度≥0.3,置信度≥0.7)

表8 藥物關聯規則分析表(支持度≥0.3,置信度≥0.7)
2.5 藥物組方規律分析 本研究通過無監督的聚類算法,將聚類個數設定為3進行聚類分析。第一類:以黃芪、黨參、陳皮、半夏、茯苓為主的處方有72份;第二類:以黃芪、黨參、陳皮、半夏、白術為主的處方有33份;第三類:以黃芪、雞內金、甘草、麥芽、雞血藤為主的處方有30份。(見表9)結合藥物頻數、關聯規則及聚類分析可知,“黃芪-黨參-陳皮-半夏-茯苓”為治療晚期胃癌的核心藥物組合。

表9 無監督聚類核心組合(聚類個數為3)
2.6 “黃芪-黨參-陳皮-半夏-茯苓”的網絡藥理學研究
2.6.1 “黃芪-黨參-陳皮-半夏-茯苓”有效活性成分和靶點 從TCMSP數據庫中篩選藥物有效活性成分,結合文獻補充了黃芪[13-14]中的黃芪皂苷Ⅰ(astragaloside Ⅰ)、黃芪皂苷Ⅱ(astragaloside Ⅱ)、黃芪皂苷Ⅲ(astragaloside Ⅲ)、黃芪皂苷Ⅳ(astragaloside Ⅳ);陳皮[15]中的橙皮甙(Hesperidin)。去重后得到有效活性成分77個(黃芪23個,黨參20個,陳皮6個,半夏12個,茯苓14個,黨參、半夏共同成分1個,黃芪、茯苓共同成分1個)。(見表10)

表10 “黃芪-黨參-陳皮-半夏-茯苓”有效活性成分
通過Pubchem數據庫排除5個無2D和3D結構的化合物及3個Swiss Target Prediction平臺無法預測的化合物,最終通過該平臺獲取可預測有效化合物69個。將該平臺屬性為“homo sapiens”,可信度≥0.1,篩重后得到藥物靶點579個,通過TCMSP數據庫得到了283個有效成分靶點,篩重后最終得到藥物靶點862個。
2.6.2 胃癌作用靶點 以GSE63089和GSE118916數據集中的胃癌樣本組織為研究對象,最終共獲得520個胃癌DEGs,包含366個上調基因和154個下調基因。圖2A為差異基因熱圖,圖2B為火山圖,圖中紅色和綠色分別代表為上調和下調基因,黑色為差異無統計學意義的基因。

圖2 胃癌差異基因的熱圖
2.6.3 構建“藥物-疾病”共同靶點PPI網絡圖 本研究利用Venn在線數據庫將862個藥物靶點和520個胃癌DEGs取交集后可得到58個“藥物-疾病”共同靶點。(見圖3)通過Cytoscape軟件中的CytoNCA插件,對獲得的PPI網絡圖進行可視化分析以獲得最顯著的靶點子網絡。以度中心性(Degree Centrality,DC)>61和介度中心性(betweenness centrality, BC)>600作為篩選條件進行PPI網絡可視化分析。將共同靶點PPI網絡圖(圖4-A,12 563個節點,63 587條邊)經degree(>61)過濾后得到PPI網絡圖(圖4-B,666個節點,28 308條邊),經BC(>600)得到PPI網絡圖(圖4-C中146個節點,3 683條邊)。NTRK1、TP53、MCM2、CUL3、CDK2、FN1、ESR1、ITGA4、UBC、NPM 1、CUL1等為排名靠前的靶點。(見表11)

表11 排名前20 的核心靶點拓撲分析表

圖3 藥物靶點與胃癌DEGs 交集韋恩圖

圖4 共同靶點PPI 網絡圖
2.6.4 構建“有效成分-共同靶點”可視化網絡圖 通過Cytoscape 3.8.1軟件構建“有效成分-共同靶點”的可視化網絡圖。圖5中紫色倒三角形為靶點,橢圓形為有效成分,共涉及105個節點(58個基因和47個藥物成分),280條邊。MOL000098[quercetin,(槲皮素)]、MOL000006[luteolin,(木犀草素)]、MOL000354[isorhamnetin(異鼠李素)]、MOL000422[kaempferol,(山奈酚)]、MOL002714[baicalein,(黃芩素)]等為度值排名靠前的有效成分。

圖5 “有效成分-靶點”可視化網絡圖
2.6.5 GO 和KEGG 富 集 分 析 通 過R 軟 件 的“ggplot2”“clusterProfiler”“enrichplot”包對58個共同靶點進行GO和KEGG富集分析。共獲得485條GO功能富集通路,其中BP涉及細胞外基質代謝、DNA信號轉導、調控有絲分裂過程等,MF涉及金屬內肽酶活性、氧化還原酶活性、蛋白酶活性等,CC涉及染色體結構、細胞周期蛋白依賴性蛋白激酶全酶復合物、蛋白激酶復合物等。
通過R軟件構建58個共同靶點的KEGG通路富集圖,其涉及的通路包括細胞周期、細胞衰老、p53信號通路、糖尿病并發癥中的AGE-RAGE信號通路、TNF信號通路等。(見圖6)此外,本研究利用Cytoscape構建了靶基因與富集通路的PPI網絡圖。此圖形共涉及41個節點(29個靶基因、12條富集通路),66條邊。圖7顯示,紅色倒三角形代表富集通路,綠色矩形代表靶基因,面積越大表示通路富集程度越顯著,基因參與富集通路越多。

圖6 KEGG 通路富集分析圖

圖7 KEGG 通路可視化網絡圖
2.7 關鍵靶點與胃癌預后的關聯性 本研究分析了Degree值排名前3的關鍵靶點(NTRK1、TP53、MCM2)與胃癌預后的關聯性。在Oncomine數據庫中,Meta分析納入10項研究,結果顯示:胃癌組織中NTRK1表達與正常組織比較,差異有統計學意義(P<0.05)。Meta分析納入7項研究,結果顯示:TP53在所有差異表達基因中其中位數值排名為3 465.0(P<0.05)。Meta分析納入12項研究結果顯示:MCM2在所有差異表達基因中的中位數值排名為2 386.0(P<0.05)。(見圖8)表12為9項研究中3個關鍵靶基因所在研究的樣本量、過表達倍數、P值等。

表12 NTR1/TP53/MCM2 在不同研究中的表達情況

圖8 Oncomine 數據庫中TP53/NTRK1/MCM2在胃癌組織中的表達
通 過Kaplan-Meier Plotter 數 據 庫 發 現,NTRK1、TP53、MCM2高表達組的OS和FP均低于低表達組,差異有統計學意義(P<0.05),提示NTRK1、TP53、MCM2表達水平越低,胃癌患者生存期越長。(見圖9~10)

圖9 NTRK1/TP53/MCM2 的表達水平與胃癌總生存期(OS)的關系

圖10 NTRK1/TP53/MCM2 的表達水平與胃癌首次進展時間(FP)的關系
胃癌是常見的消化系統惡性腫瘤,其發病率和死亡率在中國乃至全球惡性腫瘤中位居前列。本研究通過數據挖掘的方法分析了135例晚期胃癌中醫治療受益人群,發現晚期胃癌男性發病率明顯高于女性,男女比例約為3∶2,此結果與既往文獻報道男性發病率約為女性的2.22倍一致[22]。135例患者中超過85%患者的年齡在50歲以上。既往流行病學調查顯示,胃癌發病率隨年齡的增加逐漸升高,尤其是45歲以后,與本研究結果基本一致[23]。“黃芪-黨參-陳皮-半夏-茯苓”為治療晚期胃癌的核心藥物組合。黃芪和黨參是臨床上常用的補益類藥物。黃芪多糖可通過干擾細胞周期過程,抑制并殺傷人胃癌細胞MKN45、MGC-803的生長,發揮抗胃癌作用[24]。黨參多糖可顯著抑制胃癌BGC-823細胞的增殖,誘導細胞發生凋亡[25]。半夏和陳皮為常用的燥濕化痰藥對。半夏總生物堿可通過損傷細胞DNA抑制人胃癌細胞株SGC-7901細胞的增殖來發揮抗胃癌作用[26]。陳皮提取物可通過抑制STAT3信號通路,下調STAT3的磷酸化表達,抑制胃癌細胞的上皮-間充質轉化(Epithelial-mesenchymal transition,EMT)以抑制腫瘤細胞的侵襲[27]。現代藥理學研究表明,茯苓可通過增強機體免疫功能,活化巨噬細胞、NK細胞和T、B淋巴細胞,以及調節細胞因子分泌等途徑發揮抗腫瘤作用[28]。
網絡藥理學研究發現,“黃芪-黨參-陳皮-半夏-茯苓”共含有效活性成分為77個。“有效成分-靶點”網絡圖顯示,黃芪中的槲皮素、異鼠李素、山奈酚、熊竹素,黨參中的木犀草素,半夏中的黃芩素,陳皮中的橙皮素、柚皮素,以及茯苓中的16α-羥基脫氫甲基丙烯酸等成分均為抗胃癌的主要有效成分。其中槲皮素、異鼠李素、山奈酚、木犀草素、黃芩素、橙皮素、柚皮素等均為黃酮類化合物。黃酮類化合物可通過抑制腫瘤細胞增殖和腫瘤新生血管生成、誘導腫瘤細胞凋亡、促進腫瘤細胞自噬性死亡、逆轉多藥耐藥等多途徑發揮抗腫瘤作用[29-30]。有研究采用不同濃度的槲皮素處理胃癌細胞SGC-7901后發現,槲皮素可通過降低Cav-1表達抑制胃癌細胞的增殖及侵襲[31]。此外,槲皮素可通過下調Bcl-2的表達、上調Bax的表達、降低Bcl-2/Bax的水平,促進胃癌細胞凋亡[32]。朱棟良等[33]發現異鼠李素可通過p53等凋亡相關蛋白抑制人胃癌細胞MKN28的增殖,促進其細胞凋亡,從而發揮抗胃癌作用。SONG H等[34]發現山奈酚可通過下調CCNB1、CDK1、CDC25C的水平抑制胃癌MKN28和SGC7901細胞的增殖和小鼠移植瘤的生長。REN L Q等[35]發現木犀草素聯合奧沙利鉑可通過改變細胞周期比例以抑制胃癌SGC-7901細胞的增殖,從而誘導細胞凋亡。HE P等[36]發現橙皮素可通過抑制PI3K/AKT信號通路,上調PTEN表達而誘導線粒體通路以增強順鉑對胃癌的抗腫瘤作用。
本研究發現,核心藥物和疾病共同靶點為58個,其中NTRK1、TP53、MCM2、CUL3、CDK2、FN1、ESR1等為關鍵靶點。神經營養因子受體酪氨酸激酶基因1(Neurotrophic Receptor Tyrosine Kinase 1,NTRK1)負責編碼TRK家族蛋白中高親和力神經生長因子受體(TRKA蛋白),是NTRK基因家族成員之一,與EGFR、KRAS 基 因 突 變 和ROS1 融 合 基 因 不 同 時 存 在[37]。NTRK1基因融合廣泛存在于多種實體瘤中,但發生率因腫瘤類型不同而差異較大。其在非小細胞肺癌、乳腺癌等常見腫瘤中發生率不足1%,在分泌性乳腺癌、嬰兒型纖維肉瘤等罕見腫瘤中則超過90%[38]。SHINOZAKI-USHIKU A等[39]于2020年首次報道了NTRK1基因重排發生在胃癌中,可能與侵襲性表型及廣泛的淋巴管浸潤等組織學特征有關。腫瘤抑制因子p53(tumor suppressor p53, TP53)是一種重要的抑癌基因,約50%腫瘤存在TP53突變,且與腫瘤患者不良預后密切相關[40]。微小染色體維持蛋白2 (minichromosome maintenance complex component 2,MCM2)為微小染色體維持蛋白家族成員之一,過表達于增殖細胞以反映細胞增殖活性,可作為細胞增殖標記物[41]。KATO H等[42]研究發現,MCM2在食管鱗癌中的表達與淋巴結轉移、遠處轉移、病理分期等有關,其在預后價值方面可能會成為比Ki-67更可靠和有用的標記。
富集分析結果發現,NTRK1、TP53、MCM2、CUL3、CDK2等58個共同靶點通過參與細胞外基質代謝、DNA信號轉導、調控有絲分裂、金屬內肽酶活性、氧化還原酶活性、染色體結構等過程,以及調控細胞周期、細胞衰老、p53信號通路、糖尿病并發癥中的AGE-RAGE信號通路、TNF信號通路等途徑發揮抗胃癌作用。細胞周期在調控細胞生長增殖過程中起重要作用,細胞周期進程的異常或中斷會打亂細胞增殖和細胞凋亡間的平衡,繼而導致腫瘤。CDK2是重要的細胞周期依賴性蛋白。有研究發現,槲皮素可通過使CDK2過表達以阻滯胃癌SGC-7901細胞周期于S期,發揮抗癌效應[43]。有研究發現,異鼠李素可通過細胞周期通路阻斷細胞G0期轉換為S期,且可阻斷細胞DNA合成和復制,從而抑制胃癌細胞增殖,誘導細胞凋亡[44]。p53信號通路是以腫瘤抑制基因p53為核心且與許多基因相互作用而構成的信號通路,其在調控細胞正常生命活動中有重要作用。柚皮素可通過調控microRNA34a/Sirt1/p53信號通路發揮抗癌作用,而槲皮素可通過促進p53的表達及增加p53的穩定性以抑制腫瘤細胞增殖[45-46]。糖基化終末產物(AGEs)是由一系列復雜化學過程形成的異源性大分子物質。RAGE是首個AGEs的受體,屬于免疫球蛋白超家族受體,在肝癌、直腸癌、乳腺癌等腫瘤中高表達。AGEs結合RAGE共同構成了糖尿病中的AGE-RAGE信號通路[47-48]。AGEs可通過使RAGE過表達促進結腸癌干細胞增殖,抑制其凋亡[49]。腫瘤壞死因子(TNF)可通過與特異性受體結合誘發炎癥反應,促進細胞生長增殖、分化、凋亡等過程[50]。TNF可通過激活NF-κB、JNK、細胞凋亡3條下游信號通路發揮其免疫調節、抗炎、抗病毒、細胞凋亡等生物學功能。木犀草素可通過抑制TNF-α誘導的NF-κB活性以抑制NF-κB靶定抗凋亡基因的表達,其尚可通過抑制NF-κB放大并延長TNF-α誘導的JNK活性以發揮抗癌效應[51]。
本研究通過Oncomine數據庫和Kaplan-Meier Plotter數據庫發現,NTRK1、TP53、MCM2在胃癌組織中均高表達;其高表達組的OS和FP均低于低表達組,表明NTRK1、TP53、MCM2表達水平越低,胃癌患者生存期越長。TP53突變被證明與多種腫瘤的不良預后相關,但TP53的狀態與胃癌患者預后之間的關系并未明確[52]。HAMAKAWA T等[53]通過檢測晚期胃癌患者血漿中TP53基因后發現,TP53水平升高與不良預后密切相關,且術后發生復發轉移的患者TP53水平均升高。此結論與本研究通過Oncomine數據庫得出的觀點一致。MCM2是能準確反映細胞增殖狀態的標志物,可對腫瘤患者預后進行預測。YANG C等[54]通過檢測264例患者胃癌組織和癌旁組織中MCM2的水平后發現,MCM2在胃癌組織中的表達水平高于正常胃黏膜(P=0.04),且MCM2表達陰性的患者生存期明顯高于表達陽性者(P<0.05)。此結論與本研究通過Oncomine數據庫和Kaplan-Meier Plotter數據庫得出的結果一致。LIU M等[55]通過MCM2表達水平預測賁門癌的診斷和預后,發現MCM2與Ki67和PCNA的表達相關,且MCM2敏感性和陰性預測值優于Ki67,是一種敏感、特異、高效的賁門癌標志物,具有潛在的臨床應用價值。1項大規模的中國肺癌患者NTRK1融合調查[56]顯示,21 155例肺癌患者中出現12例NTRK1融合陽性,最終發現伴有多個融合的NTRK1+肺癌病例極為罕見,但NTRK1+融合的出現可能是EGFR TKIs的耐藥機制。但目前關于NTRK1在胃癌中的研究較少,SHINOZAKI-USHIKU A等[39]在2020年首次報道了NTRK1基因重排發生在胃癌中。關于其在胃癌中的表達和預后關系目前并不明確,需要未來大樣本的研究加以證實。
中醫藥治療晚期胃癌使用頻率最高和關聯程度最大的5味核心藥物為“黃芪-黨參-陳皮-半夏-茯苓”;“黃芪-黨參-陳皮-半夏-茯苓”可能通過其有效成分槲皮素、異鼠李素、山奈酚、木犀草素等調控NTRK1、TP53、MCM2、CUL3、CDK2等58個關鍵靶點,并通過細胞周期、p53信號通路、糖尿病并發癥中的AGE-RAGE信號通路、TNF信號通路等途徑參與調控腫瘤細胞周期、炎癥反應發揮抗胃癌效應;NTRK1、TP53、MCM2在胃癌組織中均高表達,三者高表達組OS和FP均低于低表達組,表明NTRK1、TP53、MCM2表達水平越低,胃癌患者生存期越長。