王 艷 李 園 高 穎 褚福浩 蘇澤琦 丁 霞 (北京中醫藥大學中醫學院,北京 102488)
胃癌(gastric cancer,GC)是全球常見的惡性腫瘤之一,其發病率和病死率分別位居惡性腫瘤的第五和第三[1]。根據Lauren 分型,可將胃腺癌分為腸型、彌漫型和混合型,其中腸型胃癌是胃癌中最常見的類型,其發生是一個復雜的、多過程的級聯反應模式,從慢性萎縮性胃炎(chronic atrophic gastritis,CAG)到腸上皮化生(intestinal metaplasia,IM),再到異型增生(dysplasia,Dys)是涉及多個基因及通路的復雜生物學過程。IM 作為胃癌前病變的重要階段,該病理階段的形成和進展可增加腸型胃癌的發生風險[2]。因此,尋找IM 的潛在關鍵靶點,明確其發生發展機制,對IM及腸型胃癌的早期診斷及預防具有重要意義和價值。
近年來,隨著生物信息學的發展和測序技術的應用,從轉錄組、蛋白組水平研究疾病的發生發展機制已成為普遍關注的熱點。本研究利用生物信息學技術,挖掘公共基因芯片數據庫(Gene Expression Omnibus,GEO)中包含IM 的基因芯片,確定IM 組織與正常胃黏膜組織之間的差異表達基因(differen‐tially expressed genes,DEGs),隨后進行GO 分析和KEGG 通路富集分析,構建蛋白相互作用(PPI)網絡,尋找關鍵基因,篩選靶向IM關鍵基因的中藥,為探究IM 發生發展的分子機制及治療藥物提供科學依據。
1.1 基因表達譜芯片的篩選 本研究從美國國立生物技術信息中心(National Center for Biotechnology Information,NCBI)的GEO 數據庫(http://www. ncbi.nlm.nih.gov/)中,以“(gastric OR gastritis)OR stomach”為檢索條件,通過閱讀全文篩選出包含IM的基因芯片數據集,獲得GPL18990 和GPL17077 平臺的GSE78523和GSE60427兩個數據集,從中選取IM 樣本和正常胃黏膜樣本進行分析[3-5]。
1.2 數據處理及差異基因分析 利用R 語言nor‐malizeBetweenArrays 函數對數據進行背景矯正和歸一化處理,使數據具有可比性,并對校正后的數據進行繪圖。采用Limma 包對IM 組織與正常組織進行差異基因篩選,篩選標準為P<0.05,|Log2FC|>1;利用pheatmap 包對差異基因進行熱圖的繪制,直觀地展現差異基因在每個樣本中的表達情況,利用火山圖分別展示2 個數據集中上調及下調的差異基因。取2 個數據集所獲得差異基因的交集,并利用在線工具繪制韋恩圖(http://bioinformatics. psb.ugent.be/webtools/Venn/),獲得共同表達的DEGs。
1.3 GO 富集分析和KEGG 通路富集分析 利用DAVID6.8 在線工具(https://david. ncifcrf. gov/)對上述共同表達差異基因進行GO 富集分析及KEGG通路分析,以P<0.05為篩選標準。
1.4 PPI 的構建 通過STRING 在線數據庫(https://string-db.org/)對2個數據集共有的DEGs構建PPI網絡,置信度評分≥0.4為顯著;將原始數據輸出并導入Cytoscape3.6.1(https://cytoscape. org/)軟件中進行PPI 網絡的可視化[6],在網絡中,節點表示差異基因所編碼的蛋白質,與該節點的連線代表蛋白間的相互作用,連接數為該節點的degree,利用Cytohubba 插件篩選PPI 網絡中degree 得分前9 的關鍵基因,MCODE插件篩選出重要的模塊。
1.5 靶點對接及中藥預測 將關鍵基因與Coremine Medical 數據庫(http://www. coremine. com/)相互映射,篩選出靶向IM 關鍵基因的中藥,以P<0.05表示差異具有統計學意義。
2.1 差異基因的篩選 本研究納入2組基因芯片,其中GSE78523 數據集包括15 例正常胃黏膜樣本,14例IM 胃黏膜樣本(6例不完全腸化生,8例完全腸化生);GSE60427 數據集包括8 例正常胃黏膜樣本,8 例IM 胃黏膜樣本。所有數據均經affy 包標準化處理[7],根據處理后的箱線圖(圖1)顯示,樣本的基因表達譜數據一致性較好,可以進行差異分析。GSE78523 數據集共篩選出458 個差異基因,其中上調基因384個,下調基因74個;GSE60427數據集共篩選出1 766個差異基因,其中上調基因1 215個,下調基因551個;通過火山圖(圖2)可以直觀地顯示兩個數據集中總體基因表達情況,橫坐標log2(fold change)為差異表達倍數的log2轉換,值≥1 表示上調的基因,≤?1為下調的基因,差異較大的基因分布在X 軸的兩端,縱坐標?log10(p-value)代表對p-value 進行?log10的轉化,值越大說明差異越顯著,圖上的每個點代表1 個基因,將|logFC|>3 的基因在圖上進行標注。通過熱圖(圖3A、B)反映差異基因在IM 組織和正常組織中的表達情況,橫坐標表示樣本聚類,縱坐標表示基因聚類;通過韋恩圖(圖3C)發現兩個數據集包含135個共同的DEGs。
2.2 GO富集分析和KEGG通路分析 運用DAVID數據庫對135 個DEGs 進行GO 和KEGG 通路富集,GO 分析包括生物學過程(biological processes,BP)、細胞成分(cell component,CC)、分子功能(molecular function,MF)三個部分。BP 相關變化主要涉及“O-聚糖合成(O-glycan processing)”“消化(digestion)”“細胞增殖的正向調控(positive regulation of cell pro‐liferation)”“蛋白水解(proteolysis)”等13 個功能簇;CC 相關變化主要涉及“細胞外空間(xtracellular space)”“質膜的組成部分(integral component of plasma membrane)”“細胞外泌體(extracellular exo‐some)”“質膜(plasma membrane)”“膜的組成部分(integral component of membrane)”等功能簇;MF 相關變化主要涉及“病毒受體活性(virus receptor activity)”“轉錄阻遏活性,RNA 聚合酶Ⅱ核心啟動子近端區域序列特異性結合(transcriptional repressor activity,RNA polymerase Ⅱcore promoter proximal region sequence-specific binding)”“Ras 鳥嘌呤核苷酸交換因子活性(Ras guanyl-nucleotide exchange factor activity)”等功能簇。KEGG 通路分析顯示基因富集于“胃酸分泌(gastric acid secretion)”“氮代謝(nitro‐gen metabolism)”“腎素-血管緊張素系統(reninangiotensin system)”“蛋白質的消化吸收(protein digestion and absorption)”“胰腺分泌(pancreatic secretion)”共5 條信號通路(表1)。對以上GO 及KEGG 結果采用R 語言ggplot2 包進行可視化呈現(圖4)。

表1 KEGG分析Tab.1 KEGG analysis

圖4 DEGs的GO功能及KEGG富集結果Fig.4 GO function of DEGs and KEGG enrichment results
2.3 PPI網絡分析和關鍵基因篩選 利用Cytoscape中的Cytohubba插件找出關鍵基因,將degree≥5的基因定義為關鍵基因,分別為MUC5AC、DEFA5、MUC17、ALPI、SST、FOXA2、MUC13、GCNT3、OLFM4,節點顏色越深代表分值越高。根據MODE 插件對模塊進行重要程度分析,篩選代表性的模塊,其中核心模塊打分值為3,包含GCNT3、MUC5AC、MUC17、MUC13共4個基因。見圖5。

圖5 DEGs的PPI網絡、關鍵基因及核心模塊Fig.5 PPI network,key genes and core modules of DEGs
2.4 根據關鍵基因預測治療中藥 利用Coremine Medical 數據庫對關鍵基因進行IM 治療潛在中藥的篩選,結果顯示南沙參(P=0.002 28)、桔梗(P=0.002 29)、半夏(P=0.003 29)、藿香(P=0.006 67)、浙貝母(P=0.090 1)、甘草(P=0.012 7)、大黃(P=0.014)、車前草(P=0.015 4)、車前子(P=0.016 2)、款冬花(P=0.016 3)、瓜蔞(P=0.020 7)、瓜蔞皮(P=0.020 7)、瓜蔞子(P=0.020 8)、野菊花(P=0.021 2)、薏苡仁(P=0.022 2)、天花粉(P=0.023)、黨參(P=0.025)、甘草(P=0.027 1)、桑葉(P=0.029 5)、山茱萸(P=0.029 7)、青蒿(P=0.033 7)與MUC5AC 相對應;蘄蛇(P=0.035 9)與ALPI相對應;木鱉子(P=0.027 8)、枳實(P=0.046 3)、蒼術(P=0.047 2)與SST相對應;鹿角(P=0.007 4)與FOXA2 相對應;蠶豆(P=0.011 3)與MUC13相對應;蓖麻子(P=0.019 9)與OLFM4相對應。這些中藥可能作為IM的潛在治療藥物。
IM 是指胃黏膜的正常上皮細胞被腸型上皮細胞取代,出現杯狀細胞、潘氏細胞及吸收上皮細胞的一種病理性形態學改變,被認為是胃癌癌前病變。本研究利用GEO 數據庫檢索得到IM 基因芯片數據集(GSE78523、GSE60427),篩選出135 個共同DEGs 進行生物信息學分析,發現IM 的發生可能與單核細胞趨化性、白細胞遷移、細胞外泌體等炎癥相關生物過程及胃酸分泌通路有關,其結果有助于揭示IM 發生發展的分子機制,從基因層面挖掘出IM 發生的關鍵基因,可能作為IM 的潛在生物標志物,篩選出可干預IM 靶點的中藥,為臨床用藥提供依據。
3.1 炎癥反應是IM 發生發展的關鍵因素 由于Hp感染或其他環境因素影響,白細胞介導慢性胃黏膜炎癥,導致多灶性腺體萎縮、壁細胞減少及酸分泌功能的降低,隨之出現以杯狀細胞為主的IM。單核細胞趨化性、白細胞遷移等生物功能及細胞外泌體等細胞組分參與了細胞的炎癥反應過程。免疫細胞被認為是腫瘤微環境的重要組成部分,嗜中性粒細胞和巨噬細胞是腫瘤微環境最豐富的免疫細胞[8]。胃部炎癥性疾病及胃癌前病變過程中可見嗜中性粒細胞、淋巴細胞等白細胞聚集,其分泌的淋巴因子可募集巨噬細胞于炎癥和腫瘤部位,發揮抗炎及殺傷癌變細胞的作用,但嗜中性粒細胞會產生活性氧(ROS)及活性氮物質(RNS),并在細胞中積累導致細胞惡性轉化[6,9]。血液中的單核細胞游走進入組織器官發育成熟為巨噬細胞,巨噬細胞常出現于急性炎癥的后期、慢性炎癥和非化膿性炎癥等,具有較強的吞噬能力,參與特異性免疫反應,攝取并呈遞抗原,巨噬細胞的表型和功能受周圍微環境的調節,當機體出現感染與炎癥時,巨噬細胞首先表現出M1 表型,表達和分泌經典促炎細胞因子和趨化因子,通過免疫識別發揮抗腫瘤作用,但長期的炎癥反應會導致組織損傷,此時,M2 型巨噬細胞可產生VEGF 和抗炎分子,起到減輕炎癥反應,促進組織修復的作用,在腫瘤微環境中,M2 型巨噬細胞可通過促進腫瘤生長、遷移侵襲、免疫抑制等作用發揮促癌效應[8,10-12]。M1、M2 型巨噬細胞的動態平衡可維持人體內環境穩態,研究發現,M2 型巨噬細胞是壁細胞丟失后誘導化生的關鍵免疫細胞,在IM中表達增多[13]。
細胞外泌體是一種具有雙層磷脂膜結構的細胞外囊泡,攜帶分泌細胞中的生物活性物質,如蛋白質、核酸、脂質等,將其傳遞到靶器官,參與細胞免疫、抗原呈遞等多種生物反應過程。腫瘤來源的循環外泌體可調節巨噬細胞的極化,誘導向M2 型促腫瘤巨噬細胞的極化,還可增強嗜中性粒細胞向癌細胞的募集來促進腫瘤發生[14-16]。外泌體包含腫瘤細胞的遺傳特征,可作為胃癌早期診斷、預后預測及治療效果評估的生物標志[17],但其在IM 發生、發展中的作用機制尚未見報道,值得進一步深入研究。
3.2 胃酸分泌異常誘發胃黏膜IM病理改變 正常胃黏膜處于不斷地更新修復中,表面上皮不斷地脫落,并由胃腺頸部干細胞增生分化,向上移行分化為表面黏液細胞,向下遷移分化為其他胃底腺細胞。位于胃體的壁細胞通過乙酰膽堿、組胺和胃泌素的刺激導致胃酸分泌,由于壁細胞數量下降,腺體萎縮,胃酸分泌量減少,加速CAG 惡性轉化,導致IM 和Dys 發生,進而誘發癌變[18-19]。除了分泌胃酸和內因子外,壁細胞還具有誘導自身和胃上皮細胞分化的功能。壁細胞功能正常時,胃腺頸部的干細胞分化為成熟細胞,腺體完整地再生。當壁細胞功能缺陷時,胃干細胞可能分化為成熟的腸細胞,胃腺以腸化生的形式再生。當壁細胞功能喪失時,干細胞不能成功分化為成熟細胞,未成熟細胞在胃黏膜組織中的積累,形成不同嚴重程度的異性增生和不同分化程度的癌癥[20]。胃壁細胞數量改變及泌酸功能的喪失是IM發展為胃腺癌的先決條件。
通過GO 富集和KEGG 功能分析發現,IM 的發生涉及鈉離子跨膜轉運、鉀離子轉運、碳酸氫鹽運輸、膽囊收縮素信號通路,且與胃酸分泌功能密切相關。胃酸不僅可以消化食物,同時高酸性環境也可殺死攝入的微生物,抑制細菌的過度生長,構成抵御食源性微生物的第一道防線[18,21]。胃酸由胃壁細胞分泌,由于胃液中H+的濃度為150~170 mmol/L,比血漿中的H+高出3 000 000~4 000 000倍,因此,壁細胞逆濃度梯度分泌H+依靠其頂膜上的H+-K+-ATP酶來完成。黏液-HCO3?屏障是胃黏膜保護的第一道防線,可有效保護胃黏膜免受胃腔內胃酸和胃蛋白酶的損傷。除黏液-碳酸氫鹽,胃黏膜上皮細胞的頂膜和相鄰細胞側膜間存在緊密連接,可防止細胞內鈉離子、鉀離子外流及氫離子內流,成為保護胃黏膜的第二道防線。IM 過程中鈉離子、鉀離子、碳酸氫鹽運輸等生物功能發生改變,導致胃酸分泌減少,胃上皮細胞破壞,繼而被腸化生細胞取代。膽囊收縮素(CCK)信號通路也參與調控胃酸分泌的過程,膽囊收縮素受體(CCKR)主要包括兩大類:CCK-A和CCK-B 受體。分泌生長抑素(SST)的D 細胞上存在CCK-A 受體,CCK 通過與CCK-A 受體結合,導致D 細胞釋放生長抑素抑制胃的運動和分泌,延緩胃排空,胃竇的G 細胞分泌胃泌素作用于壁細胞上的CCK-B 受體,刺激胃酸分泌,也可通過影響腸嗜鉻樣(ECL)細胞分泌組胺間接刺激壁細胞分泌胃酸[22-24]。整體情況下,CCK 對胃酸的分泌主要表現為抑制作用,與IM 階段胃酸分泌減少相吻合,提示結果的可靠性。
3.3 關鍵基因可能成為IM潛在治療靶點 本研究分析出的關鍵基因包括MUC5AC、DEFA5、MUC17、ALPI、SST、FOXA2、MUC13、GCNT3、OLFM4,其中DEFA5、MUC17、MUC13、ALPI、GCNT3、OLFM4表達上調,MUC5AC、SST、FOXA2 表達下調。黏蛋白(MUC)是胃黏膜屏障的關鍵成分,為上皮表面提供保護和潤滑作用,在正常組織中以細胞和組織特異性模式表達,其改變可被視為胃黏膜惡性轉化的分子標志,有望成為早期篩查/診斷標志物[25]。其中,胃黏液蛋白MUCA5AC 表達于正常胃黏膜小凹上皮表面,是胃黏膜表面黏液層的主要成分[26]。研究發現MUC5AC 在正常胃黏膜、IM、Dys 及GC 組織中表達逐漸降低,其低表達可能是胃癌預后不良的指標[27-28]。黏蛋白17(MUC17)主要在腸道中表達,可維持腸上皮完整性,在胃癌組織和細胞中表達上調,其敲低可降低胃癌細胞的遷移和侵襲能力[29-31]。MUC13 是一種跨膜黏蛋白,在正常胃黏膜中不表達,而在IM 與胃癌中經常過表達,其高表達可增強腫瘤細胞的遷移和侵襲能力,與腸型胃癌相關聯[32-33]。此外,SST是由胃腸道黏膜D 細胞分泌的一種肽類激素,可抑制胃酸分泌,發揮保護胃黏膜的作用,在胃癌組織中呈低表達,其高表達可抑制胃癌細胞的增殖、侵襲和遷移能力[34-35]。GCNT3 已被建議作為結直腸癌預后的生物標志物,其過表達可降低結腸癌細胞的增殖和侵襲能力[36]。防御素是上皮細胞表面產生的抗微生物肽,是先天宿主防御的組成部分,α-防御素(DEFA5)由小腸隱窩基部的Paneth細胞表達,參與Paneth細胞的分化,是腸道固有免疫的關鍵效應分子,對巨噬細胞和T 淋巴細胞均有趨化作用[37]。腸堿性磷酸酶(ALPI)在成熟的小腸上皮細胞中高表達,IM 發生過程中胃部出現Paneth 細胞等腸上皮細胞,因此DEFA5、ALPI 表達上調。OLFM4 與GC 細胞的增殖、遷移和侵襲有關,可促進惡性腫瘤的發生發展,在胃癌組織中過度表達[38]。FOXA2 在胃癌組織中下調,與胃癌預后不良有關,其過表達可抑制胃癌細胞增殖[39]。以上基因均在胃腸中表達,與消化道癌癥相關,其在IM 階段已能檢測出表達量差異,可作為早期干預治療、預防IM向胃癌進展的靶點。
3.4 相關中藥可能是IM治療的潛在藥物 現代醫學對IM尚無特效療法,而中醫藥可改善患者臨床癥狀,具有潛在的療效優勢。中醫學中并沒有腸上皮化生的病名,現代醫家結合患者臨床癥狀將IM歸屬于“胃痛”“嘈雜”“痞滿”等范疇,其核心病機以胃陰不足、氣陰兩虛為主,兼見陽虛、氣虛、氣滯、陰虛、熱、濕、痰等,治以益氣健脾,養陰解毒為主[40-42]。本研究通過Coremine Medical 數據庫篩選治療IM 的潛在中藥,大致可分為5類:理氣藥(枳實、桔梗)、補益藥(黨參、甘草、沙參)、祛濕藥(藿香、蒼術)、化痰藥(半夏、瓜蔞)、清熱解毒藥(野菊花、車前草)。枳實破氣消積,化痰除痞;桔梗宣肺、祛痰,宣肺氣以降胃氣;黨參補脾生津;沙參益胃生津,補氣,化痰;藿香、蒼術燥濕健脾,化濕和胃;半夏燥濕化痰、降逆止嘔、消痞散結;野菊花、車前草清熱解毒,共奏理氣健脾,養陰解毒之效。這些中藥配伍是溫膽湯、四君子湯、半夏瀉心湯、甘草瀉心湯的組成部分,體現了中醫治療的組方配伍原則?,F代研究顯示廣藿香中的廣藿香醇、桔梗中的桔梗皂苷-D 具有抗炎、免疫調節及抗腫瘤作用,體外研究表明其可抑制胃癌細胞的侵襲和轉移[43-44]。甘草中的甘草次酸可抑制胃癌細胞增殖,誘導其凋亡[45]。黨參具有抑制胃酸分泌,促進胃黏液分泌,增強黏液-碳酸氫鹽屏障,促進胃腸上皮細胞增殖,保護和修復胃腸黏膜及免疫調節作用[46-47]。沙參具有保護胃黏膜,誘導胃癌細胞凋亡的作用[48-49]。蒼術可抑制胃酸分泌,促進胃黏膜修復,抗炎抗腫瘤及免疫調節[48]。半夏具有活化白細胞及抗腫瘤作用[50];車前草的醇提物及水提物均有體外抗炎作用[51];菊花中的黃酮類化合物可抑制胃癌細胞的生長并誘導其凋亡,發揮抗腫瘤作用[52]。上述中藥可能通過干預關鍵基因發揮治療IM的作用。
綜上所述,本研究通過功能富集分析及通路分析說明IM 的發生是一個多基因異常表達的復雜過程,主要與白細胞、單核細胞、細胞外泌體等引起的細胞炎癥反應及胃酸分泌過程相關,該結果有助于對IM發生過程中涉及機制的理解,同時從基因層面挖掘出IM 中的關鍵基因,可作為IM 的潛在生物標志物和治療靶標,枳實、桔梗、黨參、甘草、沙參、藿香、蒼術、半夏、野菊花、車前草可作為IM 治療的靶向中藥,為后續的藥物研究提供思路。由于本研究只是基于已有數據集進行數據挖掘,其結果及機制仍需在基礎與臨床研究中進一步驗證。