安 霞,高夏青,楊春婷,王梓年,王宏偉,李海龍△
1.甘肅中醫藥大學附屬醫院檢驗科,甘肅蘭州 730000;2.甘肅中醫藥大學第一臨床醫學院,甘肅蘭州 730000;3.蘭州市第一人民醫院腫瘤科,甘肅蘭州 730000
胃癌是全球高發的惡性腫瘤之一,也是全球常見癌癥相關死亡原因排第二位的惡性腫瘤。目前胃癌的治療手段主要是手術切除,但絕大多數胃癌在確診時已屬于進展期,已失去通過手術根治的機會。因此,研究早期診斷和預后標志物意義重大。KLHL7是Kelch樣家族蛋白成員之一,主要編碼BTB-Kelch相關蛋白,所編碼的蛋白質可能參與蛋白質降解。有研究發現,KLHL7基因高表達于肺癌、卵巢癌和結直腸癌等腫瘤中[1],其異常表達參與了部分腫瘤的惡性表型形成,而關于該基因在胃癌中的表達及臨床意義目前鮮見報道。本文擬借助數據庫對KLHL7在胃癌中組織中的表達情況、預后參數及其相關信號通路等進行生物信息學分析。
1.1KLHL7基因在人胃癌組織及癌旁組織中的表達 選擇在線仙桃學術數據庫(https://www.xiantao.love/)檢索分析KLHL7基因在人胃癌組織及癌旁組織中的差異表達情況。仙桃學術數據庫所用數據是經癌癥基因組學數據分析平臺UCSC XENA (https://xenabrowser.net/datapages/)統一處理的腫瘤基因組圖譜(TCGA)和基因型-組織表達數據庫(GTEx)的TPM(transcripts per million reads)格式的高通量測序數據。本研究所分析的數據均提取自TCGA中的胃癌組織和GTEx中對應的癌旁組織或非配對正常組織數據。所有RNA測序(RNA-seq)數據均以TPM格式表示,并進行log2轉化后進行樣本間的KLHL7的差異表達比較。非配對組織樣本數據選擇仙桃學術數據庫中來自TCGA數據庫414例胃癌樣本,210例非配對胃黏膜組織;胃癌表達數據來源于經UCSC XENA統一處理的TCGA和GTEx的FPKM(fragments per kilobase per million reads)格式的高通量測序數據。非配對正常胃黏膜組織提取自TCGA和GTEx中胃癌組織對應的正常組織數據。配對組織樣本數據選擇仙桃學術數據庫中來自TCGA數據庫的27例胃癌樣本和癌旁組織樣本,于TCGA數據庫 (https://portal.gdc.cancer.gov/)下載并整理TCGA-胃腺癌(TCGA-STAD)項目STAR流程的RNA-seq數據,并提取TPM格式的數據。
1.2KLHL7基因在人胃癌組織異常表達的臨床病理特征分析 利用仙桃學術數據庫分析KLHL7基因在配對胃癌組織與癌旁組織中的表達情況、KLHL7基因異常表達的胃癌組織的TNM分期、組織學類型,并對KLHL7的異常表達開展免疫細胞浸潤特征分析和受試者工作特征(ROC)曲線分析。
1.3與KLHL7基因具有相關性的共表達基因進行京都基因和基因組百科全書(KEGG)信號通路富集分析 使用cBioPortal在線軟件 (https://www.cbioportal.org/)[2]檢索基于TCGA數據庫的412例胃癌與癌旁組織樣本的數據集,檢索其“co-expression”模塊中與KLHL7基因具有相關性的共表達基因。剔除相關系數<0.30的基因,并分別將剩余的上調和下調的共表達基因全部輸入Sanger學術平臺(http://vip.sangerbox.com/index.html)[3],運用KEGG一鍵化富集分析工具進行KEGG信號通路富集分析。
1.4相關共表達基因的蛋白互作(PPI)網絡分析和核心基因篩選 選擇在線STRING(https://string-db.org/)數據庫[4],將有93個與KLHL7具有相關性的腫瘤基因輸入在線軟件STRING進行PPI網絡分析,采用K-means聚類算法,以n=3進行聚類分析。觀察并分析節點后,將節點(node)和周邊(edge)數據提取后導出文件。將PPI數據庫構建作用靶點輸入Cytoscape 3.9 軟件構建網絡,采用其插件CytoNCA計算參數,篩選關鍵核心基因。進一步使用在線仙桃學術數據庫驗證核心基因在胃癌與癌旁組織間的差異表達。
1.5統計學處理 如果組間數據滿足正態分布和方差齊性,則選用t檢驗;如果滿足正態分布,而不滿足方差齊性,則選用Welcht′檢驗;如果組間數據不滿足正態分布,則選用非參數檢驗Wilcoxon秩和檢驗,信號通路富集分析使用R軟件包cluster Profiler(version 3.14.3)進行富集分析,KEGG信號通路富集分析中,選擇Benjamini-Hochberg法錯誤發現率(FDR)<0.1及P<0.05的信號通路為篩選標準。以P<0.05為差異有統計學意義。
2.1KLHL7基因在人胃癌組織及癌旁組織中的表達 在線仙桃學術數據庫檢索KLHL7基因,分析結果表明,相對于癌旁組織,KLHL7基因在人胃癌組織中表達上調(P<0.001),見圖1;在非配對組織中,KLHL7基因在人胃癌組織的表達也高于正常組織(P<0.05),見圖2。其中,圖中縱坐標是FPKM格式的高通量測序數據經對數轉換后顯示的基因表達量。

注:***P<0.001。圖1 KLHL7在配對胃癌組織及癌旁組織的表達

注:*P<0.05。圖2 KLHL7在非配對胃癌組織及癌旁組織的表達
2.2KLHL7基因在人胃癌組織異常表達的臨床病理特征分析 基于仙桃學術數據庫對高表達KLHL7基因胃癌患者的臨床病理特征進行分析,結果表明,相對于正常組織,KLHL7基因在M0和M1期胃癌組織中表達水平升高(P<0.05),見圖3;相對于正常組織,KLHL7基因在胃癌組織中N0、N1、N2和N3期淋巴結中表達水平升高(P<0.05),見圖4;相對于正常組織,KLHL7基因在腫瘤分期為Ⅰ、Ⅱ、Ⅲ、Ⅳ期的胃癌組織中表達水平升高(P<0.05),見圖5。ROC曲線分析發現,KLHL7基因診斷胃癌的曲線下面積(AUC)為0.722(95%CI:0.606~0.837),提示其對胃癌具有潛在診斷價值。對免疫浸潤特征進行分析發現,KLHL7基因高表達與中央記憶型T細胞(Tcm)和輔助性T細胞(Th細胞)浸潤呈正相關,與漿細胞樣樹突狀細胞(pDC細胞)和Th17細胞浸潤呈負相關,表明其與T細胞免疫和抗原呈遞有關,見圖6。

注:*P<0.05,**P<0.01,***P<0.001,ns為差異無統計學意義。圖4 KLHL7在N0、N1、N2和N3淋巴結中的表達

注:*P<0.05,**P<0.01,***P<0.001,ns為差異無統計學意義。圖5 KLHL7在不同STAGE期胃癌組織中的表達

注:Tcm為中央記憶型T細胞;T helper cells為輔助性T細胞(Th細胞);Tem為效應記憶T細胞;NK cells為自然殺傷細胞;Tgd為gamma delta T細胞;Th2 cells為Th2細胞;Eosinophils為嗜酸性粒細胞;Th1 cells為Th1細胞;NK-CD56 bright cells為NK-CD56亮細胞;Macrophages為巨噬細胞;Mast cells為肥大細胞;TFH為濾泡輔助性T細胞;DC為樹突狀細胞;iDC未成熟的樹突狀細胞;aDC為活化的樹突狀細胞;Neutrophils為中性粒細胞;CD8 T cells為CD8 T細胞;T cells為T細胞;NK-CD56 dim cells為NK-CD56暗細胞;TReg為調節性T細胞;B cells為B細胞;Cytotoxic T cell為毒性T細胞;pDC為漿細胞樣樹突狀細胞;Th17 cells為Th17細胞。圖6 KLHL7在胃癌組織表達的免疫浸潤特征分析
2.3與KLHL7基因具有相關性的基因的信號通路富集分析 通過cBioPortal在線數據庫和Sanger學術平臺分析工具分析發現,與KLHL7基因具有相關性的共表達基因有2 785個,包括上調的2 486個基因(Pearson相關系數為0.30~0.63)和下調的299個基因(Pearson相關系數為-0.47~-0.30)。這些基因富集在73個信號通路中,其中富集倍數>2為篩選標準的信號通路有33個,其中與腫瘤關系密切的有25個,分別是自噬、凋亡、細胞周期、慢性白血病、子宮內膜癌、腫瘤壞死因子(TNF)、缺氧誘導因子1(HIF-1)、結腸癌、Wnt等信號通路,見圖7。

注:圖中的信號通路依GeneRatio分數自上而下依次為:癌癥通路、自噬、癌癥中的蛋白聚糖、HIF-1通路、細胞周期、結腸癌、凋亡、PI3K-Akt通路、TNF通路、子宮內膜癌、環腺苷酸(cAMP)通路、非小細胞肺癌、膠質瘤、過氧化物酶體增殖物激活受體(PPAR)通路、慢性白血病、細胞程序性死亡配體1(PD-L1)和細胞程序性死亡受體1(PD-1)檢查點通路、小細胞肺癌、前列腺癌、急性白血病、黑色素瘤、Wnt通路、白細胞介素(IL)-17通路、轉化生長因子β(TGF-β)通路。圖7 與KLHL7具有相關性的共表達基因富集信號通路的氣泡圖
2.4共表達基因中核心基因篩選分析結果 共表達基因分析結果顯示,有93個基因富集在腫瘤密切相關的信號通路中;將其輸入在線軟件STRING進行PPI網絡分析,分析其節點,使用Cytoscape 3.8 軟件的CytoNCA插件計算參數篩選發現,LYN、PPP1CB、NCF1、P4HB、GAK、BBS10、RPS6KA1、H2AFV、IFT88、CD68、NFKB1、SMC3、ARL13B、RAB23、CD74、MEAF6、HYDIN、GMPPB、SEC24C、RDX共20個基因為關鍵基因。經GEPIA和UALCAN數據庫檢索,除P4HB、HYDIN、GMPPB和RDX 4個基因外,包括LYN、PPP1CB、NCF1、GAK、BBS10、RPS6KA1、H2AFV、IFT88、CD68、NFKB1、SMC3、ARL13B、RAB23、CD74、MEAF6、SEC24C的16個基因是胃癌組織與癌旁組織的差異表達基因,見圖8。在以上基因中,與KLHL7相關系數>0.5的基因為BBS10、PPP1CB、ARL13B和MEAF6(Spearman相關系數分別為0.508、0.529、0.535、0.538,均P<0.001)。另外,針對這4個基因,利用仙桃學術數據庫分析其癌組織與癌旁組織之間的差異表達情況,結果顯示,BBS10、PPP1CB、ARL13B和MEAF6在胃癌組織中表達顯著高于癌旁組織(P<0.05)。見圖9。

圖8 與KLHL7相關的共表達基因的核心基因篩選結果
KLHL7是Kelch樣家族蛋白的一員。迄今為止,已發現42種KLHL成員分子,該家族蛋白成員在結構上包含N端的BTB/POZ結構域和中間的BACK結構域,以及C端的6個Kelch重復序列。研究顯示,KLHL基因參與了DNA的損傷修復、凋亡、免疫反應和維持骨骼肌結構等多種生物學過程[5]。多項研究證明,KLHL的異常表達與腫瘤的發生發展緊密關聯[6-9]。有研究指出,KLHL6在胃癌中高表達,下調KLHL6的表達能顯著降低MGC-803胃癌細胞集落形成、增殖和轉移,增強細胞凋亡[10]。KLHL19(KEAP1)的功能缺失可激活Nrf2,為胃癌細胞的生長提供有利條件[11]。在膽管癌中,敲低KLHL21的表達顯著降低膽管癌細胞的增殖、侵襲和轉移,誘發G0/G1期細胞阻滯,以及降低ERK1/2的磷酸化來阻礙ERK信號通路的激活[12]。KLHL37(ENC1)表達上調可增加結直腸癌和毛細胞白血病的風險,且與卵巢癌患者的預后密切相關[13-15]。以上研究提示,KLHLs家族的標志物的異常表達在腫瘤的惡性生物學行為中扮演著重要角色,有望作為腫瘤診斷和預后判斷的生物標志物。
近年研究表明,KLHL7的突變與一些遺傳性疾病有關[16-19],但KLHL7在胃癌中的研究相對較少。KUROZUMI等[20]發現,KLHL7在乳腺癌中的表達水平與組織學分級和分子亞型相關,其高表達較低表達預后差。施瀟嫻[1]發現,KLHL7在肺癌、胃癌、卵巢癌和結直腸癌中高表達,沉默KLHL7可顯著抑制肺癌、胃癌和骨肉瘤細胞的增殖。本研究采用生物信息學的方法分析發現,KLHL7在胃癌組織中高表達,其表達水平與TNM分期密切相關,提示KLHL7可能是胃癌發生發展過程中的一個重要生物標志物。免疫細胞浸潤分析發現,胃癌中KLHL7高表達與Tcm和Th細胞浸潤呈正相關,與pDC細胞和Th17細胞等細胞浸潤呈負相關。KEGG富集分析表明,KLHL7的相關基因主要富集自噬、凋亡、細胞周期、慢性白血病、子宮內膜癌、TNF、HIF-1、結腸癌和Wnt等信號通路中。與腫瘤通路相關的16個核心基因在胃癌與癌旁組織中存在異常表達。由此推測,KLHL7在胃癌中的異常表達可能通過以上相關共表達基因和所富集的信號通路等促進胃癌的發生和發展。
與KLHL7相關系數較高的共表達相關基因BBS10、PPP1CB、ARL13B和MEAF6在胃癌組織中表達均顯著高于癌旁組織。BBS10是Bardet-Biedl綜合征基因(BBS)基因家族的成員,BBS10作為分子伴侶,可能影響其他睫狀體或基底體蛋白的折疊或穩定性。有研究指出,該基因在乳腺癌組織中是下調表達的熱休克蛋白亞型分子[21],而在胃癌中的表達和意義則鮮見研究。蛋白磷酸酶1催化亞單位β(PPP1CB)基因編碼蛋白磷酸酶1(PP1)的3個催化亞基之一,而PP1是一種絲氨酸/蘇氨酸特異性蛋白磷酸酶,已知參與多種細胞過程的調節,如細胞分裂、糖原代謝、肌肉收縮力、蛋白質合成和人類免疫缺陷病毒1(HIV-1)的轉錄。PPP1CB在胃癌中普遍表達,說明其在胃癌細胞生長中的起重要作用[22]。研究表明,PPP1CB基因與胃癌侵襲轉移有關[23]。BADP核糖基化因子樣GTP酶13B(ARL13B)作為ADP核糖基化因子樣家族的一個成員,是一種小的GTP酶。體外和體內實驗均表明,ARL13b可刺激胃癌細胞增殖、遷移和侵襲[24]。在胃癌研究中,ARL13B的表達與腫瘤大小和侵襲深度密切相關,ARL13B高表達的患者預后較差。MYST/Esa1相關因子6(MEAF6)為幾種不同組蛋白乙酰轉移酶復合物的組成部分,選擇性剪接導致多種轉錄變體。沉默MEAF6基因的表達可以抑制卵巢癌細胞的增殖[25]。通過構建SDR16C5、MEAF6和SOX4 3個基因特征的結腸癌預測模型發現,MEAF6在預測結腸癌的預后中顯示出較高的靈敏度和特異度,具有不同預后風險的患者還表現出基因特征的差異表達、活化的CD4記憶T細胞浸潤,以及對比卡魯胺、吉非替尼、來那度胺和伊馬替尼的藥物敏感性[26],而該基因在胃癌中的表達和意義尚鮮見報道。以上研究提示,與KLHL7相關系數>0.5的共表達基因BBS10、PPP1CB、ARL13B和MEAF6可能參與腫瘤的生物學行為,值得進一步深入研究其在胃癌中的共表達意義。
綜上所述,本研究對胃癌組織中KLHL7表達和意義的分析結果表明,KLHL7是胃癌中高表達的癌基因,其表達與胃癌侵襲和轉移有關,且與胃癌的免疫細胞浸潤和預后密切相關,可作為胃癌診斷和預后評估的良好生物標志物。