馬夢璇,張燕飛,祁玉娟
胃癌是一種侵襲性疾病,其預后較差,并且通常沒有利于早期診斷的特定癥狀。2018 年,全球有超過 100 萬人被診斷出患有胃癌,其中783 000人因胃癌死亡[1]。目前已經開發了多種針對胃癌的治療方法,但對許多進展期胃癌患者療效不佳。因此,迫切需要探索新的診斷標志物和腫瘤進展的分子機制,達到胃癌早期診斷與早期治療的目的[2]。染色質可及性作為與特定位點腫瘤功能相關的基因組特征之一,可通過與轉錄因子結合調節與癌癥進展和侵襲相關的多個基因。最近,研究者開始探索染色質狀態變化對癌癥發展的影響。染色質可及性失調可能會改變下游癌基因或抑癌基因的轉錄活性,從而影響惡性腫瘤的進展。染色質重塑是基因調控的關鍵機制[3]。染色質重塑是所有DNA相關核心細胞過程的經典步驟,一些染色質重塑決定了細胞的存亡,包括與癌癥發病和發展有關的細胞過程。過去10年中,染色質重塑在細胞轉化和癌癥發展中的作用越來越受到關注[4],大規模表觀基因組學和轉錄組學研究結果強調了癌癥中染色質重塑因子的頻繁突變或失調,表明異常的染色質重塑在癌癥發展中起著重要作用[5-6]。
本研究通過生物信息學分析,研究胃癌中染色質調節因子(Chromatin regulator,CR)的表達譜和預后價值,構建基于CR基因的預測模型,探索對治療胃癌有益的小分子藥物。
1.1 GEO的數據采集 在GEO (Gene Expression Omnibus)數據庫中搜索“Gastric cancer”相關數據表達譜,獲得2個微陣列數據研究集(GSE26942和GSE79973)。GSE26942源自 GPL6947平臺,GSE79973 源自 GPL570 平臺。GSE26942 數據集由 218 個樣本組成,包括對照組胃黏膜組織12例,胃腺癌203例,胃間質瘤3例。GSE79973 數據集由 20個樣本組成,包括對照組胃黏膜組織10例,胃癌組織10例。見表1。

表1 GEO數據庫胃癌基因表達譜數據集(例)
1.2 差異表達基因DEG的篩選 采用GEO數據庫中的在線分析工具GEO2R篩選差異基因。R軟件limma 包用于篩選DEG。篩選標準為|logFC|>0.2,P值(adj.Pvalue)<0.05,并與染色質調節因子相關基因取交集獲取染色質調節因子差異表達基因。為了直觀反映基因表達情況,采用R軟件中的pheatmap、VennDiagram、ggplot2 R包將染色質調節因子差異表達基因繪制熱圖火山圖。
1.3 DEG的功能富集分析 使用 DAVID生物信息數據庫對上述染色質調節因子差異表達基因進行 GO 功能注釋和 KEGG 通路分析[7-8]。調整后P<0.05用于閾值篩選,使用R軟件中的cluster Profiler、pathview R包將GO和KEGG結果可視化。
1.4 PPI網絡構建 將DEGs導入String數據庫,置信度>0.9[9],選擇智人進行物種選擇,形成蛋白質互作網絡,使用Cytoscape篩選出PPI網絡中的hub基因。本研究以Degree值排序前10位的基因作為蛋白質互作 (PPI)網絡中的hub基因。
1.5 構建hub基因預測模型及潛在治療藥物篩選 采用“1.4”中篩選出的hub基因構建胃癌的預測模型,使用ROCR包繪制列線圖、Calibration 圖及ROC 曲線,并通過Enrichr平臺 (https://maayanlab.cloud/Enrichr/)用DSigDB 數據庫進行 hub基因和共表達基因的藥物篩選。根據P值和調整后的P值選擇與差異表達RNA(DEmRNA)相關的前 5種候選藥物。表2顯示了 DSigDB數據庫中排名前 5 位的候選藥物[10]。

表2 DSigDB數據庫中hub基因的潛在藥物
2.1 差異基因的獲取 基于GSE26942和GSE79973基因集,使用svaR包消除了樣本間的批量效應后,獲得了差異基因與染色質調節因子取集合,共獲得染色質調節因子差異基因137個,其中上調基因93個,下調基因44個,并繪制出熱圖(圖1A)與火山圖(圖1B),紅色代表上調,綠色代表下調。
2.2 差異基因的功能富集分析 為了探索染色質調節因子差異基因對機體細胞組成及代謝活動的影響,本研究對137個差異基因進行了GO和KEGG功能富集分析。結果表明,胃癌上調基因主要包括“堿基切除修復、同源重組、細胞周期、S-腺苷蛋氨酸依賴型甲基轉移酶活性、組蛋白甲基轉移酶活性、組蛋白結合、核染色質、染色體區域、染色體端粒區域、調節DNA 代謝過程、染色質共價修飾、組蛋白修飾”等,上調的主要KEGG通路為“堿基切除修復、同源重組、細胞周期”(圖2A)。下調基因主要包括“修飾依賴蛋白結合、轉錄輔助因子活性、組蛋白結合、核常染色質、組蛋白甲基轉移酶復合體、核染色質、DNA甲基化、組蛋白修飾、染色質共價修飾”等,下調的KEGG代謝通路主要為“胰島素抵抗”(圖2B)。
2.3 PPI網絡構建和模塊分析 采用String工具構建差異基因的PPI網絡,選擇物種為homo sapiens,將所得結果導入Cytoscape軟件,對PPI網絡進行可視化(圖3A),置信度>0.9,并采用cyto-Hubba插件篩選出PPI網絡中的hub基因。得到前10名hub基因為BRCA2、BARD1、RAD51、NBN、PCNA、TP53BP1、E2F6、RUVBL1、RUVBL2、WDR5(圖3B)。

圖1 篩選差異基因

圖2 DEGs富集分析
2.4 構建hub基因預測模型及潛在治療藥物篩選 采用“2.3”中篩選出的hub基因構建胃癌的預測模型,繪制列線圖、Calibration 圖及ROC 曲線(圖4A-C),由DSigDB數據庫可見hub的胃癌預測模型中ROC值為0.953,預測效果良好,其中RUVBL1基因的預測性最佳。并根據hub預測相關潛在治療藥物有氟達拉濱、硝酸鉀等。見圖4D、表2。

圖3 DEGs的蛋白互作網絡

圖4 ROC曲線與藥物預測
近年來,大量研究發現了一些分子標志物與胃癌發生發展的相關性[11-12]。Wu等[13]研究表明,TRERNA1敲低顯著降低胃癌細胞遷移、侵襲和轉移。TRERNA1消耗減少了體內胃癌的細胞轉移,在轉錄水平調節CDH1作為胃癌進展的關鍵效應物,提示TRERNA1/CDH1是胃癌治療的新的潛在靶點[13]。Huang等[14]研究表明,LINC00673可以作為LSD1和EZH2的支架并抑制兩者表達,發揮致癌作用,促進胃癌發展進程。Qi等[15]研究顯示,AGAP2-AS1過表達促進細胞生長和侵襲。其通過與LSD1和EZH2相互作用并抑制CDKN1A(P21)和E-cadherin轉錄發揮致癌作用,表明AGAP2-AS1是胃癌患者的潛在診斷標志物和治療靶點。然而,由于癌癥的高度異質性、差異表達基因數量龐大,且染色質調節因子在癌癥的發生發展中具有重要作用[16-18],因此,本研究探究了染色質調節因子在胃癌中的作用。
生物信息學分析顯示,癌癥組織樣本較正常組織樣本,上調的染色質調節因子基因主要包括:堿基切除修復、同源重組、細胞周期、S-腺苷蛋氨酸依賴型甲基轉移酶活性、組蛋白甲基轉移酶活性、組蛋白結合、核染色質、染色體區域、染色體端粒區域、調節DNA代謝過程、染色質共價修飾、組蛋白修飾等。上調的KEGG通路:細胞周期、同源重組、堿基切除修復。下調的染色質調節因子基因主要包括:修飾依賴蛋白結合、轉錄輔助因子活性、組蛋白結合、核常染色質、組蛋白甲基轉移酶復合體、核染色質、DNA甲基化、組蛋白修飾、染色質共價修飾等。下調的KEGG代謝通路主要為胰島素抵抗。
采用cytoHubba插件獲得hub基因:BRCA2、BARD1、RAD51、NBN、PCNA、TP53BP1、E2F6、RUVBL1、RUVBL2、WDR5,在胃癌的預測模型中,RUVBL1基因的預測性最佳。RUVBL1具有較弱的ATPase活性[19-20],是TIP60復合物的重要組成部分[21],其伴隨和調節轉錄因子,包括MYC、E2F1和β-連環蛋白(β-catenin),并參與導致致癌的染色質重塑[22]。RUVBL1和β-catenin上調和核定位與癌癥進展高度相關,其增強TCF/β-catenin介導的Wnt靶基因轉錄,因此可能促進癌變[23]。生存結果較差的非小細胞肺癌(NSCLC)患者中也具有較高的RUVBL1和RUVBL2表達[24]。此外,Sun等[25]研究表明,RUVBL1可替代AR信號轉導,以促進癌細胞存活和腫瘤耐藥性發展。Lone等[26]發現,RUVBL1免疫陽性與腫瘤患者預后不良和復發率較高有關。Zeng等[27]研究表明,敲低RUVBL1可以通過抑制β-連環蛋白信號轉導,從而降低癌癥細胞增殖和轉移,并表明RUVBL1可作為口腔鱗狀細胞癌的診斷和預后生物標志物以及治療靶點。另外,在胃癌的預測模型中,BRCA2與其他基因顯示出相反的作用。證據表明,BRCA2基因突變可致胃癌風險增加[28],并且具有BRCA2高表達的胃癌與更好的預后相關[29]。這可能對胃癌具有重要的預后和治療意義。結果表明,染色質調節因子在胃癌的發生發展中具有重要作用。此外,本研究通過Enrichr平臺,采用DSigDB 數據庫進行hub基因和共表達基因的藥物篩選,其中氟達拉濱、硝酸鉀最佳。然而,由于本研究是基于軟件統計處理和數據庫分析獲得的關鍵基因和藥物,其是否能在胃癌中發揮作用仍需進一步的分子生物學實驗來驗證。
綜上所述,染色質調節因子在胃癌的發生發展中具有重要作用,采用染色質調節相關因子構建預后模型效果良好,其中RUVBL1效果最佳,并通過hub基因篩選出了潛在治療藥物,為胃癌的臨床治療提供了輔助指導,但需要更多的臨床隊列和實驗來進一步驗證結論。