韓 陽
首都醫科大學附屬北京友誼醫院檢驗科,北京 100050
神經膠質瘤起源于神經膠質細胞,是目前最常見的顱內惡性腫瘤之一,占原發性中樞神經系統腫瘤的45%左右[1],年發病率在3/10萬~8/10萬[2]。有研究認為,膠質瘤治療極其困難,預后尤為不佳,大約77%的惡性膠質瘤患者在確診后1年內死亡[3-4]。其中,膠質母細胞瘤是最為常見的腦膠質瘤類型,是所有腫瘤中預后最差的類型之一。因此,研究膠質母細胞瘤的早期干預靶點具有重要意義。
隨著基因芯片及二代高通量測序技術的不斷發展,越來越多的研究利用基因測序技術與生物信息學分析方法,通過篩選與疾病發生發展相關的差異基因,為疾病的機制研究尋找新的靶標和研究思路[5-6]。膠質母細胞瘤屬于多基因疾病,其發生和惡性進展與遺傳因素密切相關[7]。因此,本研究擬通過基因表達譜數據庫(GEO)篩選出膠質母細胞瘤相關的差異表達基因,探討這些潛在致病基因與膠質母細胞瘤患者診斷、預后的相關性,為尋找新的標志物指明方向。
1.1資料來源 本研究對GEO數據庫進行檢索,選擇“human”為物種類別,檢索關鍵詞設定為“Glioma”,分析對象為GSE31262基因表達譜數據集,該數據集主要包括5個成人神經干細胞個體樣本和9個膠質母細胞瘤干細胞個體樣本[8]。
1.2差異表達基因篩選 采用R語言軟件中的limma程序包,首先對所得到的全部數據進行標準化處理;其次,對比兩組膠質母細胞瘤干細胞樣本和正常成人神經干細胞樣本得到的基因數據,并從這批數據中尋找差異有統計學意義的差異表達基因。判定標準為|log2(FC)|>1及校正后P<0.05。
1.3差異表達基因的功能富集分析 使用基因本體論(GO)富集分析和京都基因和基因組百科全書(KEGG)通路分析方法預測潛在功能及信號通路。
1.4蛋白質-蛋白質相互作用(PPI)網絡構建及差異基因篩選 在STRING在線數據庫(https://string-db.org/)中,對篩選出的差異基因所編碼的蛋白進行PPI網絡構建,篩選combined score>0.4的相互作用蛋白。使用Cytoscape軟件分析PPI結果,采用Degree算法和Cytohubba插件,得到評分最高的前10位差異基因。
1.5差異基因的批量生存分析 利用癌癥基因圖譜(TCGA)數據庫檢索到666例膠質母細胞瘤患者的轉錄組測序結果及其臨床數據資料。根據基因表達水平差異,將篩選出的差異基因分為高、低表達組。
1.6免疫浸潤分析 使用R GSVA程序包中提供的 ssGSEA 算法,通過識別24種免疫細胞標志物[9],評估膠質母細胞瘤組織的免疫細胞浸潤情況。結果采用“ggplot2”進行可視化,所有分析和可視化均在 R 4.2.1 中進行。
1.7統計學處理 采用Graphpad Prism 8.4統計軟件進行數據分析。采用R語言軟件中的ggplot和pheatmap程序包繪制差異表達基因的火山圖及熱圖,采用ClusterProfiler程序包進行基因富集的分析及繪制圖譜,兩組比較采用t檢驗,多組間比較采用方差分析。使用R語言軟件中的pROC程序包進行受試者工作特征(ROC)曲線分析,分析各差異基因診斷膠質母細胞瘤的曲線下面積(AUC)。分析結果用ggplot2進行可視化。繪制Kaplan-Meier生存分析曲線,比較兩組患者生存率的差異并計算風險比(HR),Kaplan-Meier曲線的P和HR(95%CI)通過Log-rank檢驗和單變量COX回歸分析得出。以P<0.05為差異有統計學意義。
2.1差異基因的篩選結果 選取GSE31262數據集為分析對象,分析5個成人神經干細胞個體樣本和9個膠質母細胞瘤干細胞個體樣本,從上述樣本中的全部基因中篩選出|log2(FC)|>1的差異表達基因2 692個,其中表達上調1 182個、表達下調1 510個。差異基因火山圖及聚類熱圖結果見圖1。

注:A為差異基因火山圖;●代表上調基因,●代表下調基因,●為無差異基因;B為差異基因聚類熱圖;藍色為下調基因,紅色為上調基因,G1為膠質母細胞瘤干細胞樣本,G2為正常成人神經干細胞。圖1 差異基因的篩選結果
2.2差異基因的GO富集分析和KEGG通路分析結果 篩選出的上調、下調差異表達基因的相關功能分析結果見圖2。KEGG通路分析結果顯示,篩選到的差異表達基因主要參與細胞內吞作用、溶酶體、MAPK信號通路、細胞周期、人乳頭瘤病毒感染、人類免疫缺陷病毒感染等;GO富集分析結果顯示,差異表達基因主要涉及細胞器裂變、核分裂、胚胎器官發育、染色體分離、軸突生成、膠質細胞再生、蛋白質定位于細胞外圍等。

注:A為KEGG通路分析;B為GO富集分析。圖2 差異基因的KEGG通路分析和GO富集分析結果
2.3差異基因蛋白網絡分析 采用STRING在線數據庫構建PPI網絡,對528個|log2(FC)|大于2的上調基因進行STRING蛋白質關系分析,利用PPI網絡篩選出差異基因,評分居前10位的差異基因主要包括CDK1、CCNB1、CCNA2、BUB1、KIF11、TOP2A、CCNB2、CHEK1、RRM2和ASPM。見圖3。

注:A為差異表達基因編碼蛋白的PPI網絡;B為評分最高的前10位差異基因。圖3 差異基因編碼蛋白的PPI網絡及差異基因的篩選
2.4生存分析 根據基因表達水平差異,將篩選出的10個差異基因分為高、低表達組,比較兩組患者生存率的差異,結果顯示,上述差異基因均與疾病預后相關(P<0.000 1),見表1。10個差異基因表達水平越高,HR越大,膠質母細胞瘤患者預后越差;其中,CCNA2基因預測膠質母細胞瘤患者預后的HR最大,為5.563 4(4.073 7,7.598 0),差異有統計學意義(P<0.000 1)。

表1 差異基因表達水平與患者預后的關系
2.5免疫浸潤分析 本研究使用ssGSEA 算法探索了膠質母細胞瘤組織的24種免疫細胞浸潤水平和10個hub基因的表達水平之間的關系。Th2細胞的浸潤水平與10個基因的表達呈明顯正相關,巨噬細胞與RRM2的表達呈負相關,與其他9個基因的表達呈明顯正相關。肥大細胞與ASPM、BUB1、CDK1、CCNA2、CCNB2、CHEK1、KIF11、TOP2A、RRM2的表達呈明顯負相關(|R|>0.2)。樹突狀細胞與除RRM2外的其他9個基因呈明顯負相關(|R|>0.2)。見圖4。

注:A~J分別為ASPM、BUB1、CCNB2、CCNB1、CCNA2、CDK1、CHEK1、KIF11、RRM2、TOP2A基因表達相關性分析;*P<0.05;**P<0.01;***P<0.001。圖4 膠質母細胞瘤組織的24種免疫細胞浸潤水平與10個差異基因表達水平之間的關系
2.6ROC曲線分析 ROC曲線分析結果顯示,10個基因診斷膠質母細胞瘤的AUC及95%CI如下:CDK1,0.944(95%CI:0.910~0.978);CCNB1,0.918(95%CI:0.827~1.000);CCNA2,0.904(95%CI:0.841~0.968);BUB1,0.966(95%CI:0.936~0.997);KIF11,0.952(95%CI:0.924~0.980);TOP2A,0.971(95%CI:0.952~0.989);CCNB,20.918(95%CI:0.827~1.000);CHEK1,0.936(95%CI:0.874~0.998);RRM2,0.834(95%CI:0.734~0.934);ASPM,0.905(95%CI:0.858~0.952)。這提示10個基因在膠質母細胞瘤中均有較高的診斷價值。
現有研究表明約30%左右的腦腫瘤為神經膠質瘤,占惡性中樞神經系統腫瘤的80%[10]。其中,膠質母細胞瘤是最為常見的腦膠質瘤類型,是所有腫瘤中預后最差的類型之一。膠質母細胞瘤的發病機制較為復雜,多數研究針對多種膠質母細胞瘤相關基因進行了研究[11]。然而,膠質母細胞瘤發生的確切機制、表觀遺傳特征及基因分子特征仍未闡明。隨著生物信息學技術的持續發展,通過多種富集分析方法篩選疾病差異基因信息逐漸成為尋找疾病診斷和治療靶點的新思路[12]。
本研究選取GSE31262基因表達譜數據集作為分析對象,分析了5個成人神經干細胞個體樣本和9個膠質母細胞瘤干細胞個體樣本,從中篩選出了2692個差異表達基因。通過對這些差異基因進行KEGG通路分析,本研究發現上述差異基因主要參與細胞內吞作用、溶酶體、MAPK信號通路、細胞周期、人乳頭瘤病毒感染、人類免疫缺陷病毒感染等。GO富集分析顯示這些差異表達基因主要涉及細胞器裂變、核分裂、胚胎器官發育、染色體分離、軸突生成、膠質細胞再生、蛋白質定位于細胞外圍等。其次,本研究采用Cytoscape軟件分析所得到的各個差異基因之間的關系,并篩選出了可能在膠質母細胞瘤發生發展中發揮關鍵作用的10個差異基因(CDK1、CCNB1、CCNA2、BUB1、KIF11、TOP2A、CCNB2、CHEK1、RRM2、ASPM)。進一步在TCGA數據庫中分析上述10個差異基因的表達水平與膠質母細胞瘤患者預后的關系,結果顯示,上述10個差異基因均與患者預后有關(P<0.000 1)。與低表達組患者比較,高表達組患者的風險比明顯升高,臨床預后較差。其中,CCNA2基因預示膠質母細胞瘤患者預后的風險比值最高,該結果提示CCNA2基因可能與膠質母細胞瘤患者預后的關系最為密切。
CCNA2基因定位于人染色體4號染色體,q27區,全長7 489 bp,在人體多種器官組織中表達[13]。GAO等[14]研究發現,CCNA2基因在多種腫瘤中表達上調,SAVIRANTA等[15]研究顯示CCNA2基因在癌癥轉化和進展中發揮關鍵作用。然而,目前鮮有研究表明CCNA2基因與膠質母細胞瘤患者的不良預后有直接關系。本研究通過生物信息學分析發現,CCNA2基因是膠質母細胞瘤PPI信號通路中的差異基因之一,并與膠質母細胞瘤患者的預后相關。目前,有研究發現,CCNA2基因具有促進膠質母細胞瘤細胞增殖、遷移和侵襲的作用[16]。這提示CCNA2基因在膠質母細胞瘤的發生發展中可能發揮重要作用,為CCNA2與膠質母細胞瘤預后相關提供了理論依據,其更深的潛在機制值得進一步探索。
此外,本研究進一步分析了膠質母細胞瘤組織的24種免疫細胞浸潤水平和10個hub基因的表達水平之間的關系,為其在膠質母細胞瘤發生發展中的具體作用和機制提供思路。本研究ROC曲線分析也進一步證實了這10個基因在膠質母細胞瘤中的診斷價值。
綜上所述,本研究利用GEO數據庫篩選出10個與膠質母細胞瘤密切相關的基因,對其進行深入研究可能有助于進一步闡釋膠質母細胞瘤發生、發展的機制,并且10個差異基因有望成為評估膠質母細胞瘤患者診斷和預后的新的標志物。然而,本研究也存在一些局限性,如尚未深入的分子生物學研究驗證上述發現。因此,未來研究方向為進一步擴充膠質母細胞瘤樣本庫,深入分析上述差異基因與疾病進展的關系。