蘇亞妮,楊明義,何昌軍,雷 俠,常 宇,胡云峰*
(1.延安大學附屬醫院放療科,陜西 延安 716000;2.延安大學醫學院,陜西 延安 716000)
宮頸癌是一種常見的女性癌癥[1-2],發病率和病死率很高。由于基因測序的蓬勃發展,基因表達綜合數據庫(gene expression omnibus,GEO)在生物信息學分析中的作用越來越重要。抑制素βA(inhibin beta A,INHBA)是轉化生長因子β超家族的一個配體[3]。目前,發現INHBA的高表達與胃癌[4]、白血病[5]、前列腺癌[6]、頭頸部鱗癌[7]等多種癌癥有關。然而,尚無關于INHBA在宮頸癌中生物學功能的相關研究。免疫細胞浸潤是指免疫細胞從血液中移向組織發揮抗腫瘤作用。浸潤腫瘤的免疫細胞對腫瘤的發展和抗癌治療的成功具有深遠的影響。已有研究發現頭頸部鱗癌中免疫細胞的浸潤與INHBA相關,免疫浸潤的B細胞影響預后[7]。然而,INHBA在宮頸癌中與免疫細胞浸潤的關系少見報道。
1.1微陣列數據 GEO(http://www.ncbi.nlm.nih.gov/geo)是當今最大、最全面的公共數據資源。從GEO下載GSE9750基因表達數據集。GSE9750數據集中包含有42例宮頸癌樣本和24例正常宮頸組織樣本。平臺是GPL96Array芯片數據。
1.2鑒定差異表達基因(differentially expressed genes,DEGs) R是用于統計分析、繪圖的語言和操作環境,是一個自由、免費、源代碼開放的軟件,是一個用于統計計算和統計繪圖的優秀工具。Perl與腳本語言一樣,不需要編輯器和鏈接器來運行代碼,只需寫出程序并告訴Perl來運行。將從GEO下載的GSE9750數據集用Perl進行注釋,將基因ID轉換成基因symbol;并用Perl對數據進行分組整理。R進行數據的批次校正,R的“limma”包鑒定DEGs,篩選標準:P<0.05、logFC≥1/logFC≤-1。
1.3DEGs的基因本體論(gene ontology, GO)和京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes, KEGG)富集分析 GO由基因本體聯盟管理和更新,GO數據庫建立一套描述基因及其產物功能的標準詞匯體系/術語(term)。GO富集分析是找出目標基因集中最顯著的GO term。KEGG是一個整合了基因組、化學和系統功能信息的數據庫,是一個生物系統的計算機模擬。R的 “clusterProfiler”包對DEGs進行GO和KEGG富集,選取標準為P<0.05。
1.4蛋白-蛋白互作(protein-protein interaction,PPI)網絡的構建 STRING(http://string-db.org)是一個在線搜索已知蛋白互作關系的數據庫,可以對互作基因網絡進行預測,為了解疾病產生或發展的機制提供更加深入的科學依據。利用STRING構建INHBA的PPI網絡,綜合評分>0.4的交互作用被認為有統計學意義。
1.5INHBA在宮頸癌的表達和預后 基因表達譜交互式分析(gene expression profiling interactive analysis,GEPIA)數據庫匯集了癌癥基因組圖譜(the cancer genome atlas,TCGA)和基因型和基因表達量關聯數據庫(the genotype-tissue expression,GTEx)數據庫中306例宮頸癌及13例正常宮頸上皮的測序數據。我們用GEPIA數據庫分析INHBA在宮頸癌的表達和預后情況。
1.6宮頸癌中樣本的免疫細胞浸潤 GSE9750數據集的表達矩陣在R中經“e1071”、“parallel”和“preprocessCore”包用“CIBERSORT”軟件獲得免疫細胞表達矩陣。Perl篩選免疫細胞矩陣中P<0.05的樣本,并用R進行可視化。
1.7細胞類型表達水平分析 GEPIA上通過交互箱線圖將選擇的每個細胞類型的基因表達可視化,并進行細胞類型水平差異表達分析。與比例分析類似,輸入目標基因即可得到該基因在所選腫瘤中,各種免疫細胞中的表達水平。
1.8統計學方法 應用R軟件(4.1.1版本)進行數據分析。P<0.05為差異有統計學意義。
2.1宮頸癌的潛在生物學分子
2.1.1DEGs的鑒定 R的 “limma”包鑒定出1 485個DEGs,包括752個上調DEGs和733個下調DEGs。R對DEGs可視化火山圖(圖1A)和熱圖(圖1B)。

圖1 差異表達基因
2.1.2DEGs的GO富集分析 R的“clusterProfiler”包進行GO富集,選取標準為P<0.05。GO顯著富集情況見表1。

表1 差異基因的GO富集分析
2.1.3DEGs的KEGG富集分析 R的“clusterProfiler”包進行KEGG富集,選取標準為P<0.05。KEGG顯著富集見表2。

表2 差異基因的KEGG 富集分析
2.1.4PPI網絡的構建STRING構建 INHBA的PPI網絡,共11個節點,43條邊,平均節點度7.82,PPI富集P=3.04e-14。PPI富集相互作用的蛋白有ACVR1、ENG、ACVRL1、ACVR2B、FSTL3、ACVR1B、INHA、ACVR1C、FST、ACVR2A(圖2)。

圖2 INHBA基因PPI蛋白互作網絡的構建
2.1.5INHBA在宮頸癌中表達增高并導致不良預后 INHBA在GEPIA數據庫的分析發現相對于正常樣本來說,INHBA在宮頸癌中表達升高(P<0.05,圖3A)。根據KM生存分析,低表達INHBA組的預后較好(P=0.01,圖3B)。

圖3 INHBA在宮頸癌的表達增高并導致不良預后
2.2宮頸癌免疫細胞浸潤
2.2.1宮頸癌中免疫浸潤細胞相關性分析 R的“corrplot”包制作相關性熱圖(圖4),結果顯示未活化的CD4+記憶性T細胞和未活化的樹突狀細胞呈正相關(相關系數=0.64),兩者具有協同效應。未活化的樹突狀細胞和漿細胞呈負相關(相關系數=0.49),兩者具有拮抗作用。

圖4 宮頸癌中免疫細胞的相關性熱圖
2.2.2免疫浸潤細胞在宮頸癌和宮頸正常上皮中的表達情況 對篩選后的免疫細胞矩陣用R的“vioplot”包進一步可視化小提琴圖,發現初始CD4+T細胞(P=0.001)、未活化的自然殺傷細胞(P=0.047)、M0巨噬細胞(P<0.001)、M1巨噬細胞(P=0.007)在宮頸癌樣本中表達升高,而未活化的CD4+記憶性T細胞(P<0.001)、單核細胞(P<0.001)、未活化的樹突狀細胞(P<0.001)在宮頸癌樣本中表達明顯降低(圖5)。

圖5 免疫浸潤細胞在宮頸癌和宮頸正常上皮中的表達情況
2.2.3細胞類型表達水平分析 通過交互箱線圖將選擇的每個細胞類型的基因表達可視化,并進行細胞類型分析INHBA在宮頸癌各種免疫細胞中的表達水平。結果表明,在宮頸癌中INHBA基因在成纖維細胞中含量最高,在自然殺傷細胞和內皮細胞含量最低(圖6)。

圖6 宮頸癌中各種免疫細胞中INHBA的表達水平
宮頸癌是女性的殺手,在女性腫瘤中占有很大的地位,對女性的身心健康有嚴重影響。然而其發病機制尚不明確。生物信息學為鑒定疾病的生物標志物及相關途徑提供了一種強有力的方法,進一步推動了疾病病因及發病機制的研究。本研究通過生物信息學分析發現INHBA在宮頸癌中高表達。通路顯著富集于細胞周期、DNA復制、P53信號通路、卵母細胞減數分裂、白細胞介素17信號通路、細胞衰老等。免疫細胞分析顯示,初始CD4+T細胞,未活化的自然殺傷細胞,M0巨噬細胞和M1巨噬細胞在宮頸癌樣品中表達明顯升高。而未活化的CD4+記憶性T細胞、單核細胞、未活化的樹突狀細胞在宮頸癌樣本中表達明顯降低。
研究發現INHBA在頭頸部鱗癌中的過表達對轉錄后的調控具有深遠的影響,與蛋白質翻譯密切相關[7]。此外,INHBA的高表達與疾病的惡性程度有關,其在胃癌[4]、食管癌[8]、前列腺癌[6]、頭頸部鱗癌[7]、白血病[5]、鼻咽癌[9]、卵巢癌[10]和結直腸癌[11-12]等腫瘤中的表達明顯升高。本研究結果顯示,宮頸癌組織中的INHBA表達顯著高于正常組織,INHBA可能在宮頸癌中發揮癌基因作用。研究發現在結腸癌患者中,INHBA高表達組患者的生存周期顯著低于低表達組[3]。在頭頸部鱗癌中,免疫浸潤的B細胞影響預后,并可能與INHBA的表達情況有關[7]。INHBA高表達不僅是急性髓系白血病的不良預后因素,而且與急性髓系白血病的臨床特征相關[5]。在食管鱗癌中INHBA高表達提示不良預后[8]。INHBA對胃癌[13]、乳腺癌[14]和結直腸癌[11]的預后都有一定的指導意義。INHBA在卵巢癌中特異性表達,高表達患者的死亡風險增高[10]。INHBA也與鼻咽癌的預后相關[9]。INHBA在大腸癌中顯著上調,INHBA的高表達與大腸癌患者的不良預后密切相關[15]。雖然INHBA與多種腫瘤的預后相關,但其在宮頸癌中與預后的關系還不明確。本研究發現INHBA高表達導致宮頸癌的預后不良,將是一個新的研究方向。
研究發現INHBA在頭頸部鱗癌中的表達與免疫浸潤細胞(B細胞、CD4+T細胞、CD8+T細胞、中性粒細胞、巨噬細胞和樹突狀細胞)的豐度之間具有相關性,免疫浸潤的B細胞與INHBA在頭頸部鱗癌中表達與生存有關,說明B細胞顯著影響預后,值得進一步研究和探索[7]。可見免疫浸潤的B細胞在頭頸部鱗癌中的預后價值可能與INHBA相關[7]。此外,研究表明INHBA在頭頸部鱗癌的過表達與轉錄后蛋白質翻譯密切相關,與INHBA相關的微核糖核酸的分子功能主要在轉錄因子活性和轉錄調節活性上得到增強。但INHBA與宮頸癌免疫細胞浸潤的相關性目前尚無明確的報道。本研究結果表明初始CD4+T細胞、未活化的自然殺傷細胞、M0巨噬細胞和M1巨噬細胞在宮頸癌樣本中表達升高。而未活化的CD4+記憶性T細胞、單核細胞和未活化的樹突狀細胞在宮頸癌樣本中表達降低。未活化的CD4+記憶性T細胞和未活化的樹突狀細胞呈正相關,兩者具有協同效應。未活化的樹突狀細胞和漿細胞呈負相關,兩者具有拮抗作用。但免疫細胞之間的協同和拮抗關系的具體機制還有待進一步探索。
本研究探討INHBA在宮頸癌中的預后情況以及宮頸癌中的免疫浸潤細胞,對宮頸癌的預后研究及臨床治療具有一定的指導意義。