高建全 張宇祥 呼玲玲 薛亞妮
肺癌(lung cancer)在男性所有腫瘤中發病率為第一位,在女性為第二位,而死亡率在男女中均為第一位[1]。每年全世界范圍內肺癌死亡人數高達數百萬人[2]。肺癌根據病類型分為小細胞肺癌和非小細胞肺癌(NSCLC),NSCLC約占肺癌整體發病率的75%~80%。NSCLC確診時大多已發展為晚期或局部晚期,失去手術時機或手術效果較差,5年生存率不高。影響NSCLC患者預后的因素除了臨床分期外還與腫瘤病理類型、輔助治療等有關。近年來隨著分子生物學研究的不斷深入,發現某些基因的異常表達與患者的生存期明顯相關[3-4]。術后檢測這些基因的表達情況可作為NSCLC患者預后預測標記物。既往研究顯示,MAGEA4基因在多種腫瘤組織中呈現異常表達,推測其和腫瘤的發生發展有關[5]。MAGEA4在肺癌報道不多,其表達水平與NSCLC患者預后關系不詳。
一、MAGEA4基因表達水平
首先在TCGA數據庫中檢索NSCLC患者MAGEA4mRNA的相對表達水平。數據集選擇條件為NSCLC,包括肺鱗癌和肺腺癌;同時比較MAGEA4基因在NSCLC患者癌組織和癌旁組織中是否存在差異。存在差異表達的條件為MAGEA4基因mRNA上調或下調表達超過2倍(|Log2FC|>1),且P<0.05。
二、 MAGEA4蛋白-蛋白網絡
在STRING數據庫中檢索MAGEA4 蛋白,物種選擇human, 限制條件為:相互作用蛋白不超過20個,置信度大于0.7,相互作用來源為共表達、基因功能和比鄰關系。
三、 MAGEA4功能和KEGG信號通路富集
采用基因本體論(GO)和京都百科全書(KEGG)對MAGEA4及其相關基因功能和信號通路進行富集。GO富集包括生物學過程、細胞成分和分子功能。
四、 MAGEA4基因共表達
TCGA數據庫中,采用linkedomics在線分析軟件[6],分析TCGA數據中與MAGEA4正負相關表達的基因,同時對與MAGEA4基因存在相關性的基因進行聚類。選取正相關和負相關表達最為明顯的2個基因進行分析,計算spearman相關系數。
五、 生存分析
根據MAGEA4基因mRNA表達的中位數,將NSCLC患者分為高低表達組,采用風險比例模型繪制Kaplan-Meier生存分析曲線,進行log-rank檢驗,比較高低表達組NSCLC預后是否存在差異。
六、免疫組化
回顧性分析我院手術治療的68例NSCLC的組織標本,采用免疫組織化學法檢測患者癌組織中MAGEA4蛋白表達水平與患者臨床病理特征的關系,對前述生物信息分析結果進行驗證。免疫組織化學檢測MAGEA4蛋白表達按試劑盒操作說明進行。
七、 MAGEA4蛋白高低表達評價
隨機選取3個高倍視野進行染色強度和陽性細胞百分比計數。細胞無染色=0分,細胞著色為淺黃色=1分,細胞著色為棕黃色=2分,細胞著色為棕褐色=3分;陽性細胞比例評分:陽性細胞數<10%=0分;10~25%=1分; 26~50%=2分;51~75%=3分;陽性>75%=4分。總體評分值=陽性細胞比例評分×染色強度評分;最終評判:<6分為低表達,≥6分為高表達。
八、統計分析
一、MAGEA4基因表達
TCGA數據庫中,MAGEA4基因mRNA在NSCLC患者癌組織中的表達水平明顯高于癌旁組織(P<0.05)(圖1A)。但MAGEA4基因mRNA表達水平與NSCLC患者臨床分期并無明顯關系 (P>0.05)(圖1B)。
二、MAGEA4蛋白-蛋白相互作用網絡(PPI)
與MAGEA4蛋白相互作用網絡中,共21個蛋白節點,112個edges,平均節點度為10.7,區域聚類指數為0.90,蛋白相互作用網絡富集明顯(P<0.05)(圖2)。

圖1 MAGEA4基因mRNA在NSCLC中的表達水平
(A: MAGEA4基因mRNA在NSCLC患者癌組織和癌旁組織中的表達比較;B:MAGEA4基因mRNA表達與NSCLC患者的床分期的關系)

圖2 與MAGEA4蛋白相互作用網絡信號通路網絡(PPI)
三、MAGEA4基因共表達分析
在TCGA數據庫中,我們對與MAGEA4共表達的相關基因進行了分析,并繪制了共表達熱圖(圖3)。其中正相關表達最為顯著的基因為MAGEA410(r=0.80,P<0.05),而負相關表達最為顯著的基因為DE4D (r=-0.37,P<0.05)(圖4)。
四、功能富集
MAGEA4生物學過程、細胞成分及分子功能分別主要富集于磷脂酰肌醇3激酶結合、細胞粘附的蛋白質復合物和核苷酸受體活性(表1)。
五、KEGG信號通路
MAGEA4及相關共表達基因KEGG信號通路主要富集于Notch信號通路、維生素代謝信號通路和DNA復制相關信號通路等(圖5)。
六、生存分析
MAGEA4基因mRNA高表NSCLC患者總生存低于低表達患者(HR=1.3, 95%CI:1.04~3.21,P<0.05)圖6A;而高低表達組無疾病進展生存無統計學差異(HR=0.82, 95%CI:0.36~1.94,P>0.05)(圖6B)。

圖3 MAGEA4基因共表達分析熱圖(A:正相關基因共表達熱圖;B: MAGEA4共表達負相關基因熱圖)

圖4 MAGEA4共表達正負相關基因散點圖
(A: MAGEA410基因與MAGEA4正相關; B:PDE4D與MAGEA4基因負相關)

表1 MAGEA4生物學過程、細胞成分及分子功能富集
七、免疫組化MAGEA4蛋白表達情況
免疫組化顯示MAGEA4蛋白主要表達于細胞膜和細胞漿,陽性表達呈現棕黃色顆粒(圖7)。NSCLC患者癌組織中MAGEA4蛋白高表達者為52.9%(36/68)顯著高于癌旁組織23.5%(16/68)P<0.05。
八、MAGEA4蛋白表達與患者臨床病理特征關系
MAGEA4蛋白表達水平與NSCLC患者腫瘤分化程度(P<0.05)和淋巴結轉移(P<0.05)存在相關性,MAGEA4蛋白高表達者腫瘤分化程度較低,淋巴結轉移率較高(表2)。
黑色素瘤抗原基因家族A(MAGEA)從MAGEA1到magea12共有12個亞型[7]。MAGEA4是MAGEA基因家族的一員,這個家族的成員相互編碼具有50%到80%序列一致性的蛋白質。MAGEA

圖5 MAGEA4及相關基因功KEGG信號通路柱狀圖

圖6 MAGEA4基因mRNA表達與NSCLC患者預后關系曲線
(A: MAGEA4基因mRNA表達與NSCLC患者總生存; B:MAGEA4基因mRNA表達與NSCLC患者無疾病進展生存)

圖7 MAGEA4蛋白表達免疫組化分析

表2 MAGEA4蛋白表達與NSCLC患者臨床病理特征關系
基因的啟動子和第一外顯子表現出相當大的變異性,這表明該基因家族的存在使得能夠在不同轉錄控制下表達相同的功能[8]。MAGEA基因定位于Xq28區,各區域基因與某些遺傳性疾病有關,如先天性角化不良與該基因的突變有關。
有報道表明,MAGEA基因在不同類型的癌癥中表達上調,如淋巴細胞白血病、肺癌、卵巢癌、黑色素瘤和其他實體惡性腫瘤[9]。 已有研究顯示MAGEA4是在口腔鱗狀細胞癌、非小細胞肺癌、胰腺癌、乳腺癌等多種腫瘤中均有表達上調[9-10]。因而,MAGEA4在上述實體腫瘤的發生發展中可能發揮了重要作用。MAGEA亞家族蛋白具有高度保守性,很難獲得只識別一個家族成員的特異性抗體,例如,MAGEA4和MAGEA10蛋白質在氨基酸水平上具有50%以上的序列同源性,但具有不同的大小和細胞定位[11]。免疫組化研究中使用的幾種抗體與許多MAGEA蛋白發生交叉反應,在多種癌癥類型中都可見到,定位在細胞質和細胞核中,這使得腫瘤組織的免疫組化分析變得復雜,這些成員可能具有不同的表達模式、亞細胞定位和對惡性腫瘤的影響[12]。但MAGEA4基因的確切分子生物學功能不清。在本研究中,我們通過生物信息學研究發現,MAGEA4基因功能主要富集于磷脂酰肌醇3激酶結合、細胞粘附的蛋白質復合物和核苷酸受體活性。因此,提示MAGEA4基因及其表達產物可能通過上述功能在腫瘤中發揮相應的生物學作用。KEGG信號通路富集顯示,MAGEA4及相關共表達基因主要富集于Notch信號通路、維生素代謝信號通路和DNA復制相關信號通路等。Notch信號影響細胞正常形態發生的多個過程,包括細胞凋亡、細胞增殖及細胞邊界的形成。Notch基因位點突變引起的表型改變,表明Notch信號作用的多樣性因此,MAGEA4基因可能通過Notch信號通路影響腫瘤細胞的凋亡與增殖,從而影響患者的預后[13- 14]。同時,我們采用免疫組織化學法檢測了68例NSCLC患者的癌組織,發現MAGEA4基因高表達與患者的腫瘤分化程度和淋巴轉移有關,MAGEA4基因高表達者腫瘤分化較差,淋巴結轉移瘤較高,這些危險因素也符合患者預后不良的生物學特征。