王雪芹,劉亞鋒,吳 靜,周家偉,邢應如,張 鑫,李丹婷,謝 軍,丁選勝,胡 東
自噬是維持哺乳動物體內穩態及細胞應激適應性反應的關鍵組成部分。在饑餓環境中,自噬捕獲并降解溶酶體中的細胞器和蛋白質從而保護生物體免受疾病侵害,主要包括心臟病、感染和神經變性[1]。但有研究[2]表明,黑素瘤和乳腺癌在內的癌癥會誘導自噬并依賴自噬生存。自噬介導的循環維持能量穩態和線粒體功能可以促進腫瘤細胞的生長和增殖。因此,抑制自噬功能可能對癌癥治療產生有益效果。
肺癌占世界新癌癥發病率和病死率的第一位[3]。近年來腫瘤切除術、免疫治療和放化療綜合應用于治療肺腺癌,但是肺腺癌患者平均5年生存率仍低于20%[4]。因此,鑒定疾病特異性生物標志物,提高對肺腺癌分子機制的了解,開發新的治療決策,以改善患者的預后是非常有必要的。
1.1 數據采集于2020年8月從癌癥基因組圖譜(the cancer genome atlas,TCGA)數據庫(https://tcga-data.nci.nih.gov/tcga/)下載肺腺癌RNA-seq數據以及臨床數據。從人類自噬數據庫(human autophagy database,HADBb)(http://www.autophagy.lu/)獲得了232個自噬相關基因(autophagy related genes,ARGs)。TCGA數據庫中肺腺癌患者的基本臨床特征:女性213例(45.7%),男性254例(54.3%);65歲以上有227例(48%),65歲及以下有240例(52%);臨床Ⅰ、Ⅱ、Ⅲ期分別為251例(54%)、108例(23%)、75例(16%);T1、T2、T3、T4型分別為162例(34%)、244例(52%)、39例(8%)、19例(6%);M0、M1型分別為314例(92%)、24例(8%),N分型中N0、N1、N2~3型分別為300例(66%)、87例(19%)、68例(15%)。
1.2 鑒定差異表達自噬基因自TCGA數據庫下載肺腺癌RNAs表達譜,并從中提取人自噬相關基因的表達數據,使用R軟件“limma”軟件包對正常樣本和癌癥樣本鑒定差異表達自噬基因(DEARGs),通過“pheatmap”軟件包繪制熱圖。
1.3 自噬相關基因預后模型的構建用R語言“survival”程序包進行單因素Cox分析,并將初步篩選的基因與肺腺癌預后相關的自噬基因(P<0.05)納入多因素Cox分析,以進一步驗證基因對肺腺癌患者預后的價值。經過上述分析,獲得風險評分模型。風險評分計算如下:

其中Coef是系數,x是每個選定自噬基因的表達水平。
1.4 高、低風險組之間免疫細胞浸潤程度的比較為探討風險評分與肺腺癌預后之間的關系,對風險評分與腫瘤微環境之間的關系進行分析。使用R軟件ESTIMATE算法確定每個樣品的免疫評分,通過Wilcoxon檢驗比較高危組和低危組之間免疫細胞浸潤程度差異。此外使用CIBERSORT軟件包評估22種免疫細胞亞型比例。
2.1 篩選差異表達自噬基因使用R軟件整理TCGA數據庫中497個腫瘤樣本及54個腫瘤患者的癌旁正常樣本。轉錄組數據并從中提取232個自噬基因(HADb數據庫獲得)的表達數據,進行差異表達分析,篩選出30個差異自噬基因(FDR<0.05且|log2FC|>1)。其中有18個上調的ARGs[含有桿狀病毒IAP重復序列5(baculoviral IAP repeat containing 5,BIRC5)、CDKN2A、TMEM74、內質網氧化還原酶1-α(endoplasmic reticulum oxidoreductase 1 alpha,ERO1A)、ATG9B、GAPDH、PTK6、EIF4EBP1、整合素4 (integrin subunit beta 4,ITGB4)、VMP1、IFNG、ATIC、BNIP3、IKBKE、P4HB、PARP1、ERBB2和HSPA5]和12個下調的ARGs[MAP1LC3C、GRID1、CCL2、PRKCQ、NRG1、FOS、PPP1R15A、DAPK2、HSPB8、NLR家族含有CARD結構域4 (NLR family CARD domain containing 4,NLRC4)、DLC1和NRG3]。見圖1。

圖1 肺腺癌和正常組織間差異表達的自噬基因
2.2 肺腺癌患者預后相關自噬基因鑒定及風險評分模型構建為初步篩選與肺腺癌預后相關的自噬基因,對差異表達的30個自噬mRNAs進行單因素Cox回歸分析,共發現有9個自噬基因與患者預后相關(P<0.05)(圖2A)。經過多變量Cox回歸分析確定4個自噬基因用于構建預后風險模型(圖2B)。風險評分計算方法如下:風險評分=(0.123 746×BIRC5表達量)+(0.324 086×ERO1A表達量)+(0.121 162×ITGB4表達量)+(-0.547 430×NLRC4表達量)。
通過風險預后模型來計算497例患者的風險值并以中位值將患者分為高、低風險兩組。HR(風險比)>1的基因(BIRC5、ERO1A、ITGB4)被認為是危險基因,而HR<1的基因(NLRC4)被認為是保護性基因。隨風險值升高,病例病死率呈升高趨勢(圖2C)。高風險組患者表達危險基因增多,表達保護基因減少(圖2D)。

圖2 預后相關自噬基因篩選及表達特征A:自噬相關基因的單變量Cox回歸分析;B:自噬相關基因的多變量Cox回歸分析;C:風險評分和患者生存時間以及生存/死亡狀態的分布;黑色虛線:將患者分為低風險和高風險組的最佳臨界值;D:低風險和高風險組自噬相關基因表達譜
2.3 風險評分模型中基因的蛋白表達水平為了進一步確定這4個自噬基因在肺腺癌中的表達,利用人類蛋白質圖譜數據庫(HPA)的免疫組織化學數據加以驗證,結果顯示,與正常肺組織相比,肺腺癌中的BIRC5、ERO1A、ITGB4表達增加,而NLRC4在腫瘤細胞中則未發現(圖3)。肺腺癌中BIRC5、ERO1A、ITGB4、NLRC4蛋白水平的變化與其基因水平的變化一致。

圖3 風險評分模型中4個基因的蛋白表達水平A:BIRC5;B:ERO1A;C:ITGB4;D:NLRC4
2.4 風險評分模型的性能檢測Log-rank檢驗對低、高風險組進行Kaplan-Meier分析,結果表明高風險組的總生存期較差(P<0.000 1),見圖4A。ROC曲線下面積(AUC)用來評估風險評分模型預測效能,該風險評分模型預測患者1年生存率的AUC值為0.757(95%CI:0.727~0.787),3年生存率的AUC值為0.723(95%CI:0.667~0.779),說明該模型具有良好的短期預測能力(圖4B)。然而,5年生存率的AUC值僅為0.581(95%CI:0.516~0.646),提示該模型不能很好地預測患者長期(5年以上)生存狀態。采用ROC曲線比較風險評分模型與四個單基因及臨床參數的預測能力,風險評分模型的AUC為0.757(95%CI:0.727~0.787);BIRC5的AUC為0.667(95%CI:0.609~0.725);ERO1A的AUC為0.700(95%CI:0.649~0.751);ITGB4的AUC為0.621(95%CI:0.555~0.687);NLRC4的AUC為0.329(95%CI:0.258~0.400);年齡的AUC為0.511(95%CI:0.442~0.580);性別的AUC為0.578(95%CI:0.512~0.644);疾病分期的AUC為0.721(95%CI:0.670~0.772);T分型的AUC為0.671(95%CI:0.617~0.725);M分型的AUC為0.504(95%CI:0.434~0.574);N分型的AUC為0.674(95%CI:0.622~0.726)(圖4C、4D)。Delong檢驗表明,風險評分模型的AUC高于年齡(P=0.033)、性別(P=0.039)、T分型(P=0.047)、M分型(P=0.031)及N分型(P=0.042)的AUC,但是風險評分模型與疾病分期的AUC差異無統計學意義(P=0.083),其原因可能是樣本量不足。由此可見,無論與單基因或者其他臨床參數相比,該模型具有較好的預測能力和準確性。

圖4 風險評分模型高、低風險組Kaplan-Meier曲線、ROC曲線及臨床參數的相關性A:基于4個自噬基因的KM曲線;B:基于4個自噬基因ROC曲線;C:基于4個自噬基因與單獨自噬基因的ROC曲線;D:基于4個自噬基因與臨床參數的ROC曲線
2.5 高、低風險組之間的免疫浸潤評分免疫評分顯示高、低風險評分組之間存在差異(圖5A)。Kaplan-Meier分析顯示,肺腺癌中不同的免疫評分具有不同的生存期(圖5B)。肺腺癌的22種免疫細胞比例,其中M0巨噬細胞、M2巨噬細胞和T細胞CD4、CD8為肺腺癌浸潤主要免疫細胞亞群(圖5C)。在高、低風險組中,有10群免疫細胞水平存在差異,其中CD4記憶靜止細胞、CD4記憶激活細胞、單核細胞、M0巨噬細胞、靜止樹突狀細胞、肥大靜止細胞及肥大激活細胞差異最為明顯(圖5D)。

圖5 風險評分模型與腫瘤免疫微環境的相關性A:免疫評分、基質評分和風險評分的關聯;B:免疫評分對肺腺癌總體生存影響的KM分析;C:肺腺癌中22種免疫細胞的比例;D:高風險組和低風險組之間免疫細胞差異性表達;與高風險組比較:*P<0.05,**P<0.01,***P<0.001,****P<0.000 1
自噬是腫瘤起始和癌癥進展的抑制因子,而在腫瘤晚期自噬作為促進生存、生長和侵略性的保護因子。越來越多的證據表明自噬與癌癥密切相關。如NLRC5通過抑制自噬能夠促進子宮內膜癌細胞的增殖[5];孕酮和脂聯素受體3(PAQR3)通過調節表皮生長因子受體(EGFR)介導的自噬抑制非小細胞肺癌細胞生長[6];下調自噬通過抑制GLI系列鋅指2(GLI2)的產生,從而促進Shh途徑抑制的抗肺腺癌功效[7]。
本文基于TCGA數據庫中的RNA-seq轉錄組數據及臨床資料,結合HADBb進行生物信息學分析,表明BIRC5、ERO1A和ITGB4是肺腺癌危險因素,NLRC4是肺腺癌保護因素。BIRC5能夠通過啟動抗凋亡機制引起肺癌細胞增殖、腫瘤形成并可增強腫瘤細胞對化療和放射治療的耐藥性[8-9];ERO1A能夠通過上調血管內皮生長因子,激活腫瘤血管生成信號從而促進腫瘤的生長[10];ITGB4能夠調控腫瘤、呼吸系統疾病和神經系統病變等多種疾病的進展[11]。NLRC4通過抑制細胞增殖和促進細胞死亡來預防結直腸癌[12]。本研究利用自噬相關基因結合風險評分構建肺腺癌預后預測模型,總結出高風險組的總生存期較差,且無論與單基因或其他臨床參數相比,該模型能較好地預測肺腺癌患者預后。
目前,免疫療法是肺腺癌的一種治療方案,已有研究證明免疫細胞在腫瘤細胞上的作用。此外,肺腺癌組織中的免疫成分可用于評估患者的治療效果和肺腺癌預后[13]。該研究結果表明,4個自噬基因組合的風險評分與免疫浸潤評分具有相關性。使用CIBERSORT算法計算免疫細胞亞型,結果顯示,高、低風險評分組表達不同的免疫細胞亞型,表明免疫細胞成分比例失衡與癌癥患者的不良預后和低存活率相關。肺腺癌中的免疫細胞主要包括M0巨噬細胞、M2巨噬細胞、CD4+記憶靜止T細胞和CD8+T細胞。其中,高風險組CD4+記憶靜止T細胞和M2巨噬細胞水平較低,而M0巨噬細胞水平較高。這暗示著高危組中CD4+記憶靜止T細胞與M0巨噬細胞比例的失衡可能降低患者的生存率。