劉 澍 張 鑫 許 順
中國醫科大學附屬第一醫院胸外科,遼寧沈陽 110001
肺癌發病率和死亡率均很高[1],其中非小細胞肺癌(non-small cell lung carcinoma,NSCLC)約占所有肺癌病例的85%[2]。NSCLC 的治療手段不斷發展,但總體療效仍不理想。TMN 分期是公認的預后評估標準之一[3],但仍有一定的局限性。學者們致力于找到一個更準確的標準來評估NSCLC 患者的預后[4]。
免疫功能在NSCLC 的發生發展中起著重要作用[5]。本研究利用癌癥基因組圖譜(the cancer genome atlas,TCGA)中肺癌數據來開發一個預測NSCLC 患者預后的風險模型。
從TCGA 下載肺癌數據,從IMMPORT 數據庫中獲得免疫相關基因。從基因表達綜合數據庫(gene expression omnibus,GEO)下載GSE37745[6]數據集。
1.2.1 鑒定免疫相關差異基因 TCGA 中數據標準化后通過“edgeR”包[7-8],按照準似然F 檢驗,篩選出差異表達基因(differentially expressed genes,DEG),標準為|log2FC|>1.5 且P <0.05。取與ImmPort 基因中交集部分。
1.2.2 Cox 回歸分析 進行Cox 回歸分析,進而建立風險模型。風險評估公式為:

其中Coefi是特定模型基因的系數,Expi是每個選定基因的表達水平。
1.2.3 生存分析 利用“survival”[9]包,通過對數秩檢驗進行生存分析,研究了風險評分對患者總生存期(overall survival,OS)的預后價值。
1.2.4 模型性能評估及驗證 將TCGA 中樣本隨機分為7∶3 的訓練集(647 個樣本)和驗證集(262 個樣本),進行生存分析,繪制受試者操作特征曲線(receiver operator characteristic curve,ROC curve)并計算曲線下面積(area under the curve,AUC),進行100 次重復。最后利用GSE37745 數據按照模型計算風險評分,并依據風險評分將樣本分成高、低風險組,通過KM 曲線驗證模型。
針對1135 個隊列篩選出4549 個DEGs,其中與ImmPort 獲得的1810 個免疫相關基因有336 個重復。
本研究共納入909 例NSCLC 患者。通過單因素Cox 回歸分析,共有31 個基因與患者的OS 相關。后進行多因素Cox 回歸分析,將7 個基因的表達作為風險評估模型的指標基因(表1),風險評分公式定義如下:Risk score=FGA×0.050+LCN15×0.106+PTX3×0.118+SEMA4B×0.128-CRHR2×0.070-LIFR×0.104-UMODL1×0.073。

表1 多因素Cox 分析結果
鑒于中值(中位數)風險評分為0.995,患者被分為高風險組(455 例)和低風險組(454 例),兩組間患者OS、各基因表達比較差異均有高度統計學意義(P <0.001)(圖1~2)。TCGA 數據的內部驗證表明模型可以作為預測NSCLC 預后的有效標志模型,其AUC=0.703(圖3,見封三)。該分組方式在GSE37745 中依然可以將患者OS 區分,外部數據也驗證了模型的有效性(圖4)。

圖1 TCGA 數據庫中高、低風險組生存曲線

圖2 7 個基因在高、低風險組中的表達

圖3 模型ROC 曲線

圖4 GSE37745 數據集患者高、低風險組生存曲線
對7 個基因進行OS 分析(圖5 A~G)。模型中所有基因均與NSCLC 患者的OS 相關。UMODL1、CRHR2、LIFR、LCN15、FGA、PTX3、SEMA4B 高、低表達組總生存期比較,差異有高度統計學意義(P <0.001)。

圖5 7 個基因的生存分析
隨著醫療技術的發展,NSCLC 患者接受了更有效的治療,但臨床治療的努力并沒有明顯改善生存時間。免疫功能在NSCLC 中起著重要的作用,本實驗重點即研究免疫相關的DEGs,以期對患者進行更準確的評估。
本研究通過Cox 回歸分析,建立了7 個基因構成的預后風險模型。通過查找文獻發現,在結直腸癌的研究中,抑制CRHR2 的表達與腫瘤擴張、上皮-間充質轉換、遠處轉移風險和生存差有關[10]。CRHR2 還被證明能抑制乳腺癌細胞的轉移[11]。FGA 參與腫瘤預后生物標志物的組成[12-13]。LCN15 的突變也參與了多類型的癌癥[14]。LIFR 和PTX3 也已被證明可以抑制腫瘤發展和轉移[15-21]。同時,SEMA4B 和UMODL1 也參與了腫瘤預后生物標志物的組成,并能抑制NSCLC 的發展和轉移[22-25]。這些結果與本研究得到的結果相似。
實驗使用7 個免疫相關DEGs 建立了一個預后風險模型,并得到了一個計算風險評分的公式。本研究考慮免疫功能對NSCLC 的影響,建立了完全由免疫相關DEGs 構成的預后模型模型,但是該模型的評估預后價值還需要在未來的臨床試驗中進一步驗證。