沈陽 秦建曄 孫博文
摘 要 目的:以免疫相關基因的生物信息學分析為基礎,構建頭頸部鱗癌預后模型。方法:從癌癥基因組圖譜(the cancer genome atlas,TCGA)下載頭頸部鱗癌患者的基因表達數據和臨床數據,從ImmPort數據庫下載免疫相關基因,通過單因素Cox回歸分析、LASSO回歸分析和多因素Cox回歸分析得到相應預后基因并構建預后模型。運用KaplanMeier生存分析、受試者工作特征曲線(receiver operating characteristic curve,ROC)進行模型的內、外部評價。采用多因素Cox回歸鑒定模型能否作為獨立預后因子。通過諾莫圖和決策曲線評價模型的精確度和有效性。結果:單因素Cox回歸分析初步得到162個與預后相關的免疫基因,LASSO回歸進一步縮減到24個基因,多因素Cox回歸分析最終確認11個,構建預后模型。通過Kaplan-Meier生存分析發現在訓練集與測試集中,低風險組生存時間遠大于高風險組(P<0.001)。且預后模型的1、2、3年的ROC曲線下面積AUC較大。多因素Cox回歸分析發現模型的風險比(HR)=1.3、95% CI=1.289~1.508、P<0.001。經決策曲線驗證預后模型與分級、分期、年齡、性別一起聯用時,患者凈收益最大。校正曲線得知3、5年的C指數均為0.705。結論:成功建立了11個免疫相關基因的頭頸部鱗癌預后模型,該模型能較好的預測患者的預后情況。
關鍵詞 頭頸部鱗癌;隨機生存森林;預后模型;免疫治療;腫瘤微環境
中圖分類號:R73 文獻標志碼:A 文章編號:1006-1533(2021)24-0023-05
Construction of a prognostic mode for head and neck squamous cell carcinoma based on bioinformatic analysis of immune-related genes
SHEN Yang1, QIN Jianye2, SUN Bowen2,3(1.Graduate School of Shanghai University of Traditional Chinese Medicine, Shanghai 201203, China; 2. Shanghai Health and Medical
College, Shanghai 200120, China; 3. Shanghai University of Traditional Chinese Medicine, Shanghai 201203, China)
ABSTRACT Objective: To construct a prognosis mode for head and neck squamous cell carcinoma based on the bioinformatics analysis of immune-related genes. Methods: Gene expression data and clinical data of patients with head and neck squamous cell carcinoma were downloaded from the cancer genome atlas(TCGA), and the immune-related genes were downloaded from the ImmPort database, by univariate Cox regression analysis, Lasso regression analysis and multivariate Cox regression analysis, the corresponding prognostic genes were obtained and the prognostic mode was constructed. Kaplan Meier survival analysis and receiver operating characteristic curve(ROC) were used for internal and external evaluation of the mode. Multivariate Cox regression was used to identify whether the mode could be used as an independent prognostic factor. The accuracy and effectiveness of the mode were evaluated through the Nomo diagram and the decision curve. Results: Univariate Cox regression analysis initially obtained 162 immune genes related to prognosis, LASSO regression further reduced to 24 genes, and multivariate Cox regression analysis finally confirmed 11 immune genes to construct the prognostic mode. Kaplan-Meier survival analysis found that in the training set and test set, the survival time of the low-risk group was significantly longer than that of the high-risk group(P<0.001). Moreover, the area AUC under the ROC curve of 1, 2 and 3 years in the prognosis mode was large. Multivariate Cox regression analysis showed that the risk ratio(HR)=1.3, 95% CI=1.289~1.508, P<0.001. The decision curve verified that when the prognostic mode was combined with classification, staging, age, and gender, the patient’s net benefit was the largest. The correction curve showed that the C index in 3 and 5 years was 0.705. Conclusion: The prognosis mode for head and neck squamous cell carcinoma with 11 immune related genes is successfully established, which can better predict the prognosis of patients.
KEY WORDS head and neck squamous cell carcinoma; random survival forest; prognostic mode; immunotherapy; tumor microenvironment
頭頸部鱗癌是全世界范圍內常見的惡性腫瘤之一,通常其生存時間的中位值在10~13個月之間,5年總體生存率在50%左右,預后較差[1]。當今,頭頸部鱗癌治療的核心問題之一是對頭頸部鱗癌患者預后情況的預測,因此有必要開發出一種準確的預測模型來指導治療。
腫瘤微環境中的免疫反應不僅決定了腫瘤的生長行為,還影響著腫瘤患者的預后情況。其中,免疫逃逸已經有大量的文獻報道,特別是關于PD-1/PD-L1的研究[2-3]。2016年FDA批準PD-1單抗用于鉑類治療失敗的復發和(或)轉移性頭頸部鱗癌的治療[4]。預測腫瘤患者預后情況通常有兩種方法:(1)單分子的標志物如人乳頭瘤病毒(HPV)來預測頭頸部鱗癌患者的預后;(2)利用與患者相關的預后基因構建的模型來預測患者預后[5-6]。基于此,通過分析癌癥基因組圖譜(the cancer genome atlas,TCGA)的頭頸部鱗癌的基因表達數據,構建并驗證免疫相關基因的預后模型,從而預測患者預后情況,解決相同臨床分期但結局不同的問題。
1.1 數據收集與處理
從TCGA中下載頭頸部鱗癌的基因表達數據以及臨床信息。以TCGA數據為訓練集構建預后模型。同時從ImmPort下載免疫相關基因,并從基因表達數據庫(Gene Expression Omnibus,GEO)下載頭頸部鱗癌的數據集GSE65858作為模型測試集,以驗證模型的預測能力。提取免疫相關基因,進行單因素Cox回歸分析,設定P≤0.01,篩選獲得相應免疫相關基因,再進行LASSO回歸以及交叉驗證獲得最優基因集。
1.2 預后基因模型構建
將最優基因集進行多因素Cox回歸,同時基于赤池信息量準則,采用逐步回歸法精簡獲得相應免疫相關基因。采用另一種獨立方法即隨機生存森林評估免疫相關基因的重要性。
1.3 預后基因模型驗證

1.4 決策曲線和諾莫圖構建
采用決策曲線分析評估模型的臨床有效性,其曲線下所形成面積越大,患者的凈收益越大。同時構建風險值及其他指標的諾莫圖。通過校準曲線評價訓練集實際生存狀態和預測生存狀態的一致性。
2.1 免疫相關基因提取
從TCGA中下載的頭頸部鱗癌數據集有546例樣品信息,其中包括502例癌癥患者樣品信息和44例正常樣品信息。臨床數據包括528例患者信息,刪除缺失生存狀態和生存時間的臨床信息1例,共計527例臨床信息。從ImmPort下載到的免疫相關基因有2013個基因,GSE65858中包含了270例頭頸部鱗癌患者的基因表達數據及相應臨床信息。利用單變量Cox回歸分析后得到162個免疫相關基因與患者預后有關。LASSO回歸可得到不同基因集下的正則化參數值(圖1A),交叉驗證得到最小誤差下的最優正則化參數,從而得到最適合的基因集。當正則化參數為-3.55時,誤差最小,即基因集中含24個基因,模型表現最佳(圖1B)。

2.2 預后基因模型構建
通過多變量Cox回歸分析,同時兼顧模型的復雜度和簡潔性,利用逐步回歸法,最終得到11個免疫相關基因(圖2)和相應回歸系數(表1)。用隨機生存森林進一步評估11個免疫相關基因對患者生存狀態的重要程度,發現分類樹在2000顆左右時,錯誤率趨于平穩(圖3A),而此時的變量重要性均為非負值(圖3B),提示了這些基因對患者預后具有一定的影響。因此,最終采用這11個免疫基因作為模型構建基因。
2.3 模型驗證

11個基因代入風險公式后得到:riskScore=-0.255741*CTSG+0.167647*PTX3+0.336622*MA P2K1+0.115274*OLR1+- 0.298285*SEMA5A+ 0.131288*CHGB+0.192869*PDGFA+0.614438*AI MP1+-0.283802*TNFRSF25+-0.219474*TNFRSF4+-0.258105*IKBKB。風險值越高,患者的生存率越低。根據風險值的中位值(1.014)在訓練集即TCGA中頭頸部鱗癌患者的數據中劃分成高、低風險組(圖4A)。高風險組的死亡人數遠大于低風險組,且生存時間低于低風險組(圖4B)。通過Kaplan-Meier生存分析得到高風險組的中位生存期為1.82年,3、5年的生存概率分別為37.8%、28.7%。低風險組中位生存期為7.41年,3、5年的生存概率分別為76.0%、63.9%。低風險組較高風險組生存期長、總生存率高(P<0.05)(圖5A)。同時,1、2、3年的總體生存率ROC曲線下面積AUC分別為0.716、0.747、0.757(圖5B)。上述結果提示模型在訓練集中表現良好,具有一定的準確性和良好的預測能力。為進一步驗證模型的預測能力,通過評估模型在測試集GSE65858的表現情況。同樣在測試集中劃分成高、低風險兩組。利用Kaplan-Meier生存分析得到高風險組的中位生存期為3.15年,3、5年生存率分別是53.1%、35.65%。低風險組的中位生存期為5.38年,3、5年生存率分別是76.5%、60.2%。發現在測試集中,低風險組依然較高風險組生存期長,總生存率高(P<0.05)(圖5C)。同時測試集中1、2、3年的總體生存率的ROC曲線下面積AUC分別為0.611、0.633、0.623(圖5D),進一步提示模型在測試集上具有良好的預測能力。為驗證模型能否作為獨立預后因子,利用多因素Cox回歸方法,發現模型HR=1.3,95% CI=1.289~1.508,P<0.001,可作為一個獨立的預測因子(圖6)。


2.4 決策曲線和諾莫圖
為了解模型的臨床有效性,通過決策曲線得知,預后模型單獨與傳統的分級、分期、年齡、性別相比,患者單獨使用預后模型的凈收益比上述其他指標所得的凈收益較大。而預后模型與分級、分期、年齡、性別一起聯用時,患者凈收益最大(圖7)。諾莫圖可以通過整合多個風險因素來量化某個單獨的風險因子(圖8A)。通過校準曲線來比較患者3年、5年真實生存率與預測生存率得知3、5年的C指數均為0.705(圖8B、C),進一步提示模型具有良好的預測能力。

在頭頸部鱗癌治療中,除了常規的化療、放療外,免疫治療也在近些年來興起[7]。而免疫治療中PD-1抑制劑納武利尤單抗已經在頭頸部鱗癌中取得一定的效果。現有資料表明,納武利尤單抗組與標準治療組的2年生存率分別為16.9%和6.0%,兩組中位總體生存期分別為7.7個月和5.1個月,死亡風險降低32%,極大地顯示出免疫治療的優越性[8]。而預后情況的預測,能有效地掌握疾病的發展趨勢,對臨床用藥具有一定的指導作用。因此,本研究通過構建免疫相關基因的預后模型來預測頭頸部鱗癌患者的預后情況。
本研究通過對TCGA頭頸部鱗癌患者基因表達數據的分析得到了一個由免疫相關基因構建的預后模型。本研究所構建的模型經訓練集和測試集驗證,發現在預測患者1、2、3年的生存率時具有相對較高的AUC值,證實了本模型具有良好的預測能力。同時,多因素Cox回歸分析也證實本模型可作為一個獨立預測因子。校準曲線比較了3、5年的預測生存率和實際生存率,發現兩者之間具有較高的一致性,進一步說明本模型能較好地反應患者實際生存情況。決策曲線也驗證了模型的臨床有效性。Zhao等[9]所構建的頭頸部鱗癌預后模型AUC值僅0.6,wang等[5]構建的預后模型在相同測試集中1、3年的AUC值為0.59、0.55。而本模型的AUC值比上述模型的AUC值均大,進一步提示本模型相比其他模型具有良好的預測能力。
在一項頭頸部鱗癌治療臨床實驗中發現,手術前使用TNFRSF4激動劑抗體能有效地預防手術切除后的復發[10]。TNFRSF4是免疫檢查點分子之一,其功能主要是促進淋巴細胞的存活以及可增殖記憶性T細胞。TNFRSF4激動劑抗體可通過增強腫瘤微環境中的CD8+和CD4+T細胞的繁殖和存活能力,促進細胞因子生成,從而增強T細胞抗腫瘤的能力。因此,TNFRSF4被認為是腫瘤免疫治療藥物研發的新靶點[10-11]。OLR1為多核型髓源抑制性細胞的標志物,該細胞可抑制免疫反應,從而使腫瘤對化療、免疫治療產生抗性[12]。PTX3是固有免疫中體液免疫的重要組成成分之一。PTX3缺失,導致補體激活,促CCL2合成,增加腫瘤巨噬細胞招募,從而增加間皮質細胞和上皮細胞癌的發生[13]。本模型中包含以上幾種基因,驗證了本模型具有其臨床意義。
本研究通過多種生物信息學方法和技術,最終構建了免疫相關基因預后模型,發現對頭頸部鱗癌患者的預后情況有較好的預測能力,并具有一定的準確性和特異性。同時,還解決了不同患者具有相同分級分期等相同臨床指標,但其臨床結局不同的問題。
參考文獻
[1] Global Burden of Disease Cancer Collaboration, Fitzmaurice C, Abate D, et al. Global, regional, and national cancer incidence, mortality, years of life lost, years lived with disability, and disability-adjusted life-years for 29 cancer groups, 1990 to 2017: A systematic analysis for the global burden of disease study[J]. JAMA Oncol, 2019, 5(12): 1749-1768.
[2] 楊文婷, 余英豪. PD-1及其配體在實體腫瘤中的應用[J].臨床與實驗病理學雜志, 2015, 31(7): 791-793.
[3] 黃育剛, 王莉, 湯顯斌. PD-1/PD-L1免疫抑制劑在肺癌臨床治療和病理檢測中的研究進展[J]. 臨床與實驗病理學雜志, 2020, 36(6): 688-692.
[4] Seiwert TY, Burtness B, Mehra R, et al. Safety and clinical activity of pembrolizumab for treatment of recurrent or metastatic squamous cell carcinoma of the head and neck(KEYNOTE-012): an open-label, multicentre, phase 1b trial[J]. Lancet Oncol, 2016, 17(7): 956-965.
[5] Wang J, Chen X, Tian Y, et al. Six-gene signature for predicting survival in patients with head and neck squamous cell carcinoma[J]. Aging(Albany NY), 2020, 12(1): 767-783.
[6] Arantes LMRB, De Carvalho AC, Melendez ME, et al. Serum, plasma and saliva biomarkers for head and neck cancer[J]. Expert Rev Mol Diagn, 2018, 18(1): 85-112.
[7] Ferris RL. Immunology and immunotherapy of head and neck cancer[J]. J Clin Oncol, 2015, 33(29): 3293-3304.
[8] Ferris RL, Blumenschein G Jr, Fayette J, et al. Nivolumab vs investigator’s choice in recurrent or metastatic squamous cell carcinoma of the head and neck: 2-year long-term survival update of CheckMate 141 with analyses by tumor PD-L1 expression[J]. Oral Oncol, 2018, 81: 45-51.
[9] Zhao X, Sun S, Zeng X, et al. Expression profiles analysis identifies a novel three-mRNA signature to predict overall survival in oral squamous cell carcinoma[J]. Am J Cancer Res, 2018, 8(3): 450-461.
[10] Aspeslagh S, Postel-Vinay S, Rusakiewicz S, et al. Rationale for anti-OX40 cancer immunotherapy[J]. Eur J Cancer, 2016, 52: 50-66.
[11] 姜鑫, 杜國強, 李志勇, 等. OX40免疫檢查點在頭頸部鱗狀細胞癌中的作用機制及臨床應用的研究進展[J]. 中國醫科大學學報, 2020, 49(6): 570-573.
[12] Condamine T, Dominguez GA, Youn JI, et al. Lectin-type oxidized LDL receptor-1 distinguishes population of human polymorphonuclear myeloid-derived suppressor cells in cancer patients[J]. Sci Immunol, 2016, 1(2): aaf8943.
[13] Garlanda C, Bottazzi B, Magrini E, et al. PTX3, a humoral pattern recognition molecule, in innate immunity, tissue repair, and cancer[J]. Physiol Rev, 2018, 98(2): 623-639.