王嘉寧,林晨,沈一鳴,王嘉達,沈志森
頭頸部鱗狀細胞癌(HNSC)是一種非常多樣化的惡性腫瘤,包括口腔癌、口咽癌、喉癌及下咽癌等,是全球第七大最常見的癌癥,全球發病率和死亡率居高不下,2018 年新發病例約70 萬,死亡病例為35萬[1]。在過去的30 年里,大多采用以手術為基礎結合化療、放療和免疫檢查點抑制劑治療的綜合治療策略,但HNSC 的5 年生存率,尤其是晚期患者的5年生存率仍不足50%,局部復發和遠處轉移是治療失敗的主要原因[2]。因此迫切需要一種穩定有效的臨床相關生物標志物來預測患者的臨床結局,幫助選擇合適的治療策略,改善預后。轉化生長因子-(TGF- )信號通路在腫瘤細胞的侵襲、轉移和耐藥等多種生物學行為中發揮關鍵作用[3]。因此本研究結合TCGAHNSC隊列構建一個與TGF- 信號通路基因(TRGs)相關的風險預后模型預測HNSC患者的預后,報道如下。
1.1 資料來源 從美國癌癥基因組圖譜(TCGA)數據庫中下載HNSC 患者的轉錄組數據、突變數據及相應的臨床信息作為訓練組,排除轉移腫瘤組織樣本及重復樣本后,從501 例患者中得到497 例原發腫瘤組織樣本及44 例正常組織樣本。TGF- 信號通路相關基因集包括54 個基因,來自于基因集數據庫(Molecular Signatures Database,MSigDB)。從GEO數據庫(Gene Expression Omnibus database)中下載GSE41613 作為測試組,該數據集包括97 例HNSC患者的基因表達及臨床數據。
1.2 篩選差異表達基因 采用R 軟件中的“DESeq2”包篩選出TCGA-HNSC 隊列中腫瘤組織與正常組織間4 799 個差異表達的基因(P<0.05,|log2 FC|>1),使用R 軟件中的“venn”、“ggpubr”和“ggplot”包進行可視化。
1.3 預后模型的構建及評估 采用R 中的“Survival”包篩選出影響患者生存最為重要的關鍵基因,基于關鍵基因的表達水平及對應權重的線性組合,構建預后風險評分計算公式。以風險評分中位數為截斷值,將測試組和訓練組中的患者分為高風險組和低風險組,并繪制兩組的生存曲線。此外,采用R軟件包中的“survival ROC”繪制ROC曲線來評價該模型的敏感性和特異性。使用“rms”包,整合生存時間、生存狀態和風險評分繪制列線圖,評估這些預后因子在測試組中的預后差異。
1.4 免疫分析 采用“ESTIMATE”函數分別計算高、低風險組的腫瘤免疫評分、基質評分、ESTIMAT評分及腫瘤純度。基于“CIBERSORT”研究兩組浸潤免疫細胞的豐度差異,“Immunophenoscore”計算兩組的免疫表型評分。
1.5 突變分析 通過R 軟件中的“maftools”對高、低風險組的樣本進行突變分析,并對兩組中突變頻率前20 的基因進行可視化。
1.6 統計方法 采用R軟件(v4.0.4)進行數據分析,采用單因素和多因素Cox 回歸篩選關鍵預后基因,計算該基因的風險比及95%CI,采用Kaplan-Meier法繪制生存曲線,并用log-rank 檢驗差異性,采用Wilcox 檢驗比較兩組ESTIMATE 評分。P <0.05表示差異有統計學意義。
2.1 篩選差異基因 獲得4 799 個差異表達基因,其中2 409 個基因上調,2 390 個基因下調,差異基因中有6 個基因屬于TGF- 信號通路相關基因集,分別 為 TGFB1、PMEPA1、SERPINE1、SLC20A1、RAB31 和LEFTY2,PMEPA1、SERPINE1、SLC20A1這3 個基因在腫瘤組織中相對高表達(P <0.05),LEFTY2 在腫瘤組織中相對低表達(P <0.05)。
2.2 預后風險模型的建立和評估 單因素Cox 分析結果顯示SERPINE1、SLC20A1 和TGFB1 與患者生存有關的候選TRGs(P <0.05,HR >1),K-M 曲線顯示高表達SLC20A1、SERPINE1 和TGFB1 與患者較低的生存率有關(P <0.05)。利用多因素Cox回歸分析確定主要危險因子SLC20A1 和SERPINE1,并構建風險評分,風險評分=SERPINE1 表達量×0.033+SLC20A1 表達量×0.067,結果顯示高風險組的生存率低于低風險組(P <0.05),見封三彩圖3。患者的生存狀態圖顯示隨著患者腫瘤組織中SERPINE1 及SLC20A1 的表達量上調,患者風險評分增加,死亡風險增大,生存率逐步下降。ROC 曲線結果顯示1、3 和5 年的ROC 曲線下面積(AUC)分別為0.595、0.623 和0.558,見封三彩圖3c。
將風險評分與其他臨床病理特征(年齡、腫瘤臨床分期)納入單因素Cox 分析,結果顯示HNSC 患者的臨床預后與腫瘤臨床分期、風險評分相關(P <0.05)。經多變量調整后,風險評分仍與總生存時間相關(P<0.05),提示由TRGs構建的風險評分可獨立于其他臨床特征(P <0.05),作為HNSC 患者的獨立預后因子。此外,結合臨床分期、腫瘤分期和風險評分繪制的列線圖,可以對患者進行評分,從而直觀地了解患者的1、3、5 年生存概率(均P <0.05),見圖1a。

圖1 驗證TRGs 相關預后模型
生存曲線顯示在測試組中高風險組HNSC患者的預后情況明顯劣于低風險組(圖1b)。測試組與訓練組患者的生存狀態圖相類似,高表達SERPINE1及SLC20A1 的患者具有更高的風險評分,且死亡患者大多分布于高風險組,見圖1c。ROC 曲線結果顯示1、3、5年的AUC分別為0.82、0.84 和0.80,見圖1d。
2.3 高、低風險組腫瘤免疫微環境特征分析 腫瘤微環境主要由腫瘤細胞、免疫細胞、基質細胞及非細胞成分(細胞因子、外泌體、細胞外基質等)構成,ESTIMATE分析發現高風險組具有更高的基質評分及綜合評分(均P <0.05),兩組免疫評分差異無統計學意義(P >0.05)。進一步分析顯示兩組總免疫表型評分、效應細胞評分及免疫檢查點評分差異均無統計學意義(均P >0.05),但高風險組的MHC 評分較高,低風險組的抑制性細胞評分更高(均P <0.05)。CIBERSORT 結果顯示高風險組高水平浸潤M0 巨噬細胞、靜息CD4+記憶T細胞、靜息自然殺傷性細胞及激活肥大細胞,低風險組高水平浸潤漿細胞、CD8 T細胞及負調節免疫細胞如Treg T 細胞、輔助T 細胞及耐受DC 細胞。
2.4 高、低風險組免疫治療相關預測指標分析 瀑布圖展示了每組突變頻率前20 的基因在樣本中的突變情況,高風險組共有96.31%的樣本存在基因突變,而低風險組中88.31%的樣本發生基因突變,見圖2a。免疫檢查點表達分析發現高風險組較低風險組高表達PD-L1 及PD-L2,見圖2b。

圖2 不同風險亞型與免疫治療相關預測指標

圖3 構建TRGs 相關預后模型
在腫瘤發生過程中,TGF- 作為促腫瘤因子,能夠誘導腫瘤細胞進行上皮-間質轉化,維持其干細胞特性,促進腫瘤血管生成,參與腫瘤細胞的侵襲和轉移[4]。同時也有研究發現TGF- 在促進腫瘤免疫逃逸和免疫治療抵抗中發揮關鍵作用,在轉移性黑色素瘤中,當TGF- 1 表達水平較低時,通常表現為較高水平的細胞毒性T 細胞浸潤,此時患者具有更高的存活率[5]。目前,TGF- 信號通路也廣泛用于其他腫瘤的預后預測,如膀胱癌[6]、結腸直腸癌[7]等。有研究表明TGF- 信號通路與HNSC密切相關,如Chang等[8]發現CLDN1 在HNSC 細胞中通過AMPK/TGF-/Smad 級聯反應誘導上皮間充質轉化的發生,從而促進HNSC 的進展。李佳麗等[9]通過免疫組化方法檢測43 例喉鱗癌組織和12 例癌旁組織中TGF- 1蛋白的表達情況,發現TGF- 1 在喉癌組織中陽性表達率較高,且TGF- 1 蛋白的表達與臨床分期、淋巴結轉移及病理分級有關。這些研究均證明TGF- 信號通路與HNSC 密切相關,在調節腫瘤生物學中具有治療潛力。然而,之前的研究并未建立一個有效的TGF- 信號通路相關預后模型。
本研究基于TCGA-HNSC隊列成功構建一個與TRGs 相關的風險模型,用于評估HNSCC 患者的預后。通過生物信息學方法共篩選出6 個在HNSC 中差異表達的TRGs,進一步單因素和多因素Cox 回歸分析篩選出2 個與HNSC 預后密切相關的基因SERPINE1 及SLC20A1。SLC20A1 是溶質載體家族第20 家族的第1 個成員,屬于磷酸鈉共轉運蛋白,其在各種組織中廣泛表達,并在維持細胞磷平衡中起著關鍵作用,參與細胞代謝、信號轉導以及核酸和脂質合成,可能在細胞外基質和軟骨鈣化以及血管鈣化中發揮作用[10]。此外,SLC20A1 對細胞增殖和腫瘤細胞生長非常重要,且這不依賴于磷酸鹽轉運功能[11]。Arora 等[12]發現SLC20A1 可以作為許多癌癥的通用生物標志物。SERPINE1 是絲氨酸蛋白酶抑制因子超家族成員,又被稱為凝血酶原激活劑抑制劑-1,其是組織或尿激酶型纖溶酶原激活劑的主要抑制劑,也是纖維蛋白溶解的主要抑制劑,在腫瘤微環境中,其常表達在成纖維細胞或者內皮細胞上,參與腫瘤的生長、轉移和侵襲,被認為是一種很有潛力的治療靶點[13]。既往研究發現,SERPINE1 在胃癌[14]、口腔鱗狀細胞癌[15]等多種癌癥中的表達均有上調,且與患者的不良預后相關。因此,基于這兩個基因構建的預后模型在測試組的ROC 曲線顯示1、3 及5 年的AUC 值均大于0.8,這證明該模型在預測患者的生存上具有一定的可靠性。通過預后分析證明其可以獨立于其他臨床因素,作為HNSC 患者的預后因子。結合風險評分及腫瘤臨床分級繪制列線圖以預測患者1、3、5 年生存率,使預測模型的結果更具有可讀性,方便對患者進行評估。
最近的臨床試驗表明,腫瘤免疫細胞浸潤與免疫治療敏感性可影響HNSC 的預后,高風險組中高水平浸潤M0 巨噬細胞、靜息CD4+記憶T 細胞、靜息自然殺傷性細胞及激活肥大細胞,可能參與腫瘤的進展;同時低風險組中的免疫微環境構成復雜,既有更高水平的適應性免疫細胞,如漿細胞、CD8+T細胞的浸潤,也有負調節免疫細胞的浸潤,并具有更高的抑制性細胞評分。免疫細胞浸潤程度、PD-L1 表達水平以及腫瘤突變負荷等是HNSC免疫治療療效的預測因素[16]。在HNSC 當前的治療中,ICIs 單藥或聯合化療方案已被國內外指南推薦用于復發/轉移HNSC 的一線治療,PD-L1 表達水平及腫瘤突變負荷等是篩選ICIs 獲益患者的關鍵。高風險組患者具有更高的基因突變頻率及PD-L1、PD-L2 表達水平,這提示高風險組可能從免疫治療中獲益較大。
利益沖突 所有作者聲明無利益沖突
作者貢獻聲明 王嘉寧:實驗操作、論文撰寫;林晨、沈一鳴、王嘉達:數據整理、統計學分析;沈志森:研究指導、論文修改、經費支持