賀 晴 曹曉林 韓弈垣 劉翰林
頭頸部鱗狀細胞癌(head and neck squamous cell carcinoma,HNSCC)起源于口腔、咽腔、喉腔等的黏膜上皮細胞,其發(fā)生率位居惡性腫瘤第6位。2018年的全球數(shù)據(jù)統(tǒng)計顯示,當年有89萬新增HNSCC病例,其中有46萬病例死亡[1,2]。由于HNSCC發(fā)病隱匿性及高度侵襲性,盡管采用了包括手術在內的綜合治療,如放化療、免疫治療,該腫瘤的預后仍不理想,5年生存率僅為25%~60%[3]。因此,尋找HNSCC預后相關的生物學標志物對HNSCC患者的預后進行早期評估,進而明確影響HNSCC預后的相關因素探討新的腫瘤研究目標,成為了必然。
鐵死亡是一種新的細胞程序性死亡方式[4]。它的發(fā)生可通過谷胱甘肽途徑、泛醌途徑、四氫生物蝶呤途徑的任意途徑截斷從而使細胞內脂質過氧化,最終導致細胞死亡[5]。目前在FerrDb網(wǎng)站上共有259種鐵死亡相關基因(ferroptosis-relate genes, FRGs),分為基因調控因子及化學物質調控因子兩類。根據(jù)功能的不同,基因調控因子又分為驅動因子、抑制因子、標記因子,化學物質調控因子分為誘導劑、抑制劑。本研究旨在探討FRGs在HNSCC中的表達,并構建出有意義的FRGs相關的HNSCC預后預測模型。
1.數(shù)據(jù)收集與預處理:從TCGA數(shù)據(jù)庫UCSC網(wǎng)站下載528例頭頸部鱗狀細胞癌患者的RNA-seq數(shù)據(jù)和相應的臨床信息,去除沒有總體生存(overall survical, OS)信息或者OS為0的樣本作為訓練隊列(n=494)。使用R包“GEOquery”從GEO數(shù)據(jù)庫下載微陣列數(shù)據(jù)集(GSE41613)的RNA-seq數(shù)據(jù)和臨床信息,去除OS為0及死亡原因不詳或非原發(fā)腫瘤死亡的樣本作為驗證隊列(n=76)。使用GPL570平臺的注釋信息將探針替換為基因ID。上述兩個隊列樣本的主要人口統(tǒng)計學和臨床特征詳見表1。為了后續(xù)分析獨立臨床變量與預后的關系,將缺失部分臨床變量或變量不詳?shù)臉颖咎蕹?共納入TCGA訓練隊列(n=460)及GSE41613驗證隊列(n=76)用作分析。

表1 訓練隊列及驗證隊列的臨床資料
2.建立FRG的預后特征:從在線FerrDb數(shù)據(jù)庫得到259個鐵死亡相關基因,在TCGA訓練隊列中所有樣本中共檢測到239個基因表達,隨后將239個FRGs的表達水平與494例HNSC患者的OS相關聯(lián),通過單變量COX回歸分析獲得12個具有預后意義的基因(P<0.01)作為OS的獨立預測因子。
3.預后預測模型的構建和驗證:使用R包“glmnet”進行最小絕對收縮和選擇算子(Lasso)COX回歸分析找到了與預后相關的最顯著的11個FRGs,并根據(jù)其對應的COX回歸系數(shù)來構建預后預測模型。該模型提供了一個計算每個樣本風險評分的公式:Risk score=β1×expG1+β2×expG2+…+βn×expGn。根據(jù)訓練隊列中風險評分的中位數(shù)將訓練隊列中的患者分為高風險組(n=247)和低風險組(n=247)。使用R包“ggpubr”根據(jù)高低風險組的生存情況繪制散點圖。分別使用R包“survival”“time ROC”采用Kaplan-Meier生存曲線和時間依賴性受試者工作特征曲線(time ROC)分析,評估預后預測模型對預后的預測能力。同理,驗證該模型在驗證隊列的可行性和可重復性。
4.獨立預后分析:使用R包“survival”“forestplot”進行單因素及多因素COX回歸分析評估訓練隊列及驗證隊列中各臨床特征(包括年齡、性別、腫瘤TNM分期、臨床分期)及該模型風險評分與患者預后的關系,并繪制森林圖,判斷該模型是否能作為獨立的預后指標。
5.統(tǒng)計學方法:使用R 3.6.3軟件對數(shù)據(jù)進行統(tǒng)計分析與繪圖。兩組間的比較采用Wilcoxon秩和檢驗進行統(tǒng)計分析,生存曲線的組間差異采用Log-rank檢驗。采用COX回歸分析計算風險比(hazard ratio, HR),以P<0.05為差異有統(tǒng)計學意義。
1.與預后顯著相關FRGs的鑒定:單因素COX分析顯示,12個FRGs基因可以用作HNSCC患者OS的獨立預測因素,其中3個為保護因素(HR<1),9個為風險因素(HR>1),詳見圖1。

圖1 12個與HNSCC患者OS相關的FRGs的單因素COX回歸分析森林圖
2.訓練隊列中的預后預測模型構建:根據(jù)單因素COX回歸分析得到的12個FRGs,進行LassoCOX回歸分析得到了11個對HNSCC患者OS有重要影響的FRGs,并進行10倍交叉驗證,避免過度擬合,最終根據(jù)LassoCOX回歸分析中最小lambda值,構建了11個鐵死亡相關因子的預后預測模型。風險評分計算公式為:HSPA5的表達值×0.0419-FLT3的表達值×1.1826+ SLC2A3的表達值×0.1758+ASNS的表達值×0.0152+ TRIB3的表達值×0.1011+FTH1的表達值×0.0783+NQO1的表達值×0.0526+PRDX6的表達值×0.1278+ATG5的表達值×0.2813-CDKN2A的表達值×0.0709-BAP1的表達值×0.4057。Kaplan-Meier生存曲線圖顯示高風險組的生存率明顯較低風險組低(圖2A)。時間依賴性ROC曲線圖顯示第1、3、5年AUC分別為0.649、0.729、0.688(圖2B)。高低風險組之間的生存情況比較差異有統(tǒng)計學意義(圖2C)。

圖2 訓練隊列的預后預測模型評估
3.驗證隊列中的預后預測模型驗證:根據(jù)上面得到的風險評分公式計算驗證隊列中每位患者的風險評分來驗證模型的準確性及可重復性。使用上述方法,根據(jù)風險評風的中位數(shù)將患者分為高風險(n=38)和低風險組圖(n=38)。很顯然,Kaplan-Meier生存曲線圖顯示高風險組的生存率明顯較低風險組的低(圖3A)。時間依賴性ROC曲線圖顯示第3、5年的AUC值分別為0.747、0.824(圖3B)。高低風險組之間的生存情況比較,差異有統(tǒng)計學意義(圖3C)。

圖3 驗證隊列的預后預測模型驗證
4.風險評分的獨立預后價值:在訓練(TCGA)隊列中,單因素COX回歸分析顯示,性別(P=0.043)、M分期(P=0.002)、風險評分(P<0.001)與OS顯著相關(圖4A),其中風險評分越高的患者預后較差,男性患者及有遠處轉移的患者提示預后較差。對單因素COX分析中與OS顯著相關的3個變量進行多變量COX分析,顯示性別(P=0.033)、M分期(P=0.003)、風險評分(P<0.001)可作為獨立預后因子(圖4B)。在驗證(GSE41613)隊列中,單因素COX回歸分析顯示,臨床分級(P<0.001)、風險評分(P=0.004)與OS顯著相關(圖4C),其中風險評分及臨床分級越高的患者預后較差。對單因素COX分析中與OS顯著相關的2個變量進行多變量COX分析,顯示臨床分級(P<0.001)、風險評分(P=0.007)可作為獨立預后因子(圖4D)。

圖4 訓練及驗證隊列各臨床特征及風險評分的單因素及多因素COX回歸分析森林圖
近10年來,得益于不同類型的高通量組學(基因組學、轉錄組學、蛋白組學、放射組學)分析的發(fā)展及公共數(shù)據(jù)庫的豐盈,研究者們通過生物信息學方式篩選出了許多HNSCC診斷及預后相關的生物學標志物,給未來提高臨床診斷率及開發(fā)新的治療方法帶來了希望[3]。
鐵死亡作為一種新型的細胞死亡方式,成為了近年來的研究熱點。隨著鐵死亡的認識不斷加深,已經(jīng)發(fā)現(xiàn)鐵死亡與各種人類疾病密切相關,例如動脈粥樣硬化、神經(jīng)退行性疾病、急性肝腎損傷等[6~8]。此外,有研究證實,鐵死亡與腫瘤發(fā)生、發(fā)展存在密切關聯(lián),研究人員發(fā)現(xiàn)了FRGs在20種腫瘤中存在異常表達[9]。
本研究通過公共數(shù)據(jù)庫的挖掘,系統(tǒng)分析了259個FRGs在HNSCC組織中的表達與其生存率之間的關系,并最終建立了11個FRGs(包括HSPA5、FLT3、SLC2A3、ASNS、TRIB3、FTH1、NQO1、PRDX6、ATG5、CDKN2A、BAP1)構成的預后預測模型。
本研究發(fā)現(xiàn),FLT3、CDKN2A、BAP1與HNSCC良好預后相關,HSPA5、SLC2A3、ASNS、TRIB3、FTH1、NQO1、PRDX6、ATG5與預后不良有關。HSPA5屬于熱休克蛋白家族的一員,通過與GPX4結合,可以負調節(jié)人類胰腺導管癌細胞的鐵死亡[10]。在對膠質瘤細胞的研究中也發(fā)現(xiàn),HSPA5可能是二十二碳六烯酸(docosahexaenoic acid,DHA)誘導的鐵死亡中的負調節(jié)因子[11]。FLT3是一種受體型酪氨酸激酶,FLT3抑制劑是防止脂質過氧化抵抗谷氨酸毒性的有效保護劑,而谷氨酸毒性與細胞凋亡、壞死、鐵死亡有關。FLT3抑制劑可以阻斷神經(jīng)元中的鐵死亡細胞的死亡[12]。SLC2A3、ASNS、TRIB3是鐵死亡的生物學標志物。
在眾多鐵死亡相關研究中,可以觀察到隨著鐵死亡的發(fā)生,在mRNA水平上觀察到這些基因的表達增多。然而,這些基因在鐵死亡的具體分子調控機制還未知[13,14]。FTH1是一種鐵蛋白重鏈,在帕金森病的6-OHDA模型中,FTH1通過噬鐵抑制鐵死亡。NQO1是一種NADPH脫氫酶,敲除肝癌細胞中的FTH1、NQO1,可以促進erastin和sorafenib誘導的鐵死亡[15,16]。PRDX6是鐵死亡的負調節(jié)因子,PRDX6通過其 iPLA2 活性去除脂質活性氧,從而保護細胞免受鐵死亡[17]。ATG5是一種自噬蛋白,ATG5可通過自噬調節(jié) HNSCC 的遷移、侵襲和凋亡[18]。兩項獨立的研究表明,通過敲除ATG5,細胞的鐵死亡水平顯著降低[19,20]。
BAP1是一種腫瘤抑制因子 BRCA1 相關蛋白,BAP1 通過抑制 SLC7A11的表達來抑制胱氨酸攝取,導致脂質過氧化和鐵死亡[21,22]。而SLC7A11 被證實是HPV陽性 HNSCC的生物學標志物和治療靶點[23]。既往研究表明,這些基因可能在不同的水平,通過不同的方式調節(jié)鐵死亡,從而影響相關疾病的發(fā)生和發(fā)展。
本研究也分析了Kaplan-Meier生存曲線及時間依賴的ROC曲線,結果顯示該模型在預測HNSCC患者預后生存方面具有良好的效果。并且通過單因素及多因素COX回歸分析證明該模型可作為獨立的預后因子。此外,本研究還發(fā)現(xiàn)性別、遠處轉移、臨床分級也可作為獨立的預后因子,提示男性患者、有遠處轉移及臨床分級越高的患者預后欠佳。這些結果與臨床和既往的研究結果相符,筆者篩選出的FRGs和以此基礎上初步建立的預測模型可能提高HNSCC的評估預后的水平。
本研究確認并驗證了基于11個鐵死亡相關基因對頭頸部鱗狀細胞癌患者的臨床預后模型,并證明了該模型可作為獨立預后因素。然而,這11個鐵死亡相關基因在HNSCC中的具體作用和調控機制仍需要開展進一步的實驗驗證,并且還需要開展前瞻性臨床研究來驗證預后預測模型的臨床應用價值。