鄭希望,薛緒亭,郭慧娜,張宇良,牛敏,張春明,2,吳勇延,3,高偉,3
1 山西醫科大學第一醫院耳鼻咽喉頭頸腫瘤山西省重點實驗室,太原 030001;2 山西醫科大學第一醫院耳鼻咽喉頭頸外科;3 深圳市龍崗區耳鼻咽喉醫院 深圳市耳鼻咽喉研究所
喉鱗癌是一種鱗狀細胞癌,患者確診時多為晚期,且易發生頸淋巴結轉移,預后不佳,在過去40年里喉鱗癌患者的5年生存率呈現下降趨勢[1-3]。相分離是指溶液中的生物大分子析出凝聚在一起,構成不溶于周圍溶液的固體或凝膠的過程,該過程是可逆的[4]。相分離異常可造成蛋白質聚集異常,引起代謝、免疫和腫瘤等多種疾?。?]。相分離對腫瘤惡性進展具有潛在的調控關系,據報道,SPOP、TAZ 和ZAP70等多個相分離相關基因在腫瘤中發揮重要作用[6]。盡管相分離相關基因在癌癥中的調控能力正逐漸受到關注,但其在喉鱗癌中的作用尚未明確。2019 年7 月—2021 年7 月,我們利用生物信息學方法,分析喉鱗癌組織與正常組織中相分離相關基因的差異表達情況,并篩選與患者生存時間相關的相分離基因,構建喉鱗癌預后預測模型,為臨床治療提供理論依據。
1.1 相分離相關基因數據來源 從Pubmed(https://pubmed.ncbi.nlm.nih.gov/)網站收錄的公開文獻以及4 個在線數據庫PhaSepDB(http://db.phasep. pro/)、LLPSDB(http://bio-comp. org. cn/)、PhaSePro(https://phasepro. elte. hu/)、DrLLPS(http://llps. biocuckoo. cn/)收集1 501 個相分離相關基因。從TGCA 數據庫(https://portal. gdc. cancer. gov/)下載111 例喉鱗癌與12 例癌旁正常組織的轉錄組測序數據作為TCGA 隊列,以本實驗室自有的107 例喉鱗癌及其對應癌旁正常組織轉錄組測序數據[7]作為自測隊列。
1.2 相分離相關基因在喉鱗癌組織和正常組織中的差異表達基因篩選 使用R語言中的pheatmap程序繪制兩個隊列中相分離相關基因表達模式熱圖,進一步采用R 語言DESeq2 分析癌組織與正常組織的差異基因。以log2|FC|>1 且P<0.05 作為差異表達基因篩選的閾值,其中log2FC>1 為上調基因,log2FC<-1為下調基因。
1.3 喉鱗癌患者調控機制的分型 基于相分離相關基因表達譜,使用GSEA 軟件,采用基因集富集分析預排名算法(GSEA Preranked)對TCGA 隊列和自測隊列患者分別進行個體水平的調控機制富集評分。根據調控機制富集評分進行基于一致性聚類的調控機制分型,機制分型運算由R 語言Consensus-ClusterPlus 程序完成。為了提取對調控機制分型具有關鍵作用的調控通路,本研究將調控機制分析結果中的基因本體論(GO)生物學過程相關的調控通路進行單獨的熱圖分析。
1.4 差異表達的相分離相關蛋白質相互作用關系分析 采用蛋白質相互作用關系(PPI)網絡將“1.2”分析獲得的差異表達相分離相關基因導入在線數據庫STRING(https://string-db.org/),選擇人源數據,使用STRING 數據庫默認參數構建PPI網絡,觀察蛋白之間的相互作用關系。
1.5 影響喉鱗癌患者生存時間的因素分析 采用單因素Cox 回歸分析和Kaplan-Meier 曲線分析影響喉鱗癌患者總生存時間的基因。統計學分析采用Student's t檢驗,P<0.05為差異有統計學意義。
1.6 相分離相關基因預后預測模型的構建 將Cox 回歸和Kaplan-Meier 曲線分析中滿足P<0.05 的基因納入相分離相關基因預后預測模型。使用最小絕對收縮和選擇算法(LASSO)提取數據集代表性指征和構建相分離相關基因預后預測模型,由R 語言glmnet程序進行運算。使用相分離相關基因預后預測模型給予每位患者風險分數,計算公式為:其中CoLLPSi是預測模型中LLPSi 的風險系數,ExLLPSi是預測模型中LLPSi的表達水平,n 是預測模型中相分離相關基因的數量。根據總生存時間風險評分的中位值,將喉鱗癌患者分為高風險和低風險組,采用Kaplan-Meier曲線比較兩組的總生存時間、無進展間隔率和疾病特異性生存率。
1.7 相分離相關基因預后預測模型的預測效能評價 采用時間依賴性受試者工作特征(ROC)曲線下面積(AUC)評價相分離相關基因預后預測模型對喉鱗癌患者1、3、5年總生存率的預測效能。使用基于R 語言的rms 程序構建由相分離相關基因預后預測模型和臨床參數組成的諾莫圖,以校準曲線和決策曲線評估預后預測模型通過諾莫圖的形式在喉鱗癌臨床預后預測使用的潛力。
2.1 相分離相關基因在喉鱗癌組織中的表達譜 1 501個相分離相關基因的表達熱圖顯示,在自測隊列和TCGA 隊列中,與正常組織比較,喉鱗癌組織存在明顯的相分離基因表達水平差異。在自測隊列與TCGA 隊列中共篩選出105 個差異表達的相分離相關基因,其中上調65個、下調40個(見OSID碼圖1)。
2.2 喉鱗癌患者調控機制分型結果 聚類結果顯示,喉鱗癌患者基于不同的通路機制可分為3 個亞型,3 個亞型的相分離型關基因表達水平和富集分數明顯不同(見OSID 碼圖2)。GO 分析顯示,3 個亞型的生物學過程相關通路調控模式不同,亞型1 主要包括有氧呼吸、ATP代謝過程的調節、活性氧化物合成過程等通路;亞型2主要包括離子穩態、離子傳輸的調節、陰離子運輸調節等通路;亞型3主要包括細胞老化調節、細胞衰老、白細胞介導的免疫調節和淋巴細胞介導的免疫調節等通路。
2.3 相分離相關蛋白的相互作用關系 以自測隊列和TCGA 隊列篩選出的105 個差異表達相分離相關基因構建蛋白質互作網絡,結果顯示,網絡中的蛋白存在互作關系(見OSID碼圖3)。
2.4 相分離相關基因對喉鱗癌患者總生存時間的影響 Cox 單因素分析顯示,SLC7A5(HR=1.90,95% CI 為1.03~3.45,P=0.039)、CPEB3(HR=0.49,95% CI為0.27~0.88,P=0.018)、KIF2C(HR=0.51,95% CI 為0.29~0.91,P=0.022)、ERPINH1(HR=1.80,95% CI 為 1.03~3.30,P=0.040)、PRKAA2(HR=2.40,95% CI 為1.34~4.44,P=0.004)、LGALS7B(HR=0.43,95% CI 為0.24~0.78,P=0.005)、PIWIL2(HR=0.42,95% CI為0.23~0.78,P=0.005)、TUBB3(HR=2.10,95% CI為1.16~3.74,P=0.014)是喉鱗癌患者總生存時間的獨立影響因素(見OSID 碼圖4A)。Kaplan-Meier 分析顯示,CPEB3、KIF2C、PRKAA2、LGALS7B、PIWIL2、TUBB3、TFRC、PIMREG、POU4F1、SLC7A2、SPANXC是喉鱗癌患者總生存時間的影響因素(P<0.05 或<0.01,見OSID碼圖4B)。將Cox單因素分析結果與Kaplan-Meier 結 果 合 并,TFRC、SLC7A5、CPEB3、PIMREG、KIF2C、SERPINH1、POU4F1、PRKAA2、SLC3A2、LGALS7B、PIWIL2、SPANXC、TUBB3 等13個相分離相關基因是喉鱗癌患者總生存時間的影響因素。將上述13 種基因在喉鱗癌和正常組織中的表達進行比較,結果顯示差異均有統計學意義(P均<0.01)。見表1。
表1 13個影響喉鱗癌患者生存時間的相分離相關基因 在喉鱗癌和癌旁正常組織中的表達比較( ± s)

表1 13個影響喉鱗癌患者生存時間的相分離相關基因 在喉鱗癌和癌旁正常組織中的表達比較( ± s)
基因名稱TFRC SLC7A5 PIMREG KIF2C SERPINH1 POU4F1 SLC3A2 LGALS7B PIWIL2 SPANXC TUBB3 CPEB3 PRKAA2喉鱗癌組織(n=107)86.89 ± 95.23 28.22 ± 23.24 3.30 ± 2.36 7.33 ± 3.85 34.06 ± 30.71 0.16 ± 0.24 52.64 ± 23.31 135.33 ± 191.82 1.27 ± 2.78 0.11 ± 0.24 9.59 ± 10.62 1.21 ± 1.08 0.60 ± 0.78癌旁正常組織(n=107)32.47 ± 20.67 8.26 ± 10.70 1.70 ± 0.98 2.20 ± 1.58 8.88 ± 7.47 0.03 ± 0.08 22.10 ± 9.80 50.55 ± 86.71 0.24 ± 0.50 0.02 ± 0.06 1.85 ± 3.98 2.36 ± 0.91 1.39 ± 0.94 P 6.51E-08 2.17E-13 1.50E-09 2.20E-16 2.63E-13 4.62E-07 2.20E-16 5.26E-05 2.67E-04 2.04E-04 8.08E-11 7.05E-15 2.41E-10
2.5 喉鱗癌預后預測模型構建與驗證結果 基于13 種對喉鱗癌患者生存時間具有顯著影響的相分離相關基因,本研究構建了一個包含9 個相分離相關基因(TUBB3、SPANXC、PIWIL2、LGALS7B、SERPINH1、KIF2C、PIMREG、CPEB3 和TFRC)的喉鱗癌預后預測模型(另外4 個基因在LASSO 算法計算過程中系數為0,故舍棄)。使用相分離相關基因預后預測模型對TCGA 隊列的111 例喉鱗癌患者進行危險因子評分,評分公式為:0.206 7×ExTUBB3+ 0.053 0×ExSPANXC+ (-0.012 9)×ExPIWIL2+ (-0.089 7)×ExLGALS7B+ 0.104 7×ExSERPINH1+(-0.103 2)×ExKIF2C+ (-0.062 6)×ExPIMREG+ (-0.174 4)×ExCPEB3+ 0.127 9×ExTFRC。根據危險因子評分中位值,將患者分為高、低風險組。高風險組總生存率低于低風險組(HR=5.47,95%CI為2.68~11.15,P<0.01,見OSID 碼圖5B)。ROC 曲線分析顯示,模型風險評分對喉鱗癌患者1、2、5 年總生存率預測的AUC 分別為65.0%、79.4%和72.7%(見OSID 碼圖5C)。高風險組無進展 間 隔 率(HR=1.02,95%CI為1.00~1.04,P=0.036)和疾病特異性生存率(HR=1.02,95%CI為1.00~1.04,P=0.042)低于低風險組(見OSID 碼圖5D 和5F)。ROC 曲線分析顯示,模型風險評分對喉鱗癌患者1、2、5年的無進展間隔率預測的AUC分別為69.70%、68.70%和77.10%,對疾病特異性生存率預測的AUC 分別為64.90%、65.40%和72.50%(見OSID碼圖5E和5G)。
整合模型風險評分和喉鱗癌患者臨床參數構建諾莫圖,評估預后預測模型通過諾莫圖的形式在喉鱗癌患者臨床預后預測使用中的潛力(見OSID碼圖5H)。校準曲線顯示,諾莫圖在1、2 和5 年內對喉鱗癌患者的生存時間具有良好的預測能力(見OSID碼圖5I)。決策曲線顯示諾莫圖和預后預測模型在預測喉鱗癌患者生存時間中具有良好的臨床應用潛力(見OSID碼圖5J)。
喉鱗癌的發病機制目前尚未明確,其治療以手術切除為主,易影響患者的呼吸和吞咽功能,導致患者生活質量嚴重下降。由于喉鱗癌患者在確診時大多為晚期,往往錯過了最佳治療窗口。癌癥病變過程中基因層面的變化早于病理宏觀癥狀的顯現,因此挖掘喉鱗癌組織中差異表達基因,尋找能夠影響患者預后生存的標志基因是提高喉鱗癌診斷和預測預后生存的潛在策略。蛋白質異常相分離是前列腺癌、乳腺癌和白血病等惡性腫瘤發病的重要原因[8]。癌癥是一種復雜且異質性的疾病,是由多基因協同作用導致的[9]。本研究通過分析相分離相關基因在喉鱗癌組織中的表達差異和對患者生存時間的影響,探討相分離相關基因內在相互聯系和在喉鱗癌發展過程的協調促進作用。在兩組獨立隊列中,共鑒定出105 個在喉鱗癌組織中顯著差異表達的相分離相關基因,并且作為整體,相分離相關基因在喉鱗癌和正常組織中具有明顯不同的表達模式,其能夠將癌組織和正常組織明顯區分開。這表明相分離基因在喉鱗癌組織中的表達發生顯著變化,具有作為喉鱗癌診斷標志物的潛力。
腫瘤的發生具有復雜的調控機制,同一種腫瘤的致癌癌基因和分子機制也可能存在著不同。為了研究喉鱗癌中患者個體水平的調控差異,我們使用GSEA Preranked 算法對每個患者進行調控機制評分。基于不同的調控機制,一致性聚類將喉鱗癌患者分為3 個亞型,其主要調控機制分別富集在有氧呼吸、離子穩態、免疫調節信號通路。這表明喉鱗癌患者的分子調控機制具有顯著的異質性,基于分子水平的治療應當考慮制定具有針對性的策略。此外,為了研究相分離相關基因作為整體在喉鱗癌中的調控通路,我們對全部1 501個相分離相關基因進行功能富集分析。相分離相關基因主要富集于PD-1/PD-L1 免疫檢查點、腫瘤中心碳循環、表皮生長因子受體、表皮生長因子EGFR 受體耐藥、缺氧誘導因子和多種特異腫瘤相關通路。程序性細胞死亡受體PD-1 是一種表達在免疫效應細胞表面的免疫檢查點抑制蛋白,其由PD-L1 激活,PD-L1 異常是癌癥主要的免疫逃逸機制之一[9]。腫瘤細胞能夠利用糖酵解來維持自身的能量需求,并能夠在無氧條件下將葡萄糖轉化為乳酸,通過能量代謝的重構,改變了細胞中碳代謝路徑[10]。表皮生長因子由EGFR、ErbB1、ErbB2、ErbB3 和ErbB45 等5 個成員組成,其在多種癌癥中過表達或突變,并與腫瘤的預后不良、耐藥和轉移緊密相關[11]。低溫誘導因子與血管形成、能量代謝和細胞存活等重要生物學過程密切相關,并且促進了多種腫瘤患者死亡率的增加。在臨床研究中,抑制HIF-1 活性對腫瘤生長具有顯著影響[12]。以上結果表明,相分離相關基因可能通過作用于不同的腫瘤通路調控喉鱗癌的進展。
本研究中,使用Cox 回歸篩選出TFRC、SLC7A5、CPEB3、PIMREG、KIF2C、SERPINH1、POU4F1、PRKAA2、SLC3A2、LGALS7B、PIWIL2、SPANXC 和TUBB3 共13 個對喉鱗癌患者總生存率具有顯著影響的相分離相關基因。其中,TFRC、SLC7A5、CPEB3、PIMREG、KIF2C、SERPINH1、POU4F1、PIWIL2 和TUBB3 對腫瘤的進展具有重要的調控作用[13-15]。多基因預后預測模型預測能力優于單基因模型[16]。基于上述13 相分離相關基因,建立了一個包含TUBB3、SPANXC、PIWIL2、LGALS7B、SERPINH1、KIF2C、PIMREG、CPEB3 和TFRC 等9 個基因的喉鱗癌預后預測模型。預后預測模型對喉鱗癌患者預后總生存、無進展間隔和疾病特異性生存具有顯著不良影響。此外,我們建立了由相分離相關基因預后預測模型和臨床參數組成的用于預測喉鱗癌預后生存時間的諾莫圖,并表現出優異的性能。以上結果表明,相分離相關基因對喉鱗癌的預后生存具有顯著的影響,進而具有對喉鱗癌患者預后預測潛在的臨床應用能力。
綜上所述,相分離相關基因在喉鱗癌和正常組織中存在表達差異,并且其可根據調控機制的不同將喉鱗癌患者分成有氧呼吸、離子穩態和免疫調節等通路相關的3 個不同機制亞型。TFRC、SLC7A5、CPEB3、PIMREG、KIF2C、SERPINH1、POU4F1、PRKAA2、SLC3A2、LGALS7B、PIWIL2、SPANXC 和TUBB3 等13 個相分離相關基因對喉鱗癌患者的生存時間具有顯著影響。最后,基于LASSO 算法,本研究構建了一個包含TUBB3、SPANXC、PIWIL2、LGALS7B、SERPINH1、KIF2C、PIMREG、CPEB3 和TFRC 等9 個相分離相關基因的喉鱗癌預后預測模型。該模型對喉鱗癌的總生存率、無進展間隔率和疾病特異性生存率具有良好的預測能力。深入研究相分離相關基因在喉鱗癌中的預后預測潛力和分子機制對未來喉鱗癌的臨床診斷和預后預測具有十分重要的意義。