黃俊杰,梁彬
(中國醫科大學生命科學學院生物信息學教研室,沈陽 110122)
2018年全球癌癥統計學研究[1]顯示,世界范圍內口腔癌發病率占所有癌癥的2%,死亡率占1.9%。其中口腔鱗狀細胞癌(oral squamous cell carcinoma,OSCC)最常見,約占口腔惡性腫瘤的90%以上。盡管放療、化療以及靶向治療技術等醫療手段在OSCC的治療上取得很大進展,但是OSCC的5年生存率仍然僅為40%~50%,嚴重影響了患者的生活質量[2]。目前,OSCC的發展、侵襲和轉移機制尚不完全明確,闡明OSCC的發病機制,尋找高效的治療靶點,對OSCC的預防及治療具有重要的指導意義。FOXD1屬于叉頭框(forkhead box,FOX)蛋白轉錄因子家族,研究[3]證明FOXD1參與多種腫瘤的發生發展過程。目前,FOXD1在OSCC發生發展中扮演的角色知之甚少,本研究基于癌癥基因組圖譜(the cancer genome atlas,TCGA)數據庫和Gene Expression Omnibus(GEO)數據庫的信息,通過分析FOXD1在OSCC中的表達特點,探討FOXD1在OSCC預后中的價值,同時分析FOXD1與腫瘤微環境(tumor microenvironment,TME)的關系,為進一步明確OSCC的發病機制和治療策略提供依據。
從TCGA數據庫(https://portal.gdc.cancer.gov/)下載頭頸部鱗狀細胞癌的基因表達譜三級數據,并進行標準化處理,提取FOXD1基因表達信息。從cBioportal數據庫(https://www.cbioportal.org/)下載患者的臨床信息,包括年齡、性別、TNM分期、病理分期以及預后情況。剔除臨床信息和生存資料不完整的樣本,共314例OSCC樣本和44例癌旁組織樣本納入研究,見表1。

表1 TCGA 數據集中OSCC患者的臨床特征Tab.1 Clinical characteristics of OSCC patients in the TCGA dataset
通過關鍵詞“head and neck” “oral”和“carcinoma” “cancer” “tumor” “neoplasma”在GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)中搜索相應的GEO數據集,下載芯片表達數據,提取FOXD1基因表達信息。共4個數據集納入研究,見表2。

表2 OSCC 的GEO 數據集基本特征Tab.2 Currently available datasets curated by GEO
比較TCGA數據集中FOXD1在癌組織和癌旁組織/正常組織中的表達差異。GEO數據集作為外部驗證數據集,分別分析4個GEO數據集中FOXD1在癌組織和癌旁組織/正常組織中的表達差異。分析FOXD1表達與臨床參數的關系。根據FOXD1表達的中位數劃分,將OSCC樣本分為FOXD1高表達組和低表達組。
采用Estimation of Stromal and Immune Cells in Malignant Tumor Tissues Using Expression Data(ESTIMATE)算法對下載的RNA表達數據進行基質評分和免疫評分,并依據FOXD1的中位數將樣本分成FOXD1高表達組和低表達組,比較2組基質評分和免疫評分的差異。Cell-type Identification by Estimating Relative Subsets of known RNA Transcripts(CIBERSORT)是一種采用標準化基因表達數據來評估免疫細胞組成的生物信息學方法。采用CIBERSORT算法比較FOXD1高表達組和低表達組22種免疫細胞構成比。22種免疫細胞包括巨噬細胞(M0、M1、M2),7種T細胞亞型、B細胞(初始B細胞、記憶性B細胞)、肥大細胞(未活化、活化)、自然殺傷細胞(未活化、活化)、樹突細胞(未活化、活化)、漿細胞、單核細胞、嗜酸性粒細胞和中性粒細胞。
采用GSEA工具,利用MSigDB數據庫中參考數據集“c2.cp.kegg.v7.2.symbols.gmt gene sets”和“C5.go.bp.v7.2.symbols.gmt gene set”進行FOXD1基因相關生物學功能和信號通路富集分析。以錯誤發現率(false discovery rate,FDR)<0.25和P< 0.05的基因集為顯著富集基因集。
采用SPSS 22.0軟件進行統計學分析。計量資料2組比較采用t檢驗,多組比較采用單因素方差分析。采用Kapalan-Meier曲線和Log-rank檢驗方法比較FOXD1高表達組和低表達組的生存差異。采用單因素和多因素Cox回歸分析方法評估FOXD1的預后價值。P< 0.05為差異有統計學意義。
TCGA 數據集中,OSCC樣本FOXD1表達顯著高于癌旁組織(P< 0.001,圖1A)。4個GEO數據集,GSE25099(P< 0.001),GSE31056(P< 0.001),GSE74530(P< 0.001)分析結果表明FOXD1在癌組織中的表達量均顯著高于正常組織(圖1B~1D);GSE30784數據集中FOXD1表達顯著高于良性增生組織(P< 0.001,圖1E)。

圖1 TCGA和GEO數據集中FOXD1在OSCC組織和正常組織中的表達Fig.1 FOXD1 expression in OSCC and normal control group in TCGA and GEO datasets
TCGA數據集中,FOXD1表達與臨床分期(P=0.107)、病理分期(P=0.496)、N分期(P=0.150)和T分期(P=0.102)不相關(圖2)。但FOXD1在臨床分期Ⅱ期(P=0.050)和Ⅲ期(P=0.027)中的表達顯著高于分期Ⅰ期。在N分期和T分期中,FOXD1表達隨著N分期升級有逐漸增高的趨勢。

圖2 FOXD1表達與臨床特征的關系Fig.2 Correlation between FOXD1 expression and clinical parameters
Kaplan-Meier生存曲線顯示FOXD1表達狀態對OSCC患者總體生存率和無病生存率的影響。結果顯示,FOXD1高表達組的總體生存率(P=0.039)和無病生存率(P=0.041)顯著低于FOXD1低表達組(圖3)。進一步分析FOXD1表達和OSCC的臨床參數與預后的關系,如表3所示,單因素Cox回歸分析中,FOXD1表達與總體生存率(HR=1.408,95%CI:1.017~1.949,P=0.039)和無病生存率(HR=1.360,95%CI:1.011~1.830,P=0.042)相關。多因素Cox回歸分析結果顯示FOXD1表達僅與無病生存率(HR=1.401,95%CI:1.038~1.891,P=0.027)相關,可作為無病生存的獨立預后指標。

表3 OSCC預后影響因素的單因素和多因素的Cox回歸分析Tab.3 Univariate and multivariate Cox regression analyses influencing factors on prognosis
ESTIMATE分析結果顯示,FOXD1高表達組的基質評分(P=0.014)和免疫評分(P=0.028)顯著低于FOXD1低表達組(圖4A)。CIBERSORT分析結果顯示FOXD1高表達組的M1型巨噬細胞(P=0.037)和活化肥大細胞(P=0.010)含量顯著高于低表達組;而FOXD1高表達組未活化的樹突狀細胞(P=0.040)和濾泡輔助性T細胞(P=0.043)含量顯著低于低表達組(圖4B)。

圖4 FOXD1表達與TME的關系Fig.4 Relationship between FOXD1 expression and tumor microenvironment
GSEA分析結果顯示,與FOXD1高表達表型相關的信號通路包括:花生四烯酸代謝、細胞色素P450代謝、甾類激素生物合成、細胞黏附分子和PPAR 信號通路(圖5A);另外,FOXD1高表達表型與角質細胞分化、上皮細胞分化、補體活化、B細胞調控免疫和吞噬作用等信號通路相關(圖5B)。

圖5 高表達FOXD1和低表達FOXD1的GESA分析Fig.5 GSEA analysis of high and low FOXD1 expression phenotypes
FOX家族成員可通過FOX結構域結合DNA來調控胚胎發育,調節免疫、調節糖類和脂類代謝,以及調控細胞增殖、凋亡、遷徙和轉移等多種生物學過程[4]。FOX家族成員主要包括FOXA、FOXC、FOXM、FOXO和FOXP[5]。FOXD1作為FOX轉錄因子家族的新成員,位于染色體5q13.2。目前,研究[6-11]顯示FOXD1參與多種腫瘤(肺癌、大腸癌、卵巢癌、乳腺癌,鼻咽癌、胃癌和前列腺癌)的發生發展過程。TCGA大數據分析顯示,FOXD1在乳腺癌、膽管癌、結腸癌、食管癌、頭頸部鱗狀細胞癌、肝細胞癌、肺癌、直腸癌和胃癌中上調,而在腎透明細胞癌、甲狀腺癌、子宮內膜癌中下調。一項有關卵巢癌的研究[8]顯示卵巢癌細胞系中上調FOXD1可誘導卵巢癌細胞阻滯在G1期,從而抑制細胞增殖,且高表達的FOXD1與良好的預后相關。因此,FOXD1可能在腫瘤發展過程中呈現促癌和抑癌的兩面性。
本研究基于TCGA和GEO數據庫,發現FOXD1在OSCC組織中的表達顯著上調。預后分析結果顯示FOXD1高表達與不良預后相關,可作為評估預后的獨立因素。CHEN等[12]研究結果顯示在口腔癌的發展過程中,FOXD1可通過上調lncRNA CYTOR促進上皮間質轉化和化療抗性。LIN等[13]發現抑制FOXD1可顯著增強OSCC患者放療的有效性,且促進腫瘤免疫監視。通過對TCGA數據進行分析發現,FOXD1mRNA水平可作為OSCC診斷和預后的潛在標志物[5]。本研究結果與這些研究結果一致,推測FOXD1可作為新的癌基因參與OSCC發生發展過程。
TME是腫瘤細胞生長的內環境,主要由血管生成細胞、免疫浸潤細胞及癌相關的成纖維細胞三大基質細胞組成[14]。研究[15]發現,OSCC發生發展與TME的變化緊密相連。在 OSCC的TME中,免疫細胞微環境、免疫抑制細胞微環境、間質微環境是一個相互聯系、相互調節的整體,協同作用決定OSCC的發展及轉歸。本研究基于OSCC轉錄組學數據,采用ESTIMATE算法,預測腫瘤組織中浸潤的基質細胞和免疫細胞的比例。結果顯示OSCC樣本中,FOXD1高表達組的基質評分和免疫評分均顯著低于FOXD1低表達組(P< 0.05)。為了進一步探討TME中免疫浸潤細胞的變化趨勢,本研究采用CIBERSORT算法對TME中22種免疫細胞亞型的組成進行評估。結果顯示,M1型巨噬細胞、未活化樹突狀細胞、活化肥大細胞和濾泡輔助性T細胞在FOXD1高表達組和低表達組存在顯著差異。因此推測FOXD1與TME的變化密切相關,且影響TME中免疫浸潤細胞的組成。
本研究采用生物信息學方法對FOXD1影響的生物學過程和信號通路進行預測,結果顯示,FOXD1主要富集在細胞黏附途徑、花生四烯酸、類固醇激素生物合成以及PPAR信號通路。高FOXD1表達表型主要與上皮細胞、角化細胞分化以及免疫細胞調控相關。
綜上所述,本研究通過對生物信息數據庫的挖掘,發現FOXD1表達在OSCC組織中呈現上調的趨勢,且與OSCC患者的不良預后相關。FOXD1表達影響TME中基質細胞和免疫浸潤細胞的變化。FOXD1可能作為潛在的癌基因參與OSCC的發生發展過程,通過調控物質代謝和免疫反應調控OSCC的進展。