莊小捷 余 雙 陳金平 馮繼紅(宜春市人民醫院腫瘤科,宜春 336000)
宮頸癌為全球女性第二常見的腫瘤,發病率僅次于乳腺癌[1]。最新統計數據表明,全世界每年有超過52.5萬例新病例和26.5萬例患者死亡,其中中國是宮頸癌的高發地區,一年中有超過13萬例新增病例,我國宮頸癌患者的年齡主要集中在40~50歲[2-4]。近年來,從宮頸癌的發病率和病死率的趨勢來看,該疾病目前仍處于上升趨勢[5]。許多復雜因素與宮頸癌的生物學行為有關,并影響患者預后,導致部分患者療效不理想,復發率較高,五年生存率偏低[6-8]。
2007年,美國國家癌癥研究所的一項研究表明,順鉑化療的同時進行放療是晚期宮頸癌患者的標準治療方法,死亡的風險率(hazard rate,HR)值可降低至0.52[9-10]。然而,盡管患者接受了同步放化療,仍有部分患者治療失敗,并且治療反應和預后的差異可能與腫瘤異質性及患者個體差異有關[11]。由于分子生物學技術的飛速發展,腫瘤治療也進入了分子基因水平,并且發現了許多與腫瘤相關的基因突變[12]。通過基因標志物的檢測和針對這些標志物的靶向治療,為癌癥的個性化診斷和治療奠定了基礎[13]。盡管關于宮頸癌生物標志物預測的研究越來越多,但大多數都是基于基因表達譜的分析,臨床上尚無理想的標志物。因此,宮頸癌基因組學的研究仍是當前研究的熱點和重點。最新的研究發現,甲硫氨酸亞砜還原酶B3(methionine sulfoxide reductase-B3,MSRB3)基因缺乏會誘導乳腺癌細胞、肺癌細胞及結腸癌細胞凋亡,但其在宮頸癌中的作用機制尚未明確。
1.1數據下載并篩選差異表達基因(differentially expressed genes,DEGs) 從TCGA數據庫(https://www.cancer.gov/)中獲得宮頸癌基因組的mRNAseq表達數據和臨床特征資料。使用R語言中的“limma”軟件包分析轉化下載的標準化宮頸癌組織與正常組織數據的DEGs(定義為倍數變化>4,Padj=0.001)。最后,從TCGA數據庫中下載了306個宮頸癌樣品和3個正常對照樣本的RNA序列數據和相應的臨床數據,并進行基因差異分析。
1.2Cox比例風險回歸模型篩選并分析預后相關基因Cox回歸模型是生存分析中的重要模型,可用于描述某些時候不變的多個特征對病死率的影響。風險評分是基于多元Cox回歸分析的加權基因表達水平的總和,可用于計算每位患者的風險評分。對每個基因分別進行單變量分析,并根據P<0.05的標準篩選重要基因進行進一步分析,然后采用多元Cox回歸比例風險模型分析通過單因素回歸分析篩選差異有統計學意義的基因。最后,根據基因的中位風險評分將宮頸癌患者分為高風險組和低風險組,并使用R軟件包分析獲得基因風險熱圖。
1.3單基因表達數據的提取與分析 使用R語言的“limma”軟件包對所選基因進行差異分析,并將數據標準化。分析MSRB3在宮頸癌中的表達,并與正常組織進行比較。宮頸癌患者的臨床特征可從TCGA數據庫下載,包括性別、生存時間、年齡、種族、等級分類和TNM分期。其中一些不可用,被認為是缺失值。然后使用R語言中的“survive”軟件包進行生存分析,結合Kolmogorov-Smirnov(KS)檢驗分析得出MSRB3與宮頸癌的臨床相關性。最后,單因素分析和多因素分析再次驗證MSRB3的臨床意義。
1.4基因集富集分析(GSEA)GSEA是一種基因探針富集測定法,基于對來自微陣列數據各種水平的基因探針進行評估。GSEA基于MSRB3表達的相關性生成所有基因的有序列表,并進行KEGG信號通路分析和GO生物功能富集分析。每次分析進行1 000個基因組隨機替換,然后按P值大小選擇顯示前20個結果。最后使用R語言“ggplot2”軟件包對單獨選擇的KEGG/GO分析的10個結果進行多GESA濃縮總結。
1.5統計學分析 所有研究數據均使用R軟件包(版本3.6.1)和Perl腳本工具(版本5.30.0)進行分析。平均值和標準偏差代表連續變量,頻率和百分比代表類別變量。通過KS檢驗和Logistic回歸分析評估單基因表達與臨床特征的關系。使用Kaplan-Meier生存分析和單因素/多因素Cox比例風險回歸進行預后基因驗證分析。
2.1DEGs的分析和預后基因的篩選 從TCGA數據庫下載的306個宮頸癌組織和3個對照正常組織的臨床資料詳細特征主要包括生存時間、年齡、種族、等級分類和TNM分期等。使用R軟件分析共獲得654個DEGs,其中包括239個上調基因和415個下調基因(倍數變化>4,Padj=0.001)。所有DEGs均由火山圖表示(圖1A)。應用單因素生存分析法分析宮頸癌中654個DEGs,獲得與預后相關的基因(P<0.05)。隨后,通過Logistic回歸和多元Cox分析最終篩選出5個預后相關基因。這5個基因分別為PPP1R14A、MSRB3、SELP、CENPM和ZIC2。根據患者的中位風險評分將患者分為高危組和低危組,并用高、低風險評分熱圖確定這5個基因特征的富集程度(圖1B),該結果表明,5個基因在宮頸癌組織和正常對照組織中顯示出極大的特異性。

圖1 差異表達分析和預后驗證Fig.1 Differential expression analysis and prognosis verification
2.2MSRB3單基因差異表達分析 采用Wilcoxon秩和檢驗分析了MSRB3在306例宮頸癌組織和3例正常組織中的表達。結果表明,MSRB3的表達在宮頸癌組織和正常組織間存在差異,且差異有統計學意義(P<0.01)。比較腫瘤組織和正常組織中MSRB3的均值發現,癌組織中MSRB3的表達明顯低于正常組織(圖2)。差異表達分析初步表明MSRB3可能抑制宮頸癌的發生。

圖2 宮頸癌組織中MSRB3的表達明顯低于正常組織Fig.2 Expression of MSRB3 in cervical cancer tissue was significantly lower than that in normal tissue
2.3MSRB3臨床相關性分析 在TCGA數據庫分析了309例宮頸癌樣本中MSRB3的表達數據。使用KS檢驗和Logistic回歸分析研究了MSRB3與宮頸癌臨床特征間的關系。結果表明,MSRB3的表達增加與腫瘤分級(P=0.000)、淋巴結轉移(P=0.045)、遠處轉移(P=0.002)和年齡(P=0.000)密切相關。盡管與TNM分期的相關性差異無統計學意義,但由圖3可知,臨床分期越高,MSRB3的表達就越高。單因素Logistic回歸分析顯示,MSRB3基因與宮頸癌的臨床特征存在相關性,由表1可知,MSRB3基因與腫瘤分期、年齡、種族、淋巴結轉移和遠處轉移均具有相關性,且差異具有統計學意義。以上結果表明,MSRB3基因在宮頸癌的晚期發揮促癌因子作用,其表達越高,宮頸癌就越容易向晚期和遠處轉移。

表1 MSRB3表達與臨床特征相關(KS檢驗和Logistic回歸)Tab.1 MSRB3 expression associated with clinical characteristics(KS test and Logistic regression)

圖3 MSRB3差異表達的臨床相關性分析Fig.3 Clinical correlation analysis of differential expression of MSRB3
2.4MSRB3作為預測宮頸癌預后的獨立因素Kaplan-Meier生存分析表明,MSRB3低表達的宮頸癌患者預后優于MSRB3高表達患者(P=0.002,圖4)。單因素變量分析和多因素變量分析顯示,MSRB3與宮頸癌總體生存率顯著相關。此外,MSRB3基因可能是宮頸癌患者的獨立預后因素。單因素Cox回歸分析結果顯示,宮頸癌分級、N分型、年齡及MSRB3表達與宮頸癌預后相關。多因素Cox回歸分析表明,盡管其他協變量對其進行了調整,MSRB3仍然是宮頸癌的獨立預后因素(表2)。

表2 單因素和多因素Cox比例風險回歸分析對總生存率的影響Tab.2 Univariate and multivariable Cox proportionalhazards regression analysis on overall survival

圖4 MSRB3的生存分析Fig.4 Survival analysis of MSRB3
2.5GSEA分析MSRB3的生物學功能和相關信號通路 功能基因集采用KEGG和分子特征數據庫(MSigDB)中的GO基因集,然后使用GSEA軟件進行基因集富集分析,MSigDB集富集(c2.cp.v7.0)存在明顯差異(FDR<0.05,NOMP<0.05)。根據標準富集分數(NES)選擇P值最具統計學意義的信號通路和相關生物學功能。分別選擇MSRB3低表達組和高表達組的結果,并將其整合到多GSEA富集圖中。KEGG結果表明,MSRB3主要富集于MAPK、TGF-β和WNT等信號通路(圖5A);GO結果表明,MSRB3的生物學功能主要富集于血管生成、細胞-基質連接及上皮細胞增殖等生物功能(圖5B)。

圖5 MSRB3 GSEA結果Fig.5 GSEA results of MSRB3
宮頸癌是全球女性第二大最常見的婦科腫瘤。據不完全統計,中國女性患者數量高居全球女性患者首位[14]。宮頸癌的主要治療方法是手術治療聯合放化療[15]。隨著治療手段的進展,新輔助化療也是晚期宮頸癌術后復發轉移的一種治療方法,目前的化療藥物主要是鉑類藥物[16]。另外,基因治療也是研究熱點之一。ALK、ROS1、c-met、PI3K和mTOR等大量靶向藥物的出現為癌癥患者帶來了新希望[17]。但目前尚無針對宮頸癌,特別是晚期和復發性宮頸癌的化療相關靶基因的研究。鑒于目前晚期宮頸癌患者的低生存率和全球癌癥負擔,本研究通過TCGA數據庫初步探索與宮頸癌臨床預后相關的分子標志物。
在本研究中,TCGA數據庫提供了宮頸癌基因組測序信息和相應的臨床信息,并使用R語言分析獲得了宮頸癌中差異表達的基因。通過單因素生存分析法分析宮頸癌樣本中654個DEGs,獲得與預后相關的基因。并通過多變量Cox分析獲得了5個基因用于預測宮頸癌預后,包括PPP1R14A、MSRB3、SELP、CENPM和ZIC2。通過查閱文獻和單基因數據分析獲得與宮頸癌預后相關的特異基因MSRB3。結果表明,與正常組織相比,宮頸癌組織中MSRB3基因表達降低。多變量分析表明,MSRB3的高表達與晚期臨床病理特征如腫瘤分級、臨床分期及遠處轉移有關,且MSRB3表達越高,患者預后越差。本研究首先揭示了MSRB3基因可能是一把雙刃劍,在宮頸癌的早期階段發揮抑癌作用,但又可預測晚期宮頸癌患者的預后狀態。除MSRB3外,單因素Cox分析還顯示年齡、分級和臨床分期也是影響宮頸癌總生存率的因素。進一步多變量Cox回歸分析表明,MSRB3和腫瘤分級是宮頸癌總生存率的獨立預后因素。綜上所述,MSRB3基因是宮頸癌患者總生存率的獨立影響因素,可作為宮頸癌潛在的預后分子標志物。
MSRB家族被認為是清除細胞活性氧的重要抗氧化酶,而人類MSRB3基因位于8號染色體上,編碼位于線粒體、細胞質和細胞核中的蛋白質[18]。作為MSRB家族的重要成員,MSRB3可抑制癌基因誘導的DNA損傷,表明MSRB3可能與腫瘤發生有關。然而,只有少數研究報道了MSRB3對癌細胞的作用[19]。MOREL等[20]證明了MSRB3的表達可促進乳腺癌干細胞的惡性轉化。KWAK等[21]報道MSRB3的缺乏可導致乳腺癌、肺癌和肝癌細胞凋亡。MA等[22]表明胃癌組織中MSRB3表達升高與胃癌患者預后不良有關。2016年,KWAK等[23]首次證明了MSRB3下調可誘導癌細胞凋亡,而導致MSRB3誘導細胞死亡的途徑之一是內源性線粒體凋亡的激活。2017年,KWAK等[24]的另一項研究發現,MSRB3缺陷通過p53獨立和內質網應激依賴途徑誘導癌細胞凋亡。截至目前,MSRB3影響腫瘤發展和預后的機制尚不明確。
隨著高通量技術的飛速發展,生物信息學提供了一種強大的手段來篩選分子生物標志物或癌癥預后靶向基因[25]。與其他研究相比,該研究的優勢在于使用大型數據庫,完整的臨床數據和良好的樣品質量控制,為宮頸癌的未來研究提供了新的思路和目標。本研究基于TCGA數據庫分析了306例宮頸癌患者和3例正常對照樣本,結果發現MSRB3在晚期宮頸癌中的表達與臨床病理特征密切相關,且較高水平的MSRB3通常與患者的不良生存率直接相關。此外,結合MSRB3在宮頸癌中的表達低于正常對照組織,課題組發現,MSRB3可能在宮頸癌的發展中發揮雙重作用,其取決于癌癥的發展階段,在癌癥的早期階段發揮抑癌作用,但在癌癥的晚期階段卻促進腫瘤發展,即表達水平越高,預后越差。這項研究的局限性在于,從TCGA數據庫獲得的基因水平數據可能無法完全代表MSRB3在蛋白質水平上的表達。為了使這項研究在臨床上更有意義,上述所有結果均需要在臨床上進一步驗證。