朱軼昊,楊奕辰,馬琳琳*
(1.上海健康醫學院醫學技術學院,中國上海 201318;2.上海杉達學院信息科學與技術學院,中國上海 201209)
卵巢癌是最致命的婦科惡性腫瘤,5年生存率僅為46%[1]。缺乏早期診斷的特異性生物標志物和對化療藥物的耐藥是患者不良預后的重要原因[2]。雖然80%的卵巢癌患者最初對紫杉醇/卡鉑聯合化療敏感,但約有一半以上的患者在5年內因獲得性耐藥而復發[3]。因此,識別和開發針對化療耐藥卵巢癌患者的特異性生物標志物和潛在靶點至關重要。
微RNA(microRNA,miRNA)是一類長度約22個核苷酸的非編碼RNA分子,可以在轉錄后水平上調控基因的翻譯表達或mRNA的降解[4]。miRNA通過靶向mRNA的3′-UTR,實現對靶mRNA的降解或翻譯抑制[5~6],從而調控基因表達。越來越多的證據表明,miRNA能夠調節細胞的增殖、分化和應激反應。miRNA功能障礙與人類疾病,尤其是癌癥的形成和發展有關[7~8]。許多miRNAs在卵巢癌中異常表達,對癌癥的發生發展及預后有重要影響。例如:miR-450a是卵巢癌中顯著下調的miRNAs之一,其過表達可抑制與上皮-間質轉化相關的多個基因,減少腫瘤細胞的遷移和侵襲,增加腫瘤細胞的凋亡,在卵巢腫瘤異種移植模型中,miR-450a過表達可顯著抑制腫瘤生長[9];miR-27a被發現在卵巢癌組織和細胞系中顯著升高,抑制miR-27a的表達可抑制SK-OV-3和OVACAR-3卵巢癌細胞系的細胞周期進展,進而抑制其增殖[10]。此外,Zhou等[11]研究表明,低表達的miR-595與卵巢癌患者更短的生存期相關。本研究利用TCGA數據庫下載卵巢癌的轉錄組數據及對應的臨床信息,通過差異分析篩選與卵巢癌耐藥相關的miRNAs,隨后通過單因素Cox比例風險回歸分析及Kaplan-Meier分析篩選出與預后相關的miRNAs,并通過構建預后風險評分模型來預測卵巢癌患者的預后風險,探討其與卵巢癌預后的相關性,以期為提高卵巢癌患者的個體治療提供參考。
卵巢癌相關的miRNAs表達數據及相應的臨床數據均來源于TCGA數據庫(https://portal.gdc.cancer.gov/)。下載的基因表達數據包含499例卵巢癌患者,臨床數據包含年齡、FIGO分期、病理分級、淋巴結轉移、脈管侵襲、耐藥與否及腫瘤殘留大小等信息[12]。
利用R軟件對下載的卵巢癌數據進行預處理,將counts數轉化為表達值,并將樣本ID轉換為miRNAs基因名。根據卵巢癌耐藥與否,我們分別將卵巢癌樣本分為耐藥組與非耐藥組,通過R軟件的“edgeR”包篩選出與卵巢癌耐藥相關的mi-RNAs,篩選標準為:|log2FC|≥1(FC:fold change),P≤0.05[13]。
為了篩選與卵巢癌總體生存相關的miRNAs基因集,利用 R 軟件的“survival”和“survminer”對卵巢癌耐藥相關的miRNAs分別進行單因素Cox比例風險回歸分析及Kaplan-Meier分析,P≤0.05被認為與卵巢癌的總體生存相關,最終取兩種分析方法的交集進行下一步分析。
利用R軟件中“survival”包的多因素Cox回歸分析構建預后風險評分模型。采用前向逐步回歸法篩選多因素模型納入變量,以縮小用于構建預后風險評分模型的miRNAs基因集數。根據風險評分的中位數將卵巢癌患者分為高風險組和低風險組。采用Kaplan-Meier分析比較高風險組及低風險組患者的總體生存期,并采用log-rank檢驗進行評價。采用時間依賴性ROC曲線分析復發預測模型的敏感性和特異性。多因素分析用于評估風險評分是否獨立于年齡、FIGO分期、病理分級、淋巴結轉移、脈管侵襲及腫瘤殘留大小等臨床病理參數,成為卵巢癌患者預后的獨立風險因子[14]。
利用R軟件的“rms”軟件包繪制列線圖模型。用于構建列線圖的變量包括年齡、FIGO分期、病理分級、淋巴結轉移、脈管侵襲、腫瘤殘留大小和風險評分。校準曲線可以展示列線圖模型在全部預測概率范圍內的校準能力[15]。為評估列線圖中實際生存和預測生存的一致性,用校準曲線評價列線圖模型的預測能力。
所有分析均采用SPSS 23.0和R 3.5.3進行。所有統計檢驗均為雙側檢驗,P值小于0.05被認為具有統計學意義。符合正態分布的連續變量采用獨立t檢驗進行組間差異比較,而偏態分布的連續變量則采用Mann-Whitney U檢驗進行比較。
根據卵巢癌耐藥與否將患者分為耐藥組及非耐藥組,利用R軟件的“edgeR”包進行差異分析,篩選出與卵巢癌耐藥相關的差異miRNAs共84個(P<0.05)。
為了探討卵巢癌耐藥相關的miRNAs與患者預后的關系,我們首先利用單變量Cox比例風險回歸分析法進行篩選,結果顯示:16個miRNAs與卵巢癌患者的總體生存相關(表1,P<0.05)。隨后對這16個基因進行Kaplan-Meier分析,結果表明,共有12個基因與卵巢癌患者的預后相關(圖1,P<0.05)。我們將這12個基因用于下一步的分析。

表1 單因素Cox比例風險回歸分析篩選出的與卵巢癌預后相關的miRNAsTable 1 miRNAs related to the prognosis of ovarian cancer selected by univariate Cox proportional risk regression analysis
采用前向逐步回歸法在單變量Cox比例風險回歸分析和Kaplan-Meier分析的基礎上繼續縮小用于構建預后風險評分模型的miRNAs基因集數。結果表明,經過前向逐步回歸法,我們最終篩選出8個miRNAs(表2)。將篩選的基因置入多變量Cox比例風險回歸分析,根據這些miRNAs的回歸系數構建以下公式:Risk10=-653.47×hsa-miR-6786-5p+282.93×hsa-miR-7155-3p-0.06×hsamiR-30e-3p+4 972.34×hsa-miR-4502-8 158.13×hsa-miR-3927-3p+427.09×hsa-miR-3662-0.09×hsa-miR-30d-5p+3 121.64×hsa-miR-548ai,構建預后風險回歸模型。根據模型每個患者將得到一個復發風險評分。根據風險評分的中位值將患者分為高風險組及低風險組,Kaplan-Meier生存曲線提示高風險組患者具有較差的預后結果(P=0.029,圖2A),ROC曲線表明該風險模型在預測復發風險上具有較好的敏感性及特異性(圖2B)。卵巢癌患者的風險評分、生存狀態及基因表達的聚類熱圖分別見圖2C、圖2D和圖2E。

表2 用于構建風險評分模型的miRNAs及其回歸系數Table 2 miRNAs used to construct prognostic risk score model and their regression coefficients

圖2 預后風險評分模型的構建(A)Kaplan-Meier曲線;(B)ROC曲線;(C)卵巢癌患者風險評分;(D)卵巢癌患者生存狀態分析;(E)卵巢癌患者基因表達聚類熱圖。Fig.2 Construction of prognostic risk score models(A)Kaplan-Meier survival curve;(B)ROC curve;(C)The risk scores of ovarian cancer patients;(D)Analysis of survival status of ovarian cancer patients;(E)The gene expression heat map of ovarian cancer patients.
為了探索構建的預后風險評分模型對卵巢癌患者預后風險的預測是否獨立于患者的年齡、FIGO分期、病理分級、淋巴結轉移、脈管侵襲及腫瘤殘留大小等臨床病理參數,我們針對風險評分及臨床病理參數進行了單因素及多因素分析。結果表明,風險評分(HR=1.41,95%CI=1.30~1.53;P=5.57E-17)及FIGO分期(HR=0.55,95%CI=0.39~0.78;P=0.000 7)均與卵巢癌患者的總體預后相關。其中,風險評分(HR=1.37,95%CI=1.09~1.73;P=0.008)為預測卵巢癌患者預后的獨立風險因子(表3)。

表3 預后風險評分模型的單因素和多因素Cox回歸分析Table 3 Univariate and multivariate Cox regression analysis of prognostic risk score model
進一步探索預后風險評分與卵巢癌患者年齡、FIGO分期、病理分級、淋巴結轉移、脈管侵襲及腫瘤殘留大小等臨床病理參數之間的關系。結果表明,預后風險評分與卵巢癌患者的FIGO分期密切相關(P<0.000 1,表4),而與年齡、病理分級、淋巴結轉移、脈管侵襲及腫瘤殘留大小等病理參數無關(P>0.05,表4)。

表4 預后風險評分與卵巢癌患者臨床病理參數之間的相關性Table 4 The correlation between the prognostic risk score and clinicopathologic parameters of ovarian cancer patients
最后,為了聯合風險評分及年齡、FIGO分期、病理分級、淋巴結轉移、脈管侵襲、腫瘤殘留大小等臨床病理參數對患者的預后進行有效預測,我們構建了列線圖模型。結果顯示,該模型可以充分利用各個預后變量對卵巢癌患者的死亡風險進行精準預測(圖3)。校準曲線表示,列線圖模型在預測復發風險上具有較好的校準能力,即模型預測風險與患者實際風險具有較好的一致性(圖4)。

圖3 列線圖模型Fig.3 Nomogram model

圖4 列線圖的校準圖(A)卵巢癌患者1年生存率預測;(B)卵巢癌患者2年生存率預測;(C)卵巢癌患者3年生存率預測。Fig.4 Calibration diagram of nomogram(A)Prediction of 1-year survival rate for ovarian cancer patients;(B)Prediction of 2-year survival rate for ovarian cancer patients;(C)Prediction of 3-year survival rate for ovarian cancer patients.
卵巢癌的主要化療方法是以鉑類為基礎的聯合化療,其已被證明是最有效的化療方案。然而,在鉑類為基礎的聯合化療中,疾病常因耐藥而復發[16]。因此,尋找耐藥相關的腫瘤標記物,并探索其對卵巢癌預后的影響,對卵巢癌患者的精準治療至關重要。miRNA是一類由內源性基因編碼的長度約為22個核苷酸的非編碼RNA分子,參與調控動植物轉錄后的基因表達[17]。Shin等[18]研究表明,miRNA可以參與腫瘤的發生發展,調節腫瘤細胞對放療和化療的敏感性。因此,本研究篩選出與卵巢癌耐藥相關的miRNAs,并從中篩選出與預后相關的miRNAs構建預后風險評分模型,以預測卵巢癌患者的復發風險。
首先,我們從TCGA數據庫中下載卵巢癌轉錄組數據及臨床數據,根據卵巢癌耐藥與否將患者分為耐藥組及非耐藥組,并進行差異分析,篩選出與卵巢癌耐藥相關的基因。隨后,對篩選出來的基因進行單因素Cox比例風險回歸分析及Kaplan-Meier分析,進一步篩選出與預后相關的基因。最后,利用這些基因構建預后風險評分模型。Kaplan-Meier生存曲線分析表示,與低風險組患者相比,高風險組患者具有較差的預后。ROC曲線表示,該風險模型在預測復發風險上具有較好的敏感性及特異性。進一步的Cox回歸分析提示,該預后風險評分是預測卵巢癌患者復發風險的獨立影響因子。此外,我們還聯合風險評分及年齡、FIGO分期、病理分級、淋巴結轉移、脈管侵襲、腫瘤殘留大小等臨床病理參數構建了列線圖模型,結果顯示,該模型可以對卵巢癌患者的死亡風險進行精準預測。
在用于構建預后風險評分模型的8個miRNAs中,目前僅3個是有相關文獻報道過的,即hsa-miR-30e-3p、hsa-miR-3662 和 hsa-miR-30d-5p。Koutsaki等[19]研究表明 hsa-miR-30e-3p的表達與卵巢癌的上皮-間質轉化相關。hsa-miR-3662在實體瘤肺腺癌中過表達,且在可手術腺癌的診斷中發揮著重要的作用[20]。然而,hsa-miR-3662被報道在肝癌組織和細胞系低表達,且低表達的hsa-miR-3662與腫瘤大小、腫瘤多樣性、Edmondson分級和腫瘤-淋巴結轉移分期相關[21]。Shi等[22]研究表明hsa-miR-30d-5p的高表達與卵巢癌良好的預后水平相關。
綜上所述,我們通過一系列生物信息學方法篩選出8個與卵巢癌預后相關的miRNA標志物。多因素Cox比例風險回歸分析表明,8個miRNAs是卵巢癌預后的獨立風險因素。結合預后風險評分及卵巢癌的臨床病理參數構建的列線圖模型可有效預測卵巢癌的生存率。該預測方法在一定程度上可為未來卵巢癌預后相關研究提供方向。