別蓓蓓 周亞明 嚴成俊 孫晉
肝細胞癌(hepatocellular carcinoma,HCC)是最常見的原發性肝臟腫瘤,發病率位居惡性腫瘤第6位,死亡率更是高居惡性腫瘤第4位[1-2]。盡管近年來在HCC診斷和治療方面取得了一定進展,尤其是分子靶向治療和免疫治療[3],但由于病情隱匿且治療后極易復發和轉移,導致患者的預后較差、死亡率居高不下,因此迫切需要開發可用于HCC診斷和預后判斷的生物標志物以及新型治療分子靶標。假基因是指基因組中與正常蛋白編碼基因序列相似,但缺乏編碼氨基酸能力的DNA拷貝[4]。過去一直認為假基因無生物學功能,但近年來發現假基因可在RNA水平發揮調控作用,參與生物個體發育和疾病發生、發展[5-6]。Han等[7]發現大量假基因在不同腫瘤亞型之間存在差異表達,可對腫瘤組織學亞型進行準確分類且與患者生存期顯著相關,提示假基因具有可作為腫瘤診斷和預后判斷生物標志物的潛力。小核糖核蛋白多肽E假基因2(small nuclear ribonucleoprotein polypeptide E pseudogene 2,SNRPEP2)位于人類9號染色體,轉錄本長度為279 bp。研究發現SNRPEP2在結腸癌和乳腺癌中表達上調且與不良預后相關[8-9]。目前,SNRPEP2在HCC中表達是否異常以及是否參與HCC發生、發展仍不清楚。本研究基于癌癥基因圖譜(the cancer genome atlas,TCGA)數據庫探討SNRPEP2在HCC組織中的表達及其臨床意義,以期為SNRPEP2應用于HCC診斷和預后判斷等轉化研究提供依據。
1.1 數據獲取及處理 從TCGA數據庫(https://portal.gdc.cancer.gov/)下載374例HCC組織樣本和50例癌旁正常組織樣本的轉錄組測序(RNA-seq)數據和相關臨床資料。將下載的FPKM格式的RNA-seq數據轉換為TPM格式,經log2轉化處理后即可用于后續分析。
1.2 SNRPEP2在HCC組織中的表達及與臨床特征的關系分析 采用R語言ggplot2程序包分析HCC組織和癌旁正常組織中SNRPEP2的表達情況;根據表達量中位數將患者分為高表達組和低表達組,采用二分類logistic回歸模型分析SNRPEP2表達水平與性別、年齡、TNM分期、病理分期、腫瘤狀態(包括無瘤和荷瘤兩種狀態,無瘤指通過各種手段去除腫瘤組織后使肉眼或影像學不可見腫瘤組織,荷瘤指有影像學或肉眼可見的腫瘤組織)、組織學分級、血清甲胎蛋白(alpha fetal protein,AFP)水平、血管浸潤情況、肝纖維化Ishak評分、鄰近肝組織炎癥情況、Child-Pugh分級等臨床特征的關系。
1.3 SNRPEP2與HCC患者預后的關系 通過R語言survival程序包分析SNRPEP2表達與總生存期(overall survival,OS)、疾病特異性生存期(disease specific survival,DSS)和無進展間隔期(progress free interval,PFI)的關系,并運用Cox比例風險回歸模型分析影響預后的危險因素,其中單因素分析結果P值<0.1的臨床指標進一步納入多因素分析。根據影響預后的危險因素采用R語言rms程序包進一步構建Nomogram預測模型,用于預測HCC患者1、3和5年生存率。
1.4 SNRPEP2對HCC的診斷效能分析 利用R語言pROC程序包制作ROC曲線,通過AUC評估SNRPEP2在HCC診斷中的效能。
1.5 統計學處理 采用SPSS 20.0統計軟件。SNRPEP2在非配對和配對組織中的表達差異分別采用兩獨立樣本t檢驗和配對樣本t檢驗。繪制Kaplan-Meier生存曲線并通過log-rank檢驗分析SNRPEP2表達與患者預后的關系。通過建立二分類logistic回歸模型分析SNRPEP表達與臨床病理特征的關系。通過單因素和多因素Cox回歸分析臨床病理特征與患者OS的關系。P<0.05為差異有統計學意義。
2.1 SNRPEP2在HCC組織中的表達情況 通過比較374例HCC組織和50例癌旁正常組織中SNRPEP2的表達水平,發現HCC組織中SNRPEP2表達水平明顯高于癌旁正常組織(P<0.01,見圖1a;進一步比較50例HCC組織和癌旁配對組織中SNRPEP2表達水平,結果顯示HCC組織中SNRPEP2表達水平明顯高于癌旁配對組織(P<0.01),見圖1b。以上結果提示,SNRPEP2在HCC組織中表達上調。

圖1 基于TCGA數據庫分析SNRPEP2在HCC組織中的表達情況(a:HCC組織與癌旁正常組織中SNRPEP2表達情況比較;b:HCC組織和癌旁配對組織中SNRPEP2表達情況比較)
2.2 SNRPEP2表達水平與HCC患者臨床病理特征的關系 通過構建二分類logistic回歸模型對374例HCC患者的SNRPEP2表達水平與臨床病理特征的關系進行分析,結果顯示SNRPEP2高表達與腫瘤的組織學分級(OR=2.539,P<0.01)、血清 AFP水平(OR=2.966,P<0.01)、血管浸潤(OR=1.658,P<0.05)和鄰近肝組織炎癥(OR=1.703,P<0.05)均有關,而與性別、年齡、T分期、N分期、M分期、病理分期、腫瘤狀態、肝纖維化Ishak評分和Child-Pugh分級均無關(均P>0.05),見表 1。

表1 SNRPEP2表達水平與HCC患者臨床病理特征的關系(例)
2.3 SNRPEP2表達水平與HCC患者預后的關系SNRPEP2高表達患者OS、DSS和PFI均低于低表達患者(均P<0.05),提示SNRPEP2高表達與HCC的不良預后有關,見圖2。

圖2 SNRPEP2高表達與低表達HCC患者生存曲線的比較
單因素Cox回歸分析結果提示,T分期(HR=2.598,P<0.01)、M 分期(HR=4.077,P<0.05)、病理分期(HR=2.504,P<0.01)、腫瘤狀態(HR=2.317,P<0.01)和SNRPEP2表達水平(HR=2.024,P<0.01)均是影響HCC患者OS的危險因素;進一步多因素Cox回歸分析顯示,腫瘤狀態(HR=1.816,P<0.05)和 SNRPEP2表達水平(HR=1.970,P<0.01)均是影響 HCC患者 OS的獨立危險因素,見表2。

表2 影響HCC患者總生存期的單因素和多因素回歸分析

續表2
此外,綜合T分期、M分期、病理分期、腫瘤狀態和SNRPEP2表達水平等影響預后的危險因素進一步構建Nomogram預測模型,用于預測HCC患者1、3和5年生存率,從Nomogram圖可以看出,病理分期、腫瘤狀態和SNRPEP2表達水平對HCC患者的生存貢獻較大,見圖3。

圖3 預測HCC患者1、3和5年總生存率的Nomogram圖
2.4 SNRPEP2表達水平對HCC的診斷效能 ROC曲線分析顯示,SNRPEP2表達水平對于診斷HCC(AUC=0.925)、T1期(AUC=0.913)、M0期(AUC=0.936)、病理分期I期(AUC=0.911)均具有良好的效能。此外,SNRPEP2表達水平對于評估1、3和5年OS(AUC分別為0.659、0.649 和 0.635)、DSS(AUC 分別為 0.672、0.643 和0.604)和 PFI(AUC 分別為 0.615、0.515 和 0.610)同樣具有較好的效能,見圖4。

圖4 SNRPEP2表達水平診斷HCC及評估預后的ROC曲線
越來越多的研究證明,假基因是基因組進化過程中形成的“分子化石”,其可以通過在DNA、RNA及蛋白等層面行使調控作用,進而在各種生理和病理過程中發揮生物學功能,特別是在腫瘤的發生、發展中扮演著重要角色[10-11]。
近年來,假基因在HCC發生、發展中的作用及其調控機制也得到了證實,研究發現一些假基因在HCC中表達異常且與患者的不良預后相關,其可通過調控HCC增殖、遷移、侵襲、血管生成等生物學過程進而發揮促癌或抑癌作用。例如,重組人膜聯蛋白A2(ANXA2)的假基因ANXA2P1在HCC中表達上調,與患者的不良預后呈正相關,其可通過miR-376a-3p/ANXA2調控軸促進HCC的增殖、遷移和侵襲[12]。假基因泛素結合酶E2C假基因3(UBE2CP3)被發現其在HCC中高表達且與不良預后呈正相關,其可通過激活ERK1/2/HIF-1α/血管內皮生長因子A(VEGFA)信號增強HCC細胞VEGFA的分泌進而促進血管生成[13]。此外,研究發現磷酸酶與張力蛋白同源物(PTEN)的假基因PTENP1在HCC中發揮抑癌作用,其在HCC中呈現低表達,其過表達可通過失活PI3K/Akt信號通路進而抑制HCC的增殖、遷移和侵襲,誘導細胞發生凋亡和自噬[14]。
位于人類9號染色體p24.1區域的SNRPEP2,為SNRPE基因的加工型假基因。研究發現SNRPEP2在結腸癌和乳腺癌中表達上調且與不良預后相關[8-9],但在HCC中的表達情況及臨床相關性目前仍不清楚。本研究利用TCGA數據庫HCC臨床樣本組織的RNA-seq數據及其臨床信息進行生物信息學分析,重點圍繞SNRPEP2在HCC中的表達情況及臨床意義進行探討。
首先,基于TCGA數據庫HCC組織的RNA-seq數據進行表達分析,發現SNRPEP2在配對和非配對HCC組織中的表達水平均高于癌旁正常組織,提示SNRPEP2具有作為HCC診斷分子標志物的潛力。其次,通過對HCC患者的臨床信息數據進行挖掘分析,探討了SNRPEP2表達水平與臨床病理特征及患者預后的關系,SNRPEP2的表達水平與腫瘤的組織學分級、血清AFP水平、血管浸潤及鄰近肝組織炎癥均有關,且SNRPEP2高表達患者OS、DSS和PFI均低于低表達患者,是影響HCC患者OS的獨立危險因素,提示SNRPEP2有望成為HCC診斷和預后判斷的新型分子標志物。此外,通過ROC曲線分析發現SNRPEP2表達水平對HCC的診斷具有良好的效能,并對患者的OS、DSS和PFI均具有良好的判斷效果,進一步表明SNRPEP2可作為HCC診斷、患者預后判斷和療效評估的新型分子標志物的潛力。
綜上所述,本研究基于TCGA數據庫,通過生物信息學手段揭示了假基因SNRPEP2在HCC中異常高表達及其具有作為HCC診斷和預后判斷生物標志物的潛在應用價值,同時為后續圍繞SNRPEP2開展HCC生物標志物相關研究提供了依據。由于本研究的SNRPEP2表達數據僅局限于HCC組織,后續可進一步對HCC患者血清/血漿游離或外泌體來源SNRPEP2的表達及其臨床相關性和臨床意義進行研究。