張晉煜
(云南省腫瘤醫院,昆明 650000)
骨肉瘤組織差異表達基因篩選及其與患者預后的關系
張晉煜
(云南省腫瘤醫院,昆明 650000)
目的采用生物信息學的方法篩選骨肉瘤組織差異表達基因,并探討其與患者預后的關系。方法收集骨肉瘤組織及其配對癌旁正常組織標本各4例份,采用轉錄組測序技術篩選兩種組織中的差異表達基因,并進行基因本體(GO)功能顯著性富集分析。在癌癥和腫瘤基因圖譜骨肉瘤數據庫中選擇258例份骨肉瘤組織標本,采用Kaplan-Meier曲線分析富集于生物學過程的差異表達基因對患者生存時間的影響。結果骨肉瘤及其癌旁正常組織存在差異表達基因875個,其中表達上調的基因346個、表達下調的基因529個。GO功能顯著性富集分析共識別出14個有意義的類型;在6個生物學過程類型中,差異表達基因主要富集于外源性代謝過程、細胞黏附、細胞外基質組成、類固醇代謝過程等;在8個細胞成分類型中,差異表達基因主要富集于細胞外體、細胞外空間、膠原三聚體、核小體等。258例份骨肉瘤組織中,還原酶1(NQO1)基因高表達233例份、低表達25例份,NQO1基因高表達、低表達患者生存時間分別為(2 763±15)、(1 568±13)d,二者比較P<0.01;醛脫氫酶3族A1(ALDH3A1)基因高表達233例份、低表達25例份,ALDH3A1基因高表達、低表達患者生存時間分別為(2 725±11)、(1 421±14)d,二者比較P<0.01;其余基因表達情況對患者的生存時間均無明顯影響(P均>0.05)。結論采用生物信息學的方法篩選出骨肉瘤組織差異表達基因875個,主要富集于生物學過程和細胞成分類型;其中NQO1、ALDH3A1基因低表達提示患者預后不良。
骨肉瘤;基因本體功能顯著性富集分析;基因篩選;轉錄組測序;生物信息學;生存時間
Abstract:To screen out the differentially expressed genes in osteosarcoma tissues by bioinformatics and to investigate its relationship with the prognosis of patients.MethodsWe performed RNA-Seq to screen out the differentially expressed genes (DEGs)in osteosarcoma and matched normal tissues of four osteosarcoma patients followed by the Gene Oncology (GO) enrichment. In addition, we selected 258 cases of osteosarcoma tissue specimens in the Cancer Genome Atlas (TCGA) HCC data to analyze the influence of DEGs on survival time of patients by using based on Kaplan-Meier curve analysis.ResultsIn total, 875 DEGs were identified in four pairs of osteosarcoma specimens, including down-regulated 529 genes and 346 up-regulated genes. According to GO enrichment, 14 significant GO terms in the biological process were identified. In the six biological process types, the DEGs were mainly enriched in exogenous metabolic processes, cell adhesion, extracellular matrix composition, and steroid metabolism process; in the 8 cell composition types, the DEGs were mainly enriched in the extracellular domain, extracellular space, collagen trimer, nucleosome and so on. Two novel genes (NQO1 and ALDH3A1) were significantly associated with poor prognosis in the TCGA osteosarcoma cohort (n=258). The average survival time in 233 cases with over-expression and 25 cases with low-expression of NQO1 was (2763±15) and (1568±13) days, respectively. The average survival time in 233 cases with over-expression and 25 cases with low-expression of ALDH3A1 was (2725±11) and (1421±14) days, respectively. The expression of other genes had no significant effect on the survival time of the patients (allP>0.05).ConclusionWe identified 875 DEGs that mainly enrich in biological process and cellular component and the low-expression of NQO1 and ALDH3A1 is significantly associated with poor prognosis for osteosarcoma.
Keywords: osteosarcoma; Gene Oncology enrichment; gene screening; transcriptome sequencing; bioinformatics; survival time
骨肉瘤好發于青少年,75%的患者發病年齡為15~25歲。目前骨肉瘤的發病機制尚不清楚,但是其遺傳易感性研究已有報道。轉錄組測序技術能夠全面快速地獲得某一物種特定組織或器官在某一狀態下的幾乎所有轉錄本序列信息,可更加清晰地明確等位基因的差別表達。最近有報道對骨肉瘤進行轉錄組測序,識別了新的基因FOXC2,并發現其參與了阿霉素耐藥[1]。本研究采用生物信息學的方法篩選骨肉瘤組織差異表達基因,并探討其與患者預后的關系。
選擇2013年1月~2015年12月云南省腫瘤醫院收治的骨肉瘤患者4例,男2例、女2例,年齡8~26(14.6±4.2)歲;均經病理活檢確診。病理類型:軟骨母細胞型2例,成纖維型2例;發生部位:上肢2例,下肢2例;轉移情況:轉移3例,無轉移1例。排除標準:①肝、腎、肺功能異常者;②精神異常者;③合并其他腫瘤者;④術前進行放化療或免疫治療者。本研究通過醫院倫理委員會審核,患者及其家屬均知情同意。
2.1 骨肉瘤組織差異表達基因篩選 采用轉錄組測序技術。患者均行手術治療,術中收集其切除的骨肉瘤組織及配對癌旁正常組織(距離腫瘤組織>2 cm),保存于液氮中。取部分骨肉瘤組織行常規HE染色,確定腫瘤細胞比例>70%。轉錄組測序主要步驟:首先將組織從液氮中取出并進行研磨,采用TRIzol試劑提取總RNA。使用帶有Oligo(dT)的磁珠富集樣品中的mRNA,超聲波將mRNA打成短片段,并以其為模板合成雙鏈cDNA。純化處理,添加A尾,并對接頭進行連接測序。利用PCR富集得到cDNA文庫,對庫檢合格的cDNA在HiSeq2000儀器上進行測序。對測序獲得的原始數據進行質量評估,包括測序錯誤率檢查、A/T/C/G含量分布檢查、測序數據過濾(去掉帶接頭的以及低質量的原始序列)。使用Tophat軟件將不同組織轉錄組測序與人類參考序列(Human Genome v19)進行比對[2],記錄骨肉瘤組織標本1~4號(S1T~S4T)和癌旁正常組織標本1~4號(S1N~S4N)的總讀段數及比對率。結果顯示,骨肉瘤組織及其癌旁正常組織每例份樣本產生約9 G的數據量,骨肉瘤組織S1T~S4T的比對率分別為91.45%、91.76%、92.56%、92.34%,癌旁正常組織S1N~S4N的比對率分別為91.36%、92.45%、90.29%、88.25%。將骨肉瘤組織及其癌旁正常組織各基因表達量進行比較,篩選出差異表達基因。經過再校正獲取數據,參照Trapnell等[3]的方法進行生物學變異排除,最后利用CuffDiff軟件進行差異分析,篩選出差異表達基因。結果顯示,骨肉瘤組織及其癌旁正常組織的差異表達基因共有875個,其中表達上調的基因346個、表達下調的基因529個。
2.2 差異表達基因的基因本體(GO)功能顯著性富集分析 選擇2.1中篩選出來的875個骨肉瘤組織及其癌旁正常組織差異表達基因,將其上傳至DAVID(https://david.ncifcrf.gov/)[4]在線工具,進行GO功能顯著性富集分析,識別出有意義的GO功能分類(FDR<0.05為差異有統計學意義)。結果顯示,共識別出14個有意義的GO類型,包括6個生物學過程類型和8個細胞成分類型。見表1。

表1 骨肉瘤組織中差異表達基因的GO功能顯著性富集分析結果
2.3 骨肉瘤組織差異表達基因與患者預后的關系 選取富集于生物學過程類型(FDR最小的3個)的差異表達基因,即富集于外源性代謝過程、細胞黏附以及細胞外基質組成的基因,在癌癥和腫瘤基因圖譜(TCGA,https://tcga-data.nci.nih.gov/)中的骨肉瘤數據庫進行Kaplan-Meier生存曲線分析。結果顯示,258例份骨肉瘤組織中,還原酶1(NQO1)基因高表達233例份、低表達25例份,NQO1基因高表達、低表達患者生存時間分別為(2 763±15)、(1 568±13)d,二者比較P<0.01;醛脫氫酶3族A1(ALDH3A1)基因高表達233例份、低表達25例份,ALDH3A1基因高表達、低表達患者生存時間分別為(2 725±11)、(1 421±14)d,二者比較P<0.01;其余基因表達情況對患者的生存時間均無明顯影響(P均>0.05)。
骨肉瘤的發生是由多種基因相互作用的復雜的生物學過程,其發病機制尚不清楚。為了提高骨肉瘤患者的生存率,目前臨床上亟需找到一種新的生物學標志物,用于預測患者預后或作為新的藥物靶點。隨著基因測序技術的快速發展,該技術在疾病的預測和診斷方面均可發揮重要作用,比如在分子層面上利用全基因組關聯研究能夠將識別的基因與信號通路相結合,以闡釋骨肉瘤的發病機理[5,6]。臨床上運用全外顯子組以及全基因組測序技術發現了一系列與骨肉瘤發生有關的重要基因,如TP53、PTEN及PRB2等[7,8]。此外,CDKN1A/B基因片段的缺失以及MDM2擴增均與骨肉瘤的發生有關[7]。近年來,轉錄組測序技術在腫瘤的研究中已得到廣泛應用。轉錄組測序技術與之前的芯片技術比較具有明顯的優勢,其結果更精確、可重復性更好、應用領域更廣泛[9]。由于個體化差異,不同患者的基因表達可能存在一些差異,轉錄組測序技術能夠更加直接地對同一基因的表達情況進行比較。本研究結果顯示,骨肉瘤組織及其癌旁正常組織的差異表達基因共有875個,其中表達上調的基因346個、表達下調的基因529個。
GO功能顯著性富集分析是一種利用高通量測序數據對基因施行功能注釋的方法,檢測結果分為細胞成分、生物學過程及分子功能[10]。本研究共識別出14個有意義的GO類型;在6個生物學過程類型中,差異表達基因主要富集于外源性代謝過程、細胞黏附、細胞外基質組成、類固醇代謝過程等;在8個細胞成分類型中,差異表達基因主要富集于細胞外體、細胞外空間、膠原三聚體、核小體等。生物學過程闡釋了生物體活動的重要過程,人體內生物學過程包含了許多代謝、生化反應等重要途徑。此次研究選擇了富集于生物學過程類型(FDR最小的3個)的差異表達基因,即富集于外源性代謝過程、細胞黏附以及細胞外基質組成的基因進行生存分析。結果顯示,骨肉瘤組織NQO1、ALDH3A1基因高表達者生存時間均長于低表達者,說明NQO1、ALDH3A1基因低表達提示患者預后不良。NQO1是NAD脫氫酶家族的一員,編碼一種細胞質電子還原酶,這種蛋白酶能夠抑制醌類化合物的電子還原產生自由基。NQO1基因是引起各種腫瘤發生的易感基因,該基因突變與遲發型運動障礙有關,一些長期暴露于苯酚環境中致血液毒性增加的患者也能檢測到該基因突變。ALDH3A1基因參與體內生物胺、神經傳遞素和脂質過氧化作用的代謝過程,具有抗紫外線以及在角膜中抗氧化損傷的作用。既往關于NQO1、ALDH3A1基因對骨肉瘤患者預后的影響鮮見報道,本研究首次發現NQO1、ALDH3A1基因可能參與骨肉瘤的發生、發展,并影響患者預后,其可能成為骨肉瘤診斷及治療的新靶點。
綜上所述,本研究采用生物信息學的方法篩選出骨肉瘤組織差異表達基因875個,主要富集于生物學過程和細胞成分類型;其中NQO1、ALDH3A1基因低表達提示患者預后不良。
[1] Zhang CL, Zhu KP, Ma XL. Antisense lncRNA FOXC2-AS1 promotes doxorubicin resistance in osteosarcoma by increasing the expression of FOXC2[J]. Cancer Lett, 2016(396):66-75.
[2] Trapnell C, Pachter L, Salzberg SL. TopHat: discovering splice junctions with RNA-Seq[J]. Bioinformatics, 2009,25(9):1105-1111.
[3] Trapnell C, Williams BA, Pertea G, et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation[J]. Nat Biotechnol, 2010,28(5):516-520.
[4] Dennis G Jr, Sherman BT, Hosack DA, et al. DAVID: database for annotation, visualization, and integrated discovery[J]. Genome Biol, 2003,4(5):3.
[5] Kuijjer ML, Hogendoorn PC, Cleton-Jansen AM. Genome-wide analyses on high-grade osteosarcoma: making sense of a genomically most unstable tumor[J]. Int J Cancer, 2013,133(11):2512-2521.
[6] Savage SA, Mirabello L, Wang Z, et al. Genome-wide association study identifies two susceptibility loci for osteosarcoma[J]. Nat Genet, 2013,45(7):799-803.
[7] Ottaviano L, Schaefer KL, Gajewski M, et al. Molecular characterization of commonly used cell lines for bone tumor research: a trans-European eurobonet effort[J]. Genes Chromosomes Cancer, 2010,49(1):40-51.
[8] Naml?s HM, Meza-Zepeda LA, Bar?y T, et al. Modulation of the osteosarcoma expression phenotype by microRNAs[J]. PLoS One, 2012,7(10):48086.
[9] Raz T, Kapranov P, Lipson D, et al. Protocol dependence of sequencing-based gene expression measurements[J]. PLoS One, 2011,6(5):e19287.
[10] Ashburner M, Ball CA, Blake JA, et al. Gene ontology: tool for the unification of biology. The gene ontology consortium[J]. Nat Genet, 2000,25(1):25-29.
Screening out differentially expressed genes in osteosarcoma and its relationship with the prognosis
ZHANGJinyu
(YunanCancerHospital,Kunming650000,China)
張晉煜(1972-),男,副主任醫師,研究方向為四肢與脊柱腫瘤切除重建術。E-mail: 903170564@qq.com
10.3969/j.issn.1002-266X.2017.32.003
R738.1
A
1002-266X(2017)32-0010-03
2016-12-07)