姚佳



【摘? 要】目的:通過對肝細胞肝癌的轉錄組學研究,從而對肝細胞肝癌的基因組的異質性和生物學機制有一個更加全面的理解。方法:對10例肝細胞肝癌患者,對癌及癌旁組織進行轉錄組測序。結果:每個樣本大量的表達差異的長鏈非編碼RNA(范圍為54到69)和差異表達的基因(范圍為2971到6910)。共2873個具有明顯表達差異的基因,其中上調1666個,下調1207個(差異基因標準:FDR<0.001, Foldchang≥2, 存在于5對樣本以上)。對差異基因的功能分析結果顯示:差異基因主要集中在細胞周期、細胞粘附、脂代謝和炎癥等功能類和PPRA、P450的代謝、P53和DNA的復制等信號通路。此外,每個樣本發現了大量的腫瘤特異性突變,其中22.2%位于基因的編碼區,大部分(42.6%)為T:A >C:G這一類型的突變。結論:對差異基因的分析顯示主要集中于細胞周期、PPRA和P53等信號通路,表明這些信號通路在肝癌的發生發展中起到關鍵作用。對于腫瘤特異性突變的分析,高頻的T:A >C:G這一突變類型的發生,我們推測基因突變主要發生在RNA編輯這一過程中,這表明RNA編輯對肝癌的發生發展有相當大的影響。大量的新的基因事件的發生,說明肝癌的發生發展機制比以往的理解更為復雜。
【關鍵詞】肝癌;轉錄組測序;RNA編輯
【中圖分類號】R158????? 【文獻標識碼】A????? 【文章編號】1004-7484(2020)09-0288-02
肝細胞肝癌占了原發性肝臟腫瘤的80—90%,居全世界腫瘤發病率的第五位,腫瘤相關性死亡的第三位[1]。肝細胞肝癌是一種具有高度侵襲性的腫瘤,盡管采用了以手術切除為主的一系列綜合治療手段,但是肝癌患者的長期生存率仍然較低[2-3]。肝細胞肝癌是一種異質性疾病,由于基因、表觀遺傳和轉錄組水平的改變,使得肝細胞肝癌的形態學和臨床表現多樣性[4] 這些遺傳多樣性嚴重影響了肝癌的診斷、治療及預后。
對于肝細胞肝癌分子水平的轉錄組研究成為了近年研究的熱點,并且對于進一步篩選肝癌診斷及復發轉移相關的分子、揭示腫瘤的發生發展機制和尋找新的靶向治療位點顯示出了不可估量的潛力。本研究圍運用二代測序技術,對肝細胞肝癌進行深入測序,以尋找新的肝癌診斷及復發轉移的相關分子和通路,對肝細胞肝癌的分子生物學機制有一個更加全面和深入的理解為目標。
1方法及材料:
1.1 收集本院 2015 年 1 月至 2018 年 12月接受肝癌肝切手術的男性病人,均經病理組織學證實為原發性HCC,且均為HBV相關性肝癌,無合并HCV等其他肝炎病毒感染。臨床病理學資料完整,包括年齡、性別、術前AFP水平、有無血管侵犯及遠處轉移、病理分化分級、腫瘤大小、數目等。術前均未行抗腫瘤治療,手術切除的組織立即冷凍于-80 ℃以用于提取RNA。
1.2 主要試劑:美國Invitrogen 公司Trizol總RNA提取試劑;上海生工生物工程有限公司 DEPC、瓊脂糖;美國Illumina公司DNase I,oligo(dT),fragmentation buffer,random hexamers,緩沖液、dNTPs、RNase H和DNA polymerase I,polyA, QiaQuick PCR試劑盒;其他化學試劑:氯仿、異丙醇、無水乙醇、甲醇、等均為國產分析試劑。
1.3實驗方法:
1.3.1轉錄組測序:RNA-Seq 由深圳華大基因公司所做,簡要步驟如下: 分別提取樣本的總RNA,使用 DNase 消化 DNA 后富集mRNA,用打斷試劑將mRNA打斷成短片段并以此為模板合成 cDNA, 使用試劑盒純化雙鏈 cDNA 再進行末端修復、加 A 尾, 連接接頭后選擇合適的片段大小進行PCR擴增,構建好的文庫用 Agilent 2100 Bioanalyzer 質檢合格后,使用 Illumina HiSeqTM 2500 測序儀進行測序,上樣量為 50 ng。
1.3.2測序數據質量評估及處理
測序得到的原始數據為raw data,接下來數據處理的步驟:(1)去除含adaptor的reads;(2)去除N的比例大于5%的reads;(3)去除低質量reads(質量值Q≤15的堿基數占整個read的50%以上)。得到Clean data后,我們使用MAQ 軟件將clean reads 與參考序列進行比對,每個read的堿基錯配不能大于5個。
1.3.3差異表達基因(DEGS)的篩選
對基因進行表達分析,基因表達量使用 FPKM( Fragments Per kb per Million reads) 方法計算,以校正的 P 值( false discovery rate, FDR) ≤0. 05、差
異倍數的對數絕對值( ︱log2FoldChange︱,︱FC︱) ≥2為閾值,篩選癌和癌旁的DEGS。1.3.4 差異表達基因的 GO 分析和 KEGG 富集篩選出 DEGs 后,我們對 DEGs 進行 GO 和 KEGG 富集分析。
2結果:
2.1 表達差異:(圖1)
我們選擇10例肝癌樣本及相應的癌旁組織進行轉錄組測序(RNA-seq),10對樣本平均生成26 355 902 (range: 25 580 346-27 540 350) reads和2.37(range: 2.30-2.48)Gb的測序數據。采用MAQ軟件,平均92.76% (range: 89.37-97.02%)的reads能夠比對到人類基因組(UCSC version hg19)。通過比對腫瘤及其配對癌旁組織的轉錄本,我們篩選到每對肝癌樣本中具有表達差異的基因(2971 to 6910)。
2.2差異基因及GO和pathway分析
通過將10對樣本的read比對到基因組后,計算他們的表達量,用RPKM來衡量他們的表達量。通過將癌和癌旁組織的RPKM值進行比較,計算他們的表達差異。將10對樣本的差異基因進一步按以下條件篩選:FDR ≤ 0.001,foldchang≥ 2,上調或者下調在5對樣本以上。共獲得2873個基因,隨后進行GO和pathway的分析,結果表明,差異基因主要集中于細胞周期的調控、細胞粘附、類固醇及脂類代謝、依賴于DNA的修復及炎癥免疫反應等功能類和P53、細胞周期,PPRA,DNA修復等信號通路,具體結果見圖2及表1。隨后對于10對樣本中一致上調或下調的106個基因進行聚類,見圖3
2.3 SNP及腫瘤特異性突變:
每個肝癌樣本平均找到12909(范圍為6877-27970)個腫瘤特異性點突變,這些突變位點22.2%位于基因編碼區域(CDS區),其中946個為非同義突變。其中42.6%為T:A >C:G(圖4)。
討論:
從分子生物學的角度講,肝癌和其他腫瘤一樣,是一種復雜的疾病[4-5]。過去的幾十年的研究已經證明,基因的改變在肝癌的發生發展因此起著重要的作用[6-8]。對于肝癌的基因學特征的更加詳細的了解,能夠促進肝癌在診斷,治療及預后等方面發展。本研究中,我們對10例肝癌及其癌旁組織進行了轉錄組測序,通過這些數據及聯合分析,我們首先分析了腫瘤及癌旁組織基因的表達差異,其中有很多基因已經被證實與肝癌的發生有關,例如血管內皮生長因子(VEGF),磷脂酰肌醇蛋白聚糖3(GPC3)[9-11]。同樣,也發現了很多新的未被注釋的基因被找到,這說明基于轉錄組測序來尋找表達差異的基因是一種更加高效的研究方式。在這些信號通路中,大部分已經被報道證實與肝癌的發展具有密切的關系,例如細胞周期的信號通路、P53、PPAR等[12]。同時,差異基因在一些基本的代謝途徑中被富集,例如,類固醇的代謝、脂肪酸的代謝。特別有趣的是,細胞色素P450這一信號通路,許多該家族的基因在肝癌組織中明顯的下調,這與先前關于肝癌組織中細胞色素P450分子的活性降低及低表達相一致[13]??偠灾?,轉錄組測序揭示肝癌的發生涉及到多條關鍵的細胞通路,包括細胞生長相關的通路,代謝相關的過程及免疫相關的調劑通路。
人類的基因是由多個外顯子中穿插著內含子來構成。初級轉錄本RNA通過RNA的剪切的過程,內含子被去除,成為一個成熟的mRNA.通過選擇性剪切的機制,一個初級轉錄本能夠生成多個mRNA[14]。RNA的選擇性剪切起著重要的生物功能,例如膜結合蛋白IgM和分泌蛋白IgD 是由同一個初級轉錄本經過選擇性剪接所產生[15]。已有許多基于基因組的基礎上,對于RNA選擇性剪切的研究,這些研究表明人類35-39%的基因至少有一個選擇性剪切異構體[16-19]。一些研究顯示,RNA選擇性剪切頻繁的發生于腫瘤相關的基因,例如EGFR,CD44,NER[20-22]。本研究基于基因組學的基礎上,尋找與肝癌相關的選擇性剪切事件,作為肝癌診斷的一個潛在的腫瘤標志物。突變位點22.2%位于基因編碼區域(CDS區)其中42.6%為T:A >C:G,對于這一現象,合理的解釋為這種類型的點突變發生在RNA編輯過程中。RNA編輯過程中將腺嘌呤(A)改變為次黃嘌呤核苷酸(I),而后次黃嘌呤核苷酸被翻譯為鳥嘌呤核苷酸(G)[23]。
針對轉錄組數據的分析,發現了大量的新的基因事件的發生,包括選擇性剪接、腫瘤特異性突變等,說明肝癌的發生發展機制比以往的理解更為復雜。這一較為全面的肝癌轉錄組水平的研究,為我們進一步研究肝癌發病的分子機制提供了重要的線索和參考價值。
參考文獻
[1]Lau WY, Lai EC. Hepatocellular carcinoma: current management and recent advances. Hepatobiliary Pancreat Dis Int 2008; 7: 237-257.
[2]Zheng SS, Xu X, Wu J et al. Liver transplantation for hepatocellular carcinoma: Hangzhou experiences. Transplantation 2008; 85: 1726-1732.
[3]Lo CM, Fan ST. Liver transplantation for hepatocellular carcinoma. Br J Surg 2004; 91: 131-133.
[4]Feo F, Frau M, Tomasi ML et al. Genetic and epigenetic control of molecular alterations in hepatocellular carcinoma. Exp Biol Med (Maywood) 2009; 234: 726-736.
[5]Zucman-Rossi J, Laurent-Puig P. Genetic diversity of hepatocellular carcinomas and its potential impact on targeted therapies. Pharmacogenomics 2007; 8: 997-1003.
[6]Acevedo LG, Bieda M, Green R, Farnham PJ. Analysis of the mechanisms mediating tumor-specific changes in gene expression in human liver tumors. Cancer Res 2008; 68: 2641-2651.
[7]Woo HG, Park ES, Lee JS et al. Identification of potential driver genes in human liver carcinoma by genomewide screening. Cancer Res 2009; 69: 4059-4066.
[8]Hoshida Y, Nijman SM, Kobayashi M et al. Integrative transcriptome analysis reveals common molecular subclasses of human hepatocellular carcinoma. Cancer Res 2009; 69: 7385-7392.
[9]Chiang DY, Villanueva A, Hoshida Y et al. Focal gains of VEGFA and molecular classification of hepatocellular carcinoma. Cancer Res 2008; 68: 6779-6788.
[10]Midorikawa Y, Ishikawa S, Iwanari H et al. Glypican-3, overexpressed in hepatocellular carcinoma, modulates FGF2 and BMP-7 signaling. Int J Cancer 2003; 103: 455-465.
[11]Nakatsura T, Yoshitake Y, Senju S et al. Glypican-3, overexpressed specifically in human hepatocellular carcinoma, is a novel tumor marker. Biochem Biophys Res Commun 2003; 306: 16-25.
[12]Iakova P, Timchenko L, Timchenko NA. Intracellular signaling and hepatocellular carcinoma. Semin Cancer Biol 2011; 21: 28-34.
[13]Morgan ET. Down-regulation of multiple cytochrome P450 gene products by inflammatory mediators in vivo. Independence from the hypothalamo-pituitary axis. Biochem Pharmacol 1993; 45: 415-419.
[14]Hastings ML, Krainer AR. Pre-mRNA splicing in the new millennium. Curr Opin Cell Biol 2001; 13: 302-309.
[15]Early P, Rogers J, Davis M et al. Two mRNAs can be produced from a single immunoglobulin mu gene by alternative RNA processing pathways. Cell 1980; 20: 313-319.
[16]Huang YH, Chen YT, Lai JJ et al. PALS db: Putative Alternative Splicing database. Nucleic Acids Res 2002; 30: 186-190.
[17]Modrek B, Resch A, Grasso C, Lee C. Genome-wide detection of alternative splicing in expressed sequences of human genes. Nucleic Acids Res 2001; 29: 2850-2859.
[18]Brett D, Hanke J, Lehmann G et al. EST comparison indicates 38% of human mRNAs contain possible alternative splice forms. FEBS Lett 2000; 474: 83-86.
[19]Mironov AA, Fickett JW, Gelfand MS. Frequent alternative splicing of human genes. Genome Res 1999; 9: 1288-1293.
[20]Wikstrand CJ, Hale LP, Batra SK et al. Monoclonal antibodies against EGFRvIII are tumor specific and react with breast and lung carcinomas and malignant gliomas. Cancer Res 1995; 55: 3140-3148.
[21]Naor D, Nedvetzki S, Golan I et al. CD44 in cancer. Crit Rev Clin Lab Sci 2002; 39: 527-579.
[22]Saito H, Nakatsuru S, Inazawa J et al. Frequent association of alternative splicing of NER, a nuclear hormone receptor gene in cancer tissues. Oncogene 1997; 14: 617-621.
[23]Bass BL. RNA editing by adenosine deaminases that act on RNA. Annu Rev Biochem 2002; 71: 817-846.
基金資助:
2017浙江省教育廳課題(Y201738263)