唐懷慧 王忠帥 邵茜茜



摘要:目的? 基于TCGA數據庫挖掘肺腺癌差異表達的RNAs,通過ceRNA網絡的綜合分析并預測其與患者預后的相關性。方法? 利用TCGA數據庫下載肺腺癌的表達數據,使用R軟件“edgeR”包初步篩選差異表達的RNAs,進一步構建肺腺癌的lncRNA-miRNA -mRNA的ceRNA網絡,對ceRNA網絡中的mRNAs進行了K-M生存分析。結果? 篩選的差異表達的RNAs中有3個mRNA(ANLN、IGFBP1、TFAP2A)、4個lncRNA (AC015923.1、FGF12-AS2、LINC00211、MED4-AS1)、2個miRNA(hsa-mir-31、hsa-mir-490),均與預后相關。其中hsa-mir-31預后價值最高(P<0.001),LINC00461和has-mir-139為關鍵節點的ceRNA調控網絡。結論? 本次篩選出的3個mRNA、4個lncRNA和2個miRNA可作為肺腺癌的新候選預后因子,且LINC00461和has-mir-139是肺腺癌ceRNA 中兩個重要的調控網絡節點。
關鍵詞:TCGA;肺腺癌;ceRNA網絡;預后
Abstract:Objective? To explore the differentially expressed RNAs of lung adenocarcinoma based on TCGA database, comprehensively analyze and predict the correlation with the prognosis of patients through ceRNA network.Methods? The TCGA database was used to download the expression data of lung adenocarcinoma, Use the R software "edgeR" package to preliminarily screen differentially expressed RNAs to further construct the ceRNA network of lncRNA-miRNA-mRNA of lung adenocarcinoma, K-M survival analysis was performed on the mRNAs in the ceRNA network. Results? The screened differentially expressed RNAs included 3 mRNA(ANLN, IGFBP1, TFAP2A), 4 lncRNA(AC015923.1, FGF12-AS2, LINC00211, MED4-AS1), and 2 miRNA(hsa-mir-31, hsa- mir-490), both related to prognosis. Among them, hsa-mir-31 has the highest prognostic value (P<0.001), and LINC00461 and has-mir-139 are key node ceRNA regulatory networks.Conclusion? The 3 mRNA, 4 lncRNA and 2 miRNA selected this time can be used as new prognostic factors for lung adenocarcinoma, and LINC00461 and has-mir-139 are two important regulatory network nodes in ceRNA of lung adenocarcinoma.
肺腺癌(lung adenocarcinoma)是癌癥死亡的重要原因,目前其發病率和死亡率仍在不斷加[1]。男性肺癌患者發病率和死亡率在所有惡性腫瘤中占第1位,女性占第2位[2]。非小細胞肺癌(NSCLC)是肺癌中最常見的類型,其中以腺癌和鱗癌最常見,并且腺癌已經超過了鱗癌[3]。越來越多的研究證實,lncRNA可以作為miRNA和mRNA的競爭平臺,在乳腺癌、胃癌、肝癌、肺癌及結直腸癌等多種惡性腫瘤的細胞周期和細胞死亡調控中起著重要的調節作用,影響腫瘤的侵襲和遷移,從而在腫瘤的發生、發展過程中發揮重要作用[4]。癌癥基因組圖譜(TCGA)是一個公共資助的項目,該項目可提供公開的癌癥數據集,以幫助改進診斷方法、治療標準,并最終預防癌癥[5]。本研究利用高通量測序技術和生物信息學分析方法對肺腺癌的表達數據進行分析,為肺腺癌患者篩選新候選預后因子,以期為肺腺癌預后判斷提供新的思路。
1資料與方法
1.1資料來源? 利用TCGA數據庫(https://portal.gdc.cancer.gov/)獲取594例肺腺癌患者的mRNAs、lncRNAs和miRNAs表達數據(包括癌組織535例,癌旁正常組織59例),并收集患者的臨床信息。基因表達量用于差異基因分析和構建ceRNA網絡,患者的臨床信息用于生存分析。
1.2方法
1.2.1篩選差異基因? 基于TCGA數據庫,利用R軟件“TCGA biolinks”包獲取肺腺癌的表達數據,perl語言提取Ensembl數據庫鑒定了的lncRNAs和mRNAs。利用R軟件“edgeR”包,除去所有表達量低的RNA(平均讀數≤2)。設置差異倍數(fold change,FC)≥2,差異的顯著性(fdr:調整P值)<0.01。將肺腺癌組織的表達數據與正常組織的表達數據進行差異分析,并利用R軟件“gplots”包繪制火山圖。
1.2.2 構建lncRNA-miRNA-mRNA的ceRNA網絡? 提取篩選出的差異表達RNAs,利用miRcode(http://www.mircode.org/)數據庫預測差異lncRNAs和差異miRNAs之間的相互作用。miRDB(http://mirdb.org/),mirTarBase(http://www.mirbase.org/),miRanda(http://www.microrna.org/ microrna/home.do)和Target Scan(http://www.targetscan.org)數據庫用于檢索差異miRNAs的靶基因mRNAs。利用R軟件“VennDiagram”包繪制Venny圖,并利用Cytoscape v3.7.1構建肺腺癌 lncRNA-miRNA-mRNA的ceRNA網絡。
1.2.3 生存分析? 基于TCGA數據庫下載的肺腺癌患者的臨床信息,提取有效的生存狀態及生存時間,通過構建Lasso回歸模型和Cox風險回歸分析,利用R軟件“survival”包進行K-M生存分析,設置P<0.05。篩選出的差異RNAs認為與預后具有相關性。
2結果
2.1差異表達的RNAs? 共篩選出了2551個差異表達的mRNA,其中高表達的2033個,低表達518個;1359個差異表達的lncRNA,高表達的1185個,低表達的174個;99個差異表達的miRNA,高表達的78個,低表達21個。利用R軟件“gplots”包繪制火山圖,見圖1 。
2.2肺腺癌 lncRNA-miRNA-mRNA ceRNA網絡? ?通過miRcode數據庫查找與差異表達的miRNA相關的差異lncRNA有100個,而與100個差異lncRNA對應的差異miRNA有43個,篩選出四個數據庫共有的基因有4045個,見圖2A。并與提取出的差異表達mRNA取交集,最終獲得與肺腺癌有關的差異mRNA有294個,見圖2B。對篩選出的100個lncRNA、43個miRNA和294個mRNA基因,利用Cytoscape v3.7.1繪制lncRNA-miRNA-mRNA的ceRNA網絡,見3A、圖3B,并提取了以LINC00461和has-mir-139為關鍵節點的核心子網絡,見圖3C、圖3D。
2.3生存分析? ①單因素Cox風險回歸分析共篩選出對肺腺癌預后可能具有影響作用的有144個mRNA,29個lncRNA,5個miRNA。②采用LASSO回歸鑒定預后相關的RNAs,Lasso回歸模型擬合共篩選出7個mRNA,18個lncRNA和5個miRNA。③多因素Cox風險回歸分析共發現3個mRNA:ANLN、IGFBP1、TFAP2A;7個lncRNA:AC015923.1、AC017048.3、FGF12-AS2、HOXA11-AS、LINC00211、LINC00319、MED4-AS1;3個miRNA:hsa-mir-142、hsa-mir-31、hsa-mir-490,可能與預后相關,其中hsa-mir-31具有強的預后價值,見圖4。④Kaplan-Meier生存分析共發現3個mRNAs(ANLN,IGFBP1,TFAP2A),4個lncRNAs(AC015923.1,FGF12-AS2,LINC00211,MED4-AS1)和2個miRNAs(hsa-mir-31,hsa-mir-490)具有預后性,見圖5。
3討論
隨著醫療技術的不斷發展與創新,近年來對肺腺癌的治療已取得了較大進展,肺癌患者的生存率有了一定的改善,但其治療的療效仍不盡如人意,肺腺癌患者的預后仍然很差,其5年總體生存率仍低于15%[6]。因此,尋找新的肺癌治療策略已成為當前研究的熱點。近年來高通量測序技術和生物信息學分析方法的不斷完善,開辟了研究肺腺癌的新思路和新方法。TCGA是一個公共數據庫,包含有關癌癥中癌基因表達的全面數據集。本研究從TCGA數據庫中獲取了肺腺癌的表達數據,用以構建lncRNA- miRNA-mRNA的ceRNA網絡,并分析參與ceRNA網絡中的RNAs的預后相關性。
目前,越來越多的研究已經證明ceRNA涉及多種的腫瘤發生發展過程,其在該過程中具有重要生物學功能。如ceRNA網絡的構建揭示了直腸腺癌中潛在的lncRNA生物標志物[7]。FOXO1 3'UTR通過調節miRNA活性在抑制乳腺癌細胞轉移中起ceRNA的作用[8]。長的非編碼RNA Unigene56159通過在肝細胞癌中充當miR-140-5p的ceRNA來促進上皮-間質轉化[9]。隨著對ceRNA網絡的不斷深入開發和挖掘,本研究前期發現已不能將miRNA,lncRNA或mRNA視為在腫瘤中的獨立影響元素。在對miRNA的表達進行調控之后,由miRNA調節的靶基因mRNA的表達也隨之改變,最終導致了多種疾病(包括腫瘤在內)的發生。由于癌癥的發生和發展機制過于錯綜復雜,單基因或單一途徑的作用已非常有限。因此,系統構建和分析ceRNA網絡可以提供更有針對性的研究領域和揭示癌癥潛在機制的新視角。
本研究共篩選出2551個差異表達的mRNA,1359個差異表達的lncRNA和99個差異表達的miRNA,通過生物信息學數據庫篩選出與差異表達的miRNA相關的差異lncRNA有100個,而與100個差異lncRNA對應的差異miRNA有43個,檢索和提取出與43個差異miRNA相關的差異mRNAs有294個,構建了肺腺癌的ceRNA網絡,發現了以LINC00461和has-mir-139為關鍵節點的ceRNA調控子網絡。通過對ceRNA網絡中涉及的差異RNAs進行單因素Cox風險回歸分析、構建LASSO回歸模型以及多因素Cox風險回歸分析,共發現3個mRNA,7個lncRNA和3個miRNA可能具有預后相關性,最終通過K-M生存分析繪制生存曲線發現3種mRNA ,4種lncRNA,2種miRNA具有預后相關性,且hsa-mir-31顯示出最大的預后價值。
總之,通過構建肺腺癌的lncRNA-miRNA-mRNA的ceRNA網絡,本次篩選出的3個mRNA、4個lncRNA和2個miRNA可作為肺腺癌的新候選預后因子,且LINC00461和has-mir-139是肺腺癌ceRNA 中兩個重要的調控網絡節點。
參考文獻:
[1]Liu H,Zhou G,Fu X,et al.Long noncoding RNA TUG1 is a diagnostic factor in lung adenocarcinoma and suppresses apoptosis via epigenetically silencing of BAX[J].Oncotarget,2017(8):101899-101910.
[2]Torre LA,Bray F,Siegel RL,et al.Global Cancer Statistics,2012[J].CA Cancer J Clin,2015,65(2):87-108.
[3]Yang J,Lin J,Liu T,et al.Analysis of lncRNA expression profiles in non-small cell lung cancers (NSCLC) and their clinical subtypes[J].Lung Cancer,2014,85(2):110-115.
[4]Chen X,Chen Z,Yu S,et al.Long noncoding RNA LINC01234 functions as a competing endogenous RNA to regulate CBFB expression by sponging miR-204-5p in gastric cancer[J].Clin Cancer Res,2018,24(8):2002-2014.
[5]Tomczak K,Czerwińska P,Wiznerowicz M.Review The Cancer Genome Atlas (TCGA): an immeasurable source of knowledge[J].Contemp Oncol(Pozn),2015,19(1A):A68-A77.
[6]Wakeam E,Acuna SA,Leighl NB,et al.Surgery Versus Chemotherapy and Radiotherapy For Early and Locally Advanced Small Cell Lung Cancer:A Propensity-Matched Analysis of Survival[J].Lung Cancer,2017(109):78-88.
[7]Zhang Z,Wang S,Ji D,et al.Construction of a ceRNA network reveals potential lncRNA biomarkers in rectal adenocarcinoma[J].Oncology Reports,2018,39(5):2101-2113.
[8]Yang J,Li T,Gao C,et al.FOXO1 3′UTR functions as a ceRNA in repressing the metastases of breast cancer cells via regulating miRNA activity[J].FEBS Letters,2014,588(17):3218-3224.
[9]Lv J,Fan HX,Zhao XP,et al.Long non-coding RNA Unigene56159 promotes epithelial–mesenchymal transition by acting as a ceRNA of miR-140-5p in hepatocellular carcinoma cells[J].Cancer Letters,2016,382(2):166-175.
收稿日期:2019-12-05;修回日期:2019-12-16
編輯/成森