李乾鵬,嵇江淮,安奕,李黎,趙磊△,李冬果△
(1.首都醫科大學,北京 100069;2.首都醫科大學宣武醫院麻醉手術科,北京 100053;3.國家老年疾病臨床研究中心,北京100053;4.鄭州大學附屬洛陽中心醫院,洛陽 471009)
多形性膠質母細胞瘤(glioblastoma multiforme, GBM)是神經膠質瘤中最為惡性的一種,在所有成年腦癌患者占比達60%,盡管現今醫療技術發展迅速,對GBM仍然缺乏有效的治療手段,患者的中位生存時間只有14至15個月[1-2]。隨著研究的發展,除了編碼基因,大量通過基因組而不是編碼蛋白轉錄的非編碼RNAs(non-coding RNAs,ncRNAs)被鑒別出來[3]。MicroRNAs (miRNAs)和lncRNAs是ncRNAs研究的重要方向。大量的研究表明,miRNAs在轉錄后調控基因的表達,并參與多種生物過程和疾病[4]。最近,lncRNAs(這些長度大于200 個核苷酸且具有很少或沒有蛋白質編碼潛力的轉錄物[5])已經成為生物醫學研究的熱點。LncRNAs在腫瘤發生和發展中起重要作用[6]。Wang等[7]研究表明,lncRNA LEF1-AS1在GBM中顯著高表達,并且敲出LEF1-AS1抑制GBM細胞的增殖和侵襲。Shi等發現lncRNA H19被證明可以促進膠質瘤中癌癥的發展和侵襲[8]。盡管這些非編碼RNAs在GBM的進程中發揮著重要的作用,但這些非編碼RNAs特別是lncRNAs的功能尚不清楚,特別是lncRNAs生物標志物的鑒別仍具有很大的挑戰性。
與此同時,隨著對lncRNAs以及miRNAs等非編碼RNA研究的進行,人們發現lncRNAs可以通過與miRNAs結合從而發揮RNA海綿的功能[6, 9]。最近的研究也表明,lncRNAs作為一種競爭性內源RNA,通過充當miRNAs海綿來調控其他轉錄物的表達水平[10-11]。Yu等[12]發現GAS5作為miR-222的ceRNA可以增加p27的表達水平,從而抑制肝臟纖維化進展。另外有研究表明lncRNA lncHERG促進GBM細胞的增值,并且lncHERG可以充當腫瘤抑制因子miR-940的競爭性內源RNA[13]。然而之前的報道主要關注在GBM中lncRNAs的鑒別,同時ceRNAs相關的幾個數據庫已經被開發出來用于lncRNAs功能的研究[11, 14]。這些研究結果表明表達譜和網絡分析的整合可以用來識別風險的lncRNAs和潛在的治療靶點。目前在GBM中,lncRNAs作為ceRNA網絡的研究仍處于初步階段,有效地識別GBM中風險的致病因子對研究GBM的致病機制具有重要的意義。
在本研究中,我們整合多組數據,采用一種計算策略構建GBM中lncRNAs介導的ceRNA網絡。我們研究網絡中lncRNAs和mRNAs的拓撲屬性,選取度和中介中心性前5%的節點作為hub節點,從而進一步構建GBM中lncRNAs介導的hub-ceRNA網絡。最后,我們對網絡中的基因進行功能分析。我們的研究將會幫助理解癌癥相關的lncRNAs介導的ceRNA網絡,同時也為識別GBM風險標記物提出新的見解。
GBM的表達譜數據(共計159個腫瘤樣本)收集于TCGA數據庫。我們從miRTarBase (Release 7.0)數據庫[15]下載實驗驗證的mRNA-miRNA關系對。實驗驗證的lncRNA-miRNA關系對RAID V2.0 數據庫[16]中獲取。對GBM的表達譜數據進行預處理后,我們利用gencode中全基因組的注釋文件(V19)[17]重新注釋出lncRNA的表達譜數據和mRNA的表達譜數據。
我們將從上述兩個miRNA靶點數據庫中下載的lncRNA-miRNA和mRNA-miRNA相互作用關系對進行初步的匹配,保留在mRNA和lncRNA之間共享同一個miRNA的ceRNA關系對。為了能夠評估每個lncRNA和mRNA之間共享的miRNAs的顯著性,我們用超幾何分布來鑒別競爭性lncRNA-mRNA關系對。見式(1),整個基因組中miRNA總數為N,其中K和M是每個lncRNA和mRNA相關的miRNAs數量,x是每個lncRNA-mRNA關系對共享的miRNAs的數量。P值用來評估競爭性lncRNA-mRNA關系對的顯著性。我們用錯誤發現率(fdr)來矯正P值。如果矯正后的P值≤0.01,我們就認為該ceRNAS對是顯著的。
(1)
為了鑒別GBM中lncRNAs介導的ceRNA對,基于匹配的lncRNA和mRNA表達譜數據,我們計算每一對顯著的lncRNA-mRNA關系對的皮爾森相關系數,見式(2),式中cov(X,Y)是變量X和Y的協方差,σX和σY分別是X和Y的標準差。我們把P值≤0.01作為閾值。
(2)
研究表明一些hub節點和瓶頸節點可能成為網絡中癌癥的預后因子,并且hub節點通常被定義為網絡中節點的前10%~20%[18-19]。我們對構建的GBM相關的ceRNAs進行拓撲分析,研究網絡中lncRNAs和mRNAs的拓撲屬性,我們定義網絡中度前5% 的節點為hub節點,中介中心性(betweenness centrality,BC)前5%的節點為瓶頸節點。我們取hub節點和瓶頸節點的交集作為GBM中ceRNA網絡新的hub節點。這些hub節點被用來構建GBM中lncRNAs介導的hub-ceRNA網絡。網絡用Cytoscape(v3.6.1)軟件可視化[20]。
我們用Bioconductor包“ clusterProfiler”[21]來預測lncRNAs的功能。通過Benjamini-Hochberg方法(BH)校正P值,如果矯正后的P值≤0.05,該GO項和富集通路就認為是顯著的。
為了全面的評估lncRNAs介導的ceRNAs關系對,我們采用一種策略來逐步鑒別顯著的lncRNA-mRNA競爭性關系對。從數據庫中收集實驗驗證的lncRNA-miRNA和mRNA-miRNA相互作用關系對。在對兩類關系對進行初步匹配后,我們用超幾何分布來計算每個lncRNA-mRNA對共享的miRNAs的顯著性。保留顯著的lncRNA-mRNA競爭性關系對用作進一步的鑒別。為了鑒別GBM中共表達的ceRNAs對,我們計算每個候選的ceRNA對的皮爾森相關系數。選取PCC>0的ceRNAs關系對,總共有25536對。其中mRNA有2439個,lncRNA有575個。見圖1A,我們用這些關系對構建GBM相關的ceRNA背景網絡。其中橘黃色的圓點代表lncRNA,藍色的圓點代表mRNA,一個lncRNA-mRNA對我們用紅線連接。從圖中可以看出大部分的lncRNA集中在網絡的中央,mRNA多分布在網絡的四周。接著我們對網絡中的lncRNAs和mRNAs進行拓撲分析。見圖1B,發現lncRNAs的節點度和BC遠遠大于mRNAs的節點度和BC。因此,我們認為在GBM相關的ceRNA網絡中,lncRNA的調控占據主導地位。


圖1 GBM相關的ceRNA背景網絡和拓撲分析Fig 1 GBM related ceRNA background network and topology analysis
為了構建GBM中lncRNAs介導的hub-ceRNA網絡,選取度和BC前5%的節點作為新的hub節點。其中lncRNA有23個,mRNA有96個。我們基于之前的ceRNA關系對用這些lncRNAs和mRNAs構建hub節點的ceRNAs網絡,共426對。見圖2A,其中藍色表示mRNA,橘黃色表示lncRNA,節點的大小表示節點在網絡中的度。
為了研究這些hub-ceRNA 中lncRNAs的可能功能,我們顯著富集的功能項去注釋網絡中的編碼基因。圖2展示了顯著性靠前的GO富集項和KEGG富集項。結果顯示這些hub節點的lncRNA顯著富集的GO項為上皮細胞增殖(GO:0050673),肽酰絲氨酸磷酸化(GO:0018105),細胞周期停滯(GO:0007050)和肌細胞增殖(GO:0033002)。顯著富集的通路為癌癥中的miRNA(hsa05206),內分泌抵抗(hsa01522)和乳腺癌(hsa05224)。


圖2 GBM中lncRNAs介導的hub-ceRNA網絡和功能富集分析Fig 2 Analysis of lncRNAs-mediated hub-ceRNA network and functional enrichment in GBM
近年來,ceRNA在癌癥中的研究已經引起廣泛的關注。最近的研究表明,人類lncRNAs被發現與mRNAs競爭結合miRNAs,從而通過間接轉錄后機制調控mRNAs的表達水平[22]。Yang等研究表明GBM中ceRNA相互作用網絡與典型致癌途徑有關[23]。
在本研究中,我們利用GBM的表達譜數據和實驗驗證的miRNA靶點關系對,構建GBM相關的ceRNA關系對。通常,節點的度越高表明該節點為hub節點,可以參與更多的ceRNAs相互作用。而節點的中介中心性越高表明該節點更有可能是一個瓶頸節點,可以作為連接不同網絡模塊的橋梁。因此,我們選取度和中介中心性前5%的節點作為新的hub節點,并用這些lncRNAs和mRNAs構建hub-ceRNA網絡。Yang等[24]研究表明MCM3AP-AS1在GBM中下調,并且敲除MCM3AP-AS1可以抑制GBM的血管生成。多項實驗表明敲掉AKT3基因抑制GBM細胞的侵襲[25]。在我們的hub-ceRNA網絡中,也發現MCM3AP-AS1- AKT3 ceRNA對的存在。因此,我們推斷MCM3AP-AS1- AKT3 ceRNA對可能是GBM治療的潛在靶點。同時,我們通過利用GeneCards數據庫[26]篩選hub-ceRNA網絡中的lncRNAs,還發現其中CASC2和NPHP3-AS1兩個lncRNA與星形細胞瘤有關。
為了進一步分析這些lncRNAs的功能,我們對在hub-ceRNA網絡圖中與lncRNAs共表達的基因做功能富集分析。研究結果發現在顯著富集的GO項中,有多個GO項與細胞的增殖有關,另外還發現了與膠質生成(GO:0042063)有關的GO項。并且這些GO項都是顯著性排名靠前的GO項。研究結果進一步表明,在我們的hub-ceRNA網絡中的這些lncRNAs和mRNAs可能是GBM相關的靶點基因。但是目前對GBM中lncRNAs功能的研究認識尚淺,我們將進一步探索與GBM相關的ceRNAs對,為GBM診斷預后提供更加準確的治療靶點。