李 楠,遲少麗,劉 巖,王連友
目前肺腺癌(lung adenocarcinoma,LUAD)是人類最常見的惡性腫瘤之一,且其發病率和病死率呈逐漸上升趨勢[1,2]。肺腺癌診斷及預后方面的研究對臨床治療有重要意義。目前研究認為LUAD的發生發展是多因素、多階段以及多基因共同改變作用的結果,其中長鏈非編碼RNA(lncRNA)被認為發揮了重要作用[3]。lncRNA是一類長度大于200 nt的RNA分子,不編碼蛋白質,可以在不同水平調控基因的表達,包括染色質修飾、轉錄水平以及轉錄后水平的調節,與人類多種疾病尤其是腫瘤密切相關[4-6],目前已有研究發現,某些 lncRNA 在胰腺癌、直腸癌及肝細胞癌中表達明顯升高[7-9],提示其與腫瘤的發生發展密切相關,但目前關于lncRNA在肺腺癌中作為腫瘤標志物的研究較少。為此,該次研究擬通過對TCGA (The Cancer Genome Atlas)公共數據庫的數據挖掘,探索其在LUAD中差異表達的lncRNAs作為LUAD腫瘤標志物的效果及指導判斷預后的意臨床義。
1.1 數據收集 高通量RNA-seq結果于2017年8月2日從TCGA數據庫利用Bioconductor/TCGA biolink從TCGA數據庫下載。利用Kaplan-Meier Plotter數據(http://kmplot.com/analysis/)中的肺腺癌數據集進行在線生存分析。先在LUAD樣本中篩選高突變頻率的lncRNAs。該研究在 HGNC(www.genenames.org)數據庫中搜集了265個經證實的lncRNAs,將獲得的lncRNAs名稱全部導入cBioPortal數據庫(http://www.cbioportal.org),在基因組和轉錄組層面進行變異分析,RNA表達差異Z-score閾值為±2,在所有病例中改變超過10%的lncRNAs被認為有顯著性差異。再驗證具有顯著性差異的lncRNAs在腫瘤和正常組織中的表達差異。所有篩選出具有明顯變異的lncRNAs均使用oncomine數據庫(www.oncomine.org)在 LUAD和正常組織中進行轉錄水平的表達差異驗證。若Fold change(FC)>1.5且P值<0.05則認為結果有統計學意義。
1.2 統計學分析 使用Graphpad prism 6.0軟件進行統計學分析, 包括 t-test、heatmap、ROC 分析。生存分析采用Kaplan-Meier和log-rank檢驗法。P<0.05則認為結果有統計學意義。
2.1 肺腺癌中變異明顯的lncRNAs 所有備選的lncRNAs均為出現突變的,但是,在265個lncRNA中有8個lncRNA的拷貝數和表達量的總變異率超過 10%(圖 1)。 分別為 CASC8 (10%)、HCG11(10% )、DGCR5 (11% )、TP53TG1 (14% )、PVT1(21% )、PTCSC3(13%)、HAR1A (13%)及 HAR1B(10%)。

圖1 基因拷貝數和mRNA差異熱圖
2.2 總變異率超過10%的lncRNA對肺腺癌診斷及預后價值的相關性 利用Kaplan-Meier Plotter在線數據對上述得到的8個lncRNA進行生存分析, 結果得出,PVT1、HCG11、TP53TG1 和 DGCR5高表達患者的預后低于低表達患者,且結果具有顯著性差異 (P<0.05, 圖2)。 以上結果顯示,PVT1、HCG11、TP53TG1和DGCR5是 LUAD預后不良因素,四者的高表達與患者生存期縮短呈顯著性相關(P<0.05)。利用Oncomine中的肺腺癌組織和正常肺組織的RNA-seq數據對上述 4個 lncRNA進行ROC分析,TP53TG1和HCG11結果無統計學意義(P>0.05);PVT1 和 DGCR5 AUC 分別為 0.975 (P<0.01),0.9722(P<0.01),說明具有良好診斷效率(圖3)。綜合上述結果,PVT1和DGCR5可能成為判斷肺腺癌患者預后的標志物。

圖2 總變異率超過10%的8個lncRNAs生存分析

圖3 4個lncRNAs ROC分析
2.3 4個lncRNAs在腫瘤和正常組織中表達差異驗證 利用Oncomine數據庫的TCGA肺腺癌和正常 組 織 中 PVT1、HCG11、TP53TG1 和 DGCR5 的RNA-seq數據進行分析,驗證其差異表達。結果顯示,PVT1在LUAD組織中比正常肺癌組織升高了2.232 倍 (P<0.01),TP53TG1 升高 1.467 (P=0.021)倍,DGCR5 升高了 1.702 倍 (P=2.24E-12)。 而HCG11沒有顯著性差異。筆者所在課題組將P<0.01的作為有極顯著性差異。上述結果顯示,PVT1和DGCR5在LUAD組織中的表達量明顯高于正常肺癌組織,且差異具有極顯著性(P<0.01)。見圖4。

圖4 PVT1、TP53TG1、HCG11 和 DGCR5 在正常肺組織和LUAD組織中的表達驗證
2.4 PVT 1和DGCR5在其他類型腫瘤組織中的表達分析 利用Oncimne數據庫對PVT1和DGCR5在29種腫瘤和正常組織中的表達數據進行分析,PVT1 在結腸腺癌(colon adenocarcinoma,COAD)、肝臟肝細胞癌(liver hepatocellular carcinoma,LIHC)、LUAD、肺鱗狀細胞癌(lung squamous cell carcinoma,LUSC)、 胰 腺 癌 (pancreatic adenocarcinoma,PAAD)、直腸腺癌(rectum adenocarcinoma,READ)、胃腺癌 (stomach adenocarcinoma,STAD)、胸腺瘤(thymoma,THYM)中明顯升高,在 LAML,OV,THCA中明顯下降。而DECR5僅在LUAD明顯上升,在LGG、PAAD和TGCT中明顯下降。結果顯示作為LUAD的標志物,DGCR5更具有特異性。
LUAD是常見的惡性腫瘤之一,嚴重威脅人類健康的惡性腫瘤,早期發現、診斷、治療可以大大提高肺腺癌患者的存活率[10]。目前臨床常規物理診斷很難發現<1 cm的腫瘤,而傳統的腫瘤標志物的靈敏度和特異性也不夠高[11]。因此,采用現代分子生物學技術,尋找理想的腫瘤標志物對于提高惡性腫瘤診治水平具有重大意義。近年來研究發現lncRNA具有多種生物活性,參與了X染色體沉默、染色體修飾、轉錄激活與抑制及RNA剪切等過程,在細胞分化、胚胎與組織發育、腫瘤中均發揮重要功能[12-14],但 lncRNA 的數量眾多,生物學功能尚不完全清楚。 Han等[15]發現,與癌旁組織相比,lncRNA GAS6-AS1(growth arrest specific gene6 antisense,RNA1)在 NSCLC組織中的表達水平顯著下調。且GAS6-AS1的水平與患者淋巴結轉移、腫瘤分期及預后密切相關,GAS6-AS1表達水平越低,患者生存期越短。 Zhang 等[16]通過 qRT-PCR 技術,分析 62組肺腺癌組織和鄰近的癌旁組織ZXF1表達的差別,發現與鄰近的正常組織相比,肺腺癌組織中ZXF1水平顯著增高;進一步分析ZXF1與患者的臨床病理學特征、預后之間的關系,發現ZXF1表達上調與淋巴結的轉移、腫瘤的病理分期以及淋巴結轉移的范圍有關。這說明,長鏈非編碼RNA在肺腺癌中呈現高表達,并且在腫瘤細胞增殖和侵襲中發揮重要作用。
lncRNA在肺癌的發生、發展和耐藥過程中有重要的調控作用,這些lncRNA部分發揮致癌作用,因此,加深加快對lncRNA在腫瘤發生發展過程中的機制研究有助于對肺癌的早期診斷及預后判斷。在該次研究中,利用TCGA數據庫對肺腺癌中lncRNA進行挖掘,發現8個在基因拷貝數和表達差異超過10%的lncRNA,并利用在線數據分析其在肺腺癌診斷和預后判斷中的臨床價值,找到了PVT1和DRCG5兩個較大臨床價值的lncRNA,通過兩種分子在LUAD表達的驗證和其他腫瘤類型中表達分析,確定DGCR5可以作為特異的對LUAD進行診斷和判斷預后的指標,為臨床腫瘤標記物的篩選建立提供了研究依據。