花 蕾,鄭先斌,2,郭偉茜,陶振超,周 燕,楊麗萍,張洋洋,黃一凡,孫 斌,楊 婧,何 健,高 勁
鼻咽癌(nasopharyngeal carcinoma, NPC)是我國常見的頭頸部惡性腫瘤,2018年全球新發病例129 000例,中國占近一半,放射治療是其主要治療方式[1]。盡管近些年NPC臨床診療水平不斷提高,仍有20%~30%的患者發生遠處轉移,導致治療失敗,影響患者的整體生存率[2]。因此,NPC遠處轉移是臨床面臨的主要問題,鑒定NPC轉移相關靶點尤為重要。
長鏈非編碼RNAs(long non-coding RNAs,lncRNAs)是一類由大于200個核苷酸組成的RNAs。在細胞中,lncRNAs可以通過4種作用模式發揮生物學功能:① 調控下游基因轉錄;② 阻斷分子的作用和信號通路;③ 將蛋白復合物定位到特定的DNA序列上;④ 起“中心平臺”的作用[3-4]。目前,越來越多參與NPC發生發展的lncRNAs被發現。例如,HOX轉錄反義RNA(HOX transcript antisense RNA,HOTAIR)能夠直接激活血管內皮生長因子A(vascular endothelial growth factor-A,VEGFA)[5]的轉錄,調控基質金屬蛋白酶9(matrix metallopeptidase 9,MMP-9)和p21蛋白(protein 21,p21)的水平[6],參與NPC的進展。lncRNA-LET通過調控MAPK/ERK 通路的表達譜[7]或多梳蛋白zeste基因增強子類同源物2(enhancer of zeste homolog 2,EZH2)抑制[8],影響NPC細胞增殖。然而,lncRNAs與NPC轉移相關的潛在機制少有報道。該研究通過高通量測序篩選出在轉移與非轉移NPC患者外周血樣本中差異表達的lncRNAs,并預測其潛在機制。
1.1 標本收集選取2018年10月1日~2019年5月1日安徽醫科大學附屬省立醫院西區(安徽省腫瘤醫院)確診為NPC的5例患者,所有患者均首次診斷為NPC。其中發生遠處器官轉移者3例,未發生轉移者2例。抽取患者外周血標本5 ml,提取樣本中上層血清,分裝至無RNA酶小管,于液氮中凍存保存。所有研究對象均知情同意參加本項實驗,且該過程經醫院倫理委員會審查批準。
1.2 RNA提取和鑒定根據Takara RNAiso (Code No.9180/9109)說明書提取血清樣品中的總RNA。提取完畢后,進行瓊脂糖凝膠電泳,根據電泳條帶檢測總RNA完整性,并使用NanoDrop 1000分光光度計檢測總RNA濃度及純度。
1.3 文庫構建測序文庫構建采用每份樣品中1~2 μg總RNA,先經過去除核糖體RNA處理,產物RNA用于下一步文庫構建。基于dUTP的鏈特異性,將文庫構建分為多個步驟,包括:將mRNA富集后的RNA進行片段化處理;通過逆轉錄合成第一鏈cDNA模板;加入dUTP形成互補鏈,合成雙鏈cDNA;在各種聚合酶的作用下,使雙鏈cDNA添加多聚A尾,且修復末端;Illumina特異性接頭使用連接酶進行連接;最后經PCR擴增并純化,得到RNA測序文庫。
1.4 文庫質檢構建好的文庫將使用Agilent 2100生物芯片分析系統進行質量檢測,內容包括文庫濃度、片段大小、是否含有接頭等項目,并通過定量PCR方法進行文庫的最終定量,根據定量結果及最終測序數據量的要求,混合不同樣品的測序文庫進入下一步測序流程。
1.5 上機測序混合處理完成的不同樣品的測序文庫,經過氫氧化鈉溶液處理變性為單鏈DNA,稀釋為特定濃度后,通過測序儀進行原位擴增,擴增出的片段末端使用測序儀檢測150個循環。
1.6 測序數據分析和基因功能分析產生的測序數據通過測序質控后,將經過預處理過濾步驟產生的數據比對到參考基因組上,將比對結果進行統計分析后進行lncRNAs和轉錄本表達定量分析、lncRNAs表達水平分析、差異表達lncRNAs篩選、基因本體論(gene ontology,GO)、功能顯著性富集分析(GO enrichment analysis)、京都基因與基因組百科全書(kyoto encyclopedia of genes and genomes,KEGG)通路顯著性富集分析等一系列分析,初步探討NPC轉移相關lncRNAs潛在機制。
1.7 統計學處理使用R軟件中的Ballgown包進行樣本表達水平的定量,以及組間的lncRNAs的差異表達分析。設定閾值為1.5倍差異,P<0.05,且組內FPKM均值≥0.5來篩選差異表達lncRNAs。
2.1 文庫質量評估及測序數據質量控制表1為lncRNAs在轉移與非轉移NPC中的表達譜,序列數和堿基數分別代表各樣本的總序列及總堿基數。對每個樣品的序列統計代表錯誤識別概率為0.1%的Q30,一般情況下認為Q30≥80%則認為測序質量合格。本研究所涉及樣本測序數據Q30均≥90%,表明測序質量合格。
通過高通量測序,共鑒定出1 726條lncRNAs在5例NPC患者血液樣本中表達,其中1 328條lncRNAs在NPC轉移組中表達較高,398條lncRNAs在NPC轉移組中表達較低。在轉移組表達較高的lncRNAs中,有2條lncRNAs的表達量差異有統計學意義(Fold Change>1.5,P<0.05),在轉移組表達較低的lncRNAs中,有12條lncRNAs的表達量差異有統計學意義(Fold Change>1.5,P<0.05),如表2所示,lncRNA ENST00000610778是表達差異較大的lncRNA,FC值為4 011.71,在轉移組中含量低,非轉移組含量高。

表1 測序數據量統計

表2 差異表達lncRNAs列表
2.2 lncRNAs相應基因的GO分析lncRNAs的功能往往與其相應周圍編碼蛋白的基因具有功能相似性,因此可以根據基因功能注釋數據庫GO對差異表達的lncRNAs周圍編碼基因按照功能進行分類及注釋,GO注釋內容包括:生物學過程(biological process, BP)、分子生物學功能(molecular function, MF)和細胞學組分(cellular components, CC)。經分析發現,差異lncRNAs的周圍編碼基因生物學過程主要集中于翻譯、核糖體大亞基組裝、SRP依賴的膜靶向共翻譯蛋白、病毒轉錄、核轉錄mRNA分解代謝過程、翻譯啟動以及rRNA加工,涉及基因包括NACA、RPL3、RPL12,如圖1A所示。分子生物學功能富集于核糖體結構成分,涉及基因包括RPL3、RPL12,如圖1B所示。細胞學組分富集于胞質大核糖體亞基、黏著斑,涉及基因包括RPL3、RPL12,如圖1C所示。
2.3 lncRNAs周圍對應mRNAs的KEGG通路分析經過KEGG通路分析后發現,差異表達的lncRNAs對應同位基因在“核糖體”(Ribosome)通路富集。如圖2、3所示。

圖1 差異表達lncRNAs周圍對應編碼基因的GO注釋氣泡圖

圖2 差異表達lncRNAs對應周圍編碼基因的
人類基因組計劃和DNA元件百科全書計劃研究[3]結果顯示,人類基因組中非編碼的RNA占了大部分區域,其中的lncRNAs曾一度被認為是轉錄噪音。lncRNAs依據從基因組中被轉錄位置的不同,可被分為5大類:正義鏈、反義鏈、雙向、內含子間、基因型[3-4],這種位置關系很大程度上與lncRNAs功能有關。隨著生物信息技術以及分子生物學的發展,發現多種lncRNAs在生命活動中發揮重要作用,包括腫瘤轉移。例如,一項lncRNAs與NPC轉移相關的研究表明,AFAP1-AS1在體外實驗中通過調節肌動蛋白絲完整性促進癌細胞轉移[9],而另一項96例NPC石蠟包埋樣本的回顧性分析發現,AFAP1-AS1在浸潤淋巴細胞中高表達的患者更容易發生轉移[10]。lncRNA H19也是NPC的促癌基因之一,能通過抑制miR-630 的活性而不是直接的相互作用來調節 EZH2 的表達,促進NPC細胞的侵襲轉移[11]。也有新發現的lncRNAs在NPC中被探究,例如,LOC284454影響細胞骨架和黏附相關的Rho/Rac 信號通路,促進NPC的遷移和侵襲[12],lncRNA-n326322通過激活PI3K/AKT 和 ERK/MAPK通路促進NPC細胞的增殖和遷移[13]。除此之外,lncRNAs在NPC中也可直接與靶基因結合,通過靶基因影響其功能。NPCCAT1和LncRNA PXN-AS1-L可分別結合YY1和SAPCD2促進細胞增殖和遷移[14-15]。當然,也有部分lncRNAs在NPC中影響生物學功能的機制尚不明確。
本研究中,筆者通過嚴格控制入組標準,篩選出2例無轉移的NPC患者,3例轉移NPC患者,其中轉移患者均為全身多發轉移。并成功提取患者外周血中的總RNA,使用全轉錄組測序方法檢測樣本中的lncRNAs,結果顯示,差異表達的lncRNAs有14條,表達差異較大的為lncRNA ENST00000610778,其對應的基因為AC245060.5,定位于22號染色體。在NPC轉移患者的血清中含量低,在非轉移NPC患者血清中含量高,與轉移組比較,差異倍數為4 011.71。這些差異表達的lncRNAs對應的基因富集到不同區域,參與細胞信號通路的調節。通過生物信息學分析發現,基因中RPL3、RPL12均編碼一種核糖體蛋白,分別定位于22號、9號染色體,真核細胞80S核糖體定位于胞質,由60S大亞基和40S小亞基組成,60S大亞基含有46個核糖體蛋白,40S小亞基含有33個核糖體蛋白。而RPL3、RPL12均為60S亞基的組成部分。參與GO注釋生物學過程、分子生物學功能、細胞學組分以及KEGG通路。其中,參與的生物學過程最多,共有7個,包括翻譯、核糖體大亞基組裝、SRP依賴的膜靶向共翻譯蛋白、該圖為KEGG網站的核糖體通路具體組成,紅框部分L3、L12分別為RPL3、RPL12的簡稱,代表RPL3、RPL12參與核糖體通路病毒轉錄、核轉錄mRNA分解代謝過程、翻譯啟動以及rRNA加工。分子生物學功能富集于核糖體結構成分,細胞學組分富集于胞質大核糖體亞基、黏著斑。值得注意的是,RPL3、RPL12在KEGG信號通路中主要參與核糖體通路,KEGG網站中對應編號為map03010,在中心法則中負責翻譯過程,由此推測本研究中它們相應的lncRNA ENST00000465618、ENST00000497322/ ENST00000497825,也可能與蛋白質的合成有關,具有潛在研究價值。可針對這些具有潛在研究價值的lncRNAs,在分子水平、細胞水平揭示它們與NPC轉移發生的相關性及具體作用機制,為NPC轉移的診斷和治療提供靶點。

圖3 核糖體通路組成
盡管lncRNAs與NPC相關性研究逐漸深入,但真正應用到實際臨床工作中還需更多投入。主要難點在于:① lncRNAs自身作用復雜,且存在相互串擾,還有可能存在其他潛在機制,本研究鑒定出的lncRNA ENST00000610778、lncRNA ENST00000465618、ENST00000497322/ENST00000497825前期研究很少,尚未有文獻報道其具體功能及作用機制;② 一種lncRNA往往參與多種疾病的發生,NPC特異性的lncRNAs很少報道,轉移特異性的lncRNAs更是少見,因此,需要更大的樣本量去發現和鑒定相關的lncRNAs;③ 實驗室研究轉化以及與臨床應用的整合面臨挑戰,需要多學科的交叉、整合與協作。后續本課題組將繼續圍繞上述lncRNAs對NPC生物學影響深入展開體外及體內研究,為lncRNAs在NPC的臨床應用提供基礎。
本研究補充了人體外周血樣本中轉移性NPC的表達譜,鑒定出與非轉移性NPC患者差異表達的一系列lncRNAs,提示lncRNAs可能參與NPC的轉移過程,利用lncRNAs與其相應基因的功能相關性,對它們參與的生物學過程以及信號通路進行預測,為lncRNAs在NPC轉移過程中的生物學作用及潛在機制研究提供思路和方向。