葛將 李文坤 李倩 王蕓 王亞丹 綜述 吳靜② 審校
2003年人類基因組測(cè)序完成后,發(fā)現(xiàn)僅有20 000個(gè)基因參與蛋白質(zhì)編碼,然而超過98%的基因不進(jìn)行蛋白質(zhì)翻譯,稱為非編碼RNA(non-coding RNAs,ncRNAs)[1]。傳統(tǒng)意義上的ncRNAs分為兩大類。第一大類根據(jù)長(zhǎng)度的不同分為:長(zhǎng)度<200個(gè)核苷酸的短鏈非編碼RNA,如microRNA(miRNA)、轉(zhuǎn)運(yùn)RNA(tRNA);長(zhǎng)度超過200個(gè)核苷酸達(dá)到10萬(wàn)個(gè)堿基對(duì)的長(zhǎng)鏈非編碼RNA(long non-coding RNA,lncRNA)。第二大類組成包括:在X染色體失活中發(fā)揮重要作用的X染色體失活特異轉(zhuǎn)錄物(X-inactive-specific transcript,Xist)、同源框基因反義基因間RNA(homeobox gene antisense intergenic RNA,HOTAIR)、H19[2]。
lncRNA構(gòu)成了非編碼基因組大部分空間,根據(jù)其在基因組上相對(duì)于蛋白質(zhì)編碼基因的位置,lncRNA分類為正義lncRNA、反義lncRNA、雙向lncRNA、基因間lncRNA、內(nèi)含子lncRNA。這些非編碼轉(zhuǎn)錄本通常與相應(yīng)的mRNA編碼序列存在部分重疊,可能具有mRNA相同的功能。lncRNA包括一類不同轉(zhuǎn)錄本,其結(jié)構(gòu)類似于mRNA,但不編碼蛋白質(zhì)[3]。與mRNA相同,大多數(shù)lncRNA也是由RNA聚合酶Ⅱ轉(zhuǎn)錄,進(jìn)行可選擇性剪切,可能攜帶有單核苷酸多態(tài)性(SNPs),進(jìn)行5’端加帽和聚腺苷酸化[4]。結(jié)構(gòu)上,lncRNA可以形成復(fù)雜二級(jí)結(jié)構(gòu)及復(fù)雜高級(jí)結(jié)構(gòu),增強(qiáng)識(shí)別蛋白質(zhì)的能力[5]。
lncRNA在轉(zhuǎn)錄和轉(zhuǎn)錄后水平調(diào)控基因表達(dá)[6]。在轉(zhuǎn)錄水平,lncRNA通過順式或者反式作用以與染色質(zhì)修飾酶相互作用、誘捕轉(zhuǎn)錄因子和直接與啟動(dòng)子結(jié)合等方式導(dǎo)致基因的激活或沉默[7-9]。lncRNA LNAPPCC與EZH2結(jié)合,抑制EZH2與PCDH7啟動(dòng)子結(jié)合,下調(diào)PCDH7啟動(dòng)子中組蛋白H3K27me3水平,激活PCDH7的表達(dá)[10]。lncRNA HAND2-AS1將轉(zhuǎn)錄因子E2F4募集到C16orf74啟動(dòng)子區(qū)域,并下調(diào)C16orf74表達(dá)。有報(bào)道表明,HAND2-AS1通過募集轉(zhuǎn)錄因子E2F4抑制C16orf74表達(dá)而抑制宮頸癌發(fā)生發(fā)展[11]?!?br>