岳少康,謝 鑫,陳 瀅,李緒彥,邊少敏
(吉林大學植物科學學院,吉林 長春 130062)
在真核生物中90%的基因組可以轉錄,大部分轉錄為非編碼RNA (ncRNAs),其中長度大于200 nt、無編碼蛋白能力的RNA被稱為長鏈非編碼RNA (long noncoding RNA,lncRNAs)。近年研究表明,lncRNAs在真核生物中種類豐富且分布廣泛,能夠在表觀遺傳、轉錄及轉錄后水平調控基因的表達或直接影響蛋白功能[1-3],因此作為一個“明星分子”開始受到廣泛關注。根據文獻檢索結果,目前NCBI的PubMed數據庫中至少收錄了20多個植物物種lncRNA的報道,每個物種中都有大量的lncRNAs得到鑒定。隨著lncRNA功能缺失與獲得突變體的應用,人們對其中少量lncRNAs的生物學功能有了一定認識,主要集中在以下方面:調控植物開花的過程[4-5],參與植物有性生殖的調控[6],在光形態建成中扮演重要角色[7],參與根發育調控[8],調控種子萌發過程[9],參與共生固氮根瘤形成的調控[10],在植物磷代謝平衡中發揮重要作用[11],在次生代謝物質合成過程中發揮重要作用[12],參與外界脅迫的應答調控[13]。然而相對于動物而言,目前關于植物lncRNA功能的研究還處于初步階段。
擬南芥是展開科學研究的模式植物,其相關研究成果為研究其他植物尤其是雙子葉植物提供了重要的理論參考。目前在擬南芥中發現 40 000 多個 lncRNAs[14-15],僅對COOLAIR、COLDAIR、HID1、APOLO、AsDOG1、At4NC069370等少數幾個lncRNA的功能進行了研究,如COOLAIR通過影響FLC的表達從而調控植物開花[4-5];Wang等[7]報道 HID1 通過其靶標基因PIF3介導紅光下植物形態建成的調控,APOLO通過作用其靶標記憶基因PID從而調控出生根的發育[8];Fedak 等[9]研究表明asDOG1能夠抑制種子成熟過程中DOG1基因的表達,而asDOG1是調控種子萌發的重要因子。對于其余大量的lncRNAs,它們是轉錄“噪音”還是功能分子?如果是功能分子,它們參與哪些生物學過程?這些問題都有待于闡釋。
啟動子通常是位于基因上游起始轉錄的一段DNA序列,是調控基因表達的指揮棒,它不僅能夠調控基因表達的水平而且決定基因表達的部位和方式[16-17]。因此研究基因啟動子特性對于揭示基因在植物生長發育或響應脅迫過程中的生物學功能具有重要意義。At3NC026490是擬南芥中的一個lncRNA,目前尚未見到關于其功能方面的報道。本研究克隆了At3NCC026490的啟動子,并通過生物信息學手段對該啟動子的特性進行分析,進一步通過啟動子驅動GUS基因表達的策略對該啟動子的功能進行分析,以期為研究At3NC026490的生物學功能提供重要的信息和研究思路。
將Col-1野生型及轉基因擬南芥種子在4℃黑暗環境下春化3 d,播于蛭石與草炭以1∶3比例混合的基質中,然后在22℃、16 h/8 h(光照/黑暗)條件下培養。
1.2.1 擬南芥基因組DNA提取 采集Col-1野生型擬南芥葉片,液氮速凍后研磨成粉狀,然后利用CTAB法提取基因組DNA。
1.2.2 擬南芥At3NC026490基因啟動子克隆 在TAIR網站(www.arabidopsis.org)中獲取At3NC026490基因上游1 072 bp的DNA序列,并設計帶有Gateway接頭的引物At3NC026490-Pro-F(ggggacaagtttgtacaaaaaagcaggctCTTATGTTG ACTATGGGCCTGGTTT)和At3NC026490-Pro-R(ggggaccactttgtacaagaaagctgggtTTAGCGGTTGGCA CCAATCATAG)。以擬南芥基因組DNA為模板,利用高保真酶PrimeStar(TaKaRa)進行PCR 擴增:94℃預變性3 min;94℃變性30 s,60℃退火30 s,72℃延伸1 min,循環35次;72℃延伸7 min。PCR產物根據天根公司的普通瓊脂糖凝膠DNA純化回收試劑盒(離心柱型)說明書進行回收。
1.2.3 啟動子區域驅動的GUS表達載體構建 利用B P反應將P C R產物重組到pDONR207載體中,然后轉化至DH5α感受態細胞,進行涂板篩選,挑取陽性單菌落于37℃搖菌培養,提取質粒并測序。選取序列正確的質粒,利用LR反應將啟動子序列構建到目標載體pMDC162中,最后將成功構建好的pMDC162-At3NC026490-Pro質粒轉入農桿菌GV3101。
1.2.4 擬南芥的遺傳轉化及轉基因陽性苗的篩選 利用蘸花侵染法將At3NC026490基因的啟動子轉入擬南芥中。T0代種子經次氯酸鈉消毒后播種于含有50 μg/mL潮霉素的MS培養基中,生長10 d后,將依然保持綠色的植株轉移到土壤中生長;待T1代轉基因苗長到30 d后,采集葉片,按照1.2.1方法提取DNA,然后以啟動子序列設計正向引物、以GUS基因序列設計反向引物,通過PCR檢測上述利用抗生素篩選到的陽性苗是否存在目的基因,以確定幼苗為陽性轉基因植株,繁殖轉基因擬南芥直至篩選到T3代純合體。
1.2.5 GUS染色 選取2個At3NC026490啟動子轉基因株系,采集蓮座葉、莖生葉、花以及不同發育時期的果莢與種子(花后4、7、12、17 d),同時將轉基因種子播種于MS培養基中,收集14 d的幼苗。將不同的組織及幼苗按照Tang等[19]的方法染色:將樣品放入配好的X-Gluc solution染色液中,真空抽氣15 min后置于37℃條件下16 h,然后利用70%的乙醇脫色。最后,利用倒置顯微鏡拍照。
1.2.6 生物信息學分析 利用TSSP在線軟件(http://linux1.softberry.com/berry.phtml?topic=tssp&group=-programs&subgroup=promoter)預測At3NC026490 的轉錄起始位點;利用在線軟件PlantCARE (http://bioinformatics.psb.ugent.be/webtools/plantcare/html/) 對啟動子的順式作用元件進行分析和功能預測。
At3NC026490基因位于第3條染色體上,其上游1 004 bp處為另一個lncRNA基因(At3NC026500),它們的轉錄方向相同(圖1)。因此我們提取 At3NC026490與At3NC026500之間的DNA序列并利用TSSP在線軟件進行TSS位點預測,結果顯示在At3NC026490基因上游600 bp處有1個TSS位點。隨后利用PlantCARE網站對該段序列進行啟動子作用元件分析及功能預測,結果(圖2,彩插一)顯示,該序列具有典型的核心啟動子元件,包含29個TATA-box和21個CAAT-box,其中CAAT-box決定啟動子起始轉錄的效率及頻率,可增強啟動子的強度;TATA-box具有定位轉錄起始點的功能,說明該序列具有啟動子的基本特點。除啟動子基本元件外,該序列還具有多種轉錄調控相關的作用元件,包括11種光響應元件,生長素(TGA-element)、水楊酸(TCA-element)、乙烯(ERE)等響應元件,熱響應元件(HSE)、逆境響應元件(TC-rich repeats) 等,暗示該啟動子可能在響應光、激素、逆境脅迫等過程中發揮作用(表1)。此外,該序列還含有一些特殊的響應元件,比如在負義鏈150 nt處存在胚乳表達調控的skn-1_motif元件,在正義鏈953 nt處有1個CCAAT-box (MYBHv1結合位點)。

圖1 At3NC026490及其兩側基因的分布
以擬南芥基因組D N A為模板,利用Gataway技術對At3NC026490基因上游1 072 bp的序列進行克隆,結果見圖3A(彩插一),克隆片段大小為1 130 bp(Gateway接頭共58 nt),進一步測序表明所克隆片段序列與At3NC026490上游序列一致(圖3B,彩插一),說明克隆的基因組片段正確。利用gateway系統的pMDC162構建At3NC026490啟動子驅動GUS基因載體(pAt3NC026490∶∶GUS),轉化至農桿菌中,農桿菌菌落PCR檢測結果見圖3C(彩插一)。然后轉入到野生型擬南芥中,通過潮霉素B篩選獲得植株陽性苗(圖3D,彩插一),T1代種子繼續篩選,進一步繁殖后獲取T3代種子后用于GUS染色分析。

表1 At3NC026490基因啟動子順式作用元件


為了更好地理解At3NC026490在植物各組織的表達情況,我們挑選2個株系(pAt3NC026490∶∶GUS 2與 pAt3NC026490∶∶GUS 4),對轉基因植株的營養生長組織(根、幼苗、蓮座葉與莖生葉)與生殖生長組織(花、果莢及種子)進行GUS染色分析。結果表明,在At3NC026490啟動子的驅動下,GUS在擬南芥營養組織中的表達量均很高。由圖4(彩插一)可知,2個轉基因株系的蓮座葉、莖生葉以及幼苗與根中出現明顯的GUS表型,說明啟動子能驅動GUS在這些營養組織中表達。比較而言,生殖生長組織較少受該啟動子的影響,只在花瓣與果莢中觀察到一定的GUS表型,而在其他花器官和種子中卻沒有出現GUS表型。種子發育是一個重要的動態過程,為了進一步研究At3NC026490啟動子是否在種子整個發育與成熟過程發揮作用,我們對不同發育時期的果莢與種子(4、7、12、17 d)進行GUS染色分析,結果見圖5(彩插一),盡管在果莢中GUS基因的表達量一直很高,但是在種子整個發育過程中沒有觀察到GUS表型,即GUS在種子發育與成熟過程中并沒有表達,說明At3NC026490可能并不參與種子的發育與成熟過程。


生物信息學預測At3NC026490啟動子含有多個光響應作用元件,我們對轉基因株系進行8、16、24 h不同光照時間處理,然后觀察14 d幼苗GUS表型的變化,結果(圖6,彩插一)顯示,8、16、24 h不同光照時間處理下幼苗中GUS表型并無明顯變化,說明在幼苗中At3NC026490啟動子對長短日照具有相似的響應。

lncRNAs在真核生物中種類豐富且分布廣泛,能夠在表觀遺傳、轉錄及轉錄后水平調控基因的表達或直接影響蛋白功能[1-3]。盡管在植物中鑒定了大量的lncRNAs,然而對其功能卻了解甚少。At3NC026490是位于擬南芥第3條染色體上的一個lncRNA,目前尚未見到關于其功能方面的報道。本研究從啟動子的角度闡釋At3NC026490的功能特性,為揭示At3NC026490的生物學功能提供了重要信息和研究思路。
啟動子是位于基因上游啟動基因表達的序列,目前關于lncRNA基因啟動子的研究還鮮有報道,因此確定At3NC026490啟動子序列是一個關鍵環節。本研究從3個方面確定該啟動子的序列:一是利用生物信息學手段預測到了TSS位點;二是該序列中含有啟動子的核心元件CAAT-box和TAAT-box;三是利用該序列驅動GUS基因,可以在轉基因擬南芥中觀察到明顯的GUS表型,結果表明本研究所克隆的序列確實具有啟動子的功能。
啟動子不僅能夠調控基因表達的水平而且決定基因表達的部位和方式,研究基因啟動子的特性是揭示基因生物學功能的一條有效途徑。本研究中,我們通過兩種方式闡釋lncRNA啟動子的特性,一方面利用生物信息學手段預測該啟動子中含有響應光、激素以及脅迫的多種元件,這與許多lncRNA的表達受外界環境調控的報道相一致[19-20],表明At3NC026490可能在響應激素及外界刺激過程中扮演著重要角色;另一方面,通過啟動子驅動GUS基因聯合GUS染色的策略研究該啟動子的特性,結果表明營養組織中GUS表型明顯,而在生殖生長組織中表型不明顯,這與lncRNA具有組織表達特異性的報道一致[21-24],說明At3NC026490可能在營養生長過程中發揮著重要作用。有趣的是在整個種子發育過程并未觀察到GUS表型,至少有2個原因導致這種可能性:該啟動子(至少是我們克隆的啟動子)可能并不響應種子的發育與成熟,本研究克隆的At3NC026490啟動子沒有包括響應種子發育與成熟的元件。后續研究將檢測At3NC026490在種子中的表達情況以確定At3NC026490啟動子是否真正響應種子發育過程。
本研究克隆的啟動子并未響應種子發育過程,這在提高轉基因食品安全方面可能具有良好的應用前景。后續研究可利用該啟動子驅動目標基因在待改良的作物中表達,由于該啟動子可以響應營養生長,可以實現對營養生長以及抗性等性狀的改良,同時保證目標基因及其融合的篩選標記基因在種子中不表達,從而提高食品的安全性。