楊文文 倪嘉瑤 胡蕊潔 王華忠
(天津師范大學生命科學學院 天津市動植物抗性重點實驗室,天津 300387)
含有反向重復序列的DNA 屬于一類復雜的測序模板,目前,基于Sanger 法的常規測序方案尚不能有效地解決這一問題[1-3]。通過RNA 干擾(RNA interference,RNAi)方法創制基因沉默材料并對相應的表型進行鑒定是重要的功能基因組研究策略之一[4-6]。目前主流的RNAi 技術都需要構建靶基因反向重復序列的表達載體,進而通過轉化方法在細胞中表達出RNAi 的起始效應子——雙鏈RNA。RNAi載體構建的正確性至關重要,最終必須通過DNA 測序進行確認,這就對反向重復DNA 的序列測定帶來了挑戰。
目前,根據載體的類型和雙鏈RNA 產生方式,在植物中實現RNAi 的技術主要包括發夾結構RNA(hpRNA)表達載體的轉化[7]和病毒誘導的基因沉默(Virus-induced gene silencing,VIGS)[8]。hpRNA表達載體上構建有“啟動子—靶基因片段反向重復—終止子”表達盒,2 個反向重復中間間隔有內含子效率更高[9]。該類載體能夠在細胞內轉錄出含雙鏈結構的hpRNA,經加工后誘發RNAi。VIGS 技術則是利用RNA 病毒的基因組分子攜帶靶基因片段進入細胞,通過病毒雙鏈RNA 復制中間體的產生實現靶基因片段雙鏈RNA 的生成和RNAi 的誘發[10-11]。在載體構建階段,病毒基因組RNA 通常以cDNA 的形式保存于質粒載體上,采用常規分子克隆技術將靶基因片段插入到病毒基因組上。病毒的接種可以通過2 種方法實現,其一是通過體外轉錄方法獲得感染性的病毒基因組RNA 用于植物接種[11];其二是通過農桿菌介導的稱為agroinfiltration 的方法進行植物接種[12]。在VIGS 技術中,由于靶基因雙鏈RNA的產生是源自病毒的雙鏈RNA 復制中間體,在病毒基因組上僅插入靶基因的一段正向或反向片段即可實現基因沉默。但是有研究表明,插入靶基因串聯反向重復片段的病毒基因組能夠實現更高效的基因沉默[13]。
以上兩類RNAi 載體都要求克隆有靶基因片段的反向重復。在對RNAi 載體的正確性進行測序驗證時,位置緊鄰的反向重復序列在測序反應中有形成單鏈分子內二級結構的傾向,影響引物的結合和DNA 聚合酶的延伸[1-3]。已經報道的解決方案主要圍繞測序反應的優化進行,包括測序反應中各成分含量的調整、特殊添加物的使用、反應各步驟溫度和時間的優化等[14-17]。這些方案的技巧性較強,不同序列組成和長度的反向重復片段形成二級結構的穩定性不同,需要反復優化測序反應,這對于大多數自身不具備測序條件而將測序試驗完全委托給公司的實驗室而言實施起來比較困難。
本研究在前期構建小麥基因的VIGS 載體過程中也遇到了反向重復序列的測序問題,為排除測序反應中2 個反向重復片段之間的干擾,進而開發了一種新的測序前載體處理策略:將反向重復片段中的一個切除后對保留在載體上的另外一個進行測序,經過2 次酶切和2 次測序可以有效地對載體上的2個反向重復片段分別進行序列測定,進而確認構建載體的正確性。
1.1.1 載體和試劑 小麥自噬相關基因TaATG2為天津師范大學王華忠教授課題組已克隆基因,其全長cDNA 保存于載體上。基于大麥條斑病毒BSMV的VIGS 載體BSMVγ1保存于天津師范大學王華忠教授課題組實驗室。試驗用到的高保真DNA 聚合酶primeSTAR、普通Taq 酶、限制性內切酶(BamHⅠ、SpeⅠ和SalⅠ)以及大腸桿菌DH5α 感受態細胞均為TakaRa 公司產品;快速連接試劑盒(LigaFast)購自Promega 公司;引物合成委托北京六合華大基因科技有限公司完成;其他試劑均為國產分析純。
1.2.1 載體構建 設計合成2 條正向引物ATG2-F(5′-CGCGGATCCTCAAGCCTATTGTTCTGCACA-3′,下劃線為BamHⅠ識別位點)和ATG2-F1(5′-ACG CGTCGACTCAAGCCTATTGTTCTGCAC A-3′, 下 劃線為SalⅠ識別位點),以及一條反向引物ATG2-R(5′-GGACTAGTAGGATCAAA CTGACGAGGGA-3′,下劃線為SpeⅠ識別位點)。2 條正向引物分別和同一條反向引物搭配,用于從TaATG2的同一50 bp 區段擴增出BamHⅠ-正向片段-SpeⅠ和SpeⅠ-反向片段-SalⅠ。以含有TaATG2全長cDNA 的質粒為模板,使用高保真DNA 聚合酶primeSTAR 進行PCR 擴增。2 個擴增片段經雙酶切后與BamHⅠ/SalⅠ雙酶切切開的載體BSMVγ1同時進行連接,目的是獲得插入串聯反向重復片段(BamHⅠ-正向片段-SpeⅠ-反向片段-SalⅠ)的重組載體。連接產物轉化大腸桿菌后,使用菌落PCR 方法初步鑒定候選重組載體,對候選重組載體進行DNA 測序驗證。
1.2.2 構建載體的測序驗證 使用2 種質粒處理方法對候選重組載體進行測序驗證。一種是提取完整載體質粒后直接送到公司測序;另一種是對載體質粒首先進行酶切處理,切下一個基因片段后將保留另一個片段的線性化載體送公司測序,分別完成對2 個插入片段的測序。
經PCR 擴增獲得TaATG2一個50 bp 區段的2 個片段BamHⅠ- 正向片 段-SpeⅠ(圖1-A)和SpeⅠ-反向片段-SalⅠ(圖1-B)。將雙酶切后的2 個片段與載體BSMVγ1同時進行連接,獲得插入TaATG2串聯反向重復片段的VIGS 載體pBSMVATG2(圖1-B)。連接產物轉化大腸桿菌后采用菌落PCR 法初步篩選重組克隆,菌落PCR 使用的引物P1 和P2 的識別位點位于載體上的插入位點兩側(圖1-B)。根據擴增產物的電泳結果,挑選擴增出約500 bp(394 bp 載體序列+106 bp 串聯反向重復片段和中間SpeⅠ切點)大小片段的菌落克隆(圖1-C中的箭頭所示泳道)作為候選克隆進行下一步的測序驗證。
在菌落PCR 的電泳中還發現擴增產物大于500 bp 的情況(圖1-C 中的非箭頭所示泳道),推測是載體上同時插入了4 個或更多片段所致。這種情況產生的原因可能是連接反應中分子量較小的基因擴增片段相對濃度較高,從而容易導致多個片段串聯插入到載體上。

圖1 TaATG2 的VIGS 載體構建
為了驗證構建載體的正確性,以提取的完整環狀質粒為模板、使用載體上插入位點一側的P2 引物向插入位點方向進行測序(圖2-A)。結果發現,插入位點之前的載體序列部分測序信號正常,但進入SalⅠ位點后僅能正常測出反向片段的前20 bp 左右的序列,之后的測序信號呈現套峰(圖2-B)或迅速衰減(圖2-C)。更換測序公司或優化測序反應均無法解決這一問題,因而制約了對構建載體正確性的確認。

圖2 以完整質粒為模板的串聯反向重復片段的測序
完整質粒測序失敗的原因可能是正、反向片段在載體上有形成單鏈內部二級結構的傾向,為此設計了一個新的測序方案:酶切切除反向重復片段中的一個后對線性化載體上的另外一個進行測序。新方案的測序結果表明,保留在載體上的正向片段(圖3-A)或反向片段(圖3-B)均能得到清晰的測序信號和正確的測序結果。測序信號通過目的片段到達線性化載體的末端后迅速衰減。末端序列為ACTAGA,其中ACTAG 是SpeⅠ的粘性末端,最末端的A 是由測序反應中使用的Taq 類聚合酶添加(圖3)。新方案對正、反向片段的測序結果證明了構建載體的正確性。
載體構建是操縱基因表達或沉默的重要環節之一。過去一段時間,通過酶切、連接方法構建的載體一般通過酶切獲得插入片段的方法進行正確性驗證。但是經酶切驗證的載體仍然可能存在錯誤,如來自PCR 擴增的插入片段可能是或混有大小相近的非特異性擴增產物、PCR 過程引入了序列突變、多個載體同時構建時不同插入片段的交叉污染以及構建載體的交叉污染或人為混淆等。這些錯誤如得不到發現會使后續的基因表達或沉默試驗得不到正確的結論,也浪費了時間、人力和物力。近年來隨著DNA 測序成本的下降,構建的載體最終都要通過測序來確保準確。開展hpRNA 表達或VIGS 等RNAi試驗都需要構建能夠表達靶基因反向重復片段的載體[7,13]。此類載體上的反向重復片段,特別是串聯反向重復片段的直接測序目前還是Sanger 測序法應用上的難點[1-3]。本研究也證實了這一困難的存在,對串聯反向重復片段進行測序時因模板二級結構的形成導致測序信號出現亂峰或衰減。為了解決這一困難,本研究嘗試了將反向重復片段中的一個切除后對保留在載體上的另外一個進行測序的方案,發現該方案確實可以有效地實現對2 個重復片段的序列測定,進而確認構建載體的正確性。
也有報道采用在載體上的2 個反向重復片段之間進行酶切后測序的方法,酶切后的2 個片段分別位于線性化載體的2 個末端[1-2]。本研究也嘗試了這一方法,但目的片段部分的測序信號雜峰較嚴重,序列可讀性差。這種方法的可行性可能與插入片段的序列組成及長度,以及載體的大小(影響酶切后2 個位于末端的反向重復之間的距離和形成二級結構的難易)有關。
近幾年的載體構建工作中,Gibson assembly、LIC(ligation-independent cloning) 和Gateway 等 幾種不依賴于酶切、連接的無縫克隆方法也逐漸被采用[18-20]。鑒于反向重復片段在直接測序上的困難,在使用這幾種方法構建RNAi 載體時建議在插入的反向重復片段兩端和中間引入適當的酶切位點,以便采用本研究開發的策略對正、反向片段分別測序,實現對所構建載體正確性的準確判斷。

圖3 酶切切除載體上反向重復片段中的一個后對另外一個進行測序
開發了一個有效的RNAi 載體上的反向重復片段測序策略:切除一個片段后對保留的另外一個進行測序,經過2 次酶切和2 次測序可以有效地對2個反向重復片段分別進行序列測定,進而確認構建載體的正確性。