李雪琪 張素杰 于曼 黃金光 周煥斌
(1.青島農業大學植物醫學學院,青島 266109;2.中國農業科學院植物保護研究所 植物病蟲害生物學國家重點實驗室,北京 100093;3.農業農村部桂林作物有害生物科學觀測實驗站,桂林 541399)
基因組編輯技術是在基因組水平上對DNA序列進行定點改造和修飾的一種新興的基因工程技術,它在基因功能研究、植物遺傳改良和分子育種等方面發揮著重要的作用[1]。其中CRISPR/Cas介導的基因組編輯系統由于設計簡單、低成本和高精準性等特點,被廣泛應用于改良植物遺傳性狀,包括提高產量、提高植物病蟲害抗性以及提高抗逆性等[2-3]。
CRISPR/Cas系統是存在于原核生物中的一種天然免疫系統,根據效應復合物和Cas蛋白的不同,CRISPR/Cas系統分為兩大類、六種類型和若干亞型。其中Ⅱ型的Cas9蛋白和Ⅴ型的Cas12蛋白,是目前應用最廣泛的CRISPR/Cas系統[4]。
CRISPR/SpCas9系統由兩部分組成:SpCas9核酸酶和single guide RNA(sgRNA),sgRNA是通過CRISPR RNA(crRNA)和反式激活CRISPR RNA(tracrRNA)的融合組成的[5],Cas9有兩個不同的核酸酶結構域:HNH和RuvC-like,其中HNH切割靶標DNA鏈,RuvC-like切割含PAM序列的非靶標DNA鏈[6]。常用的SpCas9識別NGG PAM[7],這種特定的PAM要求限制了CRISPR系統可編輯的區域。為了拓展CRISPR/Cas系統對不同PAM序列的兼容性,需要挖掘出新的識別不同PAM的天然Cas9蛋白或人工改造的Cas9變體。例如,不同來源的SpCas9的天然同源物ScCas9、SaCas9以及St1Cas9等,并已被證明分別可以識別NNG、NNGRRT和NNAGAAW PAM序列[8-10]。SpCas9定向進化產生的突變體SpRY、xCas9和Cas9-NG能夠識別含G-PAM和A-PAM[11-13]。
Cas12核酸酶屬于V型CRISPR系統,包含Cas12a-Cas12k幾種變體,是一種單一的RNA引導的內切酶,不需要tracrRNA,只需要crRNA就能進行打靶。Cas12a(又稱Cpf1)是第一個廣泛用于基因組編輯的Cas12核酸酶,具有DNA和RNA內切酶活性,與Cas9蛋白不同的是Cas12a僅需要一個切割結構域即可在靶位點處產生DSBs[14]。另一方面,Cas12a可以靶向植物基因組中富含T的序列,彌補了Cas9只能識別富含G的序列的缺陷,進一步擴大了CRISPR/Cas系統的打靶范圍[15]。
Cas12e(又稱CasX)是通過對地下水中的細菌進行宏基因組分析而確定的,CasX具有兩個同源蛋白,來自Deltaproteobacteria的CasX(以下稱為DpbCasX)和來自Planctomycetes的CasX(以下稱為PlmCasX),它們具有68.5%的序列相似性。基于該蛋白建立的CRISPR/CasX系統可以通過提供一類更小的、可編程的核酸酶作為額外的治療選擇,擴展了CRISPR/Cas基因組編輯家族[16-18]。與Cas9(~1 300 aa)或Cas12a(~1 200 aa)相比,CasX(~980 aa)足夠小,可以通過單個AAV傳遞,并有額外的空間用于多重單向導RNA(gRNA)或蛋白質域融合[19-21]。與SpCas9蛋白識別NGG PAM和Cas12a蛋白識別TTTV PAM位點不同的是,CasX蛋白能夠識別TTCN PAM序列位點。因此,本研究通過利用PlmCasX和DpbCasX蛋白,建立基于CRISPR/CasX介導的水稻基因編輯系統,擴大基因編輯技術在水稻中的應用范圍。
1.1.1 植物材料 均來自早熟水稻粳稻品種Kitaake,收獲的青種子主要用于水稻遺傳轉化,熟種子用于原生質體制備。
1.1.2 菌株、質粒及試劑 本研究所用的菌株和質粒見表1。酵母粉、胰蛋白胨、細菌用瓊脂粉、植物組培用瓊脂粉、2,4-二氯苯氧乙酸、萘乙酸和6芐基腺嘌呤購自北京索萊寶公司。潮霉素、特美汀、乙酰丁香酮、氨芐青霉素、氨芐青霉素、硫酸卡那霉素和利福平購自上海翊圣生物科技公司。十六烷基三甲基溴化銨、溴化乙錠購自北京冰達生物科技公司。NaCl、三氯甲烷、異丙醇、乙醇、Tris、甘露醇、山梨醇和蔗糖等常用試劑購自國藥集團。質粒提取試劑盒購自北京全式金生物技術公司、膠回收試劑盒購自南京諾唯贊生物科技股份有限公司。T4 DNA Ligase、ATP、T4 polynucleotide kinase等購自TaKaRa。Bsa I、Sap I購自NEB。PCR擴增用的高保真酶2× TransStart? FastPfu PCR SuperMix購自北京全式金生物技術公司,Gateway? LR ClonaseTM II Enzyme Mix購自Invitrogen。

表1 載體與菌株Table 1 Bacterial strains and plasmids
1.1.3 所用引物 實驗中用到的引物的合成及測序由生工生物工程(上海)股份有限公司完成(表2)。

表2 引物序列信息Table 2 Primer sequences
1.2.1 CasX表達載體的構建 人工合成DpbCasX和PlmCasX兩個片段,通過BamH I/Spe I雙酶切將合成的基因片段克隆至瞬時表達載體pUC19中,由CaMV 35S啟動子驅動表達,同時克隆至雙元表達載體pUbi中,由玉米泛素蛋白啟動子(Ubi-p)驅動表達,分別構建pUbi-DpbCasX、pUbi-PlmCasX和pUC19-DpbCasX、pUC19-PlmCasX四個載體(圖1-A-B)。

圖1 載體示意圖Fig.1 Schematics of vector
MIDAS(Improving Editing Activity by Synergistic Engineering)是一種蛋白質工程化改造的新方法,能顯著增強PlmCasX在人類細胞中的基因組編輯活性[22],MIDAS(T26R/K610R/K808R)突變體的構建方法:分別用引物對pUbi-PlmCasX-F1/R1、pU-bi-PlmCasX-F2/R2、pUbi-PlmCasX-F3/R3、pUbi-Plm-CasX-F4/R4(表2)以PlmCasX合成片段為模板進行PCR擴增,回收純化后進行infusion連接,命名為PlmCasX-V1。最后通過BamH I/Spe I雙酶切,分別連接到雙元載體和pUC19骨架上,構建pUbi-PlmCasX-V1和pUC19-PlmCasX-V1兩個載體。
1.2.2 crRNA的設計及打靶載體的構建 利用具有核酸酶活性的HDV核酶單元、tRNA、CRISPR/CasX系統的crRNA靶序列間隔DNA修復模板,使用CaMV 35S啟動子和Nos終止子,命名為CasX-crRNA交由生工合成(圖1-C),與用Bsa I酶切后的pENTR4-gRNA41載體連接,經酶切驗證及測序,最終得到正確質粒,命名為pHZ38。
gRNA的設計:根據水稻基因組數據中內源基因序列,尋找PAM位點為TTCN(TTCA、TTCT、TTCC、TTCG)的合適靶點。使用Bsa I酶切位點時正向引物的黏性末端為aaag,反向引物為ggcc;使用Sap I酶切位點時的正向引物的黏性末端為aag,反向引物為gcc。
gRNAs的構建方法參考文章[23]。
互補的引物對(表2)經磷酸化處理后通過熱處理后自然冷卻結合成雙鏈,然后插入經Bsa I或Sap I酶切后的pHZ38載體中。通過gateway的LR反應將gRNA插入到雙元載體pUbi-DpbCasX、pUbi-PlmCasX和pUbi-PlmCasX-V1中,最終轉入農桿菌EHA105中用于水稻遺傳轉化。
1.2.3 水稻原生質體轉化 PEG介導的水稻原生質體的轉化方法參考李超的文章[24]。將pUC19載體和gRNA載體通過PEG介導的水稻原生質體轉化導入水稻細胞中進行共表達,轉染48 h后收集并提取原生質體DNA,利用OsCPK16基因的特異引物(表2)進行PCR擴增和高通量測序,鑒定靶位點是否發生基因編輯。
1.2.4 農桿菌轉化 本試驗中農桿菌介導的水稻穩定遺傳轉化方法參考Hiei等[25]和Nguyen等[26]的方法。雙元載體pUbi-DpbCasX、pUbi-PlmCasX及pUbi-PlmCasX-V1對含有不同TTCN(TTCA、TTCT、TTCC、TTCG)PAM序列的水稻內源基因進行打靶后,轉入用未成熟的Kitaake種子誘導出的水稻愈傷中進行水稻遺傳轉化。
1.2.5 編輯效率檢測 采用十六烷基三甲基溴化銨(CTAB)方法提取水稻原生質體基因組DNA,采用磁珠法提取水稻轉基因材料的基因組DNA,通過高通量測序的方法對編輯效率進行分析。
首先根據常規PCR引物設計原則進行引物設計(18-22 nt):檢測位點必需在正向或反向引物附近(10-60 bp范圍內),擴增長度為150-200 bp;在正向引物前端加搭橋序列5′-ggagtgagtacggtgtgc-3′,反向引物前端加搭橋序列5′-gagttggatgctggatgg-3′。以提取的基因組DNA為模板,并用2× Rapid Taq Master酶進行第一輪擴增,PCR反應結束后,用1%瓊脂糖凝膠電泳檢查DNA質量,確認所有樣品條帶亮度一致且特異后,以第一輪擴增產物為模板,barcoded引物(合成12條barcoded正向引物,9條barcoded反向引物)進行第二輪擴增,將所有的PCR產物等量混合,直接純化回收構建文庫,檢測文庫的DNA濃度,送給公司上機測序。最后對數據進行處理,根據不同的引物序列對每個樣品進行拆分,分析基因編輯的效率。
已有報道表明DpbCasX具有在大腸桿菌細胞中切割靶基因的能力,而其失活的對應物能夠結合靶基因并降低基因表達。首先對DpbCasX基因按照水稻密碼子使用偏好性進行了密碼子優化后進行人工合成,后克隆至瞬時表達載體pUC19中,用于水稻原生質體瞬時表達檢測DpbCasX的編輯活性。以水稻內源基因OsCPK16作為目的基因,設計以TTCT為PAM的gRNA插入pHZ38中,在水稻細胞中表達DpbCasX的gRNA。
將表達CasX蛋白的pUC19載體和攜帶靶位點gRNA的pHZ38載體通過PEG介導的方法共轉化水稻原生質體,并對靶位點進行編輯活性檢測。通過高通量測序結果顯示(圖2),pUC19:DpbCasX與gRNA共轉化后,實現了對水稻內源基因OsCPK16的有效編輯,且在DpbCasX蛋白處理下引起的靶位點的突變在-7 - -23 bp之間。上述結果證明以TTCT為PAM的CRISPR/DpbCasX系統在水稻中具有編輯活性。

圖2 CRISPR/DpbCasX系統打靶OsCPK16基因在水稻原生質體中的編輯效率Fig.2 Editing efficiency of OsCPK16 gene targeted by CRISPR/DpbCasX system in rice protoplasts
接下來通過水稻穩定遺傳轉化實驗進行進一步的驗證。本研究將DpbCasX合成片段通過BamH I和Spe I酶切克隆至雙元表達載體pUbi中,并選擇了水稻內源基因OsCPK30和OsCPK4能夠識別TTCG PAM序列的靶位點、水稻內源基因OsCPK21能夠識別TTCA PAM序列的靶位點、水稻內源基因OsCPK23和OsCPK14能夠識別TTCC PAM序列的靶位點以及水稻內源基因OsCPK11和OsCPK27能夠識別TTCT PAM序列的靶位點進行打靶實驗(表3),利用農桿菌介導的水稻穩定遺傳轉化檢測其編輯效率,通過PCR擴增和高通量測序對獲得的獨立轉基因水稻品系進行基因型分析。結果顯示(圖3),DpbCasX蛋白只在打靶含TTCA PAM識別位點的水稻基因OsCPK21實驗中有編輯效率,得到的40株轉基因獨立株系中,檢測到7株發生了編輯,編輯效率為17.5%,發生編輯的突變材料中,有5株為單等位基因突變,2株為雙等位基因突變,且靶位點在DpbCasX蛋白處理下引起的突變在-7- -10 bp之間。

圖3 CRISPR/DpbCasX和CRISPR/PlmCasX系統打靶OsCPK4和OsCPK21基因高通量測序結果比較Fig.3 Comparison of high-throughput sequencing results of OsCPK4 and OsCPK21 genes targeted by CRISPR/DpbCasX and CRISPR/PlmCasX systems

表3 DpbCasX、PlmCasX編輯效率比較Table 3 Comparison of editing efficiency among DpbCasX and PlmCasX
為了進一步建立水稻CRISPR/CasX系統,又對PlmCasX基因按照水稻密碼子使用偏好性進行了密碼子優化后進行人工合成,克隆至瞬時表達載體pUC19中。以水稻內源基因OsCPK16作為目的基因,將表達CasX蛋白的pUC19載體和攜帶靶位點gRNA的pHZ38載體通過水稻原生質體瞬時表達檢測PlmCasX的編輯活性。通過高通量測序結果顯示(圖4),pUC19: PlmCasX與gRNA共轉化后,也能實現對水稻內源基因OsCPK16的有效編輯,且在PlmCasX蛋白處理下引起的突變在-8- -23 bp之間。證明了以TTCT為PAM的CRISPR/PlmCasX系統在水稻中具有編輯活性。

圖4 CRISPR/PlmCasX系統打靶OsCPK16基因在水稻原生質體中的編輯效率Fig.4 Editing efficiency of OsCPK16 gene targeted by CRISPR/PlmCasX system in rice protoplasts
之后我們又將PlmCasX合成片段通過BamH I和Spe I酶切克隆至雙元表達載體pUbi中,并選擇了水稻內源基因OsCPK30和OsCPK4能夠識別TTCG PAM序列的靶位點、水稻內源基因OsCPK21能夠識別TTCA PAM序列的靶位點、水稻內源基因OsCPK23和OsCPK14能夠識別TTCC PAM序列的靶位點以及水稻內源基因OsCPK11和OsCPK27能夠識別TTCT PAM序列的靶位點進行打靶實驗(表3),利用農桿菌介導的水稻穩定遺傳轉化檢測其編輯效率,通過PCR擴增和高通量測序對獲得的獨立轉基因水稻品系進行基因型分析。結果顯示(圖3),PlmCasX蛋白在打靶含TTCA PAM識別位點的水稻基因OsCPK21實驗中有編輯效率,得到的56株轉基因獨立株系中,檢測到37株發生了編輯,編輯效率為66.07%,發生編輯的突變材料中,有22株為單等位基因突變,15株為雙等位基因突變,且靶位點在PlmCasX蛋白處理下引起的突變在-7- -13 bp之間。在打靶含TTCG PAM識別位點的水稻基因OsCPK4實驗中,得到的56株轉基因獨立株系中,檢測到13株發生了編輯,編輯效率為23.21%,也主要以單基因突變為主,并且大多數突變株在靶位點處產生的基因突變基本都在-7- -16 bp之間的基因突變。
為了進一步提高PlmCasX系統的編輯效率,本研究試圖用MIDAS方法對PlmCasX蛋白進行了優化,構建了基于PlmCasX-V1(T26R/K610R/K808R)的新系統,并對上述7個水稻內源基因(OsCPK11、OsCPK21、OsCPK23、OsCPK30、OsCPK4、OsCPK14、OsCPK27)進行打靶實驗,這些基因的PAM序列包含所有的TTCN PAM(TTCA、TTCC、TTCT、TTCG),通過PCR擴增和高通量測序對獲得的獨立愈傷進行基因型分析。結果發現PlmCasX-V1在這7個靶位點都不具有編輯活性。
將OsCPK4和OsCPK21靶位點的序列通過網站CRISPR-GE(http://skl.scau.edu.cn/)進行檢索,查找潛在的脫靶基因,發現OsCPK4基因不存在含有4個及4個以下錯配堿基的靶位點,而OsCPK21存在含有兩個錯配堿基和一處缺失的潛在脫靶位點,設計特異性引物PCR擴增后進行Sanger測序(圖5),結果顯示均未發現脫靶現象。

圖5 OsCPK21基因潛在脫靶情況Fig.5 Potential off-target situation of OsCPK21 gene
Cas9和Cas12系統通過PAMs區分自身和非自身DNA靶,并產生雙鏈斷裂。Cas9識別富含G的PAM并產生被RuvC和HNH結構域切割的平末端,而Cas12識別富含T的PAM并產生僅被RuvC結構域切割的黏性末端,CasX則是一種新鑒定的能識別TTCN PAM序列的具有雙RNA導向的DNA靶向核酸酶的DNA切割特性[21]。基于CRISPR/CasX系統的建立,突破了SpCas9蛋白識別NGG PAM位點和Cas12a蛋白識別TTTV PAM位點的限制,在動植物基因組編輯中具有極大的潛力。有研究表明,在哺乳動物中CasX與Cas9和Cas12a相比具有更低的錯配耐受性,這表明CasX具有高保真度和低脫靶編輯,并且在哺乳動物中PlmCasX的編輯效率要高于DpbCasX[27]。本研究通過水稻原生質體轉化和水稻穩定遺傳轉化檢測到PlmCasX和DpbCasX在水稻內源基因中均有編輯活性,但原生質體中使用含有TTCT PAM的靶位點能檢測到編輯活性,而在水稻穩定遺傳轉化的時候含TTCT PAM的靶位點并未檢測到編輯活性,這可能是因為靶位點不同,可能存在編輯位點依賴性,同時TTCT PAM的編輯活性較低,無法在穩定遺傳轉化中檢測到,需要進一步實驗驗證。
Cas12a的同源蛋白LbCas12a和AsCas12a已被證實可以在水稻中實現基因編輯,在crRNA為23 nt時,LbCas12a和AsCas12a處理的樣品都能檢測出編輯效率,且在靶位點引起的突變基本都在-6- -12 bp之間[28],而本研究證實了CRISPR/DpbCasX和CRISPR/PlmCasX系統能夠產生-7- -23 bp堿基的突變,為創造新的水稻突變體提供了條件。
有研究構建了CasX衍生型的穩定活性構象狀態的工程變體,使其在體外將催化效率提高了10-20倍,在人體細胞中平均編輯效率提高了2-3倍[29]。而本研究通過MIDAS對PlmCasX蛋白進行優化,構建了PlmCasX-V1突變體,沒有檢測到該突變體在水稻中的編輯活性。據報道,在哺乳動物細胞中經過MIDSA處理的PlmCasX蛋白比野生型的PlmCasX蛋白的編輯效率高52%,而本研究中的靶位點均沒有編輯活性,這可能是因為本實驗選取的靶位點與該報道中的位點有差異,其只在哺乳動物中有編輯活性,在植物中是否可行還需要我們進一步實驗驗證。
綜上所述,本研究建立的基于CRISPR/CasX的水稻基因編輯系統,為將來開發基于CRISPR/CasX系統的堿基編輯工具和引導編輯工具,用于基因功能研究、遺傳性狀改良和分子作物育種提供了良好的技術支撐。
本研究通過比較CasX的兩個衍生型蛋白PlmCasX和DpbCasX對不同水稻內源基因的編輯效率,建立了基于CRISPR/CasX介導的水稻基因編輯系統,且其能識別TTCR PAM這一特性,擴大了基因編輯技術在水稻中的應用范圍。