馮留鎖,任帥,朱旭玲,盧文燕,王雅麗,范永勝
(1.新鄉市農業科學院,河南 新鄉4 53000;2.河南農業大學農學院,國家小麥工程技術研究中心,河南鄭州 450046;3.河南女子職業學院,河南 鄭州 450000)
民以食為天,糧食安全的重要性一直倍受關注.特別是近年來,極端氣候頻發以及洪澇、干旱等災害影響,糧食生產面臨極大威脅,并且由于全球工業化進程加速,可利用耕地面積不斷縮小,農藥、化肥過度施用導致環境污染以及水資源匱乏.另外,世界人口不斷增加,據資料顯示,全球人口2050 年預計達到96億,這要求相應食物供給比現在要提高100%~110%才能保證供應[1].因此,如何擴大糧食生產和保障糧食安全是全世界亟待解決的問題.
人類在漫長的農業生產過程中積累了豐富的育種經驗.雜交育種、突變體育種、轉基因育種是傳統育種中最常用的技術.雜交育種通過遺傳重組的方法將優良基因導入待試品種,在后代中篩選出優良基因性狀,這個過程需要花費較長時間.由于長期進行正向選擇的結果,許多優質基因形成連鎖群,遺傳多樣性減少,這在一定程度上加大了遺傳重組的難度,使得改變額外性狀尤為困難.突變體育種利用化學物質或物理射線使基因組發生遺傳變異,但由于突變位點的隨機性,需要篩選數目龐大的突變群體才能獲得理想的基因型.上述兩種方法耗時長,而且消耗極大的人力、物力和財力,已不能滿足現代育種的需求[2].轉基因育種雖然可以打破生殖隔離,將外源基因導入所需品種,但是由于公眾的反對和擔憂,使得轉基因品種商業化進程緩慢.因此,開發效率高、耗時短、安全可靠的育種技術成為現代育種的需求.
自從1988 年首例基因定點誘變技術在煙草原生質體中成功開展后[3],科學家們開始大規模研究基因定點誘變技術的應用1993 年,PASZKOWSKI 發現DNA 雙鏈缺口可以增加定點突變效率[4],2005 年,鋅指核酸酶(ZFN)在煙草中開發出來并迅速拓展到其他作物[5],2010 年,轉錄激活類效應物核酸酶(TALENs)在煙草和擬南芥基因編輯中獲得成功[6].雖然這些方法在作物育種中取得較大進展,由于它們自身存在缺陷, 如ZFN 同其靶序列的對應性并不特異, 容易產生脫靶效應;TALEN 技術雖然特異性高,脫靶效應較低,但TALEN 蛋白較大,并且序列重復性強,同時編輯多個基因過程繁瑣,而且編輯效率偏 低 , 導 致 該 技 術 目 前 在 作 物 育 種 中 未 能 實 現 大 規 模 應 用 .
2013 年,世界上3 個獨立的實驗室分別報道利用CRISPR/Cas9 技術在水稻、小麥、煙草和擬南芥中成功進行基因編輯[7-9],報道CRISPR/Cas9 技術成本低廉、簡單易操作,突變不同的靶位點時僅需重新設計、合成與靶序列互補的sgRNA,而不需要更換Cas9 核酸酶.自此以后,科學家們利用CRISPR/Cas 基因編輯技術對許多作物進行了定點改造.此外,CRISPR 體系也在不斷研發升級,例如新的Cpf1 核酸酶代替Cas 酶體系[10]以及單堿基編輯技術[11-12]等,這使得CRISPR/Cas 系統成為一種廣泛采納的、成本低廉且易于操作的基因編輯手段而倍受青睞.
CRISPR/CAS 體系最早是由細菌和古細菌中RNA 介導的免疫體系開發而來.當噬菌體或外來入侵DNA 進入細菌或古細菌細胞后,細菌和古細菌利用自身編碼的核酸酶產生相應抵御機制將入侵的遺傳物質切除.因此,CRISPR/CAS 體系包含兩個重要核心:CRISPR 重復間隔序列和Cas 蛋白家族.CRISPR重復間隔序列由一系列高度保守的重復序列(Repeat)與間隔序列(Spacer)相間排列組成.其中CRISPR重復間隔序列起靶向作用,Cas 蛋白家族起核酸酶切割作用[13-14].
根據Cas 基因核心元件序列的不同,CRISPR/Cas 可以分為Ⅰ型、Ⅱ型和Ⅲ型系統.這3 類系統又可以根據其編碼Cas 蛋白而分為更多的亞類.Ⅰ型和Ⅲ型CRISPR/Cas 免疫系統需要多個Cas 蛋白形成復合體切割DNA 雙鏈,而Ⅱ型只需要1 個Cas9 蛋白.Cas9 蛋白包含氨基端的RuvC-like 結構域及位于蛋白中間位置的HNH 核酸酶結構域,HNH 核酸酶結構域切割與單導向RNA (sgRNA)互補配對的模板鏈,RuvC-like 結構域對另1 條鏈進行切割.切割位點位于原型間隔序列毗鄰基序(PAM)上游3nt 處.自2012 年起,人們優化了Ⅱ型CRISPR/Cas 系統,利用Cas9 蛋白和sgRNA 構成簡單的sgRNA/Cas9 系統[6,15],使其能夠在真核生物中發揮類靶向切割DNA 的作用.Cas9 蛋白與sgRNA 結合形成RNA-蛋白質復合體,共同完成識別并切割DNA 靶序列的功能.其中,Cas9 蛋白作為核酸酶切割雙鏈DNA,而sgRNA 則通過堿基互補配對決定靶序列的特異性.
2014 年,鏈球菌(Streptococcus pyogenes)和放線菌(Actinomycesnaeslundii)Cas9 蛋白的三維晶體結構被解析出來[16-17].結果發現,Cas9 家族的成員具有相同的核心結構域,該結構域可以裂開兩瓣形成鉗狀,一瓣負責目標識別,另一瓣具有核酸酶活性能切斷DNA.兩瓣中間有1 個帶正電的溝槽,可以容納sgRNA:DNA 異源雙鏈分子.目標識別瓣對于結合sgRNA 和DNA是必須的,而核酸酶瓣包含HNH 和RuvC核酸酶結構域,它們所處位置恰好可以分別切開一條DNA 鏈.Cas9 蛋白單獨存在時處于非活性狀態,但與sgRNA 結合后,它的三維結構會經歷劇烈的變化,允許Cas9 與目標DNA 結合.這一結構可以幫助改良Cas9 核酸酶,設計不影響其功能的小Cas9 突變體,使其更適合基礎研究和基因工程.
CRISPR 基因編輯的一個主要特點是在基因組特異位置處創造DNA 雙鏈斷裂(DSBs),隨后形成的雙鏈斷裂可以通過兩種方式修復:非同源末端連接(NHEJ)和同源重組(HDR).修復的過程可以引入突變.通過NHEJ 方式,斷裂的染色體會重新連接,但往往是不精確的,斷裂位置會產生少量核苷酸的插入或刪除,從而產生基因敲除突變體;通過HDR 方式,在引入同源序列的情況下,以同源序列為模板進行合成修復,從而產生精確的定點替換或者插入突變體[18].在這兩種途徑中,NHEJ 方式占絕對主導,可以發生在幾乎所有類型的細胞以及不同的細胞周期中(G1、S 和G2 期);而HR 發生頻率很低,主要發生在S 和G2 期[19].
2.2.1 NHEJ 介導的基因編輯NHEJ 方式修復可以發生在細胞周期的任何時間,并且不需要同源DNA 鏈作為模板,因此在修復過程中起主導作用.大多數基因編輯產生的突變都是由NHEJ 方式修復產生的,它可以引入小片段的插入和缺失.利用NHEJ 修復方式,人們可以利用一個簡單的Cas9 蛋白和多重序列的sgRNA 創造多位點突變,并且這種突變方法已經應用到許多作物[20-21].
2.2.2 HR 介導的基因編輯 HR 介導的基因編輯方式相對于NHEJ 要更加精準.HR 方式可以精確地在基因組特定位點創造點突變,也可以引入或替換人們需要的核苷酸序列[22].HR 修復方式一般在細胞的S和G2 周期,需要一個與斷裂位點同源的DNA 作為修復模板.修復模板可以是同源染色體的姐妹染色單體或外源單鏈DNA,如果外源單鏈DNA 模板上存在突變信息,經過HR 修復以后,在相應斷裂位置處就引入了突變.
HR 方式的基因編輯目前主要應用于動物基因改造,植物上的應用還很少.主要因為植物上的HR 編輯方式效率很低;另一個原因可能是植物有特殊的細胞壁結構,不利于供體DNA(同源模板序列)在植物細胞中運輸.盡管如此,人們還是開發了在植物中具有較好的HR 編輯系統,比如改用豆科植物的黃矮病毒以及小麥中的矮化病毒來轉運供體模板DNA[23-24];另一種方法是構建sgRNA 和供體模板嵌合的載體.這兩種方法都能提高HR 方式在植物中進行基因編輯的效率[25-26].
2.2.3 非雙鏈斷裂修復編輯方式 除了創造DBs 進行修復引起基因編輯以外,CRISPR/Cas9 還可以對基因表達進行調控,比如表觀遺傳修飾、基因表達抑制/激活、基因組成像等.
將轉錄抑制結構域(如KRAB、SRDX 等結構域)或轉錄激活結構域(如VP64,p65AD 和VPR 等結構域)與dCas9 融合,通過sgRNA 靶向特異位點,可以對特定基因進行抑制或激活[27].如Lowder 等利用這一方法在擬南芥中成功地對多重基因進行抑制.他們構建了pCo-dCas9-3X-SRDX 抑制載體并轉入擬南芥中, 在轉基因后代中觀察到CLEAVAGE STIMULATING FACTOR64 基因和小分子RNA,miR159A、miR159B 在轉化植株中表達量明顯下降[28].相反,將dCas9 和轉錄激活結構域融合,可以極大地提高單基因或多基因的轉錄活性[29].此外,dCas9 還可以和表觀遺傳調控因子如組蛋白去甲基化酶LSD1、組蛋白乙酰化酶p300、交換易位蛋白等融合,以此改變相應位點上的表觀修飾,造成特殊的染色質結構,從而調控基因表達的開關[30].將dCas9 和綠色熒光蛋白eGFP 融合,還可以觀察著絲粒和端粒等特定位點上基因組構象[31-32].
育種實踐中,有的基因對性狀起正向調控作用.有的則對性狀起負向調控作用.因此,抑制負調控基因的表達來改良作物是作物育種上最簡單和常用的手段.利用CRISPR/Cas9 方法將負調控基因敲除,獲得想要的性狀已得到大規模應用.主要體現在提高產量、增強品質、提高生物或非生物逆境抗性、加速雜交育種等方面.
3.1.1 提高產量 植物的產量一直是育種的重要目標.作物產量形成受很多因素影響,包括環境因素和自身遺傳組成等.國內外育種家們將影響產量的負調控基因敲除,如編輯突變負調控穗粒數目基因(OsGn1a)、粒形基因(OsGS3)、粒質量基因(TaGW2,OsGW5,OsGLW2 以及TaGASR7 等)、穗形基因(OsDEP1,TaDEP1)和分蘗基因(OsAAP3)等都產生了理想表型,證明CRISPR-Cas9 突變編輯方法對作物改良是十分有效的[33-38].同時,敲除水稻中3 個負調控粒質量的基因(GW2,GW5 和TGW6)促使粒質量聚合,大大提高千粒質量[39].但是,由于產量因素的復雜性,有時單一敲除某一個基因在實際應用中并不能顯著增加產量,HUANG 等[40]結合基因聚合分析,基因組測序以及CRISPR-Cas9 方法分析了影響產量形成的數量基因座,他們對綠色超級稻IR8 衍生的30 個親本以及后代進行了測序,發現通過CRISPR-Cas9基因編輯后,57 個基因在所有高產品種中都有表達, 表型分析也驗證了這些基因對產量有很高的貢獻.該方法對今后尋找產量相關基因進行基因編輯提高作物產量提供了借鑒作用.
3.1.2 增強品質 品質受外界環境和眾多遺傳因素的影響,品質育種具有包含廣、跨度大,育種目標多等特點.到目前為止,通過基因編輯技術改良作物品質主要包括以下幾方面:①淀粉含量;②香度;③營養價值;④貯藏品質等.MA 和ZHANG 等[41-42]通過CRISPR-Cas9 方法敲除直鏈淀粉含量基因Waxy,極大提高了稻米的口感和蒸煮品質.DuPont 等[43]在玉米中也通過CRISPR-Cas9 方法敲除玉米Waxy 基因提高了玉米產量.相反,敲除支鏈淀粉基因SBEIIb 使水稻中直鏈淀粉含量提高,這對患有消化慢性疾病的特殊人群很有幫助[44].
香度是稻米的一個重要品質,香稻米不僅可以增加人們的食欲,還具有較高的營養價值.2- 乙酰1-1 吡咯啉是稻米香味中的重要組成物質,而甜菜堿乙醛脫氫酶2(BADH2)基因功能的缺失可以促進2-乙酰1-1 吡咯啉的生物合成.中國科學院遺傳與發育生物學研究所高彩霞老師課題組通過基因編輯技術將水稻中的BADH2 基因敲除, 獲得了和自然條件下badh2 突變體2-乙酰1-1 吡咯啉含量相當的水稻株系[45],并且進一步將中國水稻產區的30 多個主栽優良品種稻米香度都進行了改良,這對提高稻米香度具有重要意義.
面筋是谷物籽粒主要的蛋白組成形式.許多谷物作物(如小麥)面筋含量過高,導致西方國家人群(7%以上)對面筋敏感,表現出不同程度的消化疾病.α 上醇溶蛋白基因家族在小麥中具有100 多個成員,是面筋蛋白的主要組成部分,科學家們利用CRISPR-Cas9 方法設計出保守的sgRNA,并借此將小麥中α 上醇溶蛋白基因家族全部同時敲除,從而獲得了低面筋蛋白的小麥品系,緩解了患有消化疾病人群對面筋不適應的矛盾[46].
3.1.3 提高生物或非生物脅迫抗性 生物或非生物逆境是造成作物產量和品質下降的最主要因素.在生物逆境方面,通過CRISPR-Cas9 基因敲除的方法,許多基因編輯作物都提高了逆境抗性,主要包括細菌、真菌、病毒等病原菌的感染以及昆蟲取食等.例如,白粉病是一種毀滅性的真菌病害,通常可以造成作物絕產絕收.通過CRISPR-Cas9 基因敲除方法, 中科院遺傳發育所WANG 等[47]將小麥中所有的6 個TaMLO 基因進行敲除,獲得了極高抗白粉病的小麥品系[47].NEKRAAOV 等[48]也發現MLO 基因敲除的番茄較沒有敲除的對照表現出對白粉病更高的抗性.稻瘟病可以導致水稻嚴重減產甚至顆粒無收.OsERF922 在水稻中編碼一個乙烯響應因子類轉錄因子,人們將OsERF922 基因進行敲除,獲得了對稻瘟病抗性的水稻品種[49].水稻細菌性枯萎病是由Xanthomonas oryzae pv.Oryzae 感染造成的,將OsSWEET13 基因的啟動子利用CRISPR-Cas9 方法進行缺失, 可以大幅提升水稻對細菌性枯萎病的抗性[50].在病毒病抗性方面,人們利用CRISPR-Cas9 基因敲除方法,獲得了廣譜抗馬鈴薯y 病毒的黃瓜[51]、抗卷葉病的棉花[52].在抗蟲方面,LU 等[53]最近發現敲除水稻OsCYP71A1 基因使5-羥色胺合成減少,導致水楊酸含量升高,進而提高對稻飛虱和鉆心蟲的抗性.
CRISPR-Cas9 技術也用來對非生物脅迫抗性的改良.敲除水稻中的OsARM1, OsNramp5 和OsHAK1 基因,育種家們分別獲得了抗鎘元素[54]、放射性銫元素[55]以及砷元素[56]的水稻品種.2018 年,科學家們將水稻中的3 個脫落酸受體基因PYL1/4/6 敲除,獲得pyl1/4/6 三突變體,進一步對突變體分析發現,pyl1/4/6 不僅可以顯著提高水稻產量,同時也抗極端高溫和抑制穗發芽的發生[57].
3.1.4 加速雜交育種進程 作物雜種優勢利用是提高糧食產量強有力的武器.雜種優勢利用的前提必須有優良的雄性不育系,但許多優良品種是可育的.為解決這一難題,育種家們利用CRISPR-Cas9 方法創建了許多性狀優良的不育系,比如水稻和玉米中的溫敏不育系tm5[58],水稻中的光敏不育系csa[59],小麥中的光敏不育系ms45[60]等.雜種育性低是雜種優勢利用的另外一個障礙,這種現象通常是由生殖隔離造成的,比如水稻中的秈、粳亞種,它們雜交后代幾乎得不到種子.為了打破生殖隔離,育種家們在決定生殖隔離的Sa 基因位點上的SaF/SaM[61]以及S1 位點上的OgTPR1[62]基因進行了敲除.另外SHEN 等[63]也發現秈稻基因組上的Sc 基因1~2 個拷貝的敲除可以使秈、粳亞種雜交后代結實率大大提高.YU 等[64]研究發現將水稻中的致死基因ORF2 敲除,也大大提高了秈、粳亞種雜種結實率.最近,人們利用CRISPR-Cas9方法對有絲分裂和減數分裂過程進行調控,將水稻減數分裂過程的3 個關鍵基因REC8,PAIR1 和OSD1敲除,人們發現水稻不進行減數分裂而只進行有絲分裂.另外,他們將水稻卵母細胞中的BBM1[65]基因激活或將MTL 基因敲除,可以讓水稻進行無性繁殖,這一試驗成果使雜種F1 代異質性的長期維持變為現實,為雜種優勢利用創造了極為便利的條件.
有些農藝性狀是由單核苷酸改變引起的,這種單核苷酸的改變在分子水平上會造成基因表達的變化,或由于編碼氨基酸的改變賦予基因新的功能.對基因精確的修飾和改變比如額外核苷酸的插入或替換能夠不打破原有的連鎖群而引入自然條件下不存在的基因型,大大加速了育種進程.但是,由于HDR修復方式不占主導地位,單核苷酸置換或插入技術還不是很成熟,它們在作物改良中的應用還十分有限.玉米中的ARGOS8 是基因編碼乙烯反應中的一個負調控因子, 大部分玉米自交系中ARGOS8 基因表達量很低,SHI 等[66]設計通過HDR 修復方式在ARGOS8 啟動子區利用CRISPR/Cas9 方法將GOS2 啟動子引入并且驅動ARGOS8 的表達.基因編輯后的玉米自交系中ARGOS8 基因表達量上升,提高了玉米抗旱能力.YU 等[67]也通過CRISPR/Cas9 方法將ALC 基因編碼框第317 位T 置換成A,將西紅柿的生育期延長而提高了產量.
為了提高HR 修復方式效率,人們將雙生病毒(geminivirus)DNA 的復制子構建到CRSPR 轉化載體用以提高修復過程中同源模板數量,這種方法可以大幅提升編輯效率,并且在許多作物如土豆[68]、西紅柿[24,69]、水稻[70]、小麥[23]以及木薯[71]中都獲得了成功應用.2015 年CERMAE 等[24]利用雙生病毒將35S啟動子插入番茄ANT1 基因啟動子上驅動ANT1 基因表達,插入效率提高近10 倍,高效表達的ANT1基因使番茄果實變紫,花青素含量提高.
研究表明,很多重要農藝性狀都是由單核苷酸多態性(SNP:single-nucleotide polymorphism)決定的.單核苷酸變異可以位于基因編碼區,也可以位于非蛋白編碼區,如啟動子和3’端非翻譯區域.因此,單堿基編輯對作物遺傳改良是非常有用的.單堿基編輯蛋白編碼區域一個重要的應用是抗除草劑.抗咪唑啉酮和磺酰脲的水稻[11]、小麥[72]、擬南芥[73]和西瓜[74]都是由單堿基編輯ALS 基因獲得.抗甲基化吡氟氯禾靈的水稻由單堿基編輯乙酰輔酶A 羧化酶ACCase 獲得[75].
選擇性拼接可以讓一個基因編碼多種蛋白,這使得生物體內蛋白種類多樣化,并且可能產生新的表型.單堿基編輯在基因選擇性拼接過程也發揮重要作用.絕大多數真核生物mRNA 拼接過程遵循GU/AG規則,通常拼接的內含子5’端包含一個拼接供體位點GU,3’端包含拼接受體位點AG,單堿基編輯可以讓這些保守位點發生突變,產生不經過拼接的mRNA.RANG等[76]通過單堿基編輯方法將擬南芥AtPDS基因的mRNA 一個內含子拼接受體位點上的A 突變為G;XUE 等[77]利用單堿基編輯方法將擬南芥AtHAB基因內含子供體位點上的G 突變成A,使得基因編輯后的擬南芥對脫落酸敏感;LI 等[78]通過破壞mRNA拼接創制了擬南芥AtMTA 完全喪失功能突變體和水稻OsGL1、OsNAL1 的雙突變體.
病毒作為病原物造成世界上一半以上植物病害, 嚴重影響了作物產量.CRISPR/Cas 體系可以抵御外來入侵的質粒、DNA 病毒以及RNA 病毒,因此在植物中也可以用來防御病毒入侵.雙生病毒是一種單鏈DNA 分子,它在復制時會形成一種雙鏈結構的中間體.將sgRNA 設計為特異靶向雙生病毒基因組,穩定表達的Cas 蛋白和sgRNA 能夠在雙生病毒復制時能夠切割雙生病毒基因組,因此育種上也被用來防御雙生病毒入侵植物[79].CRISPR/Cas 一個最大的缺點是組成型表達的Cas 蛋白和sgRNA 容易造成脫靶效應,最近有報道表明利用病毒的啟動子驅動Cas 蛋白和sgRNA 的表達可以有效克服這一缺點[80].
相對于DNA 病毒,RNA 病毒造成的危害比DNA 病毒更嚴重[81].在哺乳動物細胞中,FnCas9 以不依賴于PAM 序列的方式結合RNA 切割丙型肝炎病毒RNA 分子,抑制丙型肝炎病毒的翻譯和復制[82].在植物中,人們發現FnCas9 也能夠切割黃瓜花葉病毒和煙草花葉病毒RNA 分子,從而可以有效防治黃瓜花葉病毒病和煙草花葉病毒病[81].另外值得一提的是與大多數Cas 蛋白不同,C2c2 類型的核酸酶可以切割單鏈RNA,因此被用來防治蕪菁花葉病毒對植物造成的傷害[83].
自從CRISPR/Cas9 技術發明以來,經過短短的數十年時間,基因組編輯及相關領域已經取得了革命性變化,極大加快了植物功能基因組學以及分子育種的研究步伐.但目前也存在一些亟待解決的問題:精確基因定點編輯的能力,即通過HR 途徑實現定點插入或替換的效率.不同物種和細胞類型中HR 頻率差異很大,而且不同報道的基因打靶載體設計以及提高效率方法也不盡相同.在植物中如何提高效率還需要進行深入系統的探索,建立一套適合植物的體系.在提高基因編輯效率的同時,還要避免產生脫靶突變.脫靶效應主要出現在sgRNA 靶向不穩定,因此解決脫靶效應最主要的方法還是在設計靶位點時選擇特異性較高的位點,即在全基因組上沒有和其相似性高的序列.另外也有報道表明使用截短的sgRNA(即17、18 或19nt 導向序列),可以將脫靶效應降低幾個數量級,且不影響靶位點處的突變效率[84].sgRNA 截短后可能使RNA-DNA 復合體對核苷酸錯配更加敏感,因而提高靶向特異性.多基因編輯技術在植物中目前已能實現3~4 個基因同時敲除,更多個基因(10 個或以上)同時敲除尚無報道.
總之,CRISPR/Cas9 作為現代生物學育種技術, 雖然在很多領域已取得突破, 但離我們的目標還很遠,需要不斷研發新的體系,包括高效表達sgRNA 的載體和新的Cas 核酸酶,以及效率更高的植物轉化體系,相信未來CRISPR/Cas9 基因編輯技術能夠更好地為作物育種服務.