左鑫,李欣容,李銘銘,楊超飛,張重義,王豐青*
1.河南農業大學 農學院,河南 鄭州 450046;2.福建農林大學 作物科學學院,福建 福州 350002
基因編輯技術是近年來興起的能夠對特定基因位點實現靶向精確編輯的一種先進基因修飾技術。相較于傳統的轉基因技術而言,基因編輯不僅能夠對目標基因進行精確編輯,而且受體生物基因組中無外源DNA片段的引入,不存在食品安全風險,可直接應用于生產[1],尤其是具有操作更簡單、編輯更高效、價格更低廉等優點的成簇的規律間隔的短回文重復序列及其相關系統(CRISPR/Cas9),已被大量應用于植物基因組功能和作物遺傳改良等相關研究。藥用植物的栽培和使用在我國有著悠久的歷史,其目標產品中藥材在保障人類健康方面發揮著至關重要的作用。但是藥用植物在生產上存在許多亟需解決的問題,如藥用植物種類繁多,且多為野生種質資源,馴化改良周期長;藥用植物產量和質量的不穩定性;病蟲害種類多、防治難度大;雜草危害嚴重,藥用植物對除草劑敏感等。基因編輯技術在提升藥用植物生產水平、改善藥用植物品質、產量和抗性等方面具有較大的應用潛力。本文介紹了基因編輯技術的類型和作用原理及在植物不同領域中的應用,進一步展望該技術在藥用植物中的應用前景。
基因編輯技術可以在生物體基因組水平上對目標基因進行編輯,實現DNA修復位點堿基的敲除、插入和替換等,以達到定向修飾靶基因序列的目的。目前基因編輯技術根據核酸酶的不同主要分為3類:鋅指核酸內切酶(ZFN)[2]、類轉錄激活因子效應物核酸酶(TALEN)[3]和成簇的規律間隔的短回文重復序列(CRISPR)[4]。三者對靶基因的編輯方式類似,均是在目標基因位點通過序列特異性核酸酶(SSN)識別切割靶DNA后造成DNA 雙鏈斷裂(DSBs),通過細胞內非同源末端連接(NHEJ)和同源性重組(HR)2種機制進行修復,造成編輯位點堿基的插入、缺失、替換等(見圖1),從而實現基因靶位點的精確修飾。其中ZFN和TALEN對靶DNA的識別利用DNA-蛋白質識別原理[5],而CRISPR/Cas9利用RNA-DNA識別原理。

注:A.ZFN基因編輯;B.TALEN基因編輯;C.CRISPR/Cas9基因編輯;D.DSB修復機制。圖1 3種基因編輯技術及DSB修復機制示意圖
第I代基因編輯技術ZFN是由能夠特異識別結合DNA片段的ZFP結構域和對靶DNA片段進行切割的非特異性Fok I核酸內切酶構成。ZFP結構域由3~6個Cys2His2鋅指蛋白組成,每個鋅指單元決定了對DNA單鏈上3個連續核苷酸的特異性識別,因此通過串聯多個鋅指單元形成ZFP結構域以實現對特定靶序列的識別[6]。基于切割域Fok I核酸內切酶以二聚體形式發揮內切酶作用的特性[7],需在靶位點兩端設計正反向排列且間隔5~7 bp的1對ZFN,從而實現Fok I 結構域在2條靶序列間隔位點的切割,造成DSB[8-9];但是,ZFN設計復雜、成本高、脫靶率高,產生細胞毒性等缺陷限制了該技術的廣泛應用。
TALEN是繼ZFN之后的第Ⅱ代基因編輯技術,由特異性識別結合靶DNA的TALE蛋白和Fok I內切酶結合而成(見圖1),其中Fok I內切酶和ZFN中的類似,TALE蛋白由N端轉錄信號、轉錄激活結構域和C端核定位信號3部分組成。在TALE蛋白的轉錄激活結構域中存在一段由34個氨基酸組成的非完美重復序列,其中第12、13位重復可變的雙氨基酸殘基(RVD)決定了1個重復單元對不同核苷酸的特異性識別[10]。不同氨基酸組合形式的RVD與核苷酸的識別存在對應關系,一般為天冬氨酸-異亮氨酸(NI)識別腺嘌呤(A)、天冬氨酸-甘氨酸(NG)識別胸腺嘧啶(T)、天冬氨酸-組氨酸(NH)識別鳥嘌呤(G)、天冬氨酸-天冬氨酸(NN)識別A或G、組氨酸-天冬氨酸(HD)識別胞嘧啶(C)、天冬氨酸-絲氨酸(NS)識別A、T、C或G任1個,據此針對靶序列設計成對的含有18~20個重復單元的TALEN對靶基因進行定點編輯[10-11]。雖然TALEN在特異性識別切割靶基因方面有了很大的改善,但是其成本高、載體過大、構建復雜等不足同樣制約了TALEN技術在植物中的廣泛應用。
CRISPR/Cas系統是在細菌和古細菌中發現的一種適應性免疫系統,由5′端的反式激活RNA基因(trans-activating RNA,tracrRNA)、CRISPR位點附近的成簇關聯基因(CRISPR associated,Cas)及CRISPR基因座組成[12]。TracrRNA在促使pre-crRNA形成成熟的小crRNA[13]及協助crRNA-Cas復合體實現精確定位方面發揮重要作用[14]。CRISPR基因座由啟動轉錄的前導序列(leader sequence)、不連續的高度保守的重復序列(repeat)和長度相似的間隔序列(spacer)相間排列而成[15]。其中,前導序列主要負責啟動CRISPR的轉錄;重復序列一般由21~48個堿基對組成,其中包含1個由5~7個堿基對組成的回文結構,其轉錄物能形成穩定的二級發卡結構[16];間隔序列一般由26~72個堿基對組成,是宿主細胞特異性識別外源基因入侵的主要來源[15]。Cas蛋白包含了HNH和RuvC-like 2個結構域,其中HNH結構域能夠切割與crRNA互補的DNA鏈,RuvC-like結構域使非互補的DNA鏈斷裂[14]。TracrRNA、crRNA和Cas蛋白三者結合形成tracrRNA-crRNA-Cas三元復合結構,進一步對靶位點3′端PAM鄰近的20個核苷酸序列識別切割形成DSB。
盡管CRISPR/Cas9系統是目前應用較為廣泛的基因編輯技術,但crRNA的20 nt間隔特異識別序列能夠忍受一定程度的靶標堿基錯配,從而產生較高的脫靶誘導,而且其特異性識別受PAM的制約,限制了該技術的應用范圍[17]。在CRISPR/Cas9系統的前提下衍生出CRISPR/Cas9n[18]、CRISPR/dCas9[19]技術實現了脫靶率的降低。2015年9月,張峰團隊發現的CRISPR/Cas系統的Ⅱ類V型新成員Cpf1,其能夠識別富含胸腺嘧啶(T)的PAM[20],進一步提高了CRISPR/Cas系統的特異性并擴大其識別應用范圍,此外Cpf1蛋白與crRNA矩陣相結合,還能夠實現對基因組多基因的同時編輯[21]。
基因編輯技術通過基因敲除、插入及基因替換等手段,實現對目標基因的定向編輯并獲得相應的突變體。近年來,基因編輯技術已經在模式植物擬南芥中得到深入的研究。除此之外,基因編輯技術在大田作物、園藝作物及藥用植物中的應用也日趨廣泛,其相關研究成果也越來越多。
早期的TALEN基因編輯技術已經在水稻Oryzasativa中實現對個別基因的定向編輯。Li等[22]通過TALEN基因編輯技術對水稻白葉枯病易感基因(OsSWEET14)定向編輯,獲得具有白葉枯抗性的水稻新品種。姜明君等[23]利用TALEN技術對水稻中已知的苯達松抗性基因(CYP81A6)定向敲除獲得苯達松易感性的水稻品種。隨著CRISPR/Cas9基因編輯技術研究熱潮的興起,該技術也成功用于水稻的性狀和品種改良等相關研究。利用CRISPR/Cas技術對水稻中乙酰乳酸合成酶基因(ALS)[24]、乙烯反應因子基因(OsERF922)[25]、5-烯醇丙酮莽草酸-3-磷酸合成酶基因(OsEPSPS)[26]的靶向修飾,分別獲得了除草劑、稻瘟病和草甘膦抗性的水稻品種。利用CRISPR/Cas9對水稻中編碼甜菜堿醛脫氫酶的香味控制基因(Badh2)[27]和編碼吲哚乙酸-葡萄糖水解酶的千粒質量控制基因(tgw6)[28]進行編輯,獲得的后代水稻突變體的香味和千粒質量都分別得到了顯著增加。
Shukla等[29]利用最早的基因編輯技術ZFN靶向編輯玉米Zeamays的IPK1基因,從而增加了玉米對除草劑的耐受性。Char等[30]利用TALEN對玉米的glossy2(gl2)基因進行靶向誘變使該基因失活,并進一步驗證了突變體后代中3個等位基因的功能。Shi等[31]利用CRISPR/Cas9基因編輯技術獲得了玉米乙烯反應負調控基因(ARGOS8)突變體,其抗旱性得到了顯著增強,在干旱條件下改善了玉米籽粒的產量。
除此以外,基因編輯技術在大豆Glycinemax[32]、小麥Triticumaestivum[33]、大麥Hordeumvulgare[34]、棉花Gossypiumhirsutum[35]等大田作物中也實現了對特異目標位置靶基因的精確編輯,并獲得了相應的基因突變體,進一步實現對大田作物性狀和品種的改良并獲得抗性新品種。

除了番茄,基因編輯技術也在其他園藝作物中得到應用。在馬鈴薯S.tuberosum中以選擇組成型表達的泛素7基因(Ubi7)的5′UTR內的內含子區域作為靶位點,利用TALEN技術將在馬鈴薯基因組中獲得的天然無啟動子的除草劑抗性標記和目的轉基因的盒插入該靶位點,內源性Ubi7啟動子將驅動無啟動子的除草劑抗性標記基因表達,從而獲得具有除草劑抗性的馬鈴薯[41]。Kannan等[42]利用TALEN技術對甘蔗Saccharumofficinarum中的木質素生物合成基因咖啡酸-O-甲基轉移酶(COMT)進行編輯,進而提高甘蔗中的糖化效率。Tian等[43]利用CRISPR/Cas9技術對西瓜中的八氫番茄紅素去飽和酶基因(CiPDS)定向誘變,并獲得白化表型的突變體植株,實現了基因編輯技術在西瓜中的應用。Klimek-Chodacka等[44]通過構建雙靶點CRISPR/Cas9載體分析了定向敲除黃烷酮-3-羥化酶基因(F3H)對胡蘿卜Daucuscarota紫色愈傷模型花青素積累的影響,同時比較了3種密碼子優化的Cas9基因的編輯效率,發現3種Cas9基因均能夠實現對靶基因的定向敲除,其中AteCas9最為有效。這些研究表明,CRISPR/Cas9技術具有廣泛適用性,在園藝作物的基因功能研究和新品種選育中具有很強的應用價值和潛力。
藥用植物種類很多,根據第三次全國中藥資源普查結果,我國藥用植物有11 146種[45],僅有200多種實現了人工栽培。受限于基因組信息的匱乏,目前在藥用植物中應用基因編輯技術的報道較少。2016年,Kui等[46]選擇木質素生物合成途徑中的5個基因(C3H、C4H、4CL、CCR和IRX)作為靶基因,通過CRISPR/Cas9基因編輯技術對鐵皮石斛Dendrobiumofficinale這5個靶基因實現定向突變,并進一步采用PCR擴增和測序技術驗證突變,發現在靶基因的不同位點分別發生了核苷酸的取代、缺失和插入,證明了CRISPR/Cas9基因編輯技術能夠在鐵皮石斛中有效應用。可以進一步利用該技術對鐵皮石斛其他途徑進行修飾,并對基因功能和分子遺傳進一步研究,有利于加快鐵皮石斛分子育種進程。
Li等[47]采用CRISPR/Cas9基因編輯技術精確敲除丹參Salviamiltiorrhiza中參與生物合成的二萜合酶基因(SmCPS1),以發根農桿菌介導進行遺傳轉化獲得了3個純合和8個嵌合突變體。其中純合丹參突變體中化學成分丹參酮,尤其是隱丹參酮、丹參酮ⅡA和丹參酮Ⅰ完全缺失,而其他酚酸代謝物的合成不受影響;嵌合突變體中的丹參酮雖有減少但仍可檢測到。Zhou等[48]利用CRISPR/Cas9系統對丹參中水溶性酚酸生物合成途徑中的迷迭香酸合成酶(RAS)基因進行編輯,其獲得的轉基因丹參毛狀根中RAS基因表達量降低進一步導致迷迭香酸(RA)、紫草酸B(LAB)含量顯著降低,RA前體物3,4-二羥基苯乳酸(DHPL)含量顯著升高。這些結果表明CRISPR/Cas9系統作為一種具有巨大應用潛力的工具在藥用植物基因組編輯中的可行性,對進一步闡明丹參次生代謝產物合成途徑中的關鍵酶基因功能,提高丹參的產量和質量具有重要意義。
芐基異喹啉生物堿(BIA)為罌粟Papaversomniferum中的特征性藥效成分,在醫學臨床應用中,具有豐富的抗炎、抗菌、抗氧化、抗血小板凝集、抗心律失常、抗高血壓、抗腫瘤等藥理活性作用,如罌粟堿的解痙作用,嗎啡的陣痛作用、小檗堿的降血脂作用等[49]。Alagoz等[50]使用CRISPR/Cas9系統通過非同源末端連接基因組修復敲除罌粟中調節BIAs生物合成的3′-羥基-N-甲基丙氨酸4′-O-甲基轉移酶基因(4′OMT),其敲除突變體中BIA的合成顯著降低。由此可見,CRISPR/Cas9技術不僅可以研究藥用植物的基因功能,還是藥用植物代謝工程有效的研究工具。
當前,植物藥在保護公眾健康方面發揮著越來越重要的作用,尤其是在治療一些疑難病、慢性病等方面,與化學藥相比優勢更為明顯。然而,中藥材生產中面臨著各種問題,如部分名貴的野生藥用植物瀕臨滅絕,栽培的藥用植物產量和品質不穩定、抗病蟲性降低,有些藥效成分在藥用植物中的含量很低,絕大多數藥用植物對除草劑敏感,雜草防除困難等。高效的基因編輯修飾技術將在中藥材產量、品質和抗性機制研究和中藥材生產質量控制過程中發揮重要的作用。近年來,隨著高通量測序技術的發展,越來越多的藥用植物基因組序列信息獲得了解析,功能基因組學和植物分子生物技術的發展為基因編輯技術在藥用植物中的應用提供了充分的技術支持。基因編輯技術有望在以下幾個方面促進藥用植物的基礎研究和生產應用。
中藥材的品質包括外在品質、內在品質和加工品質等。品質性狀的遺傳受基因控制,并受環境條件影響;而藥用植物藥用部位發揮藥效的物質基礎為中藥材含有的化學成分,化學成分的種類和含量決定了中藥材的品質。中藥材的化學成分復雜多樣,主要有糖類、苷類、醌類化合物、苯丙素類化合物、黃酮類化合物、萜類和揮發油、生物堿、甾體類化合物、氨基酸等。中藥材含有豐富的藥效物質,同時,部分藥材還含有一定的毒性成分,如生物堿類的麻黃堿、烏頭堿、阿托品等,苷類成分強心苷、皂苷類、苦杏仁苷等[51]。改善藥用植物的品質,一方面可通過基因編輯敲除抑制藥效成分合成的基因來提高藥效成分的含量,從而降低藥用植物中有效成分的提取成本;另一方面則通過敲除合成毒性成分的基因降低有毒成分的含量,從而降低藥材的不良反應。由于基因編輯技術僅修飾特定的基因,并不會導入外源基因片段,環境安全風險低,具備改善中藥材品質的生產應用價值。
藥用植物中的活性成分主要由植物次生代謝途徑合成,其中經乙酸-丙二酸途徑(AA-MA途徑)生成脂肪酸類、酚類、醌類等化合物;萜類、甾體類化合物經甲戊二羥酸途徑(MVA途徑)合成;經莽草酸途徑合成具有C6-C3和C6-C1基本結構的苯丙素類化合物;大多數的生物堿是由氨基酸途徑合成;還可以通過以上復合途徑合成次生代謝產物。通過代謝組學中的核磁共振(NMR)、質譜(MS)、色譜(HPLC、GC)及色譜質譜聯用等技術手段對藥用植物代謝物進行定性和定量分析,進一步結合基因組學和蛋白質組學闡明藥用植物的次生代謝合成網絡途徑及關鍵酶的調控機制,明確藥用植物次生代謝產物的合成積累規律和關鍵環節。藥用植物藥用部位藥效成分的合成主要受其合成通路中的催化酶基因和轉錄因子調控,可利用基因編輯技術實現催化酶基因和轉錄因子的過量表達或敲除,通過檢測代謝產物和目標成分的含量,進而明確藥效成分合成的分子調控機制。
藥用植物藥用部位的產量組成包括生物產量和經濟產量,生物產量主要是藥用植物光合作用所形成的全部干物質產量;經濟產量是指藥用部位的產量。利用基因編輯技術提高藥用植物產量可以從2個方面展開,其一,光合作用過程中將光能轉化為有機物中穩定的化學能所涉及的2個反應階段均需要一定酶的參與,通過基因編輯技術對光合作用過程中催化酶基因進行編輯,使相應的酶基因敲除或過表達從而對基因的功能進行研究,進一步調控基因的表達,從而提高光合作用產物。其二,利用基因編輯技術對控制不同藥用部位的基因進行編輯,進一步獲得藥用部位產量高的藥用植物。因此,在鎖定藥用植物藥用部位產量控制關鍵功能基因的情況下,可利用基因編輯技術調控該基因的表達實現藥用部位增產的目的。
病蟲害是影響藥用植物安全、優質生產的主要因素,選育抗病蟲藥用植物品種,提高藥用植物抗病蟲特性是防治病蟲害,促進藥用植物可持續發展的最經濟、有效、安全的方法。根據其他植物領域中通過基因編輯獲得抗病蟲品種的研究成果,可以設計靶向敲除藥用植物中病蟲害易感性基因的CRISPR/Cas9基因編輯系統,或參考其他植物中已研究出的相關抗病蟲基因并在藥用植物基因組中比對獲得抗性同源基因,進一步對該同源基因進行編輯,也可以嘗試將其他植物中已報道的抗病蟲基因,通過構建CRISPR表達載體轉入藥用植物中,從而提高藥用植物的抗病蟲性。
在藥用植物農業生產中普遍存在雜草危害嚴重的現象,人工除草成本很高。利用除草劑對不同植物類型的選擇性防除,很多大田作物都實現了專用型除草劑的生產和應用。而大多數藥用植物對除草劑非常敏感,噴施除草劑會對藥用植物產生嚴重的藥害作用,導致藥用植物種子的發芽率降低、葉片卷曲和發黃,甚至導致藥用植物萎蔫死亡,致使中藥材農業生產上談“除草劑”而色變。最新的研究表明,植物可通過自身基因的修飾獲得對特定種類除草劑的抗性,如乙酰乳酸合酶基因ALS(對支鏈氨基酸的合成具有重要作用),對其單個氨基酸進行定向突變以降低植物對磺酰脲類除草劑的敏感性[52];5′-烯醇丙酮酰莽草酸-3-磷酸合酶基因EPSPS的突變體可以獲得草甘膦抗性[53]。另外,通過基因編輯技術將除草劑解毒酶導入植物中,以降低除草劑對植物的傷害,從而獲得除草劑抗性[54]。此外,相關研究還有報道出抗除草劑的其他潛在基因,如原卟啉原氧化酶(PPO)、α-微管蛋白等[55],可以對其進行進一步的研究明確其作用,為提高藥用植物對除草劑的抗性奠定基礎。
藥用植物有10 000多種,然而,到目前為止絕大多數藥用植物均以野生資源為主。野生藥用植物存在分布分散、生境破壞嚴重、產量穩定性差等缺點,制約了植物藥的持續供應和可持續發展。加速藥用植物的馴化,有利于變野生藥用植物為家種,保護瀕危藥用植物,保證中藥材的永續利用。此外,加速藥用植物野生種質資源的馴化,能夠進一步對藥用植物進行統一化栽培管理,對藥用植物的不良性狀進行馴化。利用傳統的栽培和育種技術馴化野生植物,周期十分漫長,獲得理想的栽培性狀常常需要數年甚至數十年。而近年來發展起來的基因編輯技術為快速馴化野生藥用植物提供了可能。Li等[56]通過基因編輯技術靶向番茄分枝數量基因、果實大小基因等,獲得的突變體植株在保留野生番茄優良性狀的前提下改善了番茄的不良性狀。因此,可利用基因編輯技術對藥用植物中調控不良性狀的基因進行修飾,定向馴化農藝性狀,從而實現藥用植物的快速馴化,加速中藥材的現代化發展進程。