郝夢圓曲曉軍崔艷華
(1. 哈爾濱工業大學化工與化學學院,哈爾濱 150090;2. 黑龍江省科學院微生物研究所,哈爾濱 150010)
CRISPRs基因編輯技術研究進展
郝夢圓1曲曉軍2崔艷華1
(1. 哈爾濱工業大學化工與化學學院,哈爾濱 150090;2. 黑龍江省科學院微生物研究所,哈爾濱 150010)
CRISPR(Clustered regularly interspaced short palindromic repeats)基因簇是一段成簇的短間距回文非編碼序列,它可以通過整合新的間隔子序列實現對入侵外源DNA的記憶,而Cas(CRISPR-associated protein)蛋白則負責輔助CRISPR的轉錄產物crRNA(CRISPR RNA),對外源DNA進行切割。二者協作組成了生物體的CRISPR-Cas系統,發揮抵御外源DNA侵染的作用。目前,CRISPR-Cas系統憑借著高效、簡單、低成本、高特異性的獨特優勢迅速吸引了整個科學界的注意,成為研究的一大熱點。對CRISPR-Cas系統的組成、結構、分型以及CRISPR技術作用機理、優勢等做了詳細的介紹,并以嗜熱鏈球菌為例,分析了CRISPR基因的堿基排布及其高級結構,旨在為分子生物學及相關領域的科學研究提供參考。
CRISPR-Cas系統;基因編輯;嗜熱鏈球菌;gRNA-Cas9復合體
神奇的自然進化造就了CRISPR-Cas系統,它是細菌及古細菌中的一種特異性免疫系統,最早由Ishino發現于大腸埃希菌的iap基因[1]。CRISPR-Cas系統不僅為研究微生物的進化提供了新思路,更為人類對基因的編輯找到了新的突破口。隨著科學界對其研究的逐漸深入,該系統現已發展成為一種高效的基因編輯手段,強大的優勢使其迅速成為近十年來微生物及相關領域研究的熱點。目前,此項技術已經成功應用于包括微生物、植物、動物在內的諸多物種當中[2-5]。本文詳細闡述了CRISPR-Cas系統的組成、結構、分型以及CRISPRs技術作用機理、優勢等內容,并著重分析了嗜熱鏈球菌中CRISPR基因的堿基排布及其高級結構,旨在為CRISPR技術的進一步研究與應用提供參考。
細菌在長期的生存斗爭中,進化出多種免疫機制[6],包括已研究較為透徹的限制修飾系統、滲透阻斷、流產感染系統及毒素-抗毒素系統等[7]。近幾年發現的CRISPR-Cas系統與前三者共同構筑了細菌體內一道“堅不可摧的城墻”,實施干擾和切斷外源基因片段的作用。
1.1 CRISPR-Cas系統的組成
CRISPRs意為規律成簇的短間距回文重復序列。CRISPR基因簇以“重復序列-間隔區”為單元,為細菌DNA上的一段非編碼區。Cas蛋白是一種與CRISPRs基因相關的蛋白質,具有核酸酶和解旋酶活性[1]。CRISPRs基因與Cas蛋白共同組成了CRISPR-Cas系統,該系統最早發現于嗜熱古細菌,用于抵御外來DNA(如質粒、噬菌體DNA)的侵染[8]。
典型的CRISPRs基因簇由高度保守的重復序列和間隔片段串聯而成,通常含有21-48 bp正向重復序列,重復序列之間又由長度基本一致的26-72 bp非重復間隔子隔開[9]。其5'端上游通常含有一段高AT含量的DNA片段作為前導序列。CRISPR序列的二級結構非常穩定,且兩端序列高度保守[8,9]。由于其部分回文重復,CRISPR序列可形成穩定的發夾結構[10]。
毗鄰CRISPR序列的操縱子編碼Cas蛋白,cas基因具有編碼解旋酶、聚合酶和多種RNA結合蛋白的核酸的特征。Cas蛋白的類型多種多樣,它能夠參與CRISPR基因位點轉錄的不同步驟,并協助目標DNA的裂解和新間隔子的整合[11-13]。不同Cas蛋白參與不同類型CRISPR-CAS 系統的各個過程,執行不同的功能,因此,Cas蛋白是該系統必不可少的組成部分。
1.2 CRISPR-CAS系統的作用機理
CRISPR-CAS系統是細菌及部分古細菌的特異性免疫系統[14],它的作用機理類似于RNA干擾。外源DNA侵入宿主細胞后,部分DNA片段會整合到CRISPR基因簇上;待該序列再次入侵時,宿主細胞在CRISPR-Cas系統的作用下,切斷、裂解入侵的DNA[15]。CRISPR-CAS免疫系統對外來DNA的排斥過程主要包括適應、表達和干擾3個階段[15]。
在適應階段,外源DNA入侵宿主細胞后,Cas1、Cas2蛋白通過識別前間隔子相鄰基序(Protospacer adjacent motif,PAM),將一段外源DNA(稱為前間隔子)整合于宿主的CRISPR基因簇前端,形成新的間隔子,由此形成對入侵DNA的“記憶”。在表達階段,帶有外源DNA片段前間隔子的CRISPR 基因簇轉錄出一條單鏈RNA(前體crRNA),前體crRNA經Cas1、Cas2蛋白及RNA酶的加工、剪切,成為成熟的短鏈crRNA,它由對應于CRISPR 基因簇上的單鏈間隔子和相鄰單鏈重復序列組成。成熟的crRNA可進一步與相關Cas蛋白或Cascade復合體結合,形成CRISPR效應核蛋白復合體(crRNP)。在干擾階段,crRNP復合體結合的crRNA作為gRNA引導復合體向目標DNA發起進攻,最終導致外源DNA的降解。在廣泛應用的CRISPR/Cas9系統中,成熟crRNA可與tracrRNA(Trans-encodedsmall RNA)互補配對形成雙鏈RNA,dsRNA與Cas9蛋白、RNase Ⅲ結合成為靶向切割復合體,與被識別的目標DNA互補配對,再對其進行切割、裂解[16]。這種高效率、特異性的DNA切割、編輯方式為基因的修飾及突變體的構建提供了新的思路。
1.3 CRISPR-CAS系統的分型
現有的生物信息學分析發現,不同物種的CRISPR基因簇可編碼大約65個同源Cas蛋白,由此可將其分為8個CRISPR-CAS系統亞型,但復雜的分類方法會阻礙CRISPR-CAS系統的應用。結合系統發育樹信息和比較基因組分析,Makarova等[17]提出一種新型的分類系統,主要包括3種不同類型。
I型CRISPR-Cas系統基因簇包含cas3基因,可編碼一種大分子量的Cas3蛋白,其基因簇上還存在編碼一種Cas蛋白復合體——Cascade(CRISPR-associatedcomplex for antiviral defense)的基因,這種復合體包含大量屬于重復相關可疑蛋白(Repeatassociated mysterious proteins,RAMP)超家族的蛋白質(如同源性較近的Cas7和Cas8)。I型系統中,發揮主要作用的是一種具有RNA酶活性的RAMP蛋白,它能夠切割前體-crRNA,進而將其加工為成熟的crRNA。在對外源DNA的降解階段,目標DNA由Cas3蛋白的HD核酸酶結構域靶向并進行切割[10]。
II型系統又稱“HNH”系統、鏈球菌樣系統及Nmeni亞型。II型系統除具有普遍存在于各型系統的Cas1和Cas2蛋白外,還含有一種特征性的大分子量(包含約1 000個氨基酸)單亞基蛋白——Cas9,其作用為協助加工crRNA以及裂解目標DNA。Cas9蛋白上有兩個不相干的核苷酸結構域[1],分別稱作RuvC樣(RNA酶H折疊)和HNH(McrA樣)核酸酶結構域[18],它們分別負責CRISPR基因簇的轉錄和外源DNA的干擾[1]。II型系統可分為3個亞型,II-A、II-B和II-C亞型。II-A亞型系統包含一個額外的csn2基因。該蛋白雖不具有干擾目標DNA的功能,但在間隔子的整合階段發揮一定作用,它編碼的Csn蛋白呈四環結構,線性雙鏈DNA可通過中心孔結合于Csn蛋白上[10]。II-B亞型系統則由一種屬于Cas4蛋白大家族的特殊蛋白發揮主要作用,該蛋白具有5'-單鏈DNA外切酶活性[1]。II-C亞型是已知的CRISPR-CAS 系統中僅僅依靠Cas1、Cas2和Cas9三種蛋白發揮作用的系統[19],該系統常用于細菌基因組測序,現已發展成為一種強有力的基因編輯工具[20]。
III型系統主要包括III-A(又稱Mtube和CASS6亞型)和III-B(又稱聚合酶-RAMP模塊)兩個亞型,兩種亞型都含有一種典型的多結構域Cas10蛋白[21]。III型CRISPR-CAS系統往往不編碼Cas1和Cas2,而是與I 型或者II型系統共用crRNA[22]。III-A亞型具有cas1、cas2和cas6基因,能夠靶向DNA[23];而大多數III-B亞型缺失這些基因,一般需要依賴同基因組的其它CRISPR-Cas系統,該亞型能夠靶向RNA[24]。Cas10蛋白是Ⅲ型系統效應物復合物上的大亞基。每種III型位點也編碼其他亞基的效應復合物,如小亞基基因、編碼Cas5和Cas7大家族RAMP蛋白的基因[25]。
考慮到CRISPR-Cas系統的快速演變,今后將會有更多類型被發掘出來,即使現有的分型系統,也不能涵蓋所有物種,如嗜酸氧化亞鐵硫桿菌Acidithiobacillus ferrooxidans ATCC 23270菌 株 的CRISPR-Cas系統便不能納入上述3種類型,有的分類系統將其歸入U型CRISPR-Cas系統[18]。該系統不含Cas1、Cas2蛋白,也無以上3種系統的任何特征。
1.4 嗜熱鏈球菌中的CRISPR-Cas
嗜熱鏈球菌是CRISPR-Cas II型系統常用的特征模型系統,其gRNA-Cas9復合體是一種傳統的CRISPR/Cas基因編輯工具,它能特異性地識別一個包含堿基配對區和PAM的DNA片段,并且可以誘導DNA雙鏈在目標位點斷裂。相關研究表明,嗜熱鏈球菌的CRISPR/Cas系統以5'-NNAGAA作為PAM識別序列[26]。長期的免疫過程讓嗜熱鏈球菌的CRISPR基因與相關功能單位實現了“進化”,同時CRISPR基因的多樣性也更加豐富。
嗜熱鏈球菌的CRISPR基因呈現多態性,按其基因位點的不同可分為4種類型,分別為CRISPR1、CRISPR2、CRISPR3及CRISPR4[27]。除CRISPR2的位點在cas基因的中部外,其它3種類型的CRISPR位點均分布在cas基因的下游[27],這在一定程度上,與CRISPR2是原始革蘭氏陽性菌基因的遺留部分有關。
不同CRISPR基因簇的堿基個數以及組成存在差異(圖1)。CRISPR1/Cas基因簇為8 037 bp,其中CRISPR1基因包含32個間隔子,長2 146 bp,這種多重復序列、多間隔子的特點有利于外源DNA片段的整合;CRISPR2/Cas基因簇總長8 628 bp,但CRISPR2基因僅包含3個間隔子,基因總長為258 bp,所含的Cas蛋白基因比重較大,這樣的結構不利于新間隔子的整合,使得CRISPR2/Cas發揮的作用相對較小;CRISPR3/Cas基因簇總長7 147 bp,CRISPR3基因包含12個間隔子,基因長度為827 bp;CRISPR4/Cas基因簇總長為7 343 bp,CRISPR4基因長762 bp,包含12個間隔子[27]。
上述4種類型CRISPR基因包含的重復序列大小及堿基構成各不相同(圖2):CRISPR1、CRISPR2和CRISPR3 3種基因的重復序列(分別以DR1、DR2、DR3表示)包含的堿基個數相同,但堿基排布各不相同,且均包含回文序列,可形成莖環狀的二級結構。DR1的堿基序列構成為GTTTTTGTACTCTCAAGATTTAAGTAACTGTACAAC(5'-3')[28],頭部為21個堿基形成的大環,莖區長6 bp,尾部長4和1 bp[29],如圖2-a所示;DR2的堿基為GATA TAAACCTAATTACCTCGAGAGGGGACGGAAAC(5'-3')[28],DR2環頭部僅由6個堿基組成,莖區長4 bp,很大一部分堿基集中在了尾部的游離區,分別長16和8 bp[29],如圖2-b所示;DR3序列為GTTTTAGA GCTGTGTTGTTTCGAATGGTTCCAAAAC(5'-3')[28],DR3呈典型的莖環結構,除頭部外,均形成了莖區,尾部沒有游離堿基[29]。與上述3種CRISPR基因不同,CRISPR4的重復序列DR4僅長28 bp,堿基排布為GGATCACCCCCGCGTGTGCGGGAAAAAC,其二級結構信息尚未有文獻報道。

圖1 S.thermophilus中不同CRISPR/Cas位點的結構[1,27]

圖2 不同類型CRISPR基因的重復序列及其二級結構[29]
在漫長的防御過程中,CRISPR基因與細菌質粒、病毒DNA等實現了“共進化”[30],研究表明,它們之間有部分同源性較高的序列[31]。CRISPR基因簇的3'末端(尾部末端)在不同菌株間呈現高同源性,而5'末端(前導末端)呈高變異性[28],這與外源DNA在前導序列之后插入密切相關。間隔子數量最多的CRISPR1基因呈現最高的多樣性,而僅有3個間隔子的CRISPR2最為保守。Horvath等[28]通過研究表示:CRISPR1是某些嗜熱鏈球菌特有的,CRISPR3在嗜熱鏈球菌CRISPR-Cas系統中的分布更為廣泛,而CRISPR2則可能由原始的革蘭氏陽性菌DNA退化而產生。
不同類型CRISPR基因簇中包含的cas基因也有一定的區別及相似性,這體現了CRISPR基因與Cas蛋白的聯系及功能上的協作。Cas蛋白能夠參與CRISPR的產生過程,如III型系統中內切酶樣的Cas蛋白涉及DNA的追蹤,因此噬菌體衍生的間隔子對嗜熱鏈球菌CRISPR結構有一定偏向性[30]。cas1和cas2基因在4種CRISPR / Cas基因座中的分布可能影響其在防御系統中的活性[32]。CRISPR1和CRISPR3的結構較為保守,它們的重復間隔區上游存在有4個cas基因;而CRISPR2基因簇的組成及結構差異性較大,cas基因則位于重復間隔區的兩側[28]。雖然CRISPR1和CRISPR3上cas基因的分布較為相似,但序列相似性低,即使是在蛋白質水平也僅有22%的相似度,僅有cas1是3種基因座之間唯一保守的基因[28]。
研究者利用人為改造過的gRNA-cas9復合體進行基因的靶向編輯,即CRISPRs技術,這一重大突破已成為繼ZFN(鋅指核酸酶)、TALEN(類轉錄激活因子效應物核酸酶)以后的第三代基因編輯技術。
2.1 CRISPRs基因編輯技術
基因定點編輯是一種針對生物基因組特定的靶位點構建序列特異性核酸酶,從而引導目標位點的DNA雙鏈斷裂(DNA double-strand breaks,DSB),隨后經生物體內源DNA斷裂修復系統實現斷裂DNA修復的技術。易錯非同源性末端連接(Nonhomologous end joining,NETJ)是一種有效的DNA損傷修復機制,但由易錯非同源性末端連接(NETJ)介導的DNA雙鏈斷裂(DBS)修復有時會伴有缺失突變,從而造成目標位點基因組信息的破環[9]。在Ⅱ型gRNA-cas9復合體的參與下,同源重組修復反應可以通過引入外源供體DNA作為修復模板產生敲入突變,從而緩解基因組破壞[9]。
ZFN、TALEN和CRISPR/Cas9 系統都可以通過設計目標位點對復雜的基因組實現定點編輯[16],ZFN和TALEN技術目前仍在廣泛使用,而新興的CRISPRs技術能夠基于細菌及古細菌中的CRISPRCAS系統,將生物自身的DNA識別、加工手段運用于突變的構建,較前者具有更大的優勢。
Ⅱ型系統的靶向切割復合物結構最為簡單,除tracrRNA、RNase Ⅲ外只需要Cas9一種蛋白的協助[33],因而成為應用最廣的CRISPR基因編輯技術。CRISPR/Cas9技術的主要工具為sgRNA-Cas9 復合體。Jinek等[34]發現,tracrRNA的5'端能夠與成熟crRNA的3'端部分配對形成莖環結構,這是識別靶DNA所必須的,他們將tracrRNA與crRNA表達為嵌合的向導RNA(gRNA)。此外,Cas9蛋白也是CRISPR/Cas9技術中必不可少的部分,Cas9蛋白(800-1,400個氨基酸)包含RuvC和HNH兩個核酸酶結構域[18],二者均能參與靶DNA的裂解[35]。此外,還具有α-螺旋組成的識別區(REC)以及位于C端的PAM結合位點[4]。Cas9蛋白的晶體結構解析顯示:Cas9具有雙葉結構[36],雙葉的兩環均貢獻一個PAM識別位點,因此靶DNA和sgRNA可結合于兩葉之間的接口處。Qi等[37]通過研究指出CRISPR/Cas9系統可以有效地沉默細菌基因,進而有效減少脫靶現象。sgRNA-Cas9 復合體除具有各自功能外,還能夠阻斷轉錄期間RNA聚合酶與DNA的結合[37],從而抑制細菌基因表達,破壞靶DNA穩定性。
CRISPRs技術主要運用于基因定點編輯,其中包括單基因及多基因敲除、精確突變、微缺失插入突變以及單基因的多重編輯。該技術在人、鼠等哺乳動物的基因編輯中應用最為廣泛,Mali等[38]將CRISPR/Cas9系統用于誘導人類多能干細胞的多重突變;Zhang等[39]將CRISPRs技術成功運用于小鼠ES細胞中大片段DNA的插入和敲除。Oh等[40]結合CRISPR-Cas9和重組技術,成功地把密碼子飽和誘變應用于羅伊氏乳桿菌當中,CRISPR-Cas9還可用于在低重組效率的細菌中鑒定重組細胞。此外,對CRISPR基因簇與Cas蛋白的研究還可為探究種屬間親緣關系及多樣性提供新的思路[29]。
CRISPRs基因編輯技術的操作程序主要包括以下幾步:首先通過測定轉化效率確定CRISPR-Cas自殺活性,接下來對轉座子進行誘變,誘變完成后通過CRISPR / Cas系統篩選自殺逃避型突變體,進而排除假陽性,然后運用PCR技術鑒定轉座子插入位點,通過“清除”缺失來驗證表型,最后補充轉導中缺失的片段,即可完成基因編輯[41]。
2.2 gRNA-Cas9進行基因編輯的影響因素
當前基于CRISPR-Cas系統的基因編輯主要依賴gRNA-Cas9,其主要受以下因素影響。
2.2.1 gRNA的選擇 gRNA的引導方式及其tracrRNA長度的設計是CRISPRs基因編輯技術的關鍵影響因素[42]。gRNA的引導方式有單獨引導和雙向引導兩種方式,單獨引導是將與靶DNA互補的crRNA與tracrRNA連接成為一條單鏈的引導RNA(single guide RNA,sgRNA)。相對于雙引導RNA(dual guide RNA),sgRNA不易引起Indel突變,編輯速度也比雙引導更快;其次,gRNA上tracrRNA序列的長度也是影響CRISPR系統作用的主要因素,多數研究將gRNA的大小設計為100 nt左右,gRNA 5'端20 nt的區域為DNA互補區、3'端70-80 nt的區域為tracrRNA序列,crRNA區則居于中間位置[42]。
gRNA-Cas9復合體的結合方式也會影響CRISPR/Cas9的作用效率。延伸gRNA上的Cas9結合區能夠增強Cas蛋白活性,進而提高編輯效率,主要方法有兩種:在gRNA3'端緊鄰tracrRNA的區域增加一段5 nt的核苷酸序列,或者于螺旋區增加4-10 bp的堿基對以增強crRNA與tracrRNA的結合[43]。
2.2.2 脫靶效應的顯著影響 脫靶效應與gRNA和Cas9蛋白的濃度及比例相關,降低gRNA的濃度可以降低脫靶率,但降低Cas9蛋白濃度在降低脫靶率的同時降低了正靶率[44]。鑒于gRNA及Cas9蛋白對脫靶效應的影響尚有爭議[44-46],我們可以從gRNA及Cas9的濃度比入手,選擇出最佳的gRNA/ Cas9比例,以降低脫靶率。sgRNA的結構對脫靶效應也有影響,可以通過對sgRNA進行截短、修飾來提高正靶/脫靶之比,如在5'端識別區之前加額外的GG堿基,或將gRNA的3'末端截短[47]。此外,有研究表明gRNA-Cas9復合體能夠耐受靶向序列5'端的突變[48,49]。再者,通過點突變使RuvC或HNH亞基失活,構建Cas9蛋白的突變體DNA切口酶(又稱dCas9,即deadCas9)亦能夠減少脫靶現象。該突變體能夠引起DNA單鏈斷裂(SSB),相比于DNA雙鏈斷裂,DNA單鏈斷裂能夠產生近距離切口,進而引起帶有黏性末端的DSB[45],提高打靶效率,同時能夠減輕脫靶的不利影響。張鋒等人的研究指出,減少mRNA的用量也能夠有效地抑制脫靶現象的發生[50]。
2.2.3 突變體位點的選擇 CRISPR/Cas9對靶點的識別需要PAM(NGG)和緊鄰PAM的11 bp種子序列完全保守,所以將突變位點設定在這14 bp之內可以防止突變引起的切割功能喪失[42]。錯配序列的出現會導致比較嚴重的脫靶現象,有研究表明,前半部分序列的單核苷酸錯配比后半部分的錯配具有更好的耐受性[43],因此對目標位點的合理選擇有望能夠使脫靶效應的不利影響最小化。
2.3 優勢
2.3.1 簡單易行的設計操作方法 CRISPR/Cas9系統的構造簡單,該技術對基因的編輯主要依靠一個sgRNA-Cas9 復合體,而無須太多輔助蛋白,編輯成本低,操作更加簡便。此外,CRISPR/Cas9識別域的構建相對簡單,想要改變靶DNA識別位點僅需要改變一小段20 bp大小的前導子序列[51],載體構建時間明顯縮短,大大減少了工作量。
2.3.2 高效率的編輯與更好的通用性 相比于ZFN、TALEN等基因編輯工具,CRISPR技術能夠更加高效地進行基因編輯。Ding等[42]分別用CRISPR、TALEN對人類多功能干細胞進行編輯,結果顯示CRISPR法的敲入克隆效率可達11%,而TALEN的效率僅有1.6%。CRISPR對靶DNA的特異性識別依賴于長度僅為2-5 bp的PAM序列[52],因此能夠識別更多的序列,擴大CRISPR的通用性。
2.3.3 更高的打靶特異性 利用CRISPR進行定點編輯更加精確。主要原因在于Cas9蛋白有RuvC和HNH兩個功能區,它們分別負責DNA兩條鏈的切割,還能利用任意一個功能區的突變將其改造為DNA切口酶,分別切割DNA的兩條鏈并產生黏性末端。D10A及H840雙突變dCas9更能夠成為一種高特異性的錨定蛋白[53,54]。
2.3.4 可實現同時對多個不同靶DNA序列的編輯CRISPR/Cas9技術更大的優勢在于它能夠用于同時編輯多個靶基因位點。“重復-間隔”的CRISPR基因座天然結構使其能夠同時插入多個新的外源DNA片段,從而實現多位點編輯。Chen等[55]利用CRISPR/Cas9對小鼠模型進行多個靶腫瘤基因的篩查,Zhang等則將多個引導序列編碼到單個CRISPR陣列中,以使其能夠同時編輯哺乳動物基因組內的多個位點[56]。
2.3.5 可運用于對真核生物基因的編輯修飾CRISPR-Cas系統雖來自于細菌和古細菌,卻能夠被廣泛應用于真核細胞的DNA突變中。這一應用的實現只需人為將Cas9蛋白轉運到哺乳動物細胞內。Cong和Zhang等[56]研究首次利用CRISPR/Cas9系統實現了對人293T細胞的EMX1和PVALB基因及小鼠Nero2A細胞的Th基因的定點突變,并指出需要在Cas9蛋白的兩端加上真核細胞的核定位號NLS,但也有研究指出只需在一端添加NLS即可實現Cas9的高效轉運[38]。
自21世紀初CRISPRs系統被發現以來,CRISPRs基因編輯技術飛速發展,已然成為第三代基因編輯工具,并造就了一批批科研奇跡。該技術的應用,涵蓋生物、農業、環境及醫學等多個領域。生物學領域中,它常作為構建突變體的重要手段,將為基因工程的進一步應用以及生物體的保護、研究提供更新、更廣的思路;農業領域中,在動植物的改造以及病原微生物的防治方面蘊藏著巨大的應用潛力;醫療領域中,CRISPRs不僅可以用于人類遺傳性疾病的治療,還可以用于疾病相關基因的篩查與檢測、幫助確定潛在藥靶,為某些疑難雜癥,如腫瘤、白血病等的治療尋求突破口。
但目前該技術的應用也存在著多方面的問題。脫靶效應是影響CRISPRs編輯效率的一個重要因素,如何有效地降低脫靶率是一個較為棘手的問題。其次,來源于細菌的CRISPRs系統是否會對人類以及現有的動植物產生危害或者引起排異現象?如何減少錯配現象的發生以及如何緩解突變位點的選擇限制對靶基因編輯的影響也是亟待解決的問題。未來的研究中,除了CRISPRs進一步應用外,我們必須從解決該編輯方法自身的問題入手,為CRISPRs的發展掃清障礙。
[1] Chylinski K, Makarova KS, Charpentier E, et al. Classification and evolution of type II CRISPR-Cas systems[J]. Nucleic Acids Research, 2014, 42(10):6091-6105.
[2] 朱金潔. CRISPR-Cas9介導的玉米基因組定點編輯研究[D]:北京:中國農業大學, 2015.
[3] Jiang W, Bikard D, Cox D, et al. RNA-guided editing of bacterial genomes using CRISPR-Cas systems[J]. Nature Biotechnology, 2013, 31(3):233-239.
[4] Nishimasu H, Ran FA, Hsu PD, et al. Crystal structure of Cas9 in complex with guide RNA and target DNA[J]. Cell, 2011, 156(5):935-949.
[5] Chang N, Sun C, Gao L, et al. Genome editing with RNA-guided Cas9 nuclease in Zebrafish embryos[J]. Cell Research, 2013, 23(4):465-472.
[6] Sturino JM, Joseph MS, Todd RK. Engineered bacteriophage-defence systems in bioprocessing[J]. Nature Reviews Microbiology, 2006, 4(5):395-404.
[7] Abedon ST. Bacterial ‘immunity’ against bacteriophages[J]. Bacteriophage, 2012, 2(1):50-54.
[8] 王立人. CRISPR/CAS系統介導的基因組大片段DNA編輯[D]:上海:華東師范大學, 2015.
[9] Bondy-Denomy J, Davidson AR. To acquire or resist:the complex biological effects of CRISPR-Cas systems[J]. Trends in Microbiology, 2014, 22(4):218-225.
[10] Kunin V, Sorek R, Hugenholtz P. Evolutionary conservation of sequence and secondary structures in CRISPR repeats[J]. Genome Biology, 2007, 8(4):61.
[11] van Embden JDA, van Gorkom T, Kremer K, et al. Genetic variation and evolutionary origin of the direct repeat locus of mycobacterium tuberculosis complex bacteria[J]. Journal of Bacteriology, 2000, 182(9):2393-2401.
[12] Demay C, Liens B, Burguière T, et al. SITVITWEB-A publicly available international multimarker database for studying Mycobacterium tuberculosis genetic diversity and molecular epidemiology[J]. Infection, Genetics and Evolution, 2012, 12(4):755-766.
[13] Zanden AGMVD, Kremer K, Schouls LM, et al. Improvement of differentiation and interpretability of spoligotyping for mycobacterium tuberculosis complex isolates by introduction of new spacer oligonucleotides[J]. Journal of Clinical Microbiology, 2002, 40(12):4628-4639.
[14] Lillest?l R, Redder P, Garrett RA, et al. A putative viral defence mechanism in archaeal cells[J]. Archaea, 2006, 2(1):59-72.
[15] Choi KR, Sang YL. CRISPR technologies for bacterial systems:current achievements and future directions[J]. Biotechnology Advances, 2016, 34(7):1180-1209.
[16] Li C, Cao W. Advances in CRISPR/Cas9-mediated gene editing[J]. Chinese Journal of Biotechnology, 2015, 31(11):7080-7081.
[17] Makarova KS, Haft DH, Barrangou R, et al. Evolution andclassification of the CRISPR-Cas systems[J]. Nature Reviews Microbiology, 2011, 9(6):467-477.
[18] Makarova KS. Unification of Cas protein families and a simple scenario for the origin and evolution of CRISPR-Cas systems[J]. Biology Direct, 2011, 6(1):38-38.
[19] Chylinski K, Le RA, Charpentier E. The tracrRNA and Cas9 families of type II CRISPR-Cas immunity systems[J]. RNA Biology, 2013, 10(5):726-737.
[20] Wei C, Liu J, Yu Z, et al. TALEN or Cas9 - rapid, efficient and specific choices for genome modifications[J]. Journal of Genetics and Genomics, 2013, 40(6):281-289.
[21] Anantharaman V, Iyer LM, Aravind L. Presence of a classical RRM-fold palm domain in Thg1-type 3'-5' nucleic acid polymerases and the origin of the GGDEF and CRISPR polymerase domains[J]. Biology Direct, 2010, 5(1):43.
[22] Nickel L, Weidenbach K, J?ger D, et al. Two CRISPR-Cas systems in Methanosarcina mazei strain G?1 display common processing features despite belonging to different types I and III[J]. RNA Biology, 2013, 10(5):779-791.
[23] Marraffini LA, Sontheimer EJ. CRISPR interference limits horizontal gene transfer in Staphylococci by targeting DNA[J]. Science, 2008, 322(322):1843-1845.
[24] Hale CR, Majumdar S, Elmore J, et al. Essential features and rational design of CRISPR RNAs that function with the Cas RAMP module complex to cleave RNAs[J]. Molecular Cell, 2012, 45(3):292-302.
[25] Makarova KS, Koonin EV. Annotation and classification of CRISPR-Cas systems[J]. Methods in Molecular Biology(Clifton, NJ), 2015, 1311:47-75.
[26] Fujii W, Kakuta S, Yoshioka S, et al. Zygote-mediated generation of genome-modified mice using Streptococcus thermophilus 1 -derived CRISPR/Cas system[J]. Biochemical & Biophysical Research Communications, 2016, 477(3):473-476.
[27] Wu Q, Tun HM, Leung FC, et al. Genomic insights into high exopolysaccharide-producing dairy starter bacterium Streptococcus thermophilus ASCC 1275[J]. Scientific Reports, 2014, 4(7500):4974.
[28] Horvath P, Romero DA, Co?témonvoisin AC, et al. Diversity, activity, and evolution of CRISPR loci in Streptococcus thermophilus[J]. Journal of Bacteriology, 2008, 190(4):1401-1412.
[29] 鄧凱波, 霍貴成. 嗜熱鏈球菌中CRISPR序列的檢測與同源性分析[J]. 食品科學, 2013, 34(3):153-157.
[30] Bolotin A, Quinquis B, Sorokin A, et al. Clustered regularly interspaced short palindrome repeats(CRISPRs)have spacers of extrachromosomal origin[J]. Microbiology, 2005, 151(Pt 8):2551-2561.
[31] Mojica FJ, Díezvillase?or C, Garcíamartínez J, et al. Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements[J]. Journal of Molecular Evolution, 2005, 60(2):174-182.
[32] Goh YJ, Goin C, O’Flaherty S, et al. Specialized adaptation of a lactic acid bacterium to the milk environment:the comparative genomics of Streptococcus thermophilus LMD-9[J]. Microbial Cell Factories, 2011, 10 Suppl 1(1):S22.
[33] Brouns SJ, Jore MM, Lundgren M, et al. Small CRISPR RNAs guide antiviral defense in prokaryotes[J]. Science, 2008, 321(5891):960-964.
[34] Jinek M, Chylinski K, Fonfara I, et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity[J]. Science, 2012, 337(6096):81.
[35] Sapranauskas R, Gasiunas G, Fremaux C, et al. The Streptococcus thermophilus CRISPR/Cas system provides immunity in Escherichia coli[J]. Nucleic Acids Research, 2011, 39(21):9275-9282.
[36] Jinek M, Jiang F, Taylor DW, et al. Structures of Cas9 endonucleases reveal RNA-mediated conformational activation[J]. Science, 2014, 343(6176):124799.
[37] Qi LS, Larson MH, Gilbert LA, et al. Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression[J]. Cell, 2013, 152(5):1173-1183.
[38] Mali P, Yang L, Esvelt KM, Aach J, Guell M, Dicarlo JE, Norville JE, Church GM. 2013. RNA-guided human genome engineering via Cas9. Science 339:823-826.
[39] Zhang L, Jia R, Palange NJ, et al. Large genomic fragment deletions and insertions in mouse using CRISPR/Cas9[J]. PLoS One, 2015, 10(3):e0120396.
[40] Oh JH, van Pijkeren JP. CRISPR-Cas9-assisted recombineering in Lactobacillus reuteri. [J]. Nucleic Acids Research, 2014, 42(17):e131.
[41] Yosef I, Goren MG, Edgar R, et al. Using the CRISPR-Cas systemto positively select mutants in genes essential for its function[J]. Methods in Molecular Biology, 2015, 1311:233-250.
[42] Ding Q, Regan SN, Xia Y, et al. Enhanced efficiency of human pluripotent stem cell genome editing through replacing TALENs with CRISPRs[J]. Cell Stem Cell, 2013, 12(4):393-394.
[43] Jinek M, East A, Cheng A, et al. RNA-programmed genome editing in human cells[J]. Elife, 2013, 2(2):e00471.
[44] Pattanayak V, Lin S, Guilinger JP, et al. High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9 nuclease specificity[J]. Nature Biotechnology, 2013, 31(9):839-843.
[45] Sander JD, Joung JK. CRISPR-Cas systems for editing, regulating and targeting genomes[J]. Nature Biotechnology, 2014, 32(4):347-355.
[46] Fu Y, Foden JA, Khayter C, et al. High frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells[J]. NatureBiotechnology, 2013, 31(9):822-826.
[47] Cho SW, Kim S, Kim Y, et al. Analysis of off-target effects of CRISPR/Cas-derived RNA-guided endonucleases and nickases[J]. Genome Research, 2014, 24(1):377-389.
[48] Semenova E, Severinov K. Interference by clustered regularly interspaced short palindromic repeat(CRISPR)RNA is governed by a seed sequence[J]. Proceedings of the National Academy of Sciences of the United States of America, 2011, 108(25):10098-10103.
[49] Cradick TJ, Fine EJ, Antico CJ, et al. CRISPR/Cas9 systems targeting β-globin and CCR5 genes have substantial off-target activity[J]. Nucleic Acids Research, 2013, 41(20):9584-9592.
[50] Zhang F. CRISPR/Cas9 for genome editing:progress, implications and challenges[J]. Human Molecular Genetics, 2014, 24(R6):40-48.
[51] Gupta RM, Musunuru K. Expanding the genetic editing tool kit:ZFNs, TALENs, and CRISPR-Cas9[J]. The Journal of Clinical Investigation, 2014, 124(10):4154-4161.
[52] Shah SA, Shah SA, Erdmann S, et al. Protospacer recognition motifs:mixed identities and functional diversity[J]. RNA Biology, 2013, 10(5):891-899.
[53] Guilinger JP, Thompson DB, Liu DR. Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification[J]. Nature Biotechnology, 2014, 32(6):577-582.
[54] Tsai SQ, Wyvekens N, Khayter C, et al. Dimeric CRISPR RNA-guided FokI nucleases for highly specific genome editing[J]. Nature Biotechnology, 2014, 32(6):569-576.
[55] Chen S, Sanjana Neville E, Zheng K, et al. Genome-wide CRISPR screen in a mouse model of tumor growth and metastasis[J]. Cell, 2015, 160(6):1246-1260.
[56] Cong L, Ran FA, Cox D, et al. Multiplex genome engineering using CRISPR/Cas systems[J]. Science, 2013, 339(6121):819-823.
(責任編輯 狄艷紅)
Advances in Gene Editing via Clustered Regularly Interspaced Short Palindromic Repeats
HAO Meng-yuan1QU Xiao-jun2CUI Yan-hua1
(1. School of Chemistry and Chemical Engineering,Harbin Institute of Technology,Harbin 150090;2. Institute of Microbiology,Heilongjiang Academy of Sciences,Harbin 150010)
CRISPR is a piece of clustered short-interspaced palindromic non-coding sequences,in which the invasive foreign DNA can be memorized by integrating new spacer sequences. However,Cas protein is responsible for supporting CRISPR transcription products---crRNA(CRISPR RNA)to splice foreign DNA. CRISPR-Cas system,based on the cooperation of the two segments,plays a role in resisting exogenous DNA infection. So far,CRISPR-Cas system attracts the attention from whole scientific community rapidly relying on its unique advantages,such as high efficiency,convenience,low cost and high specificity. This review summarizes the composition,structure and type of CRISPR-Cas system as well as the mechanism and advantages of CRISPR technology. Moreover,taking Streptococcus thermophilus as an example,the base arrangement and advanced structure of the CRISPR gene are also presented in order to provide references for the scientific research in molecular biology and related fields.
CRISPR-Cas system;gene editing;Streptococcus thermophilus;gRNA-Cas9 complex
10.13560/j.cnki.biotech.bull.1985.2016-1085
2016-11-28
郝夢圓,女,碩士研究生:研究方向:分子微生物學;E-mail:myhao1995@163.com
崔艷華,女,博士,教授,研究方向:分子微生物學;E-mail:yhcui@hit.edu.cn