楊帥朋 屈子嘯 朱向星 唐冬生,
(1. 佛山科學(xué)技術(shù)學(xué)院生命科學(xué)與工程學(xué)院 廣東省動物分子設(shè)計與精準(zhǔn)育種重點實驗室,佛山 528225; 2. 佛山科學(xué)技術(shù)學(xué)院醫(yī)學(xué)院 廣東省基因編輯工程技術(shù)研究中心,佛山 528225)
基因編輯技術(shù)被譽為21世紀(jì)生命科學(xué)領(lǐng)域最具有突破性和革命性的生物技術(shù)之一。它能夠?qū)δ繕?biāo)染色體序列或目的基因進(jìn)行定點重組、敲除、插入或替換,從而影響基因的自然表達(dá),以達(dá)到研究基因功能的目的[1]。自基因編輯技術(shù)誕生以來,就被迅速運用于基因功能探索、動植物遺傳改良和疾病治療,極大推動了生命科學(xué)及其相關(guān)學(xué)科的發(fā)展。基因編輯首次報道于1971年,Danna團隊成功使用流感嗜血桿菌核酸內(nèi)切酶(endonuclease)R切割SV40的DNA[2],自此之后,越來越多的工具酶相繼被開發(fā)并應(yīng)用。其中應(yīng)用最廣泛的有1996年開發(fā)的第1代鋅指核酸酶(zinc finger nucleases,ZFN)基因編輯技術(shù)[3];2010創(chuàng)建的第2代類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(transcription activator-like effector nucleases, TALEN)基因編輯技術(shù)[4];2012年問世的第3代由成簇的規(guī)則間隔短回文重復(fù)系列(clustered regularly interspaced short palindromic repeat,CRISPR)及CRISPR相關(guān)核酸酶蛋白(CRISPR-associated protein, Cas)組成的新型基因編輯器[5]。三代基因編輯器同時存在負(fù)責(zé)識別特定序列的識別域和負(fù)責(zé)切割DNA序列的切割域。在ZFN系統(tǒng)中,由鋅指蛋白負(fù)責(zé)識別、Fok I核酸內(nèi)切酶負(fù)責(zé)切割[6];TALEN系統(tǒng)中則是由轉(zhuǎn)錄激活因子類效應(yīng)因子(transcription activator-like effector, TALE)作為識別模塊,F(xiàn)ok I酶作為切割模塊[7];CRISPR/Cas系統(tǒng)則包含了負(fù)責(zé)識別的crRNA(CRISPRRNA)和負(fù)責(zé)切割的效應(yīng)蛋白內(nèi)切酶Cas兩部分[8]。伴隨著技術(shù)的發(fā)展迭代,科技的進(jìn)步,以CRISPR/Cas9為代表的第3代基因編輯器因其技術(shù)門檻低、操作便利、載體構(gòu)建簡單、編輯效率高和成本低廉等特點受到了廣大科學(xué)家們的青睞,成為目前使用最為廣泛的基因編輯技術(shù)[9-10]。
前三代基因編輯工具均是在識別結(jié)構(gòu)特異性基因組DNA序列后,由切合蛋白負(fù)責(zé)切割靶向基因組DNA,使靶點序列處產(chǎn)生雙鏈斷裂(double-stranded break, DSB),誘發(fā)生物體內(nèi)源修復(fù)途徑,包括非同源末端連接(non-homologous end joining, NHEJ)和同源重組(homologous recombination, HR),從而實現(xiàn)靶點的定點敲除、替換、插入等精準(zhǔn)修飾[11-12]。其中NHEJ途徑是主要的修復(fù)途徑,該途徑優(yōu)缺點十分鮮明,修復(fù)迅速但錯誤率高,常常會在靶點附近引入少量堿基的插入或缺失(insertions and deletions, Indels),從而對基因原有功能造成不可逆的破壞。HR具有更高的修復(fù)精準(zhǔn)性,但是操作復(fù)雜且局限性大。主要是因為HR途徑需要人為插入與目標(biāo)靶基因同源的DNA序列,而且該過程主要發(fā)生在細(xì)胞復(fù)制間期的S期和G2期[13]。雖然HR途徑可以解決大部分生活生產(chǎn)和研究中遇到的基因修飾問題,但在基因編輯過程中,不能保證僅僅發(fā)生HR修復(fù),因此,就會引入不必要的Indels影響基因的正常功能。而且,如何將供體有效的送往細(xì)胞體也是另一個亟需解決的難題,因此,基因編輯技術(shù)在日常生產(chǎn)研究中受到一定制約[11-12,14]。
然而,大多數(shù)人類遺傳疾病的發(fā)生和動植物性狀的改變均是由單核苷酸變異產(chǎn)生的[15-16],且依賴DSB途徑的傳統(tǒng)基因編輯技術(shù)易引入Indels,產(chǎn)生不可預(yù)測的基因突變,因此,傳統(tǒng)基因編輯器不是疾病治療或動植物遺傳育種資源開發(fā)的理想工具。科學(xué)家們迫切需要開發(fā)出一種新的能夠精準(zhǔn)高效完成堿基替換的基因編輯系統(tǒng)。2016年,哈佛大學(xué)的David Liu團隊將理想變成了現(xiàn)實,他們將大鼠(rattus norvegicus)的胞嘧啶脫氨酶(APOBEC1)、具有單鏈切割活性的nCas9(Cas9 nickase)蛋白和具有抑制DNA修復(fù)功能的尿嘧啶糖基化酶抑制子(uracil DNA glycosylase inhibitor, UGI)組合,成功開發(fā)出了第一代單堿基編輯器BE3(base editor 3),BE3的問世,正式拉開了單堿基編輯技術(shù)的序幕[17]。截至目前,科學(xué)家們相繼開發(fā)出了多種DNA單堿基編輯器,極大地豐富了堿基編輯器家族成員,主要包括能夠?qū)崿F(xiàn)C T堿基和G A堿基變換的胞嘧啶堿基編輯器(cytosine base editor, CBE)[17];能夠轉(zhuǎn)換A T堿基為G C堿基的腺嘌呤堿基編輯器(adenine base editor, ABE)[18-19];C G或C A堿基之間顛換的糖基化酶堿基編輯器(glycosylase base editor, GBE)[20];能夠?qū)崿F(xiàn)A到C或T顛換的腺嘌呤堿基顛換編輯器(adenine transversion base editor, AYBE)[21];能夠同時實現(xiàn)C T堿基、G A堿基突變和A G堿基、T C堿基突變的雙堿基編輯器(dual base editor,DBE)[22-25];能夠?qū)崿F(xiàn)所有堿基間相互轉(zhuǎn)換的引導(dǎo)編輯器(prime editor, PE)[26](圖1)。

圖1 堿基編輯器工作原理示意圖Fig. 1 Mechanisms of base editor systems
堿基編輯器的核心元件是由已經(jīng)失去切割活性的或只有單鏈切割活性的Cas蛋白和作用于單鏈DNA(single-stranded DNA,ssDNA)的工具酶組成。該系統(tǒng)由sgRNA(guide RNA)引導(dǎo)定位,在不引入DSB、無需供體DNA參與的情況下,通過工具酶的酶促反應(yīng),借助生物體內(nèi)DNA光修復(fù)和復(fù)制機制,從而實現(xiàn)對目標(biāo)靶點的精確修飾。與傳統(tǒng)基因編輯相比,堿基編輯技術(shù)有以下優(yōu)點:(1)能夠有效避免引入Indels,從而減少細(xì)胞毒性,減少細(xì)胞紊亂發(fā)生幾率。科研工作者們也不需要花費過量的時間和精力尋找解決Indels的危害。(2)無需供體DNA參與。因此,節(jié)約了大量設(shè)計供體DNA的時間和減少了投遞供體DNA的難度。(3)技術(shù)門檻低。堿基編輯器同時兼具安全高效和普適性的特點,因此自進(jìn)入大眾視野以來便被迅速而廣泛地應(yīng)用于各領(lǐng)域[27](表1)。也因此,堿基編輯技術(shù)入選Science雜志2017年度十大科學(xué)突破之一(http://vis.sciencemag.org/breakthrough2017/)。

表1 各種堿基編輯器的特點Table 1 Characteristics of each base editor
2.1.1 CBE的建立 堿基編輯器起源于CRISPR/Cas9系統(tǒng),是更加精準(zhǔn)和精細(xì)的新型基因編輯系統(tǒng)。由于CRISPR/Cas9工作時需要引入Indels,導(dǎo)致基因組較大片段的改變,如易位或刪除[55-56]或是激活細(xì)胞內(nèi)p53通路[57]。為了避免Indels的引入,哈佛大學(xué)David Liu團隊開創(chuàng)性的把改造后的喪失核酸酶功能的Cas9蛋白和僅作用于單鏈DNA的rAPOBEC1融合,首次構(gòu)建出了第一代胞嘧啶堿基編輯器BE1,BE1的編輯活性窗口位于PAM(NGG)區(qū)域上游第13-17位堿基之間約5 nt的區(qū)域[17]。BE1的工作原理是在sgRNA引導(dǎo)下,當(dāng)編輯器結(jié)合到目標(biāo)靶點時,編輯窗口內(nèi)的胞嘧啶(C)在rAPOBEC1作用下被水解脫氨形成尿嘧啶(U),在DNA的復(fù)制和修復(fù)過程中U被認(rèn)為是胸腺嘧啶(T),在互補鏈中相應(yīng)位置的鳥嘌呤(G)會被替換成腺嘌呤(A),再經(jīng)過一輪復(fù)制,改變后的A與T互補配對。結(jié)果是原先DNA中的C被T取代,G被A取代,實現(xiàn)了C G堿基對被T A堿基對取代。隨著該團隊在糾正人類細(xì)胞疾病相關(guān)突變測試時發(fā)現(xiàn),BE1在細(xì)胞中編輯效率僅為0.8%-7.7%,與體外實驗相比,效率降低了5-36倍。推測可能的原因是體內(nèi)尿嘧啶DNA糖基化酶(uracil DNA glycosylase, UDG)進(jìn)行的切除修復(fù)(base-excision repair, BER)造成的,遂該團隊把枯草芽孢桿菌噬菌體的尿嘧啶DNA糖基化酶抑制蛋白(uracil DNA glycosylase inhibitor, UGI)嵌入到BE1的3'末端,成功研發(fā)出第2代堿基編輯器BE2,在相同位點的測試中表明,BE2的平均編輯效率約為20%,是BE1的3倍。隨后的數(shù)據(jù)還顯示,BE1和BE2系統(tǒng)的Indels形成率不到0.1%。為了克服真核生物的錯配修復(fù)機制(mismatch repair, MMR),提高編輯效率,該團隊恢復(fù)了BE2中Cas9 蛋白HNH結(jié)構(gòu)域840位置處的催化His殘基,從而產(chǎn)生了第3代堿基編輯器BE3。相比于BE2,BE3在人類細(xì)胞中的編輯效率提高了2-6倍,約為37% C T(G A)得到轉(zhuǎn)換。
幾乎同時,日本神戶大學(xué)的Nishida團隊也開發(fā)出了一種類似于BE系統(tǒng)的堿基編輯器,研究人員稱之為Target-AID,經(jīng)測試,Target-AID系統(tǒng)能夠在酵母細(xì)胞和哺乳動物細(xì)胞中實現(xiàn)有效的基因定點替換[29]。Target-AID與BE3有所不同的是,Target-AID則是采用了七鰓鰻的胞嘧啶脫氨酶,而且UGI和脫氨酶(PmCDA1)均連接在dCas9或nCas9的3'末端。且該系統(tǒng)擁有較低的細(xì)胞毒性但是編輯窗口略顯狹小。
2016年,3篇基于融合人類胞嘧啶脫氨酶hAID的堿基編輯器創(chuàng)立成功的消息先后被發(fā)表[30-32]。分別是中國科學(xué)院上海生命科學(xué)研究院常興團隊開發(fā)的TAM系統(tǒng)(Targeted AID-mediated mutagenesis)[30]、美國斯坦福大學(xué)Michael C Bassik團隊開發(fā)的CRISPR-X系統(tǒng)[31]以及美國哈佛大學(xué)George M Church團隊開發(fā)的與基因編輯技術(shù)融合的堿基編輯器[32]。TAM系統(tǒng)[30]融合了dCas9及UGI,在sgRNA的指引下就可以完成大范圍基因編輯;CRISPR-X系統(tǒng)[31]僅融合了dCas9,并沒有融合UGI,CRISPR-X系統(tǒng)是通過MS2招募hAID脫氨酶,通過創(chuàng)建基因組多位點定點突變文庫的方式可以同時靶向基因組的多個位點,完成基因組多位點的定點突變,且存在較少的脫靶現(xiàn)象。TAM系統(tǒng)和CRISPR-X系統(tǒng)在結(jié)合多組sgRNA的條件下,可在哺乳動物細(xì)胞中實現(xiàn)較大范圍(編輯范圍可以達(dá)到100 nt)以及較多類型的堿基替換。George M Church團隊開發(fā)的堿基編輯器是將前兩代基因編輯器和單堿基編輯器融合[32]。將ZFN或TALEN的特異性識別單元與hAID脫氨酶融合,構(gòu)建了全新的堿基編輯器。與融和了Cas9蛋白變體的堿基編輯器相比,George M Church開發(fā)的堿基編輯器則不受PAM序列的限制,但在大腸肝菌及人類細(xì)胞測試中發(fā)現(xiàn)編輯效率普遍不高(大腸桿菌中13%,人類細(xì)胞中2.5%),推測形成這種現(xiàn)象的原因可能是因為ZFN或者TALEN與DNA結(jié)合后無法形成ssDNA,仍然保持雙鏈DNA(double-stranded DNA, dsDNA)的形式,無法形成足夠數(shù)量的可用于hAID脫氨酶催化反應(yīng)的底物,因此該系統(tǒng)的編輯效率不高。
2.1.2 CBE的優(yōu)化 CBE系統(tǒng)的優(yōu)化和改進(jìn)的目標(biāo)主要涉及6個方面:(1)提高目標(biāo)產(chǎn)物純度,降低陰性產(chǎn)物的濃度;(2)進(jìn)一步提高CBE的表達(dá)效率;(3)擴大或縮小可編輯窗口的范圍,提高編輯的精準(zhǔn)度;(4)進(jìn)一步提高編輯可編輯窗口的效率;(5)降低堿基系統(tǒng)的脫靶效應(yīng);(6)降低堿基系統(tǒng)對背景序列的依賴性。
2.1.2.1 提高目標(biāo)產(chǎn)物純度 眾多研究結(jié)果表明,CBE系統(tǒng)編輯產(chǎn)物中含有其他雜質(zhì),產(chǎn)生的原因主要有:(1)CBE除了將C轉(zhuǎn)換為T之外,有一定幾率將C突變?yōu)镚或A[11]。這是因為在UDG作用下,中間體U被切除,暫時形成無嘧啶位點(apyrimidinic site, AP),在經(jīng)過DNA修復(fù)機制及復(fù)制作用后,有一定的幾率將該位點引入其他堿基,導(dǎo)致原始C突變?yōu)槠渌麎A基;(2)在CBE行使功能過程中,會產(chǎn)生少量的Indels[11,17]。原因是編輯過程中產(chǎn)生的AP位點經(jīng)AP裂解酶作用或自發(fā)斷裂形成缺口,而在nCas9蛋白切割時,非編輯鏈上也存在一個缺口,兩個缺口正好可形成一個DSB,經(jīng)過NHEJ修復(fù)途徑后即產(chǎn)生了Indels。
通過增加UGI的拷貝數(shù)、添加游離的UGI分子或優(yōu)化胞嘧啶脫氨酶,是降低編輯副產(chǎn)物的有效手段。David Liu團隊構(gòu)建的BE4在BE3系統(tǒng)的Cas9的C端多融合了一份UGI拷貝,大幅度提高了C轉(zhuǎn)換效率(約0.5倍),且副產(chǎn)物的比例顯著降低[33]。隨后,David Liu團隊又在BE4的基礎(chǔ)上融合了DSB末端保護(hù)蛋白Gam,成功構(gòu)建了BE4Gam,進(jìn)一步大幅度降低了Indels發(fā)生頻率(約2.1倍)[33]。基于同樣的策略,Wang等[34]的增強型堿基編輯器(enhanced base editor, eBE)是將BE3系統(tǒng)與游離的UGI分子組合,在有效降低副產(chǎn)物的同時提高了BE3的編輯準(zhǔn)確度。Geheke等[35]在人類胞嘧啶脫氨酶hAPOBEC3A的基礎(chǔ)上改造出了eA3A-BE3,該系統(tǒng)縮小了可編輯窗口,從而減少了旁觀者效應(yīng)。
2.1.2.2 提高編輯活性 研究發(fā)現(xiàn),堿基編輯器的活力水平是影響編輯效率的重要因素之一。在編輯器中,通過優(yōu)化堿基編輯器的表達(dá)原件或者引入其他功能性原件,是提高編輯活性的有效策略。Koblan等[19]通過在BE4的rAPOBEC1-Cas9的N端和C端添加核定位信號構(gòu)建和優(yōu)化密碼子序列,先后構(gòu)建了新系統(tǒng)BE4max和AncBE4max,在測試對先天性1f型糖基化障礙疾病治療研究時發(fā)現(xiàn),AncBE4max校正效率為BE4的2倍。通過變換NLS位置和數(shù)量,結(jié)合優(yōu)化nCas9密碼子序列的策略,構(gòu)建了FNLSBE3系統(tǒng),與BE3系統(tǒng)相比,在哺乳動物細(xì)胞的編輯效率平均提高了15倍[36]。Zhang等[37]在Cas9蛋白和脫氨酶之間嵌入了Rad51非序列特異性單鏈DNA結(jié)合結(jié)構(gòu)域,從而得到了編輯活性顯著提高、編輯窗口更寬的hyBE4max和hyA3A-BE4max系統(tǒng)。
2.1.2.3 擴大或縮小編輯窗口 不同類型堿基編輯器有不同的編輯窗口,不同的研究目的需要選擇不同的編輯靶點,這是精準(zhǔn)醫(yī)療和育種所要求的。通過尋找新的胞嘧啶脫氨酶或者改造現(xiàn)有的脫氨酶,獲得不同的脫氨酶變體是達(dá)到改變編輯窗口的有效策略。Kim等[38]突變了脫氨酶關(guān)鍵位點,構(gòu)建了CBE系統(tǒng)變體 YE1-BE3、YE2-BE3、YEE-BE3和EE-BE3,成功將BE3的編輯窗口從5 nt縮小至1-2 nt,但對靶點位點的編輯效率有所降低。David Liu團隊使用循環(huán)置換Cas9變體構(gòu)建而成的CP-CBEmax將編輯窗口從4-5 nt覆蓋到8-9 nt,同時減少了副產(chǎn)物的生成[39]。Nishida的Target-AID系統(tǒng)[29]編輯窗口則為3-5 nt堿基。常興[30]的TAM系統(tǒng)和Michael C Bassik的CRISPR-X系統(tǒng)[31]在融合多組sgRNA的情況下,在哺乳動物細(xì)胞中可以實現(xiàn)高達(dá)100 nt以及較多類型的堿基編輯。
2.1.2.4 拓寬PAM序列范圍 堿基編輯器多是融合SpCas9蛋白,因此只能識別NGG形式的PAM序列。為此,科學(xué)家們需要尋找出新的SpCas9蛋白替代蛋白或同功能變體,通過識別不同特異性序列的蛋白體識別不同PAM序列,從而達(dá)到解除CBE系統(tǒng)在應(yīng)用過程中被PAM序列限制的目的。David Liu實驗室用Cas9蛋白的不同變體先后創(chuàng)建出了能夠識別不同PAM序列的編輯器[38]。分別為NNGRRT形式的SaBE3、NGA形式的SpVQR-Cas9、NGAG形式的SpEQR-Cas9、NGCG形式的SpVRER-Cas9、NNNRRT形式的SaKKH-Cas9以及可以同時識別多種PAM序列形式(NG、GAA和GAT)的xCas9,相比于只能識別NGG序列的SpCas9,xCas9的應(yīng)用范圍更加廣泛[58]。Nishimasu等[40]也構(gòu)建出了能夠識別NG形式的SpCas9-NG。Li等[41]則是構(gòu)建了特異性識別PAM序列TTTV的dCpf1-BE(Cas12a),并且dCpf1-BE可以在pCas9-BE不能編輯的AT富集(AT-rich)區(qū)域編輯,填補了spCas9-BE僅能在GC富集(GC-rich)區(qū)域?qū)崿F(xiàn)編輯的不足。賴良學(xué)團隊將LbCas12a與高活性的脫氨酶結(jié)合,構(gòu)建出了可以識別具有NTTN、TYCN和TRTN形式PAM的編輯系統(tǒng)(enCas12a-、RR-和RVR-A3A-Y130F)[42]。
2.1.2.5 降低堿基系統(tǒng)的脫靶效應(yīng) 2019年,CBE系統(tǒng)在全基因組中的脫靶問題相繼被報道[59-60],其安全問題進(jìn)入了大眾的視野。但是在此之前,科學(xué)家們就已經(jīng)陸續(xù)發(fā)現(xiàn)CBE系統(tǒng)存在輕微的脫靶現(xiàn)象,并對此展開了研究[61-62]。2017年,David Liu實驗室將Cas9蛋白的突變體HF1-Cas9與BE3融合,成功地構(gòu)建出高保真型BE3系統(tǒng)(High-fidelity BE3,HF-BE3),HF-BE3可明顯降低BE3系統(tǒng)對非靶標(biāo)位點的活性,提高序列編輯的特異性[43]。Lee等[63]在大腸桿菌埃希菌株中通過改造和篩選,成功篩選出了具有高特異性的Sniper-Cas9蛋白,有效地降低了脫靶現(xiàn)象。Wang等[44]結(jié)合胞嘧啶脫氨酶的抑制序列結(jié)構(gòu)域(deoxycytidine deaminase inhibitor,dCDI)開發(fā)的堿基編輯器tBEs可以對非靶標(biāo)位點進(jìn)行鎖定,僅僅在靶點位置保持開放,從而降低了Cas9/sgRNA依賴性和非依賴性脫靶效應(yīng)。同時,該團隊還表示,tBE系統(tǒng)在小鼠體內(nèi)沒有檢測到全基因組和全轉(zhuǎn)錄組的脫靶效應(yīng)。
2.1.2.6 降低序列背景依賴性 融合rAPOBEC1的BE3對TC序列編輯效率較高,但是對GC序列基本沒有編輯效率[17];而融合了hAID、PmCDA1和hA3A系統(tǒng)則可對富含GC的序列進(jìn)行有效編輯[33,64-65],且hA3A系統(tǒng)還能有效的應(yīng)對高甲基化區(qū)域,這是其他編輯器不能做到的[66]。直到2018年,Li等[41]構(gòu)建的dCpf1-BE(Cas12a)系統(tǒng)對其他編輯器做了有效的補充,該系統(tǒng)可以在AT富集(AT-rich)PAM序列區(qū)域?qū)崿F(xiàn)有效的編輯。
2.2.1 ABE的建立 人類致病性的SNPs并非全部由T變異成C引起的,CBE堿基編輯器雖然可以實現(xiàn)C T(G A)堿基轉(zhuǎn)換,但CBE系統(tǒng)僅能糾正部分變異,遠(yuǎn)遠(yuǎn)達(dá)不到糾正人類疾病的需求。因此科學(xué)家們迫切需要拓展出新的編輯器家族成員。基于與CBE系統(tǒng)同樣的原理,David Liu實驗室在2017年開發(fā)了可以實現(xiàn)A G(T C)轉(zhuǎn)換的ABE堿基編輯器,ABE系統(tǒng)打破了編輯器只能編輯C或G的限制,從而擴大了堿基編輯的應(yīng)用范圍[18]。ABE系統(tǒng)的作用原理與CBE系統(tǒng)相似,在DNA復(fù)制過程中,腺嘌呤脫氨酶將靶位點處的腺嘌呤(A)經(jīng)脫氨反應(yīng)轉(zhuǎn)變?yōu)榧≤眨↖),肌苷在DNA復(fù)制時會被錯誤當(dāng)作鳥嘌呤(G)進(jìn)行讀碼,因此,肌苷與鳥嘌呤互補的胞嘧啶(C)結(jié)合形成C-I堿基對,再經(jīng)過一輪DNA復(fù)制,部分形成C-G堿基對,最終實現(xiàn)A-G的改變。ABE的開發(fā)并沒有CBE系統(tǒng)那么一帆風(fēng)順,起初,David Liu實驗室分別運用自然界中的大腸桿菌TadA、大鼠ADA、人類ADAR2和人類ADAT2四種腺嘌呤脫氨酶直接與nCas9融合,但幾乎沒有編輯活性[18]。這表明自然界中的腺嘌呤脫氨酶不能直接融合于堿基編輯器中。遂該團隊決定采用將現(xiàn)有腺嘌呤脫氨酶改造的策略,以解除腺嘌呤脫氨酶在連接成單鏈或雙鏈DNA時不能脫氨的限制。科學(xué)家們發(fā)現(xiàn)大腸桿菌埃希菌株的RNA腺苷脫氨酶TadA能夠作用于多核苷酸且不需要額外的激活程序,遂以TadA作為改造對象對其進(jìn)行人工隨機改造。將隨機突變的TadA序列與dCas9蛋白融合,構(gòu)建成隨機突變文庫,再結(jié)合易錯PCR、DNA重組等定向進(jìn)化策略,再通過相應(yīng)的抗生素篩選和測試,先后共經(jīng)過7輪的改造和篩選,最終成功改造出了能直接作用于ssDNA的ABE7.10系統(tǒng)。在哺育動物細(xì)胞測試中,A G(T C)的平均編輯效率顯著提高,由最初的3%提高到了58%,提高了約19倍,編輯活性窗口可覆蓋sgRNA的第4-9位[18]。
2.2.2 ABE的優(yōu)化 研究表明,自然界中缺乏可以直接起作用的腺嘌呤脫氨酶,因此,ABE系統(tǒng)的優(yōu)化相對于CBE系統(tǒng)比較局限,其優(yōu)化策略主要是建立在TadA7.10的基礎(chǔ)上。又由于研究人員發(fā)現(xiàn)ABE系統(tǒng)無論是在編輯哺乳動物或者植物,相比CBE系統(tǒng),ABE存在更高的準(zhǔn)確性和更少的Indels,因此,ABE系統(tǒng)的優(yōu)化主要表現(xiàn)在如何提高堿基的編輯效率、如何擴大編輯活性窗口和堿基編輯范圍方面[11,67]。David Liu實驗室將SV40 NLS換成bipartite NLS(bpNLS),并在TadA7.10的N端增加1個bp NLS,優(yōu)化了其密碼子,構(gòu)建出了ABEmax,其編輯效率相較于ABE7.10進(jìn)一步穩(wěn)定提高,在HEK293T細(xì)胞中實驗結(jié)果顯示,ABEmax的編輯效率提高了1-6.1倍[19]。David Liu實驗室開發(fā)的CP-ABEmax(CP1012-ABEmax、CP1028-ABEmax、CP1041-ABEmax和CP1249-ABEmax)系列堿基編輯器在一定程度上將堿基編輯窗口從4-8位拓展到4-12位[39]。與CBE系統(tǒng)相似,將識別不同PAM序列的SpCas9變體融入ABEmax系統(tǒng),即可拓展ABEmax在基因組的編輯范圍。目前,融合在ABEmax系統(tǒng)中的不同SpCas9變體或不同來源的Cas9蛋白有VQR-SpCas9(PAM:NGA)、VRERSpCas9(PAM:NGCG)、VRQR-SpCas9(PAM:NGA)、SaCas9(PAM:NNGRRT)、SaKKH(PAM:NNNRRT)、ScCas9(PAM:NNGN)、xCas9(PAM:NG)、SpCas9-NG(PAM:NG)、SpG(PAM:NGN)和SpRY(PAM:NRN),這些蛋白極大擴大了ABE在動植物基因組中的可編輯范圍[39, 45, 48-49, 68]。
以上的改造比較局限,均是在ABE7.10或ABEmax的基礎(chǔ)上,未涉及對TadA脫氨酶的升級替換。2020年,David Liu實驗室通過噬菌體輔助的非連續(xù)和連續(xù)進(jìn)化(PANCE和PACE)系統(tǒng)改變了ABE7.10的脫氨酶成分,產(chǎn)生了具有Cas結(jié)構(gòu)域兼容性與活性均得到提升的腺嘌呤堿基編輯器ABE8e[50]。與ABE7.10相比,ABE8e包含8個額外的突變,活性提高590倍。該團隊還證明,ABE8e系統(tǒng)還可以編輯ABE7.10編輯效果不佳的靶點。但不幸的是,ABE8e的脫靶率比ABE7.10高,為了解決ABE8e高脫靶率的問題,該團隊將TadA-V106W突變引入了ABE8e系統(tǒng),創(chuàng)建了ABE8eV106W,大幅度降低了ABE8e在DNA和RNA上的脫靶效應(yīng)[50]。Lapinaite等[69]對ABE8e進(jìn)行了超高分辨率冷凍電鏡結(jié)構(gòu)分析,結(jié)果表明,最新的ABE8e對DNA的脫氨基速率比ABE7.10和miniABEmax分別高出590倍和1 170倍。2022年,賴良學(xué)團隊在ABE8eV106W的基礎(chǔ)上優(yōu)化出可以識別具有NTTN、TYCN和TRTN形式PAM的ABE8e編輯器(enCas12a-、RR-和RVR- ABE8eV106W)[42]。超高的編輯效率和編輯范圍大大增強了ABE堿基編輯的應(yīng)用范圍。
在CBE行使功能的過程中[53],C變?yōu)閁后,會被細(xì)胞內(nèi)源的尿嘧啶-DNA糖基化酶(uracil-DNA glycosylase, UDG)酶水解,成為無嘌呤無嘧啶AP狀態(tài),進(jìn)而引發(fā)堿基切除修復(fù)(base-excisionrepair,BER)機制,恢復(fù)為原來的C堿基,或者被AP裂解酶(APlyase)識別,引發(fā)DNA雙鏈斷裂,造成隨機突變。但是不管發(fā)生哪種情況,都是在降低CBE編輯器的編輯效率,甚至引入隨機突變。因此,在CBE系統(tǒng)的優(yōu)化過程中,引入了外源的UGI(uracilglycosylaseinhibitor)序列來抑制UDG的活性,從而保護(hù)U堿基,提高C到U再到T的轉(zhuǎn)換效率。DNA序列在AP狀態(tài)下經(jīng)過AP裂解酶作用缺失的堿基有幾率被修復(fù)為其他3種堿基,為了保持AP狀態(tài),尋找C堿基轉(zhuǎn)化為其他3種堿基的可能,就需要在CBE的基礎(chǔ)上除去UGI序列,增強UDG序列的活性。由于GBE更加依賴于機體自帶的修復(fù)機制,因此,C轉(zhuǎn)變成為G或A存在不確定性和不穩(wěn)定性。
CBE和ABE堿基編輯器的功能是實現(xiàn)同類堿基間的轉(zhuǎn)換(嘌呤至嘌呤、嘧啶至嘧啶),但不能實現(xiàn)堿基間的顛換[70]。一些科學(xué)家另辟蹊徑,以CBE系統(tǒng)產(chǎn)生的副產(chǎn)物為突破口,尋找其他的可能。2021年7月,美國哈佛醫(yī)學(xué)院[53]和中國科學(xué)院天津工業(yè)生物技術(shù)研究所的張學(xué)禮研究員[20]相繼在Nature Biotechnology上發(fā)表了新構(gòu)建的堿基編輯器GBE,GBE能有效的將DNA靶點處的C-G及C-A堿基進(jìn)行顛換修飾。2項研究采取了類似的開發(fā)思路,即GBE編輯器在CBE編輯器的基礎(chǔ)上去除UGI的同時又增強UDG的功能,以期獲得更高的C G或者C A顛換頻率。David Liu團隊使用CRISPRi(CRISPR干擾)技術(shù)針對堿基顛換過程中的影響因素(轉(zhuǎn)氨酶和Cas效應(yīng)結(jié)構(gòu)域以及多種DNA修復(fù)蛋白)從而確定了影響C G至G C編輯結(jié)果的十多種序列特征[70]。并開發(fā)了與機器學(xué)習(xí)模型配套的系列工程化CGBE和預(yù)測文庫CGBE-Hive。Yuan等[54]通過篩選不同來源的尿嘧啶DNA N-糖基化酶(uracil-N-glycosylase,UNG)和改變其與脫氨酶的種類和位置,結(jié)合密碼子優(yōu)化等策略,開發(fā)了效率更高的OPTI-CGBE。該團隊通過內(nèi)源位點及文庫水平的研究并進(jìn)一步開發(fā)出TCN PAM偏好性的eA3AOPTI-CGBEs,偏好CCN PAM的hA3G-OPTI-CGBEs和hA3G-CTD-OPTI-CGBEs等編輯器。
與GBE類似,一些科學(xué)家也在尋找嘌呤顛換為嘧啶的可能性。但是與CBE系統(tǒng)相比,ABE系統(tǒng)的副產(chǎn)物極少,因此開發(fā)AYBE的難度可想而知。科學(xué)家們發(fā)現(xiàn)N-甲基嘌呤DNA糖基化酶(N-methylpurine DNA glycosylase, MPG)有一定的切除肌苷(I)中次黃嘌呤堿基(Hx)的活性,于是猜想可以通過工程化改造MPG,以達(dá)到開發(fā)出可以將嘌呤顛換成嘧啶堿基編輯器的目的。令人興奮的是,2023年1月,楊輝課題組與胥春龍課題組合作,率先實現(xiàn)了這一目標(biāo),開發(fā)出了新型可以顛換A成Y的堿基編輯器——腺嘌呤堿基顛換編輯器(AYBE,Y= C or T),首次實現(xiàn)了高效的腺嘌呤堿基顛換[21]。該系統(tǒng)通過在ABE8e的C端與野生的次黃嘌呤切除蛋白MPG融合,得到了最初的AYBEv0.1系統(tǒng)。為了提升AYBE的顛換效率,該團隊對MPG序列開展了一系列的優(yōu)化,并構(gòu)建了一系列突變體庫,經(jīng)過多輪的篩選優(yōu)化和測試,最終成功獲得了堿基顛換效率較高的突變體AYBEv3。該研究顯示,AYBEv3的顛換編輯效率是AYBEv0.1的4.78倍。而且AYBEv3和AYBEv0.1均有著相當(dāng)?shù)牡虸ndels頻率。
2020年,高彩霞課題組率先開發(fā)出了雙重堿基編輯器——飽和靶向內(nèi)源基因突變堿基編輯器STEME(saturated targeted endogenous mutagenesis editors),拉開了雙重堿基編輯器DBE的研究序幕[22]。該編輯器結(jié)構(gòu)中包括可以實現(xiàn)雙堿基編輯功能的元件有胞嘧啶脫氨酶APOBEC3A、腺嘌呤脫氨酶ecTadA-ecTadA7.10以及起引導(dǎo)作用的蛋白nCas9(D10A),依次通過48或32個氨基酸連接成為一個大的融合蛋白,并在nCas9的C端融合2個NLS拷貝和1個UGI拷貝。從而構(gòu)建了STEME-1和STEME-NG兩種編輯器。該研究還表明,創(chuàng)建的STEME系統(tǒng)可以在單個sgRNA的引導(dǎo)下在靶點位置同時產(chǎn)生C T(G A)和A G(T C)的突變。緊接著,Nature Biotechnology刊登了3篇采用類似策略的雙堿基編輯器。Zhang等[23]將hAID、TadA與nCas9依次連接,并輔以優(yōu)化nCas9密碼子、增加雙分型核定位信號(bpNLS),以及融合2個拷貝的UGI和優(yōu)化linker序列獲得了雙堿基編輯器A&C-BEmax;結(jié)果表明,與CBE和ABE相比,A&C-BEmax編輯效率、產(chǎn)物純度、可編輯窗口顯著提高,而且?guī)缀醪划a(chǎn)生DNA水平脫靶且RNA水平的脫靶也大幅降低。Sakata等[25]將胞嘧啶脫氨酶PmCDA1和腺嘌呤脫氨酶TadA與nCas9融合同樣構(gòu)建了雙堿基編輯器Target-ACEmax。Target- ACEmax在47個被測試的基因組靶點上同樣顯示出較高的編輯活性。Grunewald等[24]則是將miniABEmax-V82G中的腺嘌呤脫氨酶和七鰓鰻中的胞嘧啶脫氨酶分別融合到nCas9的N端和C端,并添加兩個拷貝的UGI,最終得到了雙堿基編輯器SPACE。隨后,該團隊在HEK293T細(xì)胞中進(jìn)行測試,數(shù)據(jù)顯示,與miniABEmax-V82G和Target-AID相比,SPACE在靶點處實現(xiàn)了更加高效的雙重編輯,且Indels產(chǎn)生率和脫靶概率也得到了有效降低。
2.6.1 PE編輯器的建立 單堿基編輯器始終存在一定的局限性,不能隨意轉(zhuǎn)換4種堿基序列,對基因的插入和敲除也存在巨大的應(yīng)用限制。2019年,David Liu團隊在Nature上發(fā)表了新的研究成果,一種新型基因編輯技術(shù)——“prime editing”[26]。該技術(shù)直接將基因精準(zhǔn)編輯推到了新的高度。PE系統(tǒng)的特點是可以直接靶向靶位點,在靶位點處進(jìn)行基因精準(zhǔn)插入、精準(zhǔn)刪除以及堿基修飾。最重要的是,PE系統(tǒng)有效避免了DNA雙鏈斷裂。PE系統(tǒng)的成功構(gòu)建,大幅增加了基因精準(zhǔn)編輯的編輯類型,同時,又大幅降低了基因編輯中脫靶效應(yīng)的概率,提高了基因編輯的安全性和準(zhǔn)確性。該編輯技術(shù)的核心之一是由逆轉(zhuǎn)錄酶和Cas9蛋白融合而成的特殊蛋白;另一個核心是在sgRNA的C末端增加了一段RNA序列,組成的特殊gRNA稱為pegRNA。pegRNA具有雙重作用,一段序列與sgRNA作用類似,作為靶點結(jié)合位點,與斷裂的靶點處DNA鏈C末端融合以作為逆轉(zhuǎn)錄的起始位點,另一端序列則連接需要的目標(biāo)逆轉(zhuǎn)錄序列。當(dāng)PE行使功能時,nCas9蛋白在sgRNA的招募下,使DNA雙螺旋打開,并在目標(biāo)靶基因距離PAM序列上游3 nt處切割DNA單鏈。在游離的DNA單鏈處,DNA原序列與引物結(jié)合位點(primer binding site, PBS)結(jié)合,在逆轉(zhuǎn)錄病毒的作用下,以逆轉(zhuǎn)錄模板(reverse transcriptase templates,RTT)為模板開始逆轉(zhuǎn)錄過程,形成新的融合單鏈。最后經(jīng)過細(xì)胞的修復(fù)機制和復(fù)制機制,有概率以新的DNA單鏈為模板進(jìn)行復(fù)制,最終形成新的DNA雙鏈,將目的基因整合到自身的基因組中(圖2),以達(dá)到靶點突變、插入和敲除的目的。

圖2 引導(dǎo)編輯器工作原理示意圖Fig. 2 Mechanisms of prime editors
相比于其他堿基編輯器,PE系統(tǒng)具有無可比擬的優(yōu)勢。(1)PE系統(tǒng)具有可編輯類型廣的優(yōu)勢,包括實現(xiàn)所有的堿基突變和小片段的插入和刪除以及他們的組合,這是其他堿基編輯器無法做到的;(2)較高的準(zhǔn)確性,研究顯示,雖然在PE3系統(tǒng)中檢測出因為一條sgRNA的增加而增加了Indels產(chǎn)物,但I(xiàn)ndels的水平大多在10%以下,仍然保持了較高的精準(zhǔn)性;(3)高特異性,靶向區(qū)域DNA與pegRNA的spacer雜交、靶向區(qū)域DNA與pegRNA的PBS序列的雜交、靶向區(qū)域DNA與逆轉(zhuǎn)錄產(chǎn)物的雜交機制保證了PE系統(tǒng)的高特異性[26]。
2.6.2 PE編輯器的優(yōu)化 PE編輯器雖然優(yōu)勢明顯,但是,最初版本的PE編輯器編輯效率比較低,極大限制了PE的應(yīng)用范圍。得益于CBE(GBE)和ABE的優(yōu)化改造經(jīng)驗,科學(xué)家們通過改造優(yōu)化編輯器本體或融合新的輔助元件,對PE1編輯器進(jìn)行了一系列的優(yōu)化改造,將PE的應(yīng)用范圍大幅度提高。優(yōu)化改造的方向包括提高PE的編輯效率、改變PE靶向PAM范圍、提高目標(biāo)產(chǎn)物純度、降低副產(chǎn)物濃度等,且大部分改造策略已經(jīng)被大量科學(xué)家證實可行并且產(chǎn)生了積極效果。
2.6.2.1 PE編輯器編輯效率的提升 PE1的編輯效率比較低[26],為了提高編輯效率,Anzalone等[26]對PE1的莫洛尼鼠白血病病毒逆轉(zhuǎn)錄酶(moloney murine leukemia virus reverse transcriptase,M-MLVRT)進(jìn)行改造,在M-MLVRT酶中引入了5個突變位點構(gòu)建了PE2,PE2逆轉(zhuǎn)錄酶的耐熱性能、逆轉(zhuǎn)錄連續(xù)工作能力、催化DNA/RNA結(jié)合能力和對RNase的活性的抑制作用均得到有效提高,進(jìn)而靶點處堿基轉(zhuǎn)換、片段的插入或敲除效率得到提升(1.6-5.1倍)[26,71]。而隨后Anzalone等[26]開發(fā)的PE3/PE3b進(jìn)一步將編輯效率提高了1.5-4.2倍,而且,DSB和Indels也得到了有效的控制。Liu等[72]融合Csy4蛋白RNA加工系統(tǒng)而開發(fā)ePE系統(tǒng)平均提高4.9倍的編輯效率。Nelson等[73]的工程化pegRNA(epeg-RNA)則是在pegRNA的C端加入了防止C端降解的結(jié)構(gòu)化RNA序列,測試發(fā)現(xiàn),epegRNA的編輯效率提高了3-4倍。同樣地,為了防止pegRNA的C端降解,Zhang等[74]和Li等[75]分別創(chuàng)制了xrPE和G-PE編輯器,同樣將編輯效率提高了4倍。Li等[76]通過在RTT上引入同義突變和優(yōu)化pegRNA二級結(jié)構(gòu)的策略分別制備了spegRNA和apegRNA,二者大幅度提高了PE的編輯效率(353倍和2.77倍)。Lin等[77]采用雙pegRNA的方式將編輯效率提高了17倍。Zhuang等[78]開發(fā)的HOPE系統(tǒng)顯示出更高的編輯效率和產(chǎn)物純度。融合了染色質(zhì)調(diào)節(jié)肽(CMPs)、Rad51蛋白、c-Myc NLS、病毒核衣殼蛋白等功能性蛋白并結(jié)合優(yōu)化密碼子的方法已被證明是另一種有效的提高編輯效率的可行策略[73-77,79-86]。
2.6.2.2 PE編輯器可編輯范圍的提升 與CBE(GBE)和ABE一樣,PE編輯器的編輯范圍嚴(yán)重依賴SpCas9蛋白。因此,擴大PE編輯器的應(yīng)用范圍就必須解除SpCas9蛋白對NGG形勢PAM序列或編輯窗口的限制。目前,已經(jīng)形成了可以識別多種PAM形式的PE編輯器變體,例如SpCas9-VQR(NGA)、SpCas9-VRQR(NGA)、SpCas9-NG(NG)、SpCas9-SpRY(NRN)、SaCas9(NNGRRT)[85,87]。此外,Oh等[88]構(gòu)建的FnCas9(PAM:NGG)將SpCas9可編輯窗口擴大到PAM序列上游6-8 nt,大幅擴大了PE的應(yīng)用范圍。
2.6.2.3 PE編輯器敲除/敲入范圍的提升 PE編輯器的功能異常強大,不僅可以定點修飾,還可以進(jìn)行小片段的敲入和敲除,因此,PE受到廣泛的關(guān)注。然而,在研究中,科學(xué)家們花費了大量的精力關(guān)注PE的突變功能,卻少有人關(guān)注PE編輯器的敲除/敲入能力。值得興奮的是,Anzalone等[89]通過采用構(gòu)建兩條相向的pegRNA替換PE編輯器內(nèi)源性DNA序列的策略、成功制備了TwinPE系統(tǒng);TwinPE系統(tǒng)可以實現(xiàn)108 bp片段的敲入和818 bp片段的敲除。基于同樣的策略,Choi等[90]開發(fā)的PRIME-Del系統(tǒng)可以敲除長達(dá)10 kb的片段。Wang等[91]創(chuàng)制的GRAND則可以誘導(dǎo)150 bp序列敲入到目標(biāo)基因組中,敲入效率甚至高達(dá)63.0%,且能夠?qū)崿F(xiàn)最長約1 kb序列的敲入。Tao等[92]的WT-PE系統(tǒng)采用靶向基因組上不同的位點,實現(xiàn)了長達(dá)16.8 Mb的大片段的敲除。這為敲除大片段DNA序列提供了新的思路。
自2016年新型堿基編輯系統(tǒng)進(jìn)入大眾的視野,便迅速受到科學(xué)家們的青睞,并廣泛應(yīng)用于動植物及細(xì)菌的研究中。豬作為一種重要的農(nóng)業(yè)經(jīng)濟動物,在農(nóng)業(yè)和醫(yī)學(xué)領(lǐng)域均具有重要應(yīng)用價值,利用基因編輯技術(shù)能夠快速提高豬的經(jīng)濟性狀和模擬人類疾病。
堿基編輯器可以通過提前引入終止密碼子、調(diào)控內(nèi)源mRNA的可變剪接和改變蛋白定向進(jìn)化從而影響豬經(jīng)濟性狀的表達(dá)。Wang等[93]利用堿基編輯技術(shù)(hA3A-BE3-NG)同時對豬的肌肉生長抑制素(myostatin, MSTN)、CD163受體、氨基肽酶-N(aminopeptidase, APN)以及MC4R四個基因進(jìn)行編輯,產(chǎn)生了多個經(jīng)濟性狀相關(guān)基因的無義突變和錯義突變豬細(xì)胞。Pan等[94]則是通過rAPOBEC1-BE3編輯器在豬的MSTN基因中提前引入終止密碼子,導(dǎo)致豬成纖維細(xì)胞中產(chǎn)生MSTN基因的無義突變。得到了MSTN基因缺失豬細(xì)胞。同樣的策略,趙為民等[95]利用YE1-BE3-FNLS載體對豬的CD163基因第7外顯子進(jìn)行C到T的堿基突變,提前進(jìn)入了終止密碼子TAA,從而導(dǎo)致CD163基因不能完全翻譯。王晶等[96]在寧鄉(xiāng)花豬MSTN基因第2外顯子處引入終止密碼子,獲得MSTN基因表達(dá)沉默的腎成纖維細(xì)胞系。王煜等[97]將rA1-BE3、hA3A-BE3、hA3A-BE3-Y130F和hA3A-eBE-Y130F4種胞嘧啶堿基編輯器分別作用于大白豬和巴馬豬IGF2基因第3內(nèi)含子第3 072 bp處的核苷酸,經(jīng)細(xì)胞篩選后獲得了C-T突變的豬細(xì)胞系。Song等[98]將hA3A中的第130位的酪氨酸突變到苯丙氨酸構(gòu)建了hA3ABE3-Y130F體系,在豬胚胎成纖維細(xì)胞中的CD163、IGF2和MSTN基因的靶位點實現(xiàn)C-T精準(zhǔn)修飾,導(dǎo)致無意或錯義突變,生產(chǎn)出了即能抵抗豬藍(lán)耳病病毒侵害,又顯著提高了經(jīng)濟效益的仔豬。
在豬的疾病模型構(gòu)建過程中,新型堿基編輯器的應(yīng)用更加廣泛。2018年,Li等[99]運用BE3系統(tǒng)對豬胚胎成纖維細(xì)胞的Twist2基因和Tyr基因做了定點修飾,并通過細(xì)胞核移植(somatic cell nuclear transfer, SCNT)方法建立了無臉巨口綜合征和皮膚白化病的疾病模型。Xie等[100]運用BE3系統(tǒng)結(jié)合SCNT技術(shù)得到5頭免疫缺陷癥仔豬。該團隊[100]運用同樣的策略構(gòu)建了400個克隆豬胚胎,并將克隆胚胎移植到代孕母豬,獲得了1頭健康的DMD單等位基因精準(zhǔn)突變母豬。Zhu等[101]利用ABEmaxAW對豬胎兒成纖維細(xì)胞GHR基因可變剪接體做定向修飾,成功制備出4組純合突變細(xì)胞。Yuan等[102]將BE4-Gam與GGTA1、B4galNT2和CMAH基因的3組sgRNA結(jié)合,結(jié)合后的3組sgRNA-BE4載體通過電穿孔法轉(zhuǎn)染到巴馬豬胎兒的成纖維細(xì)胞,結(jié)合SCNT技術(shù),得到1只3基因精準(zhǔn)修飾的可解決免疫排斥問題的仔豬。Yao等[103]以瓦登伯革氏綜合征模型豬為基礎(chǔ),利用HA3A-eBE-Y130F對突變豬早期胚胎進(jìn)行了干預(yù)。結(jié)果表明,通過基因編輯手段,可以將該病徹底糾正。但該編輯器產(chǎn)生了較為嚴(yán)重的脫靶效應(yīng),是HR途徑的5倍,需要進(jìn)一步的優(yōu)化和降低脫靶效應(yīng)。Jiang等[104]使用hA3ABE3-Y130F在大白豬胎兒成纖維細(xì)胞中過早引入終止密碼子到3個腫瘤抑制基因TP53、PTEN和APC中。在290個分離的單克隆群落中得到232個三基因修飾群落。Zheng等[105]使用BE4max在豬睪丸干細(xì)胞中的豬內(nèi)源性逆轉(zhuǎn)錄病毒(porcine endogenous retrovirus, PERVs)基因組上的gag(3個)和pol(4個)區(qū)域共設(shè)計7組sgRNA,在7個位點提前引入終止密碼子以達(dá)到停止PERVs功能的目的,最終得到了少量的(10%)PERVs完全失活的單克隆。基因修飾后的干細(xì)胞與HEK293-GFP共培養(yǎng)的結(jié)果顯示,完全失活的單克隆不能夠整合到宿主細(xì)胞。
單堿基編輯器作為重要的研究和改造單堿基變異的研究工具,其靶向特異性和脫靶效應(yīng)受到了科研工作者們廣泛而持續(xù)的關(guān)注。堿基編輯器導(dǎo)致的脫靶效應(yīng)已經(jīng)被大量科學(xué)家們相繼報道。高彩霞組將堿基系統(tǒng)的脫靶分為傳統(tǒng)的可預(yù)測的脫靶、全基因組范圍內(nèi)不可預(yù)測的脫靶和轉(zhuǎn)錄水平脫靶[106]。
基于傳統(tǒng)的可預(yù)測的脫靶效應(yīng),一般可以通過軟件進(jìn)行脫靶位點的預(yù)測,如CRISPOR(http://crispor.tefor.net/),后續(xù)通過傳統(tǒng)分子生物學(xué)的方法檢測即可確定是否存在脫靶效應(yīng)。David Liu實驗室構(gòu)建的高保真型BE3系統(tǒng)[43]、Lee等[63]篩選出的高特異性Sniper-Cas9蛋白、Wang等[44]開發(fā)的tBEs均可以有效的降低傳統(tǒng)的脫靶效應(yīng)。還可以通過改變sgRNA的長度、運用蛋白質(zhì)工程的方式解決此類問題[43, 61-62]。
基于后兩種脫靶問題,目前所開發(fā)的軟件不能做出有效的預(yù)測,需要通過全基因組測序或者轉(zhuǎn)錄組測序獲得[43,61]。2019年,Jin等[59]和Zuo等[60]分別在植物和動物中發(fā)現(xiàn)BE3存在全基因組的脫靶現(xiàn)象,而ABE在全基因組水平未檢測出明顯的脫靶現(xiàn)象,這表明ABE在全基因組水平上的安全性遠(yuǎn)超過CBE,這可能與人工定向進(jìn)化的脫氨酶是否存在UGI等元件有關(guān)。在轉(zhuǎn)錄水平上,同年,Grünewald等[44]通過對人類細(xì)胞轉(zhuǎn)錄組測序發(fā)現(xiàn),BE3和ABE系統(tǒng)在轉(zhuǎn)錄組水平存在嚴(yán)重的脫靶效應(yīng)。隨后,David Liu實驗室也發(fā)現(xiàn)了ABEmax在編輯哺乳動物細(xì)胞系時發(fā)生了能夠檢測到的RNA脫靶效應(yīng)[46]。針對這類問題,可以通過降低脫氨酶的活性,從而降低脫靶的概率;可以借鑒ABE的開發(fā)經(jīng)驗,通過蛋白質(zhì)工程技術(shù),如蛋白質(zhì)的定向進(jìn)化和從頭設(shè)計,開發(fā)出新的脫氨酶,在不降低編輯器效率的前提下,提高特異性;還可以將新型編輯技術(shù)與傳統(tǒng)基因編輯技術(shù)融合,開發(fā)新的編輯系統(tǒng),以提高編輯的準(zhǔn)確性[51-52]。2021年,Wang等[44]開發(fā)tBEs堿基編輯器可以對非靶點進(jìn)行鎖定,降低依賴性和非依賴性脫靶效應(yīng),同時,經(jīng)在全基因組和全轉(zhuǎn)錄組水平的檢測顯示,未發(fā)現(xiàn)脫靶效應(yīng)。2022年賴良學(xué)團隊將TALE融入ABE/CBE系統(tǒng)而創(chuàng)建的新型堿基編輯器TaC9-ABE/CBE,在保留了堿基編輯器高效率編輯的同時又可以完全消除Cas9依賴性脫靶[51-52]。其他的脫氨酶突變體結(jié)合的堿基編輯器如BE3-R33A、BE3-R33A/K34A、ABEmaxAW、ABEmaxQW、ABE7.10D53E和ABE7.10F148A均可以同時兼具編輯活性和降低特異性[28,46-47]。
堿基編輯技術(shù)的創(chuàng)建為精準(zhǔn)醫(yī)療和精準(zhǔn)育種提供了重要的研究工具,堿基編輯技術(shù)以其低廉的價格和較低的門檻迅速受到科學(xué)家的青睞。經(jīng)過多年的研發(fā)和優(yōu)化,目前堿基編輯器家族成員也十分豐富,功能也越來越多樣化。目前,堿基編輯系統(tǒng)已經(jīng)能夠?qū)崿F(xiàn)嘌呤至嘌呤、嘌呤至嘧啶、嘧啶至嘧啶、嘧啶至嘌呤的轉(zhuǎn)換,可以完成小片段的插入和敲除;堿基編輯系統(tǒng)的局限性也越來越小,現(xiàn)在科學(xué)家們已經(jīng)開發(fā)出了近似無需PAM序列依賴的編輯器;編輯窗口也可以隨著需要擴大或縮小。然而,堿基編輯器相比傳統(tǒng)的HR途徑,卻存在著更高全基因組水平及RNA水平的脫靶效應(yīng),存在著潛在的危險性。因此,堿基編輯系統(tǒng)在技術(shù)及應(yīng)用等層面仍需要潛心研發(fā)優(yōu)化,以達(dá)到同時兼?zhèn)涓咝院桶踩缘哪康摹?/p>
盡管堿基編輯技術(shù)已經(jīng)廣泛應(yīng)用于人類疾病研究、人類疾病模型的創(chuàng)建、動植物精準(zhǔn)育種、動植物機制研究、微生物研究等領(lǐng)域,但堿基編輯技術(shù)存在的脫靶效應(yīng)帶來的潛在危害仍讓人心存畏懼。目前,雖然科學(xué)家們結(jié)合人工智能,通過深度學(xué)習(xí)建立的物理預(yù)測模型可以有效的預(yù)測傳統(tǒng)型脫靶效應(yīng),且已經(jīng)展示出無可比擬的優(yōu)勢[70,107-108]。但是,全基因組水平的脫靶和轉(zhuǎn)錄組水平的脫靶卻無法有效預(yù)測,通過后期的檢測方法雖能檢測出是否存在脫靶效應(yīng),但是存在一定的滯后性。因此,需要進(jìn)一步將堿基編輯與機器學(xué)習(xí)結(jié)合,通過收集規(guī)模化數(shù)據(jù),建立龐大的數(shù)據(jù)庫,優(yōu)化映射模型,結(jié)合高效的人工智能大數(shù)據(jù)信息處理系統(tǒng),尋找出影響脫靶效應(yīng)的影響因素,為以后基因編輯發(fā)展方向和人工定向蛋白質(zhì)進(jìn)化提供詳實的數(shù)據(jù)支持。
堿基編輯技術(shù)在基礎(chǔ)研究和應(yīng)用等方面充滿生機,堿基編輯技術(shù)的問世會加速科學(xué)家探尋自然的奧秘,將進(jìn)一步推動以農(nóng)業(yè)、生物醫(yī)藥為代表的生命科學(xué)的發(fā)展。未來,隨著基因組序列信息的不斷挖掘和生物體機制不斷地研究,隱藏在自然界中的奧秘會越來越多的展示在我們面前;另一方面,隨著計算機技術(shù)的快速發(fā)展,人工設(shè)計精準(zhǔn)醫(yī)療、精準(zhǔn)育種也許會變成現(xiàn)實。