周 項, 朱海霞, 黃 強
復旦大學 生命科學學院, 上海 200438
單堿基編輯是一種由Cas蛋白主導的基因編輯技術[1],具有不依賴于DNA鏈的DSB(Double strand break)的特點,可以對靶位點上的單堿基進行替換[2-3]。近年來,該技術已廣泛應用于動植物模型的建立、疾病發病機制以及微生物的研究等領域[4-7]。在應用過程中,單堿基編輯技術展現出了高效、高靶向性等特點,因此該技術備受研究人員的關注,有望在基因治療中大放異彩。根據堿基的轉換類型,單堿基編輯技術可以分為兩大類,分別是胞嘧啶堿基編輯器(Cytosine base editors, CBE)和腺嘌呤堿基編輯器(Adenine base editors, ABE)。在一些動植物的基因編輯實驗中,ABE比CBE表現出了更好的特異性、有效性和安全性[5, 8],因此,ABE具有廣闊的應用前景。通過多代定向進化優化,人們獲得了迄今最為優秀的一個腺嘌呤堿基編輯器:ABE8e[2]。
目前,ABE8e的結構已被解析,結構顯示其天然形態為二聚體結構[9]。但是,我們在ABE8e的體外純化制備過程中卻發現其多聚體比例較高。在其它相關文獻中,ABE8e的制備緩沖體系中含有一定量的還原劑[10]。當蛋白質混合液中含有大量多聚體時,會導致蛋白質性質不穩定,進而使結構發生改變[11]。因此,在蛋白質的體外制備過程中需要盡可能地控制多聚體的比例,以保持樣品的穩定性[12]。
在本文中,為了降低ABE8e多聚體的比例,我們首先分析了ABE8e的三維結構,了解其多聚體形成的分子根源。然后,在結構信息的指導下推測分子間的聚集源于ABE8e二聚化界面中疏水區域的曝露。為驗證理論推測的正確性,我們構建了相應的ABE8e突變體(ABE8e-T),對其進行表達和純化。ABE8e-T的純化結果證實了多聚體成因的理論推測。在此基礎上,我們有針對性地優化了緩沖體系,從而降低了ABE8e多聚體的比例,有效地提高了純化制備的效率。
1.1.1質粒與菌株
本研究使用的ABE8e及ABE8e-T質粒由課題組保存。DH5α、Rosetta (DE3)大腸桿菌感受態細胞購自天根生化科技(北京)有限公司。
1.1.2主要試劑
表達:氨芐青霉素、IPTG、氯霉素及LB Broth購自生工生物工程(上海)股份有限公司。純化:咪唑、Tris、KCl、精氨酸及鹽酸購自生工生物工程(上海)股份有限公司。醋酸、SDS、考馬斯亮藍、甲醇購自滬試實驗室器材(上海)股份有限公司。電泳膠配制緩沖液購自天根生化科技(北京)有限公司。突變體構建:質粒小提試劑盒、點突變試劑盒及感受態細胞購自天根生化科技(北京)有限公司。
1.1.3主要設備
表達:恒溫搖床購自上海天呈實驗儀器制造有限公司。純化:AKTA Avant 25購自格來賽生命科技(上海)有限公司。電泳儀購自北京六一生物科技有限公司。凝膠成像系統購自上海勤翔科學儀器有限公司。
1.1.4主要耗材
純化:Ni-NTA Agarose購自凱杰生物工程(深圳)有限公司。凝膠層析柱為Superdex 200 Increase 10/300及HiLoad Superdex 200 16/600,均購自格來賽生命科技(上海)有限公司。
1.2.1表達步驟
將復蘇好的菌液添加至含有氨芐及氯霉素的LB培養基中,進行擴大培養。擴大培養的溫度設為37 ℃,轉速設為200 r/min,培養4 h~5 h后檢測OD值。當OD值為0.8~1.2 時,進行表達培養。表達培養的溫度設置為20 ℃,轉速設置為200 r/min,培養12 h~14 h后停止培養。將菌液進行離心,收集菌體,保存至-80 ℃,以備后用。
1.2.2純化步驟
Ni柱親和層析的實驗步驟依次為:平衡1、平衡2、上樣、淋洗及洗脫。其中,平衡1及洗脫步驟的緩沖體系為:20 mmol/L Tris,500 mmol/L KCl,300 mmol/L咪唑pH 8.0;平衡2與淋洗步驟的緩沖體系為:20 mmol/L Tris,500 mmol/L KCl,10~20 mmol/L咪唑pH 8.0。平衡1沖洗體積大于5個柱體積,平衡2的沖洗體積大于5個柱體積;淋洗體積大于5個柱體積;洗脫體積大于3個柱體積,在洗脫的過程中可以分管收集洗脫液,根據SDS-PAGE電泳結果分析各泳道蛋白的分子量、濃度以及純度,并進行下一步驟。
凝膠層析的實驗步驟依次為:平衡、上樣、再平衡。其中,優化前的緩沖體系為:20 mmol/L Tris,500 mm/L KCl pH 8.0,優化后的緩沖體系為:20 mmol/L Tris,0.5 mol/L精氨酸鹽酸,0.5 mol/L KCl pH 8.0。此外,還設置了對照緩沖體系:20 mmol/L Tris,0.5 mol/L 精氨酸鹽酸 pH 8.0。流速設置為0.5 mL/min~1.0 mL/min,平衡與再平衡的體積為1個柱體積。
1.2.3突變體突變流程
采用點突變的方式進行質粒構建。實驗流程為首先提取ABE8e的質粒,其次對進行點突變。突變完成后,轉化入細胞內并挑選單克隆,最后對其進行測序確認序列的正確性。
1.2.4PyMOL及Rosetta軟件的應用
運用PyMOL軟件觀察ABE8e的三維結構,觀察的主要內容是:疏水性氨基酸在三維結構中所處的位置,分子之間的靜電勢等信息。從觀察結果中更深入地分析分子之間的相互作用,從而了解多聚化的原因及確認可能的氨基酸突變位點。
用Rosetta軟件中的fixbb模塊對需要突變的氨基酸位點進行隨機氨基酸突變,經排列組合后,得到多種突變體。根據fixbb輸出的5 000個突變體結果,通過Python編程剔除序列完全相同的重復突變體,最后根據Rosetta能量由低到高排序,從而選出能量最低的突變設計結構。
核酸酶大多為堿性蛋白質,在中性pH條件下,表面氨基酸帶有大量正電荷,與帶有負電荷的靶標DNA相互吸引并結合,捕獲靶標DNA。但是,在體外制備核酸酶的過程中,一般不直接添加靶標DNA。因此,在緩沖體系中缺乏負電荷的情況下,核酸酶的結構有可能會不穩定。所以,在核酸酶制備緩沖體系中,通常使用高鹽緩沖體系提供一定的負離子環境。以SpCas9為例,在高鹽緩沖體系中,該蛋白質以單體為主;而在相同的緩沖體系中,ABE8e則是含有34.2%的多聚體。
為了抑制多聚體的形成并降低其比例,首先分析了ABE8e的結構,了解多聚體的成因。蛋白質分子結構的形成與分子間的相互作用取決于靜電作用力、疏水作用力、氫鍵與范德華力的共同影響,其中靜電作用力和疏水作用力起到了非常關鍵性的作用。多聚體的產生往往因為蛋白質自身之間發生了非正常的結合,通常與靜電作用力和疏水作用力相關[13-15]。因此,我們詳細分析了ABE8e的三維結構、TadA-8e的氨基酸序列、疏水性氨基酸分布、電荷分布等性質,以了解多聚體的成因。具體如下:
(1) TadA-8e氨基酸序列分析。ABE8e主要由兩部分組成,分別是nCas9和TadA-8e。其中nCas9僅在野生型SpCas9上突變了一個氨基酸(D10A)。我們和其他人的研究表明,野生型SpCas9的純化結果顯示其僅含有少量的多聚體(結果未顯示)。因此,首先考慮分析TadA-8e的氨基酸序列。
TadA-8e是從TadA野生型(wtTadA)定向進化而來。從圖1可知,進化后所得的TadA-8e一共突變了19個氨基酸,其中三個疏水性氨基酸突變為親水性氨基酸(W23R、A109S、F149Y),5個為親水性氨基酸突變為疏水性氨基酸(H36L、P48A、R51L、E155 V、T166I)。相較于野生型TadA,TadA-8e新增了兩個疏水性氨基酸。所以,由表1可知,TadA-8e共有166個氨基酸,其中70個氨基酸為疏水性氨基酸,疏水性氨基酸占比42%。

表1 TadA-8e疏水性氨基酸分布概況表

(a) wtTadA 和 TadA-8e 序列對比圖
當疏水性氨基酸含量較高時,分子形態的改變可能會造成更多的疏水區域曝露,從而造成分子間聚集,產生大量的多聚體。考慮到ABE8e疏水性氨基酸占比較高,推斷其存在易于聚集的風險。但是,當疏水性氨基酸位于分子內部時,將有助于分子結構的穩固,并不會引起分子間聚集。因此,需要進一步觀察TadA-8e的疏水性氨基酸在結構中的分布。
(2) TadA-8e疏水性氨基酸分布分析。TadA-8e序列如下:
MSEVEFSHEYWMRHALTLAKRARDEREVPVGAVLVLNNRVIGEGWNRAIGLHDPTAHA
EIMALRQGGLVMQNYRLIDATLYVTFEPCVMCAGAMIHSRIGRVVFGVRNSKRGAAGS
LMNVLNYPGMNHRVEITEGILADECAALLCDFYRMPRQVFNAQKKAQSSI
圖2(a)展示了TadA-8e的疏水性氨基酸分布,從圖中可以觀察到,其疏水性氨基酸主要分布于分子內部、柔性部位及分子表面,其中柔性部位也大多位于分子表面。疏水性氨基酸密集地位于蛋白質分子表面時,易造成分子間的聚集。圖2(c)展示了TadA-8e疏水性氨基酸分布較密集的區域。由圖可知,柔性部位的疏水性氨基酸雖分布在分子表面,但分布較松散。分子表面的疏水性氨基酸主要密集地分布在兩個α螺旋的外表面,占比約17.1%(表2)。然而,這部分的區域為TadA-8e的二聚化界面,當TadA-8e呈二聚體形態時,二聚化界面內的疏水性氨基酸聚攏在分子間,有助于穩固二聚體的構象。圖2(b)展示了TadA8e的電勢分布,可以看到:在二聚化界面中,除了疏水作用力,界面中的靜電勢相互吸引,界面三維結構呈互補形態,二聚化界面結合的非常緊密。綜上,我們推斷:當帶有TadA-8e的ABE8e分子以二聚體形態存在時,分子表面密集的疏水性區域較少,不易造成聚集。

表2 TadA-8e二聚化界面疏水性氨基酸概況表

(a) TadA-8e 疏水性氨基酸分布圖
(3) ABE8e三維結構分析。根據上述理論分析結果可知,ABE8e以二聚體為主要結構形態時,多聚體較少。但是,ABE8e的體外純化結果顯示:蛋白混合液中約含有34.2%的多聚體。因此,我們進一步考察ABE8e的三維結構。
由圖2(d) ABE8e的三維結構可以發現:nCas9的分子較大,當TadA-8e通過linker連接上nCas9后,增加了蛋白質的剛性。分子剛性的增加限制了TadA-8e的移動,減少了TadA-8e二聚化界面碰撞結合的機會。當二聚化界面沒有相結合時,相關界面中的疏水性區域可能會和蛋白質其他區域的疏水性氨基酸相互結合,特別是分子表面及柔性部位。這種結合將會造成多聚體的形成。
綜上,本研究提出關于多聚體形成的假說:由于TadA-8e二聚化界面中疏水性區域的曝露,造成了分子間的聚集,從而產生大量的多聚體。當ABE8e無法形成二聚體結構時,其更傾向形成多聚體,而非單體。
為了驗證多聚體的形成是否與二聚化界面的打開有關,我們突變了TadA-8e二聚化界面的關鍵氨基酸,以阻礙其二聚化。觀察二聚化界面進一步打開后,多聚體的比例是否會發生改變。若多聚體的比例增加,則可證明以上假說的正確性。
(1) 突變體的構建。為了尋找二聚化界面的關鍵氨基酸,運用PyMOL軟件分析了該界面中特異性較高的部分。從圖3(a) ABE8e二聚化界面的三維結構細節圖可以發現:64位和74位的精氨酸位于此部位,且精氨酸帶有正電荷,與對面的負電荷相互吸引。可以推斷:這兩個位點的氨基酸是二聚化界面中影響二聚化的核心氨基酸。
在確定需要突變的氨基酸后,使用Rosetta軟件中的Fixbb模塊對ABE8e的64及74位氨基酸進行突變優化。Fixbb模塊共輸出5000個結果,先通過Python程序剔除重復結果,再以蛋白質的能量值由低到高進行排序,然后選出能量最低的突變體。這樣,最終確定的突變體中R64突變為L;R74突變為E。我們將此突變體命名為ABE8e-T。從圖3(b)突變體的測序圖中可以看出,64位的核酸序列為CTG;74位的核酸序列為GAA,說明突變體ABE8e-T的表達質粒構建成功。

(a) ABE8e突變位點圖
(2) 突變體的純化。 為了觀察ABE8e-T的結構形態,采用平臺工藝條件對ABE8e-T進行表達純化。先進行Ni柱純化,再取其Ni柱層析收獲的洗脫液進行凝膠層析純化,分離多聚體和二聚體。ABE8e-T的Ni柱親和層析純化結果見圖4(b)。由圖可知,ABE8e-T經Ni柱純化后純度較高。ABE8e-T的凝膠層析純化結果如圖4(c)所示。從分子篩的實驗結果見圖4(c)中可知,在20 mmol/L Tris 0.5 mol/L KCL 緩沖體系中,F1的出峰位置約在7.2 mL,F2的出峰位置約為9.3 mL。根據Superdex的說明書可知,660 kDa的標準蛋白出峰位置約在8.0 mL,440 kDa的標準蛋白出峰位置約在8.8mL,66 kDa的標準蛋白的出峰位置約在12.5 mL。ABE8e的單體理論分子量為182 kDa,二聚體理論分子量為364 kDa。因此,我們判斷,F1為多聚體,占比為34.2%,F2為二聚體,占比為43.8%。凝膠層析實驗結果顯示ABE8e-T的多聚體占比為71.6%,比例遠高于二聚體的占比27.1%。對比ABE8e-T與ABE8e的凝膠層析圖譜見圖4(d)后發現:ABE8e-T的多聚體比例大幅度上升,二聚體比例大幅度下降。由此說明,在二聚化界面打開后,ABE8e-T沒有傾向變成單體,而是傾向于多聚體。
綜上,ABE8e-T的體外純化實驗結果驗證了2.1中對ABE8e多聚體形成的理論分析假說。
(3) 緩沖液優化。在蛋白質制備的過程中,通過優化緩沖溶液的組分,可以有效地防止及抑制蛋白質聚集傾向[12]。在確認了ABE8e聚集體的成因后,本研究擬通過此方法來抑制多聚體的比例,從而幫助ABE8e恢復其二聚體結構。精氨酸因其對蛋白質分子有良好的保護作用,已經廣泛地應用于制劑及下游純化工藝中[16-18],其中精氨酸鹽酸體系抑制分子間聚集的效果最佳[19, 20]。探究其機理,有兩方面可能的影響因素:其一,精氨酸側鏈能夠與某些氨基酸側鏈產生有利的相互作用,特別是對疏水性氨基酸上的芳香烴類的側鏈[17]。其二,精氨酸側鏈中的胍基能以游離基團的形式存在于緩沖體系中,并與蛋白質分子表面產生相互作用[21],減弱分子間的作用力。因此,精氨酸可以在不影響蛋白質二級及三級結構折疊的情況下,減少蛋白質與蛋白質之間的疏水作用力,從而有效地抑制蛋白質之間的聚集[19, 21]。所以,本研究在原緩沖體系中添加了0.5 mol/L 精氨酸,將緩沖體系優化為:20 mmol/L Tris,0.5 mol/L KCl,0.5 mol/L 精氨酸鹽酸 pH 8.0,以抑制ABE8e多聚體的形成。
從圖4(c)和圖4(d)的凝膠層析實驗結果可知,優化了緩沖體系后,ABE8e的二聚體比例上升到52.8%,多聚體比例降至18.2%。對比兩種緩沖體系下凝膠層析譜發現:在保持其它條件不變的情況下,僅在原緩沖體系中添加0.5 mol/L 精氨酸鹽酸后,ABE8e的二聚體比例上升了8.8%,多聚體比例下降了16.0%。可見,精氨酸能有效地抑制多聚體的形成。

圖4 ABE8e-T及ABE8e緩沖體系優化純化實驗結果
此外,我們還嘗試了僅含有20 mmol/L Tris 0.5 mol/L精氨酸pH 8.0的緩沖體系。在這個緩沖體系下,負電荷相對減少了一定數目,因而ABE8e的多聚體比例也提升到40.6%,二聚體占比為35.4%。這再次表明,在缺少負電荷的環境下,ABE8e不穩定,容易形成多聚體。
前期研究表明,ABE8e在提純的過程中發現了出現多聚體比例偏高的現象。為降低多聚體的比例,提高二聚體的含量,本研究首先探究了多聚體產生的原因。通過研究與分析TadA-8e疏水性氨基酸分布、電荷分布及ABE8e的三維結構,推測ABE8e分子在未形成二聚體的情況下,曝露了二聚化界面中疏水性區域,這些區域傾向與分子表面的其它疏水性氨基酸結合。這種傾向加劇了分子之間的結合力,從而導致了多聚體的形成。
為了驗證理論推測的正確性,本研究構建了可進一步阻礙二聚體形成的相應突變體ABE8e-T。ABE8e-T的純化結果證實了ABE8e多聚體形成的理論推測。在找到多聚體的成因后,本研究通過優化緩沖體系,在緩沖液中添加0.5 mol/L 精氨酸鹽酸后,有效地降低了多聚體的比例。優化后的緩沖體系可以為其它堿基編輯器的制備提供了一種新的技術方案。
在常規緩沖體系優化的過程中,一般通過試錯的方式來摸索工藝條件。這樣的方式費時費力,效率低下。在本研究中,使用PyMOL建模軟件分析了蛋白質的結構信息,可以快速精準地尋找引起聚集的關鍵氨基酸。這樣,在確認具體原因后再尋找解決方案可以有效地提高了緩沖體系的優化效率。不難預見,當其它堿基編輯器遇到類似聚集問題時,也可考慮應用相同的方式解決,這為純化制備工藝的開發提供了有用的思路。
還有,現有的ABE定向進化優化主要方向是通過增強其與底物DNA 的結合力來實現提高編輯活性及降低脫靶效應。本文的結果提示,當蛋白質不易發生聚集時,將有助于提高蛋白質的穩定性,增加其編輯活性。所以,本研究的結果也可以為ABE的定向進化優化提供了新的方向。