張 碩,周雨瀟,吳海波,索 倫
(上海交通大學醫學院附屬第九人民醫院,上海 200011)
CIRSPR/Cas9基因編輯技術自誕生以來,因其設計簡便、操作簡單等諸多優點,先后被應用于畜牧業的各個領域,如改良家畜性狀、生產無過敏原的動物源性產品、動物福利優化以及生產含外源基因的轉基因動物等[1]。CRISPR/Cas9的有效性分別在細胞系[2-3]、小鼠[4]、豬[5-7]、牛[8-9]以及家禽[10]上均已獲得驗證,為遺傳育種、宿主改造、構建疾病模型和疾病治療等的研究提供有效的技術手段[11]。
CRISPR/Cas系統發現于大腸桿菌[12-14],包括3種主要類型,目前廣泛應用的CRISPR/Cas9系統是在Ⅱ型系統的基礎上進行改造而來[14]。CRISPR/Cas9主要作用過程為:在sgRNA(small guide RNA,sgRNA)的指導下,Cas9蛋白對與其結合的靶向序列進行切割,導致DNA雙鏈斷裂(double strand breaking,DSB),斷裂的DNA可以通過同源重組修復[15](homologous directed repair,HDR)或者非同源末端連接[16](non-homologous end joining,NHEJ)兩條途徑進行修復,從而實現基因改造的目的。
研究發現,CRISPR/Cas9系統不僅可以在雞胚中穩定表達編輯[17],還可以在豬、綿羊、牛等大型動物上表達編輯[18]。截至目前,Shi等[19]使用CRISPR/Cas9技術對BMP15外顯子1號區域進行編輯,獲得了雜合子母豬,并展現出較高的繁殖性能,為定向育種提供了有效的實施方法;Whitworth等[20-21]使用該技術成功生產出抗PRRSV(porcine reproductive and respiratory syndrome virus)的基因編輯豬,大大提高了豬抗病能力,Ikeda等[22]運用CRISPR/Cas9技術和體細胞核移植技術成功獲得IARS致病基因被糾正的胎牛,進而降低了牛感染的機率,因此,CRISPR/Cas9技術在抗病育種方面展示出巨大的優勢。此外,CRISPR/Cas9技術的出現為改善畜牧業相關產品的品質提供了有效的技術手段,Wang等[23-24]成功將二花臉豬上的MSTN基因進行突變,獲得雙肌表型,使得豬的肌肉更加豐滿,Oishi等[25]使用CRISPR/Cas系統敲除了蛋清中卵清蛋白和卵黏蛋白的基因,進而去除雞蛋中的過敏原。
然而,目前CRISPR/Cas9的生殖系導入方式主要是采用胚胎顯微注射的方式進行,對動物的胚胎生物技術要求較高[26],而某些家畜生殖細胞體外操作技術并不成熟[27],這嚴重阻礙了該技術的應用。業界提出通過病毒介導的方式進行在體生殖系的長效基因編輯,但長效CRISPR系統作用下,基因編輯動態結局為何,長效編輯是否會增加脫靶風險目前尚未可知。
為此,本研究借助慢病毒整合系統,先后將Cas9基因序列和靶基因序列整合到U-2 OS細胞基因組中進而實現對基因組長期穩定編輯的目的,并選擇FANCF和VEGFA基因為研究對象,分析在CRISPR/Cas9基因編輯工具長期作用下靶點序列編輯效率和修復的動態結局,比較靶點序列位置對CRISPR/Cas9編輯效率和修復結局的影響,追蹤CRISPR/Cas9長效作用下FANCF靶點的脫靶效應,為CRISPR/Cas9基因編輯技術在轉基因動物育種的應用提供數據參考。
1.1.1 試驗材料 本試驗使用的感受態細胞為Trans-T1菌株,購自北京全式金生物技術有限公司;U-2 OS細胞購自中國科學院上海細胞庫;Cas9誘導表達質粒Tet on-Cas9-Neo-TLCV2、sgRNA質粒U6-sgRNA-TLCV2-Puromycin與慢病毒包裝質粒(PsPAX和PMD2.G)均由上海交通大學中心實驗室贈予。
1.1.2 試劑與試劑盒 本試驗分子克隆所需的T4 DNA連接酶、限制性內切酶、DNA高保真聚合酶均購自NEB公司;質粒中量小提試劑盒購自天根生化有限公司;DMEM細胞培養基、青霉素-鏈霉素溶液、胎牛血清均購自Invitrogen公司;LipofectamineTM3000轉染試劑購自Thermo Fisher Scientific;DNA抽提試劑盒(DNeasy Blood &Tissue Kits)購自QIAGEN公司;TruePrep Index Kit V2 for Illumina購自諾維贊生物科技有限公司;Sure PAGE預制膠購自金斯瑞生物科技有限公司;抗體試劑購自Cell Signaling Technology公司和Invitrogen公司。
1.1.3 主要儀器 PCR儀購自Applied Biosystem;高速離心機購自Eppendorf,核酸蛋白定量儀為Nanodrop 2000購自Thermo Fisher Scientific。
1.1.4 生物合成及測序服務 試驗所需的各類引物合成(sgRNA寡核苷酸引物、PCR相關引物等)及后續的一代測序、二代測序均由生工生物工程有限公司完成。
1.2.1 靶點表達載體構建 本試驗所用2個靶區位點(FANCF和VEGFA)sgRNA克隆方法:1)使用引物(表1)以U6-sgRNA-TLCV2-Puromycin載體為模板進行PCR:①使用引物Vector primer F&R擴增TLCV2載體骨架;②使用引物scaffold-CMV primer F&R擴增載體啟動子區域;③使用引物FANCFsite primer F&R或VEGFAsite primer F&R將基因對應的sgRNA片段連入載體啟動子區域;2)使用NEBuilder?HiFi DNA Assembly Master Mix將載體骨架與sgRNA啟動子區域進行連接,以構建完整的靶點病毒表達載體;3)使用Trans1-T1感受態完成轉化過程并過夜培養;4)挑取克隆進行測序,并選擇測序結果正確的克隆進行擴增,去內毒素質粒中量小提后以用于后續的細胞轉染試驗。

表1 引物信息
1.2.2 慢病毒包裝 HEK293T細胞使用含10% FBS、100 μg·mL-1青霉素-鏈霉素的DMEM高糖培養基進行培養。使用LipofectamineTM3000轉染試劑分別將Tet on-Cas9-Neo-TLCV2質粒、U6-FANCFsgRNA-TLCV2-Puromycin質粒、U6-VEGFAsgRNA-TLCV2-Puromycin與病毒包裝質粒PsPAX2、PMD2.G共轉染進HEK293T細胞,在37 ℃、5% CO2細胞培養箱內培養,轉染24 h后收集細胞培養液上清,使用0.45 μM濾器過濾后使用。
1.2.3 Tet on-Cas9慢病毒感染U-2 OS細胞 U-2 OS細胞使用含10% FBS、100 μg·mL-1青霉素-鏈霉素的DMEM高糖培養基進行培養。將U-2 OS細胞按照3×105個·孔-1的密度接種于6孔板中,在37 ℃、5% CO2細胞培養箱內培養24 h后,按照病毒滴度為MOI=0.05感染U-2 OS細胞,慢病毒感染24 h后,將細胞培養液更換為含1 mg·mL-1G418的DMEM高糖培養基培養3~5 d,得到誘導表達Cas9蛋白的U-2 OS細胞株。
1.2.4 靶點慢病毒感染Tet on-Cas9-U-2 OS細胞 將Cas9-U-2 OS細胞按照3×105個·孔-1的密度接種于6孔板中,在37 ℃、5% CO2細胞培養箱內培養24 h后,按照病毒滴度為MOI=0.05感染Cas9-U-2 OS細胞,慢病毒感染24 h后,將細胞培養液更換為含2 mg·mL-1Puromycin的DMEM高糖培養基培養3 d,得到穩定表達靶點sgRNA以及誘導表達Cas9蛋白的U-2 OS細胞株。
1.2.5 誘導Cas9蛋白表達 將U-2 OS-Cas9細胞和穩定表達靶點sgRNA-Target以及Cas9蛋白的U-2 OS穩轉株分別使用含10% FBS、5% 100 μg·mL-1青霉素-鏈霉素以及2 μg·mL-1Doxycycline的DMEM高糖培養基進行培養,持續誘導Cas9蛋白表達,選擇不同編輯時間點收集細胞,使用DNeasy Blood &Tissue Kits(QIAGEN)提取細胞基因組DNA用于后續試驗。
1.2.6 蛋白免疫印跡檢測蛋白表達 取2 μg·mL-1Doxycycline誘導第3天的U-2 OS-Cas9細胞,加入100 μL含有蛋白酶和磷酸酶抑制劑的RIPA裂解液,刮刀將細胞從培養皿底刮下并轉移至1.5 mL離心管中,置于冰上孵育30 min后4 ℃ 12 000 r·min-1離心10 min,吸取上清,加入5×Loading Buffer混合均勻,95 ℃金屬浴加熱10 min使蛋白充分變性。經電泳、轉膜、封閉、一抗孵育、二抗孵育、顯影等步驟得到蛋白印跡圖。
1.2.7 DNA測序文庫構建、二代高通量測序及數據分析 針對靶點的DNA文庫構建流程如下:1)①以外源性靶點為中心設計含有index序列的特異性引物OUT-NGS-F&R、FANCF-OUT-NGS-F&R、VEGFA-OUT-NGS-F&R(表1);②以內源性靶點為中心設計含有index序列的特異性引物ONT-NGS-F&R、FANCF-ONT-NGS-F&R、VEGFA-
ONT-NGS-F&R(表1);③以FANCF靶點GUIDE-SEQ預測的7個脫靶位點為中心,分別設計含有不同index序列信息的特異性引物F1.1/1.2/1.3-NGS-F&1R、F2.1/2.2/2.3-NGS-F&2R、F3.1/3.2/3.3-NGS-F&3R、F4.1/4.2/4.3-NGS-F&4R、F5.1/5.2/5.3-NGS-F&5R、F6.1/6.2/6.3-NGS-F&6R、F7.1/7.2/7.3-NGS-F&7R(表1)。使用上述引物擴增出長約200 bp的DNA片段,用于第二輪擴增的底物。PCR組分和用量:10 μL 2×Q5 Master Mix,0.5 μL primer F(10 μmol·L-1),0.5 μL primer R(10 μmol·L-1),1 μL基因組DNA模板,RNase-Free Water補齊至20 μL。PCR參數:98 ℃預變性30 s;98 ℃變性10 s,67 ℃退火30 s,72 ℃延伸10 s,重復30個循環;72 ℃徹底延伸5 min;4 ℃儲存;2)第二輪PCR建庫使用TruePrep Index Kit V2 for Illumina接頭引物,PCR組分和用量:10 μL 2×Q5 Master Mix,0.5 μL primer P7(10 μmol·L-1),0.5 μL primer N5(10 μmol·L-1),1 μL一輪PCR產物,RNase-Free Water補齊至20 μL。PCR參數:98 ℃預變性30 s;98 ℃變性10 s,64 ℃退火30 s,72 ℃延伸10 s,重復20個循環;72 ℃徹底延伸5 min;4 ℃儲存;3)PCR結束確認條帶大小正確后,將所有樣品混勻后吸取200 μL進行瓊脂糖凝膠電泳,經膠回收純化測定濃度后,將純化產物送上海生工生物工程有限公司測序。
1.2.8 統計學分析 本研究試驗數據先采用Excel 2019進行整理,然后使用GraphPad Prism 7.0軟件分析數據并作圖,所有數據以“平均值±標準差(mean±SD)”表示。采用單因素方差分析對每個外源靶點在不同時間點的基因編輯效率差異進行分析,采用雙因素方差分析各基因內、外源靶點的編輯效率差異,P<0.05表示差異有統計學意義,*代表P<0.05,**代表P<0.01,***代表P<0.001,****代表P<0.000 1。
本試驗針對FANCF基因的第一個外顯子區域以及VEGFA基因的第二個外顯子區域,各自設計一個長20 bp的靶區,并合成含有N20以及N20-CGG的特異性序列(表1),將sgRNA(N20)和Target(N20-CGG)序列連入U6-sgRNA-TCLV2-Puromycin的慢病毒表達載體中(圖1A)。測序結果顯示,該克隆分別含有完整的sgRNA序列和target序列(圖1 B和1C),且二者由669個堿基的linker連接,將上述測序正確的sgRNA和靶點克隆用于后續試驗。
此外,為了保證細胞模型中同時表達sgRNA序列和Cas9蛋白,本研究構建了誘導型Cas9蛋白表達載體,并與PsPAX2、PMD2.G慢病毒包裝載體共同轉染到HEK293T細胞中用于生產慢病毒感染U-2 OS細胞(圖1D),蛋白免疫印跡結果表明,在Doxycycline作用濃度為2 μg·mL-1時,可成功誘導Cas9蛋白表達(圖1E)。
本試驗將上述成功構建的含FANCF、VEGFAsgRNA和其對應靶點的TLCV2慢病毒表達載體進行慢病毒包裝并感染整合有Cas9的U-2 OS細胞,在Doxycycline誘導不同時間點收集細胞樣品并抽提基因組DNA用于檢測基因編輯效率(圖2A)。

A.加入Doxycycline后使用二代測序檢測細胞中外源和內源靶點區DNA的編輯情況;B.外源FANCF靶點在不同時間點的編輯效率單因素方差分析結果;C.外源VEGFA靶點在不同時間點的編輯效率單因素方差分析結果;D. 內源FANCF靶點在不同時間點的編輯效率;E.內源VEGFA靶點在不同時間點的編輯效率。*.P<0.05;**.P<0.01;***.P<0.001;****. P<0.000 1。下同A. Detection of DNA editing at exogenous and endogenous target regions in cells using next-generation sequencing following the addition of Doxycycline; B. Editing efficiency of FANCF exogenous targets at different editing times by one way ANOVA; C. Editing efficiency of VEGFA exogenous targets at different editing times by one way ANOVA; D. Editing efficiency of FANCF endogenous targets at different editing times; E. Editing efficiency of VEGFA endogenous targets at different editing times. *.P<0.05;**.P<0.01;***.P<0.001;****. P<0.000 1. The same as below圖2 不同誘導時間點對CRISPR/Cas9編輯效率的影響Fig.2 Effect of different Doxycycline treatment time points on CRISPR/Cas9 gene editing efficiency
使用特異性引物分別對外源靶點和內源靶點進行PCR擴增,通過二代高通量測序技術對CRISPR/Cas9編輯后的靶點進行測序,并統計各位點編輯效率的情況,經過分析發現,FANCF外源靶點在第4天編輯效率達到峰值(圖2B),VEGFA外源靶點在第3天編輯效率達到峰值(圖2C);對應上述靶區的內源靶點達到峰值的時間點與外源靶點基本一致(圖2D和2E)。上述結果表明,隨著Cas9蛋白誘導表達時間的增加,編輯效率逐漸升高,第4天以后編輯效率逐漸趨于穩定,靶點位置對CRISPR/Cas9編輯效率的整體趨勢無明顯影響。
為比較基因靶區位置對基因編輯效率的影響,本試驗針對同一靶區,分別比較了內、外源靶點在第4~7天的編輯效率,結果顯示編輯效率在不同時間點趨于穩定,但對于上述兩個編輯靶區,其內源靶點在各時間點的編輯效率均顯著高于外源靶點(圖3A和3B)。
本試驗使用特異PCR引物對內源靶點的堿基序列進行擴增并選取數據量排名前20位的結果進行分析,結果發現,內源FANCF靶點在第4~7天堿基的刪除、插入、替換結局改變穩定(圖4A-D),內源VEGFA靶點在編輯的各時間點堿基的刪除、插入、替換結局改變也穩定(圖4E-H)。上述結果說明,加入Doxycycline誘導Cas9蛋白表達在第4~7天各編輯時間點,內源靶點堿基的改變結局呈穩定狀態。
本試驗采用上述相同的方法對外源靶點的修復結局進一步分析,結果同樣發現,在加入Doxycycline第4~7天,外源FANCF靶點堿基的刪除、插入、替換結局改變穩定(圖5A-D);在該編輯時間段,外源VEGFA靶點堿基的刪除、插入、替換結局改變也穩定(圖5E-H)。上述結果說明,在CRISPR/Cas9作用的第4~7天,外源靶點堿基序列的改變呈穩定狀態。
本試驗對各基因內、外源靶點誘導7 d后編輯結局進一步比對發現,FANCF內源靶點編輯結局中插入占比為18%,刪除占比為69%,其它類型占比為13%(圖6A),FANCF外源靶點編輯結局中插入占比為18%,刪除占比為80%,其它類型占比為2%(圖6B);VEGFA內源靶點編輯結局中插入占比為13%,刪除占比為85%,其它類型占比為2%(圖6C),VEGFA外源靶點編輯結局中插入占比為13%,刪除占比為86%,其它類型占比為1%(圖6D)。上述結果說明,FANCF內源靶點和外源靶點編輯結局比重趨勢一致,從大到小均依次為刪除、插入、其它類型,VEGFA內源靶點和外源靶點各編輯結局占比也呈現相同的狀況,表明基因靶點所處位置并不影響基因編輯后各結局占比順序。

A.內源FANCF靶點編輯結果統計圖;B.外源FANCF靶點編輯結果統計圖;C.內源VEGFA靶點編輯結果統計圖;D.外源VEGFA靶點編輯結果統計圖A. Statistical chart of endogenous FANCF target editing results; B. Statistical chart of exogenous FANCF target editing results; C. Statistical chart of endogenous VEGFA target editing results; D. Statistical chart of exogenous VEGFA target editing results圖6 靶點編輯結局統計分析Fig.6 Statistical analysis of target editing outcomes
本試驗針對FANCF編輯位點,采用GUIDE-SEQ預測出6個潛在脫靶位點[28](圖7),分別使用特異性引物進行PCR擴增,通過二代高通量測序技術對預測的靶點進行測序分析,各脫靶位點具體的序列信息及測序比對發現沒有脫靶現象的產生。
目前,CRISPR/Cas9編輯工具主要通過AAV(adneo-associated virus)、AdV(adneoviral vector)、LV(lentiviral vector)和VLP(virus-like particle)等病毒載體傳遞進入體內[29],進而達到長效基因編輯的目的[30-31]。研究發現,借助慢病毒載體整合到豬基因組的DNA片段在其4歲時的表達水平與其幼時相當,在羊、雞等動物體內也觀察到相似的現象,在小鼠多代傳遞后整合片段尚未發現明顯的沉默現象[32]。目前,表達Cas9蛋白的轉基因小鼠模型已用于試驗研究中,通過病毒整合的方式將sgRNA整合到宿主體內即可實現對宿主任意細胞或器官的編輯[33],但長效CRISPR/Cas9提高編輯效率的同時也出現了相應的挑戰,如基因編輯動物中CRISPR/Cas9的脫靶問題[34],且CRISPR/Cas9持續表達下基因編輯的動態也尚未可知。因此,為追蹤長效CRISPR/Cas9作用下基因編輯的動態過程,本研究針對基因FANCF和VEGFA各自設計一個Target靶區,并將sgRNA序列和Target靶區序列構建到TLCV2質粒載體中,Cas9基因序列和靶點序列分別借助病毒載體隨機整合到細胞基因組中。研究發現,在加入Doxycycline誘導Cas9蛋白表達后,對不同時間點的編輯效率和結局進行追蹤分析,研究結果表明,CRISPR/Cas9持續作用的第4天之后編輯效率和結局呈現穩定狀態,這為追蹤長效CRISPR/Cas9基因組的編輯情況提供了有力的數據參考。
本研究通過對編輯第7天的內源靶點和外源靶點的編輯效率進行對比發現,內源靶點的編輯效率顯著高于外源靶點。推測,外源靶點編輯效率顯著性降低一方面可能與外源靶點整合進入基因組中的位置有關,以往研究發現通過慢病毒可以將目的序列隨機整合到基因組中多個位點[35-39],在Cas9豐度相同的情況下,外源位點拷貝數遠大于內源位點,導致未被編輯位點的占比提高,進而降低CRISPR/Cas9對外源位點的編輯效率[40]。在CRISPR/Cas9基因編輯的過程中,隨著外源靶點整合到基因組中位置的不同,將顯著影響DNA三維結構,進而影響了外源靶點的編輯效率,導致外源靶點的編輯效率低于內源靶點。另一方面可能與靶點兩翼的特異性序列有關,研究表明Cas9蛋白活性受非靶點序列以外其它序列信息的影響[41],本研究中由于慢病毒載體中靶點序列的兩翼序列與基因組中不同,從而導致了CRISPR/Cas9在外源靶點和內源靶點編輯效率的不同。然而,內源靶點與外源靶點編輯效率的不同并不影響對CRISPR/Cas9修復結局動態過程的追蹤。通過控制Doxycycline誘導時間,進而人為控制Cas9蛋白表達并編輯基因組過程,在不同作用時間節點觀察基因編輯的動態。
本研究發現,無論是FANCF位點還是VEGFA位點,通過NHEJ途徑修復后,內源靶點和外源靶點刪除、插入及其它類型編輯結局占比順序一致,這一結論在Shen等[42]的研究中發現相同現象:采用相同的策略將sgRNA和target序列構建入一個載體中,對經NHEJ途徑修復后內外源靶點的編輯結局中堿基刪除與插入占比分析發現其順序一致。
目前,本研究只在細胞層面研究了CRISPR/Cas9編輯及修復的動態過程,動物活體中CRISPR/Cas9編輯的具體情況尚不清晰。在未來,需要生產含有CRISPR系統的轉基因動物,來進一步研究動物活體中基因編輯及修復的動態過程,進而為長效CRISPR/Cas9技術在定向育種、改良家畜性狀方面的進一步應用提供更為詳實的研究數據。
在長效CRISPR/Cas9系統作用下,靶點的編輯效率在第3或第4天達到峰值,且內外源各編輯結局類型占比趨勢一致。此外,對于FANCF位點而言,CRISPR作用時間增加不會增加脫靶風險。該研究結果為動物體內追蹤CRISPR/Cas9長效作用后的編輯效率和結局提供了初步的科學參考。