■文 /常 興
隨著單堿基基因編輯工具的進一步完善,它將在人類的遺傳性疾病的基因治療中發揮越來越多的作用。
生命的遺傳物質是DNA?;蚝帽仁且淮蒁NA堿基“字母”拼起來的詞句,構成了生命的“遺傳天書”。如果“字母”出錯,基因就不能正常行使功能,甚至產生有害的功能,引起各種各樣的疾病。而“遺傳天書”中的錯誤,既有單個字母的“錯字”,也有成千上萬個“字母”的缺失。自從人類基因組計劃完成以來,人類第一次完全破譯了DNA的“遺傳天書”,疾病的遺傳學基礎一一被闡明,如何修復這些疾病相關的“錯誤”,是科學家面臨的新的挑戰。
近年來基因編輯技術的發展,首次使DNA可以直接成為藥物開發的靶標,修復“遺傳天書”中的錯誤,從而根治一些疾病,尤其是單基因遺傳性疾病。現在最常用的CRISPR/Cas9基因編輯技術,好比是一把可以精確控制的“剪刀”,將“剪刀”精確定位到某些區域內的基因上,同時提供正確的修復模板,用以實現突變基因的修復。然而,“剪刀”也會造成目的基因的破壞和刪除,無法同時實現精確和高效修復的目的。為開發更好的基因編輯方法,近年來,科學家逐步把單一功能的CRISPR “剪刀”, 改造成多功能的“瑞士軍刀”。例如,單堿基基因編輯技術,利用CRISPR的精準定位功能,招募特定的堿基修飾酶,就可以直接對單個“字母”進行修改,完成單堿基的基因編輯,治療單個“字母”錯誤造成的疾病。此外,研究還發現,精確地針對某些“字母”進行置換,也可以修復上萬個“字母”缺失造成的疾病。因此,這一技術有可能在人類疾病治療中得到廣泛的應用。

CRISPR/Cas系統是細菌中的適應性免疫系統,原本是細菌用于降解噬菌體DNA的機制。經過遺傳工程改造的CRISPR/Cas9系統僅包括1個Cas9 蛋白和1條向導RNA(sgRNA),在sgRNA的定位下, Cas9蛋白可以像剪刀一樣, 對靶向DNA進行切割。利用CRISPR/Cas進行基因編輯,只需提供20 個堿基對的特異性核酸序列,因此,其構建過程相對之前的基因操作技術更加簡單、快捷,適合規?;⒏咄康慕M裝,操作簡單,制作成本低,受到越來越廣泛的應用。盡管具有很多優勢,但常用的CRISPR/Cas系統也存在一些缺點。
首先,利用CRISPR/Cas9技術進行修復突變的效率較低。CRISPR/Cas9主要采用同源重組的方式,同源重組主要發生在細胞分裂的DNA復制前期和復制期,因此在不分裂的體細胞中,同源重組基本上無法實現。此外,基于CRISPR的基因編輯依賴于對DNA雙鏈的切割,而DNA斷裂造成的損傷可能造成哺乳動物細胞癌變;在一些細胞中,DNA斷裂可造成細胞死亡,使依賴于CRISPR酶切活性的基因編輯無法實現。
其次,CRISPR/Cas9不僅靶向編輯目標DNA位點,而且會切割那些與靶位點序列相同(或高度相似)的其他DNA位點,使其產生突變,即脫靶效應。脫靶效應是CRISPR/Cas9基因編輯技術所面臨的最主要問題。由于Cas9蛋白對sgRNA序列與靶位點間的錯配不完全敏感,其脫靶風險較高。
基于以上原因,現在的CRISPR/Cas9技術應用大多針對細胞系或體外培養的干細胞,或者對模式生物進行基因編輯,對于大部分的體細胞只能進行基因敲除,無法精確地進行基因修復?,F階段利用CRISPR基因編輯技術開展疾病治療,也主要是利用非同源末端連接的修復模式。
很多人類疾病,都是單堿基突變造成,因此通過單堿基基因編輯,修復錯誤的堿基,可以直接應用于這些疾病的基因治療。
在哺乳動物細胞內,大部分細胞的同源重組效率很低,這決定了現在的CRISPR技術只能進行有效的“刪除”,無法對DNA序列進行高效的“替換”。但是,在免疫系統中有一個高效的DNA突變體系,也就是抗體蛋白的親和力成熟過程。免疫球蛋白進行高頻突變,對編碼的DNA序列進行隨機“替換”,獲得高親和力的抗體。研究發現,這一過程主要由一個胞嘧啶脫氨酶(AID)介導。通過高頻突變,抗體分子的氨基酸序列發生隨機改變,經過正向選擇使含有高親和力抗體的B細胞選擇性擴增,對此過程進行迭代,最終演化出高親和力的抗體。
基于AID可以進行高效的誘導突變,將DNA序列進行“替換”,提示我們可以將這一特點和CRISPR相結合。我們發現,將dCas9和AID融合,可以利用dCas9的靶向功能,把AID蛋白招募至細胞內源的DNA上,在任何感興趣的位點誘導高頻突變。我們證明dCas9-AID融合蛋白(TAM)具有多個獨特的功能,包括:(1)胞嘧啶可以隨機地向其他3個堿基轉變;(2)dCas9-AID融合蛋白的活性只依賴于sgRNA,與AID識別的一級序列無關;(3)dCas9-AID可以同時誘導多個胞嘧啶的突變,并且這一方法不依賴于DNA切割和修復,可以大幅提高單堿基精確編輯的效率,避免了DNA的雙鏈斷裂;(4)在一種多肽抑制劑 (uracil glycosylase inhibitor,UGI)存在的情況下,TAM可以誘導胞嘧啶(C)向胸腺嘧啶(T)轉變,并且其活性只局限于前間隔序列(protospacer)內的特定堿基; (5)利用dCas9-AID可以有效地預測出小分子抑制劑的耐藥性突變。作為遺傳操作的新技術,靶向性胞嘧啶脫氨酶有著廣泛的應用前景,可以為分子進化、基因治療和在單堿基水平上分析基因調控元件等領域提供新的方法。
除了最初的胞嘧啶單堿基編輯之外,美國哈佛大學的科學家還通過蛋白人工進化,開發出了針對腺嘌呤的單堿基編輯,可以將A轉化為G;麻省理工學院的科學家將靶向RNA的CRISPR蛋白Cas13a和腺嘌呤脫氨酶ADAR融合,用于在RNA上誘導A到G的突變。很多人類疾病,都是單堿基突變造成,因此通過單堿基基因編輯,修復錯誤的堿基,可以直接應用于這些疾病的基因治療。但是,現在的單堿基編輯平臺仍然不夠準確,往往會在臨近的2~3個堿基同時造成突變,有可能會引起其他意想不到的后果。因此,對靶點的選擇和治療方案的設計,都需要認真的考量。另外,即使同一種遺傳疾病,不同患者往往有不同的致病突變,有可能需要對每個患者開發特異的治療方案,全面衡量其效率,這從經濟上和成本上都面臨巨大的挑戰。
在真核細胞中,基因在轉錄后還受多種不同機制的調節,包括可變剪切、差異化3’聚腺苷酸化、微小RNA介導的基因沉默等。據估計,超過75%的人類基因具有一種以上的信使RNA(mRNA)剪接方式,其中大部分可以翻譯為功能性蛋白質,與RNA表達的組織特異性一起,共同造成轉錄組的組織特異性,介導細胞的分化,賦予不同細胞截然不同的功能,是決定細胞命運的重要環節。因為RNA剪接的重要作用,mRNA剪接的異常是許多疾病的直接誘因,估計35%~50%的人類疾病是由基因剪接異常造成。
針對RNA剪接過程進行修復是很多遺傳疾病的治療靶點。現有的調控RNA剪接的方法是通過反義寡聚核苷酸(ASO)。ASO經過特殊修飾,通過互補配對結合到RNA上后,不誘導RNA的降解,而阻斷相應蛋白和RNA的相互作用,調控RNA的剪接。但是,因為RNA二級結構的影響,往往需要對ASO進行大量篩選,才能獲得有效的調控特定RNA剪接的ASO序列。
利用ASO調控RNA剪接,針對一些遺傳疾病,最近獲得了一些成功:在臨床試驗中,對杜氏肌肉萎縮癥 (DMD)和脊髓性肌萎縮癥 (SMA)都有一定的緩解作用。然而,ASO療法也面臨一些內在的挑戰,例如,大部分ASO只能有效地靶向到肝臟,無法通過血腦屏障,修復神經細胞;因為ASO作用到RNA,其作用是瞬時的,需要持續給藥;ASO的合成需要復雜的修飾,因此臨床應用價格昂貴(約20萬美元/年);更重要的是,一些ASO療法的效果十分有限, 例如針對杜氏肌肉萎縮癥的ASO只能恢復約1%的肌萎縮蛋白表達。因此,無論從科學研究還是臨床應用角度,都亟須開發出新的調控RNA剪接的基因編輯方法。
絕大多數基因中內含子的剪接位點由GU-AG構成,我們發現并證明可以利用之前開發的單堿基基因編輯,將內含子剪接位點的鳥嘌呤(G)突變成腺嘌呤(A),使這一剪接位點不能被剪接體識別,從而特異性阻斷外顯子識別,調控內源性mRNA的剪接。通過這一策略,有望針對多種RNA剪接缺陷造成的疾病起到治療作用。
例如,杜氏肌營養不良癥是一種致命的遺傳疾病,每4000名男性中就有一人患有此遺傳疾病。DMD的發病機理很簡單,由于遺傳突變破壞了DMD基因讀碼框,或產生提前終止密碼子,造成肌萎縮蛋白的完全缺失,引發肌肉萎縮和癱瘓,最終造成心臟或肺功能的衰竭。過去研究證明,如果通過外顯子跳躍,恢復蛋白讀碼框以產生內部截短的Dystrophin蛋白,可以用來治療DMD。在我們前期的研究中,建立了DMD患者來源的誘導型多能干細胞。這個患者因為DNA大片段的缺失,超過1萬個堿基的缺失,造成了DMD基因的移碼突變和肌萎縮蛋白的完全缺失。我們通過設計基因編輯策略,在剪接位點精確地誘導了鳥嘌呤到腺嘌呤的突變,造成相應外顯子的跳讀,恢復了mRNA的讀碼框和肌萎縮蛋白的表達。進一步在體外分化的心肌細胞中證明心肌細胞的缺陷被完全修復。更重要的是,通過全基因組測序,只發現了一個脫靶位點,其位于基因間區域,對周圍的基因編碼和表達都沒有影響。除此之外,我們還證明類似的策略可以用于多種RNA剪接疾病的治療。
單堿基基因編輯的應用,現在還處于起始階段,隨著對這一工具的進一步完善,它將在人類的遺傳性疾病的基因治療當中發揮越來越多的作用。