汪亮,徐澍
(中國藥科大學基礎醫學與臨床藥學學院,江蘇 南京 210009)
“人類基因組計劃”的完成,為闡明基因組功能以及在遺傳變異和生物表型之間建立因果聯系提供了可能,而高效、簡便和精準的基因編輯系統是將這一可能付諸實現的重要工具。許多以此為目標的基因編輯系統被開發和應用,從2012年開始大規模應用的成簇規律間隔短回文重復系統(clustered regularly interspaced short palindromic repeats-CRISPR associated nuclease 9,CRISPR-Cas)[1]到 以 前 的 轉錄激活樣效應因子核酸酶系統(Transcription activator-like effector nuclease,TALEN)[2]和鋅指核糖核酸酶系統(Tincfinger nuclease,ZFN)[3]等。這類基因編輯工具可以在DNA鏈上產生雙鏈斷裂(DSB),從而在編碼基因中誘導插入缺失(indels),使之移碼突變,繼而解析闡明特定基因和調控元件的功能。但這種“切割”技術存在兩大問題,首先,“切割”是不可逆轉的,無法應用于與致死性突變相關的基因;另外,DSB的形成可能導致未知的細胞毒性。
相比于基因編輯,調控基因表達不會像“分子剪刀”一樣切割基因組DNA。因此,不會造成DNA雙鏈斷裂,可避免在特定基因上產生某種永久突變從而對宿主產生不利的影響[4]。由于基因的選擇性表達出現在生物體生命進程中的各個階段,所以人為的控制基因表達的激活或抑制會影響細胞正常功能甚至相關的生命進程。因此,使精準地調控靶標基因使之能夠適時、適量、適度地表達,對疾病的發生發展進程、致病基因功能的研究以及基因治療方面有顯著的作用。已有研究表明,細菌中發現的天然DNA結合結構域(DBDs),如TetR、LacI和LexA等也常作為招募效應分子的結構域用來調控基因的表達[5]。如今,CRISPR/dCas9系統、人工構建的TALEs(Transcriptional activator-like effectors)、人工構建的ZFs(Zinc fingers)、miRNA和siRNA等非編碼小RNA等可以通過相應不同地機制調控靶標基因的表達[6-8]。下面將介紹幾種調控基因表達技術的研究進展。
RNA干擾(RNA interference,RNAi)是一種存在于真核生物中相對保守且廣泛存在的轉錄后的調節機制,通過特異性降解靶標mRNA從而實現靶標基因沉默。其形成過程及作用機制如圖1。
如圖1所示,當siRNA與Argonaute(Ago)蛋白和多種酶結合形成RNA誘導沉默復合物(RNA-inducing silencing complex,RISC)后,其中的解旋酶利用ATP供能解開siRNA雙鏈,釋放的反義鏈通過堿基互補配對識別并結合靶標Mrna,再利用核酸內切酶切割mRNA,隨后被降解的mRNA被宿主細胞中的RNA酶降解,從而實現靶標基因沉默[9]。除了介導mRNA的切割外,siRNA還可以在RNA依賴的RNA聚合酶的作用下,以靶標mRNA為模板作為合成dsRNA的引物,合成新的dsRNA。dsRNA再一次被Dicer切割產生更多的siRNA,接著再經以上循環作用于靶標mRNA。如此往復,不斷級聯放大了RNAi的效果[10]。

圖1 形成過程及作用機制圖
目前,RNAi已被廣泛用于基因組中的篩選,其結果可通過Project Achilles[11]和GenomeRNAi[12]等數據資源中獲取。金海玲等通過促進真菌寄生蟲對dsRNA和siRNA的吸收,開發出用于產生新RNA殺菌劑的新型系統,稱為環境RNAi[13]。另外,patisiran,全球第一個RNAi生物技術藥物,已經被用于治療成人患者的遺傳性ATTR淀粉樣變性第1階段或第2階段多發性神經病(一種退行性神經疾病)[14]。
microRNA(miRNA)是一類由自身基因組編碼的長約20-24nt的單鏈非編碼小RNA分子,通過靶向mRNA充當轉錄后調控因子實現對靶標基因的調節[15],在許多生物學過程中具有重要的作用,包括發育,分化,細胞增殖,代謝和炎癥以及人類疾病等[16]。在細胞核內,大部分miRNA在RNA聚合酶II(很少部分由RNA聚合酶III)的作用下轉錄出不同長度的初級產物pri-miRNA。隨后,pri-miRNA被核酸內切酶Drosha和輔助因子DGCR8剪切成約70個堿基的miRNA前體pre-miRNA。pre-miRNA在轉運蛋白Exportin 5的幫助下,從細胞核內運輸到細胞胞質中。在核酸內切酶Dicer及其輔助因子的作用下pre-miRNA被剪切加工成miRNA:miRNA*配對分子[17]。接著,miRNA:miRNA*配對分子與Ago等多種蛋白結合形成RISC(過程類似于siRNA)。隨后,miRNA:miRNA*配對分子中穩定性較強的miRNA*被快速降解,穩定性較弱的miRNA形成成熟的miRNA進而引導RISC進行靶標基因的識別[18]。miRNA通過序列完全或不完全的互補配對,結合靶標mRNA的3’UTR,導致靶標mRNA被切割或翻譯抑制,從而下調相應蛋白的表達。
自20世紀90年代以來,在臨床前研究和臨床試驗中,兩種基于miRNA的治療工具已顯示出希望,分別是miRNAmimetics和antimiRs[14]。越來越多的miRNA已經用于治療各種疾病,包括代謝綜合征,自身免疫性疾病和癌癥等[14]。Miravisen作為第一個針對miRNA的藥物,目前已經進入治療丙型肝炎病毒的II期實驗[14]。
鋅指蛋白(Zinc finger protein,ZFP)普遍存在于真核生物基因組中,人類基因組中有近1%的序列編碼含有鋅指結構的蛋白[19]。ZFP作為對基因調控起重要作用的轉錄因子,通過折疊形成“手指”樣結構,特異性地識別靶標結構,在生物體多種生命過程中發揮重要作用。由于ZFP的DBDs中含有與靶標DNA雙螺旋結構互補的獨特結構,其“指型”結構與DNA雙螺旋的大溝吻合,通過α螺旋結構與DNA堿基發生特異性接觸介導其特異性識別并結合靶標基因。ZF與DNA結合必須三個條件:(1)ZFP的α螺旋位于DNA雙螺旋的大溝內;(2)ZFP攜帶正電荷的區域接近磷酸骨架;(3)鋅指(Zincfinger,ZF)間的接頭結構相對固定(ZF為構成ZFP的基本單元)[20]。ZFP作為基因表達調控工具的關鍵點是可以通過人工設計改變鋅指結構,以特異性識別特定的靶標序列。對于不同的靶標位點,需要創建不同的ZFP,通過將ZFP與不同功能的結構域融合,可以構建出不同用途的人工合成的DBDs,從而實現對基因組的定點修飾或調控[21]。
已有研究表明,以ZF為核心構建了一種可調控的合成生物學系統,用于調節真核生物的轉錄[8]。目前,仍有很多靶標序列不知道哪種ZFP能與之高效結合,研究人員已開發出多種方案用于ZFP的構建和篩選。如模塊組裝(Modular assembly,MA)方案、雙鋅指模塊組裝方案、寡聚文庫構建(ligomerized pool engineering,OPEN)方案和上下文依賴組裝 (context-dependent assembly,CoDA)方案[21]。或者,也可以通過商業購買工程鋅指,如Sangamo生物科學公司和Sigma-Aldrich 公司合作開發的鋅指結構合成平臺CompoZr。
轉錄激活樣效應因子(Transcription activator like effectors,TALEs)是由黃單胞菌分泌的影響宿主植物防御反應相關基因表達的效應蛋白,TALEs能夠特異性識別并結合宿主植物中靶標基因的啟動子序列,發揮類似于真核生物轉錄因子的作用干預宿主植物靶標基因的轉錄,以便于黃單胞菌在宿主中繁殖[22]。隨后,研究人員便將其作為基因表達調控工具進行深入研究。由不同數量的重復單元構成的DBDs形成了TALEs的特殊結構從而實現了對靶標基因的特異性識別與結合。一般情況下,TALEs的每個重復單元由34個序列高度保守的氨基酸組成。但第12和13位的兩個氨基酸序列可變,構成了重復單元可變區(RVDs)。一個重復單元上的一個RVD特異性識別一個堿基對[22]。所以理論上說,研究人員可以利用這一特征設計出與任意靶標結合的TALEs。同樣,TALEs也可以通過人工設計改變RVDs結構,以特異性識別特定的靶標序列。TALEs與具有激活或抑制功能的結構域融合,就能夠讓相對應的靶標基因激活或抑制。
目前,David Bikard等借助天然的AvBs3設計出TALEs的中央重復結構域,靶向靶標基因的啟動子序列,最后成功激活了植物基因的表達[7]。張鋒等利用融合VP64激活結構域的TALEs成功激活了了SOX2和KLF4的表達[23]。另外,Jeffrey C Miller和René Geissler的研究團隊使用了融合VP64激活結構域的不同的TALEs激活了人類細胞中相關基因的表達[24,25]。雖然TALEs理論上可以靶向識別任何序列,但其合成與裝配往往也具有一定的難度和限制。相應地,研究人員開發了多種用于人工構建高效TALEs的方案,主要包括:(1)Golden Gate(GG)克隆法;(2)連續克隆組裝法;(3)利用基因固相合成的高通量技術法;(4)長粘末端的LIC(ligation‐independent clonging)組裝方法等[26]。
CRISPR/Cas9系統起源于細菌和古細菌中,為抵抗病毒、噬菌體等的入侵而形成的一種遺傳適應性免疫防御系統,可以有效地切割細胞內的外源DNA[27]。該系統特異性識別并結合靶標不是利用蛋白與靶標基因間的相互作用而是利用RNA與靶標間的堿基互補配對引導Cas核酸內切酶對靶標序列進行雙鏈切割[1]。該系統由CRISPR RNA復合體和Cas9核酸內切酶組成。自然狀態下,前者由crRNA(CRISPR-derived RNA,crRNA)和 反 式 激 活 RNA(Trans-activating RNA,tracrRNA)組成,目前,研究人員已經將其簡化為一條導向RNA(single guide RNA,sgRNA)[28]。通過對該系統的升級改造,CRISPR/Cas9系統已不僅限于作為基因編輯工具,還是一種重要的基因調控工具。研究人員發現將Cas9蛋白切割活性域RuvC1第10位天冬氨酸突變為丙氨酸(D10A)和HNH第840位組氨酸突變為丙氨酸(H840A)后,將失去核酸內切酶活性,成為不能切割DNA但可以在sgRNA的引導下與特異靶標序列結合的dCas9(catalytically dead Cas9,dCas9)[6]。此外,將dCas9蛋白與轉錄調控因子融合后,dCas9可以將這些調控因子引導到啟動子區域、調控區域或編碼區域,對靶標基因進行精確定點調控而不造成DNA損傷,可用于研究轉錄因子或輔助轉錄因子對特定基因的影響[27,29]。
將dCas蛋白與轉錄激活結構域融合構成了轉錄激活工具CRISPRa(CRISPR activation)。在原核生物中,David Bikard等在大腸桿菌中發現將RNA聚合酶ω亞基與dCas9融合可以使報告基因激活約3倍[6]。Lingjun Yu等在溶桿菌中發現ω亞基與dCas9融合顯著激活了5個基因共表達[30]。在真核細胞中,Luke A Gilbert等發現,VP64激活結構域與dCas9融合除了激活報告基因外還可以激活被沉默的內源基因或者上調已激活基因的表達[31]。隨后,研究人員開發出了SunTag、VP64-p65-Rta(VPR)和 SAM 等系統[31-33],擴大了該系統的應用。
不僅能用于轉錄激活,還可以用于轉錄抑制。將dCas蛋白與轉錄抑制結構域融合構成了轉錄抑制工具CRISPRi(CRISPR interference)。 研 究 表 明,CRISPRi系 統可以通過干擾轉錄的起始和延伸來高效地抑制靶標基因轉錄[6]。亓磊等發現在大腸桿菌中單獨的dCas9就能通過sgRNA引導識別并結合特定的靶標基因,有效地抑制基因的表達[34]。雖然該系統在細菌,酵母和其他原核細胞中能夠顯著抑制基因的表達,但在哺乳動物細胞中的基因表達抑制效率較差。為了提高轉錄抑制能力,亓磊和張鋒等研究團隊將抑制結構域KRAB與dCas9融合。這種增強的CRISPRi系統依靠KRAB募集不同的組蛋白修飾因子,通過形成異染色質的方式抑制基因表達[31,35]。CRISPRi特異地抑制靶標基因轉錄并且可以調控轉錄水平的能力得到了廣泛的應用。如全基因組內基因篩選、敲低特定基因轉錄以研究基因功能、通過分析代謝途徑利用CRISPRi調控必需基因轉錄水平提高代謝物產量或減少副產物的分泌等[36-39]。
由于非編碼小RNA以RNA為靶標且在細胞質中發揮作用,因此其沉默作用不受細胞倍性,染色質構象和基因座可及性的影響。相對于其他技術,非編碼小RNA不需要遞送外源蛋白以及其他調控蛋白,簡化了基因工程,所以對于特定的細胞模型可能特別有利[40]。但由于大量位置靶標,這可能會導致非編碼小RNA的脫靶效應較高,往往限制其應用,尤其是當目的基因為中等或低水平表達的必需基因時[41]。并且基于非編碼小RNA的療法仍處于開發的早期階段,大多數處于臨床前研究中,很少進入臨床試驗。
盡管人工合成的DBDs能夠達到CRISPR系統類似的水平,但往往需要通過復雜的克隆去實現激活或抑制基因的功能。相比于其他技術,人工合成的DBDs與靶標的特異性結合依賴蛋白質與DNA間的相互作用,因此易受表觀遺傳狀態的影響。目前也無法實現對任意一段序列設計出相應理想的DBDs[42]。
CRISPR/dCas9系統相對于其他基因表達調控技術,具有設計簡單,效率高、適應性廣等優點,從而應用更為廣泛。如Prashant Mali將熒光蛋白與CRISPR/dCas9系統融合用于基因定位,研究基因組的動力學特征和三維結構[34]Silvana Konermann和Piyush K Jain將光遺傳工具與CRISPR/dCas9系統融合,實現通過光誘導抑制基因表達[35,43]。但CRISPR/dCas9仍然存在一些局限性,如脫靶,較難遞送等問題。Mazhar Adli等發現染色質的結構和動力學特征可以影響dCas9與靶標基因的結合,這可能會改變其影響基因表達的能力[44]。另外,一些與不同細胞類型特異性表觀遺傳修飾相關的基因和跨細胞周期階段差異調節的相關基因,CRISPR/dCas9的效果可能會有所不同。因此在這種情況下,針對特定細胞類型的文庫可能更加精確[45]。隨著生物技術以及大數據的發展,越來越多的基因及其功能將被發現,癌癥等尚未克服疾病的發生發展機制將被更加清楚地認識,醫療人員進而能從源頭上制定解決方案,做到真正的對癥下藥。越來越多的頑疾也將被攻克。最后,希望有更多更好的基因調控工具被研發出來造福與人類。