武慧慧,耿淑慧,郭志濤,孟祥寧,朱 靜,*
(1.哈爾濱醫(yī)科大學醫(yī)學遺傳學研究室,黑龍江 哈爾濱 150081;2.哈爾濱醫(yī)科大學中國遺傳資源保護與疾病防控教育部重點實驗室,黑龍江 哈爾濱 150081)
真核細胞的遺傳物質主要存在于染色體上,而位于染色體外的DNA 則成為染色體上DNA 的額外補充,可能影響著基因組的不穩(wěn)定性和可塑性,并參與基因表達調控和基因組進化。染色體外DNA 中有一大類特殊的呈現(xiàn)閉合環(huán)狀的DNA 分子。根據(jù)目前的研究,這些環(huán)狀的染色體外DNA分子又可以按其大小和功能分成不同類別:包括相對分子質量較小的microDNA(<1 kb)[1]、小而多的分散環(huán)狀DNA(20 kb~1 Mb)[2]和端粒環(huán)(Tloop)[3]等以及相對分子質量較大的染色體外環(huán)狀DNA 比如長達幾Mb的雙微體(double minute chromosomes,DMs),近年有研究者稱DMs 為染色體外DNA(extrachromosomal DNA,ecDNA)[4]。我們在此所討論的染色體外環(huán)狀DNA(extrachromosomal circular DNA,eccDNA)指的是一類相對較小(長度分布多在1 kb 以下),在酵母菌、植物和動物細胞中均廣泛存在的,位于染色體外的閉合環(huán)狀DNA 分子,主要包括microDNA 以及使用類似富集方法并進行高通量測序分析的eccDNA分子。
1964年,Hotta等[5]通過電子顯微鏡首次在野豬精子和小麥細胞核中發(fā)現(xiàn)了eccDNA。正常細胞和腫瘤細胞均可檢測到eccDNA[6],它的普遍性、豐富性和極高的異質性提示其可能在細胞中有重要功能。eccDNA 和拷貝數(shù)變異、單核苷酸多態(tài)性有密切聯(lián)系[7],能反映基因組的不穩(wěn)定性和多樣性。DNA 雙鏈斷裂造成的基因重組伴隨eccDNA的產(chǎn)生,eccDNA也可重新整合到基因組[8-9],表明eccDNA 可能是基因組重塑的象征。酵母菌在分裂中將無益的eccDNA 保留,避免影響子代[10],說明eccDNA可能有助于物種進化。
eccDNA 可能代表了機體適應外界變化的應答產(chǎn)物。在不同生理和病理狀態(tài)下,eccDNA 表現(xiàn)出不同的生物學特征,提示其可能參與了不同的生理和病理進程[6]。eccDNA由于相對分子質量小,無法像DMs 或ecDNA 那樣作為癌基因的載體,但eccDNA 可攜帶小片段調控序列,可能具有調控基因表達的功能。在腫瘤中,eccDNA 攜帶的DNA 片段與腫瘤致病因子有顯著關聯(lián)。eccDNA 的特征和功能研究目前還處于起步階段,但正在引起越來越多的關注。本綜述旨在討論eccDNA 的生物學特性、生物學功能、發(fā)生機制以及潛在應用等方面的最新研究進展,為理解eccDNA和進一步研究eccDNA提供參考。
隨著高通量測序技術的發(fā)展和生物信息學分析方法的開發(fā),在哺乳動物細胞中,利用核酸酶消化去除線性DNA并滾環(huán)復制擴增環(huán)狀DNA 的方法,定義了一類新的染色體外環(huán)狀DNA-microDNA。大多數(shù)microDNA的長度小于1 kb且集中分布在200~400 bp 之間,富集于基因組的5′非翻譯區(qū)(5′untranslated regions,5′ UTR)、3′非翻譯區(qū)(3′ untranslated regions,3′UTR)、外顯子和CpG 島等區(qū)域[1]。此后多數(shù)eccDNA研究均基于此方法進行eccDNA富集,并且證明了此類eccDNA特征明顯、廣泛存在。隨后,學者們利用電子顯微鏡、外向PCR、DNA 凝膠電泳等技術和RepeatMasker、UCSC(UCSC Genome Browser)等數(shù)據(jù)庫,對eccDNA 展開系統(tǒng)性研究。這些新近研究圍繞eccDNA的物理特征和序列特征,發(fā)現(xiàn)eccDNA能穩(wěn)定維持在細胞中,具有長度周期性、空間移動性和接頭序列微同源等特性。eccDNA分子的物理特征和序列特征總結見表1。

表1 eccDNA分子的物理特征和序列特征
目前對于eccDNA產(chǎn)生機制的研究主要圍繞eccDNA是如何從基因組上產(chǎn)生,與eccDNA產(chǎn)生相關的因素,比如eccDNA片段的產(chǎn)生、環(huán)化和連接所利用的機制等方面。新近的研究認為,基因組的微缺失、凋亡機制、轉錄激活和DNA損傷修復等過程與eccDNA的產(chǎn)生密切相關。
微缺失是基因組中普遍存在的事件,大約每2 000 個堿基存在一處微缺失[1]。研究發(fā)現(xiàn),人類和小鼠的基因組缺失可促成eccDNA[1,14]。2012年,研究人員在小鼠腦組織的microDNA產(chǎn)生熱點區(qū)域中檢測到較多微缺失(25/30)末端有直接重復序列,與相應eccDNA 末端的序列特征一致,證明雙鏈環(huán)狀DNA 源于基因組位點的微缺失[1]。2018 年,研究者在人類健康肌肉樣本中檢測到eccDNA 對應基因組的精確位置發(fā)生了DNA 缺失,從DNA缺失的熱點區(qū)域也檢測到eccDNA,表明在健康組織中基因組的缺失可導致eccDNA的形成[14]。由于同源重組修復可以恢復DNA雙鏈斷裂(DNA double-strand break,DSB)后切除的遺傳信息,microDNA的產(chǎn)生并不一定伴隨基因組DNA片段的缺失,提示DNA缺失可能不是eccDNA的主要來源[16]。以上研究表明基因組片段的缺失可能是eccDNA片段產(chǎn)生的來源之一,但并不是其全部機制,還需要其他途徑提供eccDNA的片段來源。
microDNA 的長度大多小于1 000 bp,主要集中在100~400 bp 之間,在200 bp 和400 bp 左右有明顯的峰,每間隔大約200 bp會出現(xiàn)一個小峰,而且GC豐富度周期性地被AA/AT/TT 二核苷酸打斷,這些特征表明核小體可能參與了eccDNA 的形成,提示eccDNA 的產(chǎn)生和細胞凋亡有密切聯(lián)系[1,17-18]。凋亡介導的DNA 片段化(apoptosis mediated DNA fragmentation,ADF)正是以核小體為單位切割的,該過程由半胱天冬酶活化的DNA 酶、DNA 酶γ和內(nèi)切酶G 介導。在小鼠胚胎干細胞中觀察到DNA酶γ(DNase1L3基因編碼)的缺失顯著減少了eccDNA的產(chǎn)生,證明ADF缺失阻礙了eccDNA的生成,ADF對eccDNA的生成發(fā)揮了重要作用[17],具體過程如圖1 所示。有研究[19]顯示,DNase1L3 可釋放到循環(huán)系統(tǒng)中作用于細胞外游離eccDNA,在DNase1L3缺陷型小鼠和DNase1L3突變患者的血液中觀察到eccDNA 豐度和長度的增加。另外,DNase1L3以細胞類型特異性方式發(fā)揮作用,DNase1L3缺陷型小鼠的肝組織和血沉棕黃層中eccDNA 的豐度及長度未發(fā)生明顯改變[19]。以上研究為ADF介導因子DNase1L3以細胞或組織依賴的方式影響eccDNA 的生成提供了證據(jù)。至于半胱天冬酶活化的DNA酶和內(nèi)切酶G是否通過細胞凋亡途徑影響其他組織或細胞eccDNA 的產(chǎn)生有待進一步探究。

圖1 凋亡介導的eccDNA生成機制及eccDNA在細胞質中的作用
此外,凋亡產(chǎn)生的DNA片段可能通過某些連接酶進行連接從而產(chǎn)生eccDNA。Wang 等[17]研究發(fā)現(xiàn),CH12F3 細胞中DNA連接酶3(Lig3)的敲除顯著減少了紫外線誘導凋亡后eccDNA的生成,敲除Lig1 和(或)Lig4 未明顯影響eccDNA 生成,表明Lig3是CH12F3細胞中介導eccDNA生成的主要連接酶。
基因組起源分析顯示,microDNA 富集于外顯子區(qū)和染色質活性標記(如H3K4me3)的基因組區(qū)域,提示microDNA的產(chǎn)生可能與轉錄激活有關。microDNA 的產(chǎn)量隨著基因組外顯子密度的增加顯著提高,活性啟動子核心區(qū)域和帶有染色質活性標記的轉錄起始位點表現(xiàn)出microDNA 的顯著富集。在酵母菌中觀察到CUP1位點的轉錄激活可導致eccDNA 的特異性累積[10]。轉錄激活本身可以引發(fā)DSB[20],且microDNA的形成與DSB觸發(fā)的DNA 損傷修復通路有關。可見,轉錄激活可能通過DSB 和DNA 損傷修復通路誘導活性基因位點形成eccDNA。對microDNA 和R-loop 的起源位置及影響因素分析后,研究者猜測microDNA 的產(chǎn)生與R-loop 有關[11]。R-loop 可累積在帶有活性標記的啟動子區(qū)佐證了該觀點[20]。也許,攜帶活性啟動子序列的microDNA 可在全基因組范圍內(nèi)促進轉錄,形成轉錄激活-eccDNA的正反饋環(huán),不斷積累eccDNA。
eccDNA 來源于染色體DNA,DNA 斷裂損傷及其修復途徑很可能參與了eccDNA 的形成。Dillon 等[11]研究發(fā)現(xiàn)眾多microDNA 基因組位點的起始位置和終止位置存在微同源性,推測基于微同源序列的修復途徑可能參與microDNA 的形成,敲除MSH3的DT40 細胞系表現(xiàn)出microDNA 豐度的降低,表明錯配修復途徑(mismatch repair,MMR)可以產(chǎn)生大部分的microDNA。2021 年,該研究組報道m(xù)icroDNA 水平依賴于DSB后的切除和微同源介導的末端連接(microhomology-mediated end joining,MMEJ)修復,eccDNA 可作為單個DSB 的副產(chǎn)物[16]。小鼠大衛(wèi)星DNA 傾向于通過DNA 連接酶IV(MMEJ)依賴途徑形成eccDNA[21]。在酵母菌中,DNA 末端切除基因Sae和Mre11的缺失導致CPU1 eccDNA 數(shù)量銳減[10]。經(jīng)典非同源末端連接(non-homologous end-joining,c-NHEJ)修復不涉及DNA 雙鏈斷裂后切除。在正常情況下,c-NHEJ 修復通路會抑制microDNA 的形成,除非同一染色體中存在一對相鄰斷點可由該通路連接環(huán)化形成eccDNA[16]。酵母菌中Dnl4(c-NHEJ 的關鍵DNA 連接酶)的缺失未明顯改變CPU1 eccDNA 的數(shù)量[10]。這些研究共同表明,MMR 和MMEJ 為參與eccDNA 生成的主要途徑,c-NHEJ可指導小部分eccDNA的形成。最新研究基于單細胞測序技術scEC &T-seq(single-cell extrachromosomal circular DNA and transcriptome sequencing)發(fā)現(xiàn)在小分子環(huán)狀DNA細胞中基因富集在核酸切除修復、DNA 修復和DNA 損傷細胞應答等通路中[22],為多種DNA 損傷修復通路參與eccDNA 的形成提供了證據(jù)。DNA雙鏈斷裂后切除的DNA為eccDNA的形成提供了部分“原材料”,DNA 損傷修復通路和DNA 連接酶共同將DNA片段加工成環(huán),實現(xiàn)eccDNA的生成。
綜上,eccDNA 的產(chǎn)生是多個過程共同參與的結果(圖2)。此外,其他因素也會影響eccDNA 的產(chǎn)生。研究人員觀察到eccDNA的數(shù)量與編碼基因的基因密度呈正相關(正常體細胞)[14],與減數(shù)分裂重組率呈負相關(精細胞)[23]。細胞環(huán)境變化也會引起eccDNA 的改變[24-25]。所以,eccDNA 的產(chǎn)生受到轉錄頻率、細胞類型、細胞環(huán)境等多種因素的影響,需要更加深入的研究闡明這些機制在其中的具體作用。

圖2 eccDNA的產(chǎn)生機制
eccDNA 的生物學特征和功能有著密不可分的關系,其功能與亞細胞定位有關。當前提取eccDNA 的主要方法是酶切消化,該方法eccDNA 得率相對較低,異質性較高,且包含部分線性DNA,所以多利用人工合成eccDNA探究其生物學功能。
對eccDNA 的基因組起源研究顯示,eccDNA 更傾向源于CpG 島,DNA 酶超敏區(qū),3′UTR、5′UTR 等調控區(qū)域。據(jù)此推測,eccDNA 可能發(fā)揮基因調控功能。Thibault 等[26]構建包含了κB結合位點的迷你環(huán),發(fā)現(xiàn)κB迷你環(huán)能夠有效抑制NF-κB依賴的轉錄活性。隨后,多支研究團隊相繼發(fā)現(xiàn)eccDNA 具有轉錄產(chǎn)物[14,27-28]。Allen 等[27]在草履蟲中發(fā)現(xiàn),基因組切除的“垃圾”DNA可連接成環(huán),轉錄出有功能的小RNA。有研究者構建了包含不同元素的eccDNA 如miRNA、外顯子、CpG 島、3′UTR、5′UTR,包含miRNA 序列的eccDNA 使miRNA 的轉錄本數(shù)量增加,結合到3′UTR或5′UTR抑制靶基因表達,且與基因組miRNA的加工過程和作用機制相同;包含外顯子和CpG島的eccDNA可不同程度地提高基因的表達水平[28-29]。研究者在肌肉樣本中鑒定出eccDNA的25個轉錄本[14]。以上研究表明eccDNA可能在轉錄層面發(fā)揮作用,既能轉錄出非編碼RNA產(chǎn)物抑制下游靶基因的表達,又可作為全長或截短編碼基因的轉錄模板,改變編碼基因的轉錄水平影響生物表型(圖3)。

圖3 eccDNA在細胞核中的作用
細胞質通過物理破壞和酶降解機制維持eccDNA 在最低水平[30]。在正常狀態(tài)下,DNA的急劇變化可引發(fā)免疫系統(tǒng)的應激反應[24]。DNA彎曲程度可促進免疫介質對DNA的識別,誘發(fā)免疫炎癥反應[31]。eccDNA 作為具有環(huán)狀結構的DNA 分子,免疫系統(tǒng)面臨其數(shù)量的急劇變化可能會作出應答。研究發(fā)現(xiàn),瞬時轉染eccDNA分子可顯著誘導免疫因子如I型干擾素、白細胞介素和腫瘤壞死因子的表達,而線性DNA不具備該能力[17]。后續(xù)實驗發(fā)現(xiàn),胞質DNA 感受器環(huán)磷酸鳥苷-腺苷合成酶(cyclic GMP-AMP synthase,cGAS)可識別eccDNA,催化三磷酸鳥苷和三磷酸腺苷合成“環(huán)狀GMP-AMP”(cyclic GMP-AMP,cGAMP),激活cGAS-STING 途徑[17](圖1),證明eccDNA 可作為免疫刺激因子激活免疫途徑,且其免疫功能與序列信息無關,與其環(huán)狀結構有關。導入包含某些因子的外源性eccDNA 未明顯影響細胞轉錄,學者推測eccDNA 可能影響mRNA 的翻譯,在轉錄后水平發(fā)揮作用改變細胞表型[29]。
綜上,eccDNA 的亞細胞定位和序列信息均影響其生物學功能。eccDNA 的序列信息是否影響它的外排,是否有其他通路參與eccDNA 的監(jiān)測,eccDNA 強大的運動能力賦予eccDNA哪些便利,是否有其他因子輔助該運動過程,目前尚不清楚。eccDNA 可能具有重要功能,但當前對其功能的研究只是冰山一角,正吸引著越來越多的研究興趣;我們期待出現(xiàn)更多新型技術,早日闡明其生物學功能,并有效投入到臨床應用中。
eccDNA具有核酸酶抗性,細胞游離eccDNA不易被物理因素和酶等破壞,能穩(wěn)定保持在體液中,所以,eccDNA 可能成為良好的、穩(wěn)定的液體活檢指標。2017 年,Zhu 等[15]在人外周血血漿中檢測到游離的eccDNA。同年,Kumar等[32]在小鼠和人的血漿和血清中分別檢測到來自基因組獨特區(qū)域的細胞游離microDNA。之后,Sin和其同事[33]公布了母源和胎兒源eccDNA的表觀修飾信息,胎兒源eccDNA 的甲基化程度低于母源eccDNA。這與小鼠研究發(fā)現(xiàn)的甲基化程度隨年齡的增長而增加的現(xiàn)象相符。該特征提示在臨床中可借助血漿eccDNA 的甲基化程度確定胎兒的真實胎齡,判斷胎兒的生長發(fā)育情況?;蛟S,隨著研究深入,可基于血漿eccDNA 甲基化程度建立健康評價系統(tǒng),評估個體的整體健康狀態(tài)。
2020年,Sin等[7]從母體血液中通過特異性單核苷酸多態(tài)性識別出胎兒源eccDNA,發(fā)現(xiàn)胎兒源eccDNA 的長度短于母源eccDNA。研究者通過建立小鼠腫瘤異種移植模型,從小鼠血液中提取到人源microDNA,首次證明了microDNA 可由腫瘤釋放入血,癌組織中的microDNA 長于癌旁組織且腫瘤切除減少了血漿長microDNA[32]。此外,化療藥物干預改變了細胞microDNA 的長度和豐度[34]。以上研究提示血漿eccDNA 的長度和豐度變化可作為孕婦和腫瘤患者的檢測項目,以一種相對安全、簡單的方式監(jiān)測身體變化。
eccDNA 不僅能在血液中探測到,研究者陸續(xù)在患者的尿液、腦脊液中發(fā)現(xiàn)了eccDNA[35-36],或許eccDNA 也存在于唾液、胸水、腹水等體液中。eccDNA 的高穩(wěn)定性和多應用場景賦予其作為液體活檢生物標志物的潛力。在臨床中,監(jiān)測eccDNA 的長度變化能反映患者的疾病狀態(tài),可能為評價患者預后和腫瘤耐藥的新型生物標志物。eccDNA 或許是攜帶某些遺傳病標記的載體,能實現(xiàn)靶向檢測和靶向干預。最近的研究在肺腺癌、痛風性關節(jié)炎、系統(tǒng)性紅斑狼瘡等多種疾病中檢測和揭示了eccDNA 的特征。本文將不同生理狀態(tài)或疾病中eccDNA的研究發(fā)現(xiàn)和相關意義總結如表2所示。

表2 不同生理狀態(tài)或疾病中的eccDNA的研究進展
近年來eccDNA 在染色體起源、分子結構特征和與機體生理病理狀態(tài)等領域取得了較多的新進展,并且越來越多的研究提示eccDNA 可能具有參與基因組可塑性、調控基因表達、通過免疫機制影響細胞功能等作用。
隨著技術的進步,我們對于eccDNA 的認識和應用將進一步提升。二代測序以及基于二代測序的表觀遺傳學測序技術、生物信息學分析技術將在eccDNA 的分子結構和潛在功能的揭示方面有更多的應用。CRISPR 技術及相關衍生技術在該研究領域也嶄露頭角。Lyu 等[13]將相分離和CRISPR 技術結合(CRISPR FISHer),突破性地實現(xiàn)了eccDNA 的可視及運動軌跡的復現(xiàn),并捕捉到DNA 雙鏈斷裂后的動態(tài)修復過程。由于eccDNA 異質性高,還需要更多的研究和新型技術去揭示發(fā)揮主要功能的eccDNA 分子?;蛟S,將來可以和其他技術聯(lián)用,靶向消除致病eccDNA,逆轉疾病狀態(tài)。
在尿液、血液、腦脊液等多種體液中檢測到eccDNA 的表觀修飾和長度分布情況會隨著人體生理或病理狀態(tài)的改變而改變,eccDNA 有潛力作為一種實時的、動態(tài)的監(jiān)測人體變化的液體活檢標志物。eccDNA 豐富的應用場景,如產(chǎn)前診斷、化療耐藥、手術切除、腫瘤惡性進展等,表明eccDNA 作為生物標志物可能具有巨大的應用前景。