邱勁軍,朱鵬,曾啟昂,李鳳艷
(深圳市坪山區人民醫院,南方醫科大學附屬坪山總醫院,廣東 深圳)
胃癌(gastric cancer, GC)是消化道常見的惡性腫瘤之一,是世界第四大常見惡性腫瘤,每年大約有70萬人死于胃癌。我國是胃癌高發國家,每年新增大約40萬胃癌患者(約占全世界胃癌發病人數的1/3),且呈年輕化趨勢[1-2]。胃癌早期癥狀多缺乏特異性,I期僅有10%的檢出率[3]。多數胃癌患者被確診時已經發展至中晚期或伴有淋巴、血液轉移,其五年生存率低至1/5[4]。胃鏡檢查是診斷胃癌的“金標準”,但因患者不適反應多,依從性差,限制了其作為胃癌篩查的應用。上消化道鋇餐透視、CT和磁共振等影像學檢查已廣泛應用于胃癌診斷,但早期胃癌和癌前病變的影像學表現常缺乏特異性,故影像學檢查在發現早期胃癌及微小病灶方面有一定的局限性。而傳統的抗原類腫瘤標記物多在胃癌晚期才明顯升高,且其陽性率低于40%[5]。這些傳統的技術不利于腫瘤的早期診斷,臨床上仍然缺乏有效的胃癌早期預警診斷方法。
胃癌的發生發展涉及多個因素,病程復雜,其發病機制尚未完全清楚。較多研究表明胃癌的發生和發展涉及基因功能的異常改變,而基因功能的改變可能與基因堿基突變和表觀遺傳學改變有關。這些改變會引起抑癌基因和原癌基因活性與功能的改變,從而導致胃癌的發生和發展。多數胃癌患者因發現晚而已經失去最佳治療時機。如果臨床上能及時發現早期胃癌患者,并判斷其危險程度,憑借目前的醫療技術可以有效地提高患者的生存率。因此,進一步了解胃癌的遺傳學分子機制,對提高胃癌的早期篩查和診斷有著十分積極的意義。目前,胃癌發病的分子機制中研究得較多的是DNA甲基化、錯配修復基因等[6],這些研究基本都是針對單個基因的檢測。近年來,基因組的三維空間構象和功能逐漸成為基因組學研究的新熱點[3]。傳統的DNA測序技術通常會將基因的表達形式描述成線性,實際上,基因除了成線性排列外,基因的兩側可能會互相成線性,非常接近三維立體的形式。染色體構象捕獲(Chromosome Conformation Capture,3C),是一種研究細胞核的實驗方法,通過高通量測序技術和生物信息學方法,深入分析整個染色質DNA在空間位置上的關系。本文從細胞染色質三維構象角度,探討其與胃癌發生發展之間的關聯,同時展望了細胞染色質三維構象等表觀遺傳圖譜在胃癌臨床診治中的應用前景。
多年來,人們通過系統研究腫瘤基因組發現,癌癥是由細胞不受控制的生長和擴散而引起的一大類惡性疾病,其特征是基因組的各種突變,其中包括點突變、小插入/缺失、染色體重排、拷貝數變異。癌癥基因組圖譜(TCGA)描述了許多類型癌癥的點突變和結構變異[6]。常見的突變基因包括TP53、KRAS和PIK3CA。
這些基因與主要的細胞增殖途徑相關,包括MAPK信號、PI(3)K信號和轉錄調控。后續也有研究表明,癌癥會發生表觀遺傳學的改變[7]。目前,胃癌的發病機制中研究得較多的是DNA甲基化、錯配修復基因等分子機制,但仍舊未完全闡釋清楚胃癌的發病機制。越來越多研究報道,染色質三維結構在基因表達調控,細胞分化,以及疾病發生等過程中起著至關重要的作用。
(1)DNA甲基化
DNA甲基化是一種重要的表觀遺傳,也是基因活性抑制的一個重要的機制,以s-腺苷甲硫氨酸為甲基供體,將甲基轉移到特定的堿基上的一種反應。DNA甲基化會抑制腫瘤基因被或沉默轉錄,在腫瘤的發生的早期階段就發揮著重要的作用[8]。隨著整體測序的完成,人們發現在很多腫瘤抑制基因的啟動子區存在著大量CpG島,提示DNA甲基化可能在腫瘤抑制基因失活方面發揮著重要作用。已有多個研究表明表觀遺傳學修飾在胃癌的發生過程中扮演著重要的角色。目前已有多個研究報道,DNA甲基化直接參與了胃癌腫瘤細胞分化、細胞周期、腫瘤轉移等過程 ,提示DNA甲基化有可能參與了胃癌發生的整個過程[9,10]。谷胱甘肽過氧化物酶GPX3是GPX的一種重要的細胞亞型,GPX3基因啟動子CpG島的高甲基化可使GPX3的蛋白表達下調,導致體內過氧化物含量增多,參與胃癌的發病[11]。現已確認EBV感染與胃癌發生密切相關,初步研究證實EBV感染可誘導相關抑癌基因啟動子區呈高甲基化狀態,這是EBV引起腫瘤抑制基因功能失活的重要機制之一[12],但其具體機制有待進一步的研究。有研究分析胃癌組織發現,細胞中3號染色體短臂(3p)抑癌基因啟動子區CpG島呈高度甲基化。這些發現可能為胃癌的早期診斷和預后監測等方面提供重要幫助。
(2)錯配修復基因系統
錯配修復(mismatch repair,MR)系統屬于一種DNA復制后的修復系統,由一系列保守基因組成,具有修復錯配DNA堿基、增強DNA復制準確性、維持基因組穩定性、降低自發突變的功能。它的缺陷導致基因組不穩定而對腫瘤易感。[13-15]。DNA錯配修復(MMR)系統是保證基因組相對穩定的重要組成部分,由一系列特異性修復DNA堿基錯配的MMR基因調控的酶分子組成,在保持遺傳物質的完整性方面起重要作用。細胞一旦出現MMR功能缺陷,就會引起基因突變的累積,最終導致腫瘤發生。錯配修復基因hMLHl能識別多種基因的突變并加以修復,當細胞內突變基因積累時,hMLHl蛋白表達上調,這可能是由于基因突變在癌旁黏膜上皮細胞有所積累的結果[14]。胃癌旁黏膜上皮出現hMLHl蛋白核表達增高,提示具有該蛋白高表達的胃黏膜上皮細胞可能是易發生癌變細胞。胃黏膜上皮細胞核hMLHl蛋白的表達顯著高,可能是胃癌發生的前兆,該蛋白在細胞核和細胞漿同時出現可能是胃癌發生的標志[15]。檢測胃黏膜細胞核hMLHl蛋白的表達可能有助于臨床預警胃癌的發生及判定胃癌的高危人群。
(3)遺傳與表觀遺傳失調對染色質結構產生影響
在染色質組成完整的情況下,非編碼基因的遺傳或表觀遺傳失調可以對染色質三維結構產生深遠的影響。尤其是,轉錄因子結合位點的序列或表觀遺傳環境的變化可能改變染色質的交互作用,這能深遠影響到基因的表達和細胞身份的表達。全基因組多態性關聯分析研究發現,相隔甚遠的調控元件之間也能發生一種很強的相互作用[16]。后續有研究關聯了這些疾病相關的非基因區域的多態性,發現該區域存在的調控因子參與染色質的形成和成環[17,18]。最近有研究發現,結直腸癌(colorectal cancer,CRC)的某一特定基因亞型存在CCCTC結合因子(CCCTC-binding factor,CTCF)結合位點突變優勢[19]。而且,這些CTCF結合位點突變與一種已被證實的癌癥突變信號AT>GC突變高度相關,并且這種信號富集在CTCF保守序列的特定位置上[20]。在大樣本中CTCF結合位點突變呈單峰分布,類似地,小樣本中的大多數突變發生在CTCF結合位點上[21]。在一個全基因組研究中,CTCF結合位點被耦合到延遲復制定時域,并且已有研究報道這些CTCF/粘連蛋白結合位點不是被主導DNA多聚酶復制而是有另外的非典型多聚酶復制的[22]。綜上所述,這些結果提示部分CRC患者在修復CTCF結合位點突變方面可能存在全局性缺陷。而且,這種突變特征并不是CRC獨有的,在其他多種癌癥類型中也觀察到了。
CTCF結合模式也會受到其結合位點表觀遺傳修飾的影響。CTCF保守結合序列的DNA甲基化已被證明可以控制細胞類型特異CTCF結合,說明CTCF結合可以通過可逆的表觀遺傳改變來調節[23]。因為DNA甲基化的破壞是多種癌癥的標志,DNA甲基化的改變可能直接或間接影響CTCF的結合。一項關于IDH突變型膠質瘤的研究發現,CTCF結合位點的高甲基化與重要結構域邊界的溶解和強致癌基因的異常表達有關[24]。以上研究表明,DNA甲基化的改變是癌癥中染色質結構被破壞的一種潛在機制。所以,表觀遺傳學、染色質結構以及基因突變對細胞基本生命活動都具有重要影響,也可能是誘導癌癥等疾病的關鍵因素。
DNA測序技術是分子生物學研究中最常用的技術,它的出現極大地推動了生物學的發展。自從1953年Watson和Crick發現DNA雙螺旋結構后,人類就開始了對DNA序列的探索,在世界各地掀起了DNA測序技術的熱潮[25]。1977年Maxam和Gilbert[26]報道了通過化學降解測定DNA序列的方法。同一時期, Sanger[27]發明了雙脫氧鏈終止法。20世紀90年代初,熒光自動測序技術的出現將DNA測序帶入自動化測序的時代。這些技術統稱為第一代DNA測序技術。最近幾年發展起來的第二代DNA測序技術則使得DNA測序進入了高通量、低成本的時代。目前,基于單分子讀取技術的第三代測序技術已經出現,該技術測定DNA序列更快,并有望進一步降低測序成本,推進相關領域生物學研究。
然而,即使解碼了幾乎所有的遺傳信息,人們認識到線性的DNA序列尚不能去解釋整個基因組是如何指導復雜生命過程完成的。實際上,編碼在DNA序列上的遺傳信息的表達很大程度上依賴于其所處的染色質環境——染色體空間結構。科學家們再次將研究方向轉到最初的染色體結構研究,試圖結合宏觀水平(基因組空間結構)去理解微觀水平上基因功能。大量證據表明基因組三維空間結構及其變換具有一定的規律性,并且與細胞核一些基礎功能(如基因轉錄、基因復制、基因易位等)密切相關[28-30],深入理解基因組三維空間結構信息對于認識基因表達調控具有重要的意義。基因組的空間結構是由染色體內和染色體間錯綜復雜的交互形成并由細胞核內部元件介導,參與這一過程核內部調控元件包括轉錄因子、轉錄和復制工廠、多家族蛋白體以及核纖層的交聯等。
在過去的幾十年里,一系列分子生物學和基因組學技術的發展使得人們能夠更加深入地去認識基因組的3D結構,這些技術包括熒光原位雜交(FISH)和染色質構象捕獲(3C)及其衍生技術。傳統測序是基于核苷酸的一維排列不同,而3C及其衍生技術測序是基于染色質的三維構象,如圖1所示。近些年來,結合3C技術和高通量測序技術,再加上新的數據分析方法,能夠在全基因組范圍內捕獲不同基因座之間的空間交互,揭示基因組空間結構的規律性及其與基因調控之間的關系。然后,基于這些高通量交互數據,進一步采用數學建模方法,極大拓展了我們對基因組空間結構的認識。Duan等人[31]首次預測了釀酒酵母基因組的空間三維結構,揭示酵母基因組也具有層次化結構。Bau等人[32]通過對人類第16條染色體中包含alpha-globin的基因域進行研究,發現該基因域也具有球形結構:活化基因在空間會聚集在球形中央,而非活化基因則零散地分布各個基因環(gene loop)上。Erceg等[33]利用Hi-C技術通過測量人類正常淋巴細胞染色體中基因座空間交互信息,證實了染色體地域(chromosome territories,CTs)的存在。此外,他們還發現該細胞基因組在空間結構上呈現出開合和閉合兩種相互隔離的構象區域。進一步,他們還通過生物物理模型預測這個基因組在空間上具有一種分形的三維結構。

圖1 左邊為傳統DNA測試,右圖為3C技術測序
通過探究基因組的空間三維結構,發現染色體空間結構和基因共表達之間具有十分重要的聯系。這些實驗及計算結果對揭示基因組空間層次結構起到了重要作用,但是它們無法確定究竟是何種基因相互結合在一起,空間結構又是如何對基因實施具體調控的。Bellush等人[34]使用新技術對人類基因組中的特定調控因子,雌激素a受體的空間交互信息進行了研究,發現絕大多數的結合位點都通過遠程的染色體空間交互而聚集在一起。進一步的實驗表明,這些聚集在一起的基因比其它基因具有更高的表達水平,證明了基因組空間三維結構與基因調控之間具有直接的關聯。
基于高通量染色質交互數據,通過層層剖析,從分子水平層面初步揭開染色體復雜空間結構隱藏的特性:短程基因座交互數量龐大,形成初級環化過程;遠程基因座交互,如增強子和啟動子、啟動子和啟動子之間的交互,將不同的短程環連接一起,形成高級環化過程(A類和B類結構域);最后,少量的超遠程基因座交互將不同層次的空間結構進一步結合在一起,形成更高層次的復雜空間結構,如圖2所示。這些研究為更加深入地理解基因組三維空間特征,尋找易感基因[35-37]。

圖2 細胞核空間結構Hi-C測序原理示意圖
雖然近幾十年來,我們已經了解了很多關于癌癥中的基因組序列如何發生突變,但我們對基因組三維結構在癌癥發展中的作用知之甚少。 近年來,多項研究對乳腺癌、前列腺癌、膠質瘤、結直腸癌、多發性骨髓瘤以及多種血液癌癥的基因組三維結構進行了分析[38-45]。研究發現,癌癥中基因組在A/B結構域切換、TADs和染色質相互作用等三維結構上發生了改變[46]。(1)染色質中發生A/B結構域轉換失調。在乳腺癌、多發性骨髓瘤、B細胞淋巴瘤和T細胞急性淋巴細胞白血病中,多達20%的基因組區域存在結構域轉換(由A到B,反之亦然)[38,41-45]。正常乳腺上皮細胞(MCF-10A)和乳腺癌(MCF-7)細胞系的Hi-C分析顯示,癌細胞中基因組的三維結構與正常細胞中存在明顯差異[38]。與正常細胞相比,乳腺癌中大約12%的基因組區域有A/B結構域切換。 此外,從A結構域到B結構域的轉換與基因表達下調有關,而結構域的切換改變方向則會引起基因表達上調。考慮到染色質結構域的映射算法,這種結構域切換更可能反映了癌細胞中基因表達的變化,而不是在癌癥發展中起著致病作用[39]。(2)TADs數量和邊界發生改變。在TADs水平看,雖然不同的癌癥類型的變化特征各不相同,但健康細胞和癌細胞之間的差別特別明顯。據研究報道,乳腺癌、前列腺癌、多發性骨髓瘤等類型的癌癥的TAD邊界發生了變化,通常伴有相應的TAD數量的增加和大小的減小。對于健康細胞和癌細胞,腫瘤細胞中TADs數量的增加程度可能有很大差異[38,40,42]。與正常的B細胞相比,多發性骨髓瘤中TADs的數量增加了25%,而前列腺癌細胞系中TADs的數量是正常前列腺上皮細胞的2-3倍。Taberlay等[42]人發現在前列腺癌中,基因組三維結構是處于無組織狀態,同時發現前列腺癌細胞比正常細胞有更多的TAD邊界和更小的平均TAD長度,而且許多癌癥特異性區域的邊界出現在拷貝數變異的區域。此外,長程染色質相互作用的變化與表觀遺傳修飾和基因表達的變化一致。膠質瘤、急性淋巴細胞白血病TAD界限的減弱和/或消失更為典型[41]。Wu等[44]人通過整合Hi-C、全基因組測序(whole genome sequencing, WGS)和RNA-seq數據來比較多發性骨髓瘤細胞和正常B細胞也有類似的發現。對于膠質瘤、急性淋巴細胞白血病等類型的癌癥,TAD界限的減弱和/或消失更為典型。B細胞淋巴瘤中TADs的數量和結構無明顯差異[41,45]。(3)染色質的相互作用異常。在乳腺癌細胞中,16號染色體與22號染色體等小而富含基因的染色體之間的相互作用頻率低于正常細胞。染色體內的相互作用也不同:正常細胞中端粒和亞端粒區域的相互作用比乳腺癌細胞中更頻繁[44,46]。
目前,胃癌已經成為我國城市居民死亡的重要原因。據統計,我國該病發病率在20年間升高近50%,而近80%的胃癌在發現時已經是中晚期,且生存率極低[4]。如何早期發現胃癌,已經成為醫學界的關注重點。與國際水平相比,國內一些大型醫院的設備和診治水平已經接近或達到發達國家水平,但對胃癌防控的能力嚴重不足,缺乏胃癌的早期診斷技術。最新研究報道40%胃癌患者是可以通過預防而不得癌癥的,40%患者可以通過早發現、早診斷、早治療而治愈,20%患者可以帶癌生存,這充分說明了癌癥早發現早診斷的必要性和重要性[47]。但目前的檢測手段存在有創性,不利于胃癌早期診斷,難以大規模人群普查,可見,實現胃癌早期無創檢測是亟需解決的重大科學問題。新一代DNA測序技術是高通量特性進行測序分析,能夠發現血漿中微小的游離DNA變化,同時結合生物信息分析技術,能夠實現對胃癌早期診斷、個性化治療和治療預后的監測。因此,利用高通量測序方法,將胃癌基因組三維結構圖繪制出來,比較正常組織與胃癌患者組織基因組的三維結構,定位胃癌組織中基因組結構的變化,并進行系統分析,找到所有致癌和抑癌基因的微小變異,了解胃癌癌細胞發生、發展的機制,為胃癌的診斷、治療奠定基礎。建立該研究技術平臺,開發出實體胃癌及血液系統胃癌的早期診斷和治療監測試劑盒,構建自動化生物信息學分析平臺,將有助于實現對胃癌早期診斷、個性化治療、治療預后的監測。