孫 浩,肖俊文,胡 坤,蘇港林,劉宇辰
1. 深圳大學第一附屬醫院/深圳市第二人民醫院泌尿外科(廣東深圳 518000)
2. 深圳市泌尿生殖系統腫瘤研究重點實驗室(廣東深圳 518000)
3. 安徽醫科大學深圳市第二人民醫院臨床醫學院泌尿外科(廣東深圳 518000)
4. 汕頭大學深圳市第二人民醫院臨床醫學院泌尿外科(廣東深圳 518000)
5. 深圳大學第一附屬醫院/深圳市第二人民醫院轉化醫學研究院(廣東深圳 518000)
融合基因自從被科學家們發現以來,就一直被當作可能是影響腫瘤進展的重要因素。科學家針對融合基因的研究從未中斷,取得了許多突破性的成就,尤其是針對BCR/ABL 融合基因的研究,開發出的伊馬替尼可用于治療慢性髓系白血病(chronic myeloidleukemia, CML)[1-2],成功挽救了無數患者的生命。近年來,隨著測序技術的不斷發展,越來越多的融合基因在其他的腫瘤中也被發現[3]。
第一個融合基因在20世紀70年代發現,大約在此后的十年間染色體重排是通過顯帶方式識別的。雖然以前已經發現重復的結構重排,但是直到20世紀70年代染色體顯帶技術的出現,腫瘤細胞的基因組才能被詳細分析,主要的例子就是CML中的費城染色體[4]。1973年第一次報道在CML中發現的費城染色體被證明是9號染色體和22號染色體t(9;22)(q34;q11)之間移位所產生的衍生物,同時在急性髓系白血病中發現t(8;21)(q22;q22)[5-6]。這些發現激發了人們對于血液系統腫瘤的興趣,在其中發現越來越多的染色體重排,包括在Burkitt淋巴瘤中發現的t(8;14)(q24;q32)、t(2;8)(q24;q32)和 t(8;22)(q24;q11)[7-8],在急性淋巴細胞白血病(ALL)中發現的t(4;11)(q21;q23)[9],在急性早幼粒型白血病(APL)中發現的t(15;17)(q22;q21)[10]和在濾泡細胞淋巴瘤中發現的t(14;18)(q32;q21)等[11]。在血液系統腫瘤中融合基因被大量發現后的十年中,在惡性實體腫瘤中也發現了大量的融合基因。在實體腫瘤內新發現的融合基因與在血液系統腫瘤中發現的融合基因一樣具有明顯的特異性,例如在肺泡橫紋肌肉瘤中發現的t(2;13)(q36;q14)[12],在尤因式肉瘤中發現t(11;22)(q24;q12)[13],在腎癌中發現的 t(X;1)(p11;q21)[14],在唾液腺囊性癌中發現的 t(6;9)(q23;p23)[15]。此外許多良性的腫瘤也存在明顯的融合基因,例如在脂肪瘤中發現的 t(3;12)(q27;q13)[16]。
1.2.1 染色體顯帶技術與高通量測序
傳統的檢測方法主要是染色體顯帶技術,盡管這種技術有很多優勢(曾經發現過很多融合基因),但其依然存在一些十分明顯的缺陷。20世紀90年代開始興起的基因分析高通量測序工具給融合基因的檢測帶來了全新的革命,如陣列的基因表達平臺和拷貝數分析,提供了新的途徑檢測融合基因。基于陣列的平臺不但能提供全基因組的視圖,還能提供比染色體顯帶更高的分辨率,并且不需要預先培養細胞。基于此技術發現的第一個融合基因是在橫紋肌肉瘤中發現的PAX3-NCOA1融合基因[17],隨后不久在前列腺癌中也發現了復發基因融合。Tomlins等發現了TMPRSS2基因與兩個編碼ETS轉錄因子的基因,一個是ERG導致了TMPRSS2-ERG的融合,另一個ETV1導致了TMPRSS2-ETV1的融合[18]。重要的是有一些像TMPRSS2-ERG的融合,兩個基因是位于同一個染色體條帶之上,無法進行染色體顯帶分析,這是第一次發現在常見的惡性腫瘤中存在此種基因融合的方式。隨后,科學家們試圖通過關注單個外顯子而不是整個基因組來識別基因的5’和3’末端的差異表達,之后被證明可以成功的檢測到許多其他腫瘤類型的基因融合,如腱鞘巨細胞腫瘤、肺癌和軟骨肉瘤[19-21]。雖然平衡易位是基因融合最常見的方式,但是也存在著非平衡易位的方式,例如間質缺失。這種融合的例子在20世紀90年代就已經被發現,例如T細胞ALL中的STIL-TAL1融合[22]。此外有許多看似平衡的易位導致的基因融合都或多或少存在廣泛的缺失、重復和擴增的斷點區域[23-25]。因此,受拷貝數變化影響的基因是參與融合的潛在候選基因。以此種檢測方式檢測到的第一個融合基因的例子是在CML中發現的USP16-RUNX1[26]和在T細胞ALL中發現的SET-NUP214[27],隨后在其他血液系統惡性腫瘤和實體腫瘤中也發現了同樣的融合[28-30]。然而,這項技術并沒有被當作檢測基因融合的獨立技術,制約它發展的主要原因是它既受惡性腫瘤典型的斷點數量的影響,同時也受其他很多影響拷貝數的因素影響。
1.2.2 深度測序技術
與上述基因融合檢測的指導方法不同,在十年前一種叫做深度測序技術的方法給人們提供了一種全新的思路,這種檢測技術可以識別在DNA或RNA水平上的融合。通過全基因組和全轉錄組測序的信息,可以識別那些更加隱蔽和微小的染色體改變和基因融合。首次利用深度測序技術檢測腫瘤相關的融合基因研究是在已經建立的細胞系上進行的[31],隨后對像乳腺癌、結腸癌、前列腺癌、肺癌和子宮內膜癌等常見癌癥的初步樣本進行了大量檢測[32-34]。表1[35]顯示了目前按照腫瘤亞型分布的所有已知融合基因數(9519個)和重復出現的基因數(373個)。其中血液系統腫瘤中的融合基因數為932個,重復出現191個;實體中融合基因數為8 512個,重復出現168個。可以看出,目前發現的融合基因總數已經接近一萬個,其中90%以上都是過去5年通過各種深度測序方法鑒定的。通過深度測序檢測到的融合基因在某種程度上不同于傳統方法檢測到的融合基因。首先深度測序能夠檢測到重排產生的融合,而不是通過染色體顯帶分析檢測到的染色體段的交換,因此分辨率就要高出很多。其次染色體內部細微的重排產生的融合現在也可以被檢測到,例如在單發的纖維腺瘤中染色體12的NAB2與STAT6的翻轉融合和在大腸癌染色體帶10q25中500kb缺失引起的VTI1A-TCF7L2的融合[34,36-38]。這種新技術加快了新融合基因的發現速度同時其成本大幅下降,大量新的融合基因在實體腫瘤特別是在膀胱癌中被發現,這為我們進一步研究和闡釋融合基因在膀胱癌進展中扮演怎樣的角色打下了堅實的基礎。

表1 參與重大腫瘤亞型的融合基因數目Table 1. Number of fusion genes involved in major tumor subtypes
1.3.1 失去對轉錄的調節作用
20世紀80年代開始科學家們對各種生物當中轉座子的研究日益加深,根據這些研究有科學家推測人類癌癥也可能是遺傳轉座的結果,染色體易位和其他染色體重排導致位于斷點的正常細胞基因的異常表達[39-40]。這一假設馬上就被證明是正確的,第一次是在MPC和Burkitt淋巴瘤中發 現 t(2;8)(p11;q24)、t(8;14)(q24;q32)和t(8;22)(q24;q11)引起免疫球蛋白基因位點非正常重組,最終導致轉錄因子MYC表達下調[41]。隨后,IGH、IGK和IGL易位的克隆成為識別腫瘤相關基因的一種新手段,可以用于檢測許多腫瘤細胞[42-44]。在惡性T細胞疾病中發現了類似的情況,其中涉及T細胞受體基因位點的非正常重排導致了染色體斷點區域附近失去了原有的調控作用[45-47]。在大多數情況下,這種重排所解除的基因大多編碼轉錄因子或參與轉錄調控的其他蛋白質。眾所周知轉錄調控的中斷無疑是腫瘤發生的重要因素,然而參與其中的許多基因被重新排列這勢必會導致細胞出現不正常的增殖。由于易位和其他染色體重排而導致的基因表達異常并不是B細胞和T細胞惡性腫瘤所獨有的,有一些其他的實體腫瘤也是由于目標基因調控序列受到影響而被解除管制。
1.3.2 嵌合基因
20世紀80年代大量的染色體易位導致的基因融合被發現,使人們認為基因解除管制可能是染色體重排的唯一途徑。因此當9q34上的ABL1基因在CML中被轉移到22q11時,最初推測費城染色體的功能可能是通過22q11處來自IGL基因的啟動子或增強子來使ABL1的表達增加。然而事實卻正好相反,t(9;22)被證明是一個嵌合的BCR-ABL1基因,編碼一個具有異常酪氨酸激酶活性的雜交蛋白[1-2],并很快就發現了幾種產生融合蛋白的易位,像在ALL中發現的t(1;19)(q23;p13)和TCF3-PBX1[48-49]。從20世紀90年代開始許多嵌合基因在實體腫瘤和間充質來源的腫瘤中也被發現。起初參與融合的基因類型主要是編碼轉錄因子或相關的輔助因子的基因,例如RARA、RUNX1和TCF3等[50]。因此,基因嵌合主要被當作是增加或抑制轉錄或構成激活激酶信號。當全基因組以及轉錄組測序成為更常用的研究和臨床診斷手段時,將會有更多的嵌合基因被發現。
1.3.3 基因截斷
近幾年基因截斷成了新的致病因素,基因截斷將會導致腫瘤抑制因子的失活,例如CDKN2A[51]和NF1[52];或者導致其變為野生型蛋白有主導作用的亞型,例如PAX5[53]。現在詳細染色體分析已經證明,如果這些基因被放松調節或者結構發生改變就很大程度上會發生癌變。已經有很多學者證實過基因融合會比單個的基因突變對細胞的影響更大,因為許多基因都已經被證明是通過其他基因的改變才引發其突變。例如除了在某些惡性腫瘤中易位外,有些基因在相同或其他腫瘤中也經常發生突變、刪除和擴增,像BRAF、CCND1、CCND2、CEBPA和ETV6等[54-56]。
綜上所述,融合基因的研究目前所取得的主要成果大多來自血液系統腫瘤,各種應用也主要集中在白血病和淋巴瘤。但是,近些年的研究也不斷的證明基因融合是所有腫瘤細胞的共同特征,大家一致認為融合基因在腫瘤的進展過程中起到了關鍵的作用。越來越多的融合基因在不同的實體腫瘤細胞中被發現,特別是在膀胱癌中有一些已經被明確證實是腫瘤進展的關鍵因素。但是,也有許多融合基因我們目前還沒有研究清楚它們與腫瘤的具體關系。這就需要全世界的科學家和臨床醫生們去不斷地探索,揭示融合基因和腫瘤之間的具體聯系。
膀胱癌是泌尿生殖系統最常見的惡性腫瘤之一,據報道在全球范圍內其發病率居全部惡性腫瘤的第九位,死亡率居全部惡性腫瘤的第十三位,世界衛生組織推測膀胱癌的發病人數和死亡人數在不久的將來將會翻倍[57]。目前,關于膀胱癌的診斷、治療和預后方面還存在許多問題亟待解決,科學家們通過深度測序發現在膀胱癌中存在大量的融合基因,但是這些融合基因在膀胱癌中的作用有很多還不明晰。被認為與膀胱癌關系最為密切,也是研究最多的是人成纖維細胞生長因子受體(FGFR)家族。
FGFR家族由22個因子和5個跨膜受體組成。在這22個因子中18個是分泌的,其中4個是完全在細胞內發揮作用的。FGFR基因改變發生在各種癌癥中,包括膀胱癌、乳腺癌、卵巢癌、子宮內膜癌、肺癌和胃癌[58]。目前FGFR1/2/3/4均在膀胱癌的研究中有過報道,FGFR1的改變包括FGFR1擴增和細胞外D2結構域附近的T141R突變[59]。 FGFR基因擴增通常與基因產物的過表達導致酶活性的增加有關,例如FGFR1-NTM 的融合就是通過這種方式產生作用[59]。膀胱癌中也會發生FGFR3的擴增。此外,有5個FGFR3的細胞外結構域突變被發現,分別是:S131L、R248C、S249C、G370C 和 Y373C[60]。
很多FGFR的改變被猜測可能與膀胱癌是否發生肌層浸潤有密切的關系,有報道稱超過一半的非肌層浸潤性膀胱癌和大約10%的肌層浸潤性膀胱癌發生FGFR3突變[61]。通過重排的方式產生融合蛋白是FGFR影響腫瘤進展的常見方式,其中最常見也是研究最多的融合是FGFR3-TACC3。首次發現FGFR3-TACC3融合是在神經膠質細胞瘤中發現[62-64]。Williams等發現在膀胱癌中同樣存在此種融合基因,這種融合會導致它們缺發磷脂酶Cγ1(PLCγ1)在內的最后一個外顯子結合位點,從而可能導致癌變。同時,他們還指出由于FGFR3融合的尿路上皮細胞對FGFR選擇型藥物極為敏感,融合基因的表達可能有助于選擇適合FGFR靶向治療的患者[65]。Guo等對膀胱癌標本進行全基因組和全外顯子組的測序也發現了FGFR3-TACC3的融合,并且認為FGFR3-TACC3可以作為膀胱癌診斷的潛在指標[66]。除了常見的FGFR3-TACC3融合外,還有一些融合也被報道過,例如FGFR3-JAKMIP、FGFR3-TNIP2和 FGFR3-ADD1等[61]。FGFR融合蛋白通常導致形成受體二聚體和隨后的蛋白激酶磷酸化和接下來的激活來發揮作用。目前,針對FGFR家族在膀胱癌中的研究還有很多。美國FDA在2019年第一個批準了口服FGFR拮抗劑:厄達替尼(Erdafitinib)來治療晚期的膀胱癌,并取得了很好的臨床效果,這無疑是FGFR家族在膀胱癌研究中的一次重大突破。
此外,除了FGFR家族外,許多FGF基因的突變也在膀胱癌中被大量報道,其中涉及最多的是FGF3/4/19,大約在12%的病例中可以發現FGF基因突變[66]。在膀胱癌中,針對FGF3/4/19基因改變的主要方式是擴增,基因的擴增導致這些生長因子信號大量增加。 相反,膀胱癌中涉及FGF17和FGF20的基因改變大多是缺失,從而導致生長因子信號減少[61]。因此我們可以推測許多FGF基因表達的上調或下調與膀胱癌的發生發展有著重要的關系。
近年來RNA測序技術的興起給了我們一個尋找融合基因的全新視角,越來越多新的融合基因通過RNA測序技術被檢測出來。Helsten等通過嚴格篩選條件從TCGA數據庫中的 819 個融合基因中篩選出 SEPT9/CYHR、IGF1R/TTC23、SYT8/TNNNI2和 CASZ1/DFFA 四個新的融合基因,但是 其 中 SEPT9/CYHR、IGF1R/TTC23 和 CASZ1/DFFA并沒有在患者采集的樣本中檢測到,這些融合基因可能并不是膀胱癌發生的主要原因,同時他們發現SYT8/TNNNI2融合基因卻存在于37.5%(18/48)的樣本之中,具體的功能和臨床相關性尚不清楚[67]。Kekeeva等從414個膀胱癌樣本中發現了19 547個高置信度的融合基因,經過嚴格的篩選后得到了271個融合基因,其中有13個融合基因是首次發現。他們選取了6個融合基因用于細胞系和臨床樣本的實驗,發現其中兩個嵌合RNA BCL2L2-PABPN1和CHFR-GOLGA3在膀胱樣本中的表達明顯高于臨近的正常樣本,親本基因的野生型沒有差異表達。接著,他們證明了這兩種融合是由相鄰基因之間的順式剪接產生的,而且這兩種融合主要是在細胞核內被檢測到,這說明具有潛在非編碼RNA的作用,這些嵌合RNA或許是全新的潛在的新型生物標志物[68]。
除了通過傳統的測序來發現和驗證融合基因外,利用融合基因與其他技術之間的聯系來治療膀胱癌也是一個值得探索的方向。其中一些研究已經取得了一定的成績,例如聯合自殺基因通過改造和修飾腺病毒來治療膀胱癌。自殺基因,是指將某些病毒或細菌的基因導入靶細胞中,其表達的酶可催化無毒的藥物前體轉變為細胞毒物質,從而導致攜帶該基因的受體細胞被殺死。常用的自殺基因系統有兩種,TK-GCV系統和CD-5-FC系統。更昔洛韋(GCV)是臨床上用于治療單純皰疹的藥物。GCV在胸苷激酶的作用下生成三磷酸GCV,能阻斷DNA合成產生細胞毒作用。病毒、細菌、真核細胞中都存在胸苷激酶(HSVTK)。Wang等構建了一種Arg-Gly-Asp(RGD)修飾的腺病毒RGDAdUPII-TK,它攜帶HSV-TK自殺基因,與GCV聯合注射處理膀胱癌細胞系,證實了RGDAd-UPII-TK與GCV注射相結合可以顯著降低T24腫瘤的生長,增加體內凋亡[69]。胞嘧啶脫氨酶基因(CD)存在于許多細菌和真菌中,5-氟胞嘧啶在微生物體內被CD代謝 成5-氟尿嘧啶,后者有明顯的抗腫瘤活性。目前有學者將CD-TK兩個自殺基因融合到一起形成雙自殺基因,用以治療膀胱癌。Hu等采用薄Flm水化超聲、碳二酰亞胺化學方法和靜電吸附方法,制備了負載CD-TK雙自殺基因的均勻納米尺度納米氣泡,并將其與可以和VEGFR2陽性細胞相結合的抗VEGFR2相融合。結果證明CD-TK雙自殺基因的過度表達可以在體外培養中抑制腫瘤細胞的生長[70]。這為我們治療膀胱癌提供了一個新的思路。
目前全世界的科學家都認識到融合基因在腫瘤的進展過程中起了至關重要的作用。隨著測序技術的不斷進步,越來越多的融合基因被我們發現,相應的也有越來越多的融合基因被證明在腫瘤的進展過程中扮演重要的角色。但是,測序技術的進步對于我們研究融合基因來說是一把“雙刃劍”。一方面,測序技術的不斷進步使我們可以對全基因組、全轉錄組進行測序,而不再像以前一樣依賴簡單的染色體顯帶技術觀察基因融合,這使得我們可以發現許多原來觀察不到的融合基因。但另一方面,先進的測序技術可以觀察到非常細微的基因融合,使我們很難分辨出哪些在腫瘤進展過程中真正發揮重要作用,哪些是無意義的融合,因為現在有研究表明我們可能夸大了某些融合基因的作用。
未來的研究中,探尋這些融合基因在腫瘤進展過程中具體扮演怎樣的角色,與腫瘤的惡性程度是否相關或許才是我們應該研究的重點。伴隨著合成生物學的發展與進步,我們可以利用合成生物學基于對CRIPRS-cas9的改造,使某些融合基因在特定的腫瘤組織過表達或敲除某些基因,從而確定融合基因是否真的在腫瘤的進展過程中起關鍵性的作用。