楊芳 朱瑜 何佩 徐仁伵
(1江西省人民醫院神經內科,江西 南昌 330006;2南昌大學醫學部研究生院)
肌萎縮側索硬化(ALS)是一種進行性、致命性的神經退行性疾病,其特征為選擇性侵犯腦與脊髓運動神經元,現有研究發現神經膠質細胞等也存在受累。ALS病因尚不十分明確,其已發現的致病機制具有多樣性、異質性,因此僅利魯唑和依達拉奉能輕度延緩疾病發展且未發現其他特異性藥物治療此疾病。ALS通常發病在中老年時期(平均年齡55歲),平均生存期3~5年,少數患者可帶病生存。隨著生物分子技術的不斷發展,愈來愈多的分子機制被發現,其中RNA結合蛋白(RBPs)占據重要地位。本文對ALS中RBPs相關突變的作用及機制的研究進展進行綜述。
RBPs可以結合單鏈或者雙鏈 RNAs,對調節轉錄后基因的表達和組織特異性可變剪接有重要作用。RBPs 參與RNA的轉錄、編輯、剪接、運輸和定位、穩定性與翻譯等生物學過程〔1〕。RBP伴隨RNA生命始終,一個RBP可能存在多種靶標RNA,且其表達缺陷會造成多種疾病。人體內5%~10%的蛋白質可與RNA結合,到目前為止,研究人員尚未對所有RBPs進行普查,已知的RBPs數量仍是估計數。基于現有研究,尚認為哺乳動物細胞存在1 000~2 000個RBPs。有研究者指出,致力于發現新的RBPs意義可能并不大,更重要的事情在于探究RBPs的調節和生理功能〔2〕。有研究使用IBM Watson人工智能算法對RBPs進行篩選和排序,通過結合免疫組織化學處理來自ALS和非神經疾病對照組織的蛋白質及多功能干細胞分化而來的運動神經元的RNA分析,驗證了ALS潛在改變的前10位候選RBPs〔3〕,即異質核核糖核蛋白(hnRNP)U、突觸蛋白結合細胞質RNA相互作用蛋白(Syncrip)、RNA結合基序蛋白(RBM)45、RNA結合基序單鏈相互作用蛋白(RBMS)3、絲氨酸/精氨酸豐富剪接因子(SRSF)2、hnRNPH2、類核蛋白(NUPL)2、細胞周期相關蛋白(CAPRIN)1、RBM6、甲烯基四氫葉酸合成酶結構域蛋白(MTHFSD)。目前研究發現基因表達中轉運和翻譯過程是相互聯系的,如果蛋白質合成要發生在不同的亞細胞器中,mRNA必須在轉錄后不久就被識別出來,并在轉運到適當空間的過程中處于翻譯休眠狀態。RBPs既可抑制轉錄后的翻譯,也可激活此過程,此機制歸因于RBPs zipcode結合蛋白(ZBP)1。ZBP1通過阻斷翻譯起始來阻止細胞質中的過早翻譯,只有當ZBP1-RNA復合物到達細胞外圍的目的地時,才會發生翻譯。在mRNA轉運的終點,蛋白激酶Src通過磷酸化ZBP1中與RNA結合所需的關鍵部位酪氨酸殘基來促進翻譯〔4〕。
雖然目前ALS病因尚不明確,但其可能的發病機制已被初步描述,或與遺傳因素、興奮性氨基酸毒性、氧化損傷、神經營養因子缺乏、線粒體功能缺陷、蛋白質的異常聚集、軸突運輸損害等密切相關,且其作用可相互重疊,相互影響。
從第一個經典蛋白超氧化物歧化酶(SOD)1基因突變被發現〔5〕,至今已有20多種蛋白〔6〕明確其功能改變、分布改變、錯誤定位以及異常聚集都影響ALS的病程。其他ALS基因的致病突變,包括TAR DBP、TARDNA結合蛋白(TDP)-43、FUS、hnRNPA1、選擇性自噬接頭蛋白(SQSTM)1、纈酪肽蛋白(VCP)、視神經蛋白(OPTN)和抑絲蛋白(PFN)1等,也在散發ALS患者中被發現,盡管它們很罕見。遺傳變異增強了ALS的易感性,或改變其臨床表型〔7〕。已經證明SOD1突變體的致病性是由于毒性功能的獲得而不是正常功能的喪失,SOD1的錯誤折疊及積聚誘導內質網應激,形成氧化損傷〔8〕。有研究提出了一種新的TDP-43毒性機制,其中TDP-43存在于線粒體中,通過優先結合線粒體轉錄的Nd3/6mRNAs,并通過抑制其翻譯引起線粒體功能障礙和神經退行性損傷〔9〕。編碼微管調節器的微管解聚蛋白(STMN)2在TDP-43基因敲除和TDP-43基因錯誤定位動物模型中及ALS患者脊髓尸檢中表達下降。STMN2對于正常的軸突生長和再生是必不可少的。在TDP-43基因敲除模型中,STMN2下調是由于RNA剪接錯誤造成的,STMN2翻譯后的穩定性可挽救了TDP-43缺失引起的神經突生長和軸突再生缺陷〔10〕。現在已經提出了幾種基于FUS介導的毒性機制,包括突變體FUS聚集和重新分布到細胞質中。FUS包涵體的形態和分布在不同神經退行性疾病的中樞神經系統(CNS)中不同,據報道FUS包涵體在亨廷頓病中是存在細胞核,但主要是在ALS和額顳葉變性(FTLD)中的細胞質〔11〕。
研究發現11個RBPs的基因突變或變異體與ALS相關,包括TARDBP、FUS、hnRNPA1、hnRNP A2/B1、細胞核基質蛋白Matrin(MATR)3、神經退行性疾病相關解旋酶Senataxin(SETX)、延伸體乙酰轉移酶復合體亞基(ELP)3、真核細胞RNA結合蛋白Atarin(ATXN)2、血管生成素(ANG)、運動神經元存活基因(SMN)1和SMN2〔7、12、13〕。此外,在ALS患者的神經元和(或)膠質細胞中,發現許多其他RBPs表現出亞細胞分布的改變,但并無引起ALS的已知突變〔14〕,這表明即使RBPs的基因未發生突變,也能引起ALS中RNA穩態的破壞,或是在ALS的發生發展過程中影響RNA的代謝及穩定。
3.1hnRNPA1 hnRNP A1是hnRNP家族成族成員。hnRNP家族是能與新生mRNA結合的一組相關蛋白〔15〕。參與將pre-mRNA包裝到hnRNP顆粒中,將polyA mRNA從細胞核轉運到細胞質,并可能調節剪接位點選擇。小RNA干擾消耗RBPs Sam68會引起抗凋亡B細胞淋巴瘤(Bcl)-x積累,而其上調會增加促凋亡Bcl-x水平;hnRNP A1和Sam68協同調節活細胞中Bcl-x的選擇性剪接和細胞凋亡〔16〕。亞細胞無膜細胞器由具有低復雜性結構域的蛋白質組成。它們中的大部分如hnRNPA1,都可以組裝成淀粉狀原纖維的多分散液相和有序固相。前者反映了生物顆粒的組裝,而后者通常與神經退行性疾病有關。為了從可逆的原纖維形成中受益并規避不可逆原纖維形成的風險,細胞需要對蛋白質相分離進行嚴格調控,否則蛋白質相分離可能會導致疾病。在研究〔17〕中觀察到hnRNPA1的可逆淀粉樣蛋白形成,與液相-液相分離同步,調節液狀液滴的流動性,并促進hnRNPA1募集到應激顆粒中。可逆的淀粉樣蛋白的形成降低了hnRNPA1液滴的流動性,因此加強了相分離。hnRNPA1的可逆淀粉樣蛋白核心形成有助于原纖維的可逆性,并解釋了由家族性ALS中鑒定的Asp突變引起的不可逆的病理原纖維形成。盡管尚未出現關于突變體hnRNPA1如何導致神經功能障礙的明確共識,但已經積累了大量證據表明hnRNPA1錯誤折疊和纖維化與疾病有關,也有其他研究表明ALS發病機制可能僅是由于hnRNPA1水平的變化。
3.2hnRNPA2/B1 hnRNPA2/B1以兩種不同的亞型A2(341個氨基酸)和B1(353個氨基酸)存在,均由HNRNPA2B1基因轉錄而來,主要定位于細胞核。hnRNPA2/B1含有兩個RNA結合基序(RRM),并且在其C末端附近具有富含Gly的結構域。hnRNPA2/B1蛋白是最豐富的RBPs之一,是真核細胞中與新生轉錄RNA結合的核蛋白復合體的核心〔18〕。在朊病毒樣富集域(PRLD)中,由強突變的空間拉鏈基序引起的失調聚合可引發退化性疾病。因此,與PrLDs相關的蛋白應該被認為是引發和傳播肌肉、大腦、運動神經元和骨骼蛋白病變的候選蛋白。PrLDs的聚合是有序相變的基礎,這種相變驅動包括RNA顆粒在內的非膜結合細胞器的組裝,而RNA顆粒是RNA代謝的許多方面發生反應的關鍵。疾病突變將更強的空間拉鏈引入hnRNPA2/B1和hnRNPA1的PrLDs中,調控、加速成核和聚合,改變RNA顆粒組裝動力學,可能對RNA代謝產生了不良后果。除了hnRNPA2/B1和hnRNPA1外,至少還有4種攜帶PrLDs的RBPs(TDP-43、FUS、EWSR1和TAF15)在疾病病理學中積累。研究者在多系統蛋白病(MSP)的患者中發現了編碼HNRNPA2/B1的基因突變,其患者肌肉組織的免疫組化染色表明,與疾病相關的突變導致hnRNPA2 / B1蛋白的核清除率增加,并與TDP-43共同定位于胞質異常蛋白聚集體和(或)應激顆粒中〔19〕。
3.3MATR3 MATR3是一種分子量為125 kD的核基質蛋白,可以結合DNA和RNA。有研究使用外顯子組測序,在ALS 患者中鑒定了MATR3的突變〔20〕,值得注意的是MATR3的Ser85Cys突變與ALS的緩慢進展有關,而攜帶Phe115Cys突變的患者通常在出現癥狀的5年內死于呼吸衰竭,其他ALS基因也有類似的表型變異。在ALS患者中,在運動神經元的細胞核中觀察到了MATR3,偶爾在細胞質中也存在。MATR3具有多種功能,包括RNA處理、保留超編輯過的RNA、通過與含多結構域蛋白(Ago)復合物的相互作用而使基因沉默及在N-甲基-D-天冬氨酸受體(NMDA)谷氨酸受體激活后介導神經元細胞死亡。MATR3相關的S85C突變所致遠端肌病患者可能患有家族性ALS〔21〕。MATR3可結合并調節長鏈非編碼RNA(lncRNA)Neat1水平及調節肌細胞中肌鈣蛋白RNA的編輯〔22〕。MATR3的鋅指結構介導過表達毒性,其RRM調節亞細胞分布。RNA結合缺陷的MATR3變體的毒性高度依賴于其亞細胞分布,彌漫性MATR3不能結合RNA時,它具有很高的神經毒性,將RNA結合缺陷的MATR3變體螯合入核顆粒時毒性減弱〔23〕。部分致病性MATR3突變的會影響蛋白質的溶解度和穩定性〔23〕,這種現象也很好地解釋了基因突變表型的變異。MATR3過表達和敲低均可引起神經元顯著的毒性反應,說明神經元對MATR3水平的變化具有雙向易感性。對散發性和家族性ALS患者中MATR3分布的尸檢研究顯示,MATR3核染色較強,運動神經元中存在胞質MATR3聚集物〔24〕。雖然這些發現的影響尚不清楚,但MATR3的定位錯誤或被螯合成聚合體可能影響其正常功能,或產生異常功能,或兩者兼有。
3.4SETX SETX是一種由2 677個氨基酸組成的DNA/RNA解旋酶〔25〕,參與DNA修復、復制、重組和轉錄,RNA加工、轉錄物穩定性和翻譯起始〔26〕,該蛋白與RNA/DNA解旋酶的酵母Sen1p家族成員表現出相當大的同源性。SETX基因中的T3I、L389S、T1118I、C1554G、K2029E、R2136H、I2547T等多個錯義突變被報道與ALS4相關〔27〕。SETX蛋白功能的毒性增強導致了ALS4的運動神經元病理,而SETX功能的喪失導致了神經退行性疾病共濟失調伴動眼性失用癥(AOA)2,這是一種病理范圍更廣的疾病〔26〕。SETX對RNA DNA雜交體(R-loop)的分解至關重要,已知SETX缺失會導致R-loop和DNA雙鏈斷裂(DSBs)積累,這些持續轉錄的DSBs會隨著時間的推移在神經元細胞中積累,導致神經退行性疾病〔28〕。SETX基因突變的ALS4小鼠模型的神經病理學特征顯示核內TDP-43減少,并伴有TDP-43胞質的錯誤定位,這與在人ALS患者中觀察到的標志性病理一致;SETX ALS4小鼠的運動神經元內應激顆粒形成增多、核膜異常,胞內物質入核延遲,表明核質運輸受損;SETX ALS4小鼠的研究闡明了與TDP-43定位錯誤相關的ALS疾病表型,并為TDP-43組織病理學提供了深入的了解,將SETX功能障礙與ALS運動神經元退化的常見通路聯系起來〔29〕。
3.5ELP3 ELP3是RNA聚合酶Ⅱ核心組成成分,此酶由6個亞基組成(ELP1~ELP6),參與組蛋白H3和H4的乙酰化,使DNA進入轉錄〔30〕。Simpson等〔31〕進行了兩項獨立的研究:第一項是基于單核苷酸多態性的人類ALS基因關聯研究,第二項是果蠅的誘變篩選。在這兩種情況下,相同基因的變體,即ELP3被認為是軸突生物學的關鍵,這得到了進一步功能研究的支持。隨后ELP3被確定為攜帶C9orf72重復擴增的患者延長生存的調節因子〔32〕,通過參與組蛋白H3和H4中賴氨酸殘基的三甲基化降低擴展載體中C9ORF72的表達〔33〕。研究ELP3在SOD1 G93A小鼠中的作用發現,ELP3在腦和脊髓中的表達降低,ELP3表達在有癥狀的前期和有癥狀的階段均具有保護作用,然而在有癥狀前的SOD1G93A小鼠中,神經元中特異性地增加ELP3的表達本身并不足以延長其存活時間。ELP3通過維持軸突完整性發揮了保護作用,而不是通過維持運動神經元的存活發揮作用〔34〕。
3.6ATXN2 ATXN2是一種真核RBPs,在RNA代謝調控中發揮著多種作用,包括調控mRNA的穩定性、聚腺苷酸化和翻譯激活等〔35~37〕。ATXN2在N端通常含有約22個polyQ重復,大于34個polyQ重復的擴增將導致脊髓小腦共濟失調2型(SCA2)〔38〕。ATXN2是polyQ疾病基因,Zmber等〔38〕研究分析了900多例散發性和家族性ALS患者中polyQ重復序列的長度,表明ATXN2中長度polyQ擴增與ALS有顯著關聯(約占4.7%的病例),據此提出ATXN2是一個新的潛在的ALS疾病基因。TDP-43毒性在ATXN2水平上調時更為嚴重,降低ATXN2后,TDP-43毒性顯著降低。由ATXN2水平引起的毒性增強并非僅歸因于TDP-43蛋白水平的升高,因為在此蛋白上調后,變性的程度比僅具有更高水平的TDP-43嚴重得多〔39〕。同樣,突變體ATXN2的表達也增強了突變體FUS的毒性〔40〕。最近的一項研究在ATXN2中發現了相分離和壓力顆粒組裝及長期記憶和神經退化所需的結構域〔41〕,相對于其他RBPs, ATXN2獨特的結構和功能說明了ALS分子機制的復雜性。
3.7ANG ANG是一種誘導新生血管形成的血管生成分子,屬于核糖核酸酶(RNase)a超家族,具有與RNase a相同的催化性能〔42,43〕。Adams等〔44〕在血管內皮生長因子(VEGF)基因中發現了具有生物學效應的序列變異,相關蛋白ANG的基因位于14q11.2號染色體上,并在2例散發性ALS患者中發現了一種新的突變,這種突變可能抑制ANG的功能。有研究表明ANG變體與帕金森病(PD)、ALS 之間存在明確的關聯,ANG變體是兩種疾病的易感因素〔45〕。在FUS(1-359) ALS小鼠模型中,血管損傷先于運動神經元的丟失,但ANG治療不影響小鼠模型的生存或抗血管退化〔46〕。ANG在神經外胚層分化過程中表達于神經元細胞,并且具有神經營養和神經保護功能。ANG-ALS結構變異可影響神經元的存活及誘導神經元細胞應激顆粒的形成〔47〕。研究表明ANG的神經保護作用是通過激活磷脂酰肌醇3-磷酸(PI3K)-蛋白激酶B(Akt)信號通路抑制細胞凋亡〔48〕。運用鼠類神經元和星形細胞系發現ANG可激活Nrf2通路,從而提供細胞抗氧化應激的關鍵防御,但此機制發生在星形膠質細胞中,而非運動神經元〔46〕。這些發現擴展了ANG作為神經保護劑的作用,并強調了其在ALS管理中的潛在效用。進一步對這些ANG-ALS變異體的結構功能進行研究,也為深入了解它們在ALS中所起作用的細胞和分子機制提供了新思路。
3.8SMN SMN是一個普遍表達,存在于細胞核和細胞質中的RBPs。到目前為止,人們已經很清楚地認識到SMN與其他至少8種蛋白質結合在一起,形成大分子復合物。SMN復合物與Sm蛋白和snRNA相互作用,并協助它們組裝成剪接體小核核糖核酸(snRNPs),snRNPs是mRNA前剪接機制的重要組成部分,催化從細胞核中的mRNA前體切除內含子〔49〕。即SMN作為一個分子伴侶,通過與細胞核內多個RBP的相互作用,促進核內snRNP剪接體組裝,并在胞質中組裝和轉運RNP顆粒。人類基因組包含2個SMN基因:SMN1端粒基因,其純合缺失會導致脊髓性ALS(SMA);SMN2著絲粒基因,其拷貝數調節SMA表型。它們之間只有5個核苷酸不同,該基因主要由于外顯子7跳躍性翻譯而產生截短的不穩定蛋白,僅有10%全長轉錄后成為功能性SMN〔50〕。雖然SMN1的純合缺失與ALS不相關,但異常的SMN1拷貝數顯著增加了患ALS的風險〔51〕。
RBPs缺陷可引起神經變性疾病,其生理和病理功能存在明顯的交叉或重疊。現已發現一些與ALS密切相關的RBPs具有介導疾病過程的特異性結構和功能特性,其中最引人注目的結構特性是LC域。當在LC域中包含ALS連鎖突變基因時,RBPs與聚集或原纖維化傾向增加、細胞質錯位及應激顆粒動力學失調有關,表明LC域在ALS發病機理中起重要作用。但并非所有ALS連接的RBP都具有定義的LC結構域(如MATR3和ATXN2),表明可能存在其他致病機制。上下運動神經元是體內最長的細胞,完整的功能需要在近一米的距離內運輸RNP顆粒。也許,由于其獨特的生理學,運動神經元最容易受到RNA運輸機械中的細微干擾。RNA剪接在神經系統細胞中比在任何其他細胞類型中都普遍,通過可變剪接可致基因表達具有多樣性。如果中樞神經系統的正常功能需要微調可變剪接,那么大腦和脊髓細胞可能對RNA剪接或其他RNA處理過程的改變極其敏感,這些改變在其他組織中未被注意到。其次根據定義,這些RBP在RNA代謝中發揮功能性作用,包括轉錄、RNA加工、mRNA輸出和穩定性及翻譯調控。這些蛋白質中與ALS相關的突變可能會影響基因表達,從而影響某些細胞過程,包括DNA修復反應、細胞凋亡及細胞生長和增殖。或許這些蛋白生理和病理功能存在重疊及相互作用和影響,導致很難查明這些RBP以導致ALS的單個或幾個路徑或機制。更好地了解這些RBP的正常功能及病理意義對于闡明這種破壞性疾病背后的生物學特性至關重要。