

本篇報道圍繞2022年上海市自然科學獎一等獎項目“環形RNA生成和功能機制的研究”展開,該獎項由中國科學院分子細胞科學卓越創新中心陳玲玲研究員領銜獲得。
神秘的SC35核斑
1989年的秋天,哈佛醫學院湯姆·馬尼亞蒂斯(Tom Maniatis)實驗室的博士后付向東在篩選了幾百株單克隆細胞系后,終于鑒定出了一個全新的剪切因子——SC35。
付向東發現,SC35在細胞核中的分布呈現出有規律的斑點狀。經過與冷泉港實驗室的大衛·斯佩克特(David Spector)的合作,他們發現SC35組成的斑點與大衛早先發現的“核斑”結構高度重合。他們推測,SC35核斑為RNA分子的剪切提供了特殊的活動場所。
但SC35核斑的復雜程度遠不止于此。
將近20年以后,借著基因組學技術發展的東風,哈佛醫學院的安德魯·切斯(Andrew Chess)團隊發現了兩條名為NEAT1和NEAT2的長鏈非編碼RNA。顧名思義,非編碼RNA本身并不能編碼產生蛋白質,但能以其他方式調節細胞活動。安德魯團隊發現,NEAT2(人類肺腺癌轉移相關轉錄本1,簡稱MALAT1)集中在SC35核斑內部,而NEAT1分布在SC35核斑外圍的一處名為“旁斑”的結構之中。
2009年,包括康涅狄格大學戈登·卡邁克爾(Gordon Carmichael)在內的四個不同的研究團隊相繼獨立地發現NEAT1對于維持旁斑結構的穩定至關重要。陳玲玲彼時正是戈登指導的博士研究生,她在博士階段研究發現NEAT1是旁斑的形成所必需的RNA,在人胚胎干細胞發育分化的過程中,NEAT1能通過影響旁斑的形成,進而對信使RNA轉移出細胞核的效率進行調控。
陳玲玲關注到了一個有趣的現象:在當時已經鑒定出的上萬種長鏈非編碼RNA之中,NEAT1和NEAT2是唯二在末端不存在多聚腺嘌呤“poly(A)尾巴”的例外。
這令她不禁好奇:在茫茫的基因組中,“poly(A)尾巴”缺失的NEAT1和NEAT2是否還有其他“親戚”呢?
從sno-lncRNA的發現到“滴血驗病”的臨床可能
2009年博士畢業以后,陳玲玲作為獨立研究員獲得康涅狄格州干細胞研究經費的種子基金,與當時在同一研究機構工作的楊力博士(現任復旦大學教授)合作,開始對“poly(A)尾巴”缺失的長鏈非編碼RNA進行了系統性研究。2010年陳玲玲回國,在中國科學院原上海生物化學與細胞生物學研究所組建了自己的研究團隊。
隨著研究進展,陳玲玲和楊力推測,NEAT1和NEAT2這兩個特例的背后很可能還隱藏著一類新型的RNA分子。經過兩年的研究,他們一共找到了超過300種“poly(A)尾巴”缺失的長鏈非編碼RNA。
有趣的是,其中表達量比較高的幾個有代表性的RNA分子,在基因組中的位置竟然也非常集中,都坐落于15號染色體q11到q13間一段跨度為100 kb左右的區域之中。
這幾個“poly(A)尾巴” 缺失的新類型RNA分子,由于在它們的頭尾都具有snoRNA的特征序列,因此被陳玲玲命名為“sno-lncRNA”。
隨后的研究中,陳玲玲團隊又揭示了一類特別的分子家族,稱為SPA(5’snoRNA capped, 3’polyadenylated RNA),它們特別之處在于:5’末端是snoRNA ,但3’末端則具有poly(A)尾巴。他們進一步研究發現sno-lncRNA和SPA,為一種名為“小胖威利癥”罕見遺傳病的臨床診斷提供了新的希望。
在人群中,平均每一萬到三萬人之中就會有一人不幸患有“小胖威利癥”,病童往往身材異常肥胖,神經發育遲緩。
幸運的是,如果病童能及時得到生長激素的治療,病癥就能得到有效緩解。
但臨床上的困難在于,很多病童在被診斷出病癥的時候,已經錯過了接受生長激素治療的最佳時期。
那么,是否能在孩子剛剛出生的時候通過基因水平的診斷就對疾病風險進行預測呢?
事實上,人類遺傳學研究發現,15號染色體q11到q13間一段跨度為100 kb 左右區域的片段缺失是導致絕大部分“小胖威利癥”發病的病因。
很遺憾,這一段和“小胖威利癥”相關的基因片段中并沒有編碼蛋白質的序列,因此不存在蛋白水平的疾病診斷靶點。同時,因為病人兩條15號染色體中,只有一條染色體存在片段缺失,并通過“基因印記”的機制,片段缺失的那份拷貝會被表達出RNA,所以也難以通過DNA水平直接對發病風險進行預測。
如今,這些新RNA的發現則令人看到了另一種可能性:是否可以對15號染色體q11到q13間的sno-lncRNA水平進行測量,并將其發展為一種新型的“小胖威利癥”診斷手段呢?
2023年,這一臨床轉化方向的努力初奏凱歌:陳玲玲團隊與浙江省兒童醫院鄒朝春教授團隊合作發現,在正常人體內的1微升血液樣品中存在上千個sno-lncRNA分子,而這些sno-lncRNA分子在“小胖威利癥”患者中的含量則可微乎其微!
總之,這些新分子家族的發現為人們認識“小胖威利癥”病理和發展新型檢測手段提供了源頭依據。
被低估的環形RNA:一條新型免疫通路的發現
除了以上新類型長鏈非編碼RNA,陳玲玲和楊力對于另一類特殊的長鏈非編碼RNA很感興趣。此前就有研究者發現,在一些信使RNA、長鏈非編碼RNA成熟的過程中,其中的一小部分會頭尾相連在一起,形成環形RNA分子。相較線性RNA分子,這些環形RNA分子表達水平低,但同時在體內會更加穩定。
這些環形RNA分子是隨機產生的嗎?陳楊團隊合作相繼報道了內含子來源的環形RNA和外顯子反向剪接來源的環形RNA的普遍存在,提出了可變環化的現象(一個基因可以產生多個環形RNA)及其發生機制。
那么這些普遍表達的環形RNA是否具有生物學功能呢?通過解析環形RNA分子家族“生老病死”的規律,他們揭示了環形RNA具有重要功能和應用潛能。
首先,陳玲玲實驗室的博士研究生張楊設計了一個新生環形RNA捕獲檢測體系,發現了環形RNA產生效率低,但是穩定性好。
陳玲玲實驗室的博士研究生李響設計了一個遺傳學篩選實驗:他通過一套誘導表達系統,讓一段基因序列在刺激下高水平表達。如果表達出的序列是線性的,那么不會發出熒光信號;與之相反,如果表達出的序列形成了環形RNA,則會產生出來自環形RNA蛋白表達產物的強烈紅色熒光信號。
在這套表達系統中,李響讓細胞感染了siRNA病毒文庫,嘗試對各個基因逐一敲低。他猜想,如果存在調節環形RNA生成的基因,那么通過siRNA破壞這些基因,會降低環形RNA的產生效率。因此他將興趣集中在那些被敲除后會導致紅色熒光信號變弱的基因,將其作為后續研究的候選基因。
完整的一輪篩選過后,李響發現了103個候選基因,它們可以表達出能與RNA進行結合的蛋白產物。出乎他意料的是,其中竟然有16個與免疫系統響應病毒感染的通路相關。
難道說,環形RNA的產生多少,會由免疫通路的激活程度來決定嗎?
實驗結果支持了這個令人興奮的猜想,病毒的感染的確會導致免疫細胞中環形RNA的數量下降。
接下來,研究者將注意力集中在了一個名為ILF3的候選基因上。
ILF3基因可以編碼表達出NF90和NF110兩個不同的免疫分子。有趣的是,NF90和NF110可以在細胞核內結合,處于從線性向環形轉化過渡階段的RNA分子,通過穩定其構象促進環形RNA分子的產生。
當病毒感染入侵免疫系統時,大量的NF90和NF110免疫因子進入細胞質對病毒的遺傳物質進行圍剿。這樣一來,細胞核內的NF90和NF110數量減少,環形RNA的產生效率也隨之降低;與此同時,陳玲玲團隊還發現免疫系統激活的核酸內切酶RNase L,可以快速降解細胞質中的環形RNA。
兩個因素合在一起,環形RNA產生效率降低,分解速度提高,總體的數目自然也隨之快速降低下來。
那么問題來了,受到如此精細調控的環形RNA分子,在細胞中究竟發揮著怎樣的生物學功能呢?
對于免疫分子NF90而言,它結合環形RNA的親和度要比同樣序列的線性RNA更加強。
那么在其他免疫分子之中,是否也有類似NF90、具有更偏好結合環形RNA的情況存在呢?
利用生物化學手段,陳玲玲團隊的博士研究生劉楚霄系統地篩選了免疫通路中RNA結合蛋白對環形RNA的結合能力——研究者最終發現免疫分子PKR能緊密結合環形RNA,并且活性也會隨著結合環形RNA而被抑制。
為什么環形RNA會抑制PKR呢?劉楚霄設計了化學方法標記細胞內的環形RNA分子的單鏈和雙鏈的區域,并結合高通量測序等手段,預測環形RNA在細胞內的折疊狀態。這使得團隊發現很多不同的環形RNA分子具有類似的折疊方式,即形成分子內的短雙鏈結構(這完全不同于具有一樣序列的線性RNA)。這一環形RNA獨具的特征使其特異結合并抑制免疫分子如PKR等在正常情況下的過度激活。
有趣的是,免疫分子PKR活性的過度激活,正是一部分紅斑狼瘡患者的重要特征。
陳玲玲團隊聯合上海交通大學醫學院附屬仁濟醫院的沈南教授團隊發現,在紅斑狼瘡患者的免疫細胞中的環形RNA水平要低于對照人群。
那么是否有可能將環形RNA設計成具有特殊折疊構象的RNA藥物,通過抑制免疫分子PKR來緩解紅斑狼瘡患者的癥狀呢?
陳玲玲團隊設計出了低免疫活性的環形RNA分子,并初步在細胞實驗中進一步驗證了它們對于PKR免疫通路的抑制作用。
環形RNA分子未來是否能在PKR異常激活的炎癥性疾病模型中乃至人體臨床試驗取得成效呢?最近陳玲玲團隊的研究表明,體外合成的環形RNA不僅是PKR的高效抑制劑,更重要的是,體外合成的環形RNA無需像mRNA一樣進行額外修飾去除免疫原性,環形RNA本身就是低免疫原性的,因此具有良好的應用前景。
我們樂觀地等待它們接受事實的檢驗。
本文作者黃宇翔是密歇根大學在讀博士研究生,主要研究“細胞自噬的調控機制”,科普作品主要圍繞生命科學及相關學科方向
術語對照
snoRNA""""""""""""""""""""""""""""""" 小核仁RNA
sno-lncRNA"""""""" 含有小核仁RNA的長非編碼RNA
siRNA""""""""""""""""""""""""""""""""" 小干擾RNA
PKR""""""""""""""""""""""" 雙鏈RNA活化的蛋白激酶
EIF2α"""""""""""""""""""""""""""""" 真核起始因子2α