羅斌,呂自力,單旭東,趙情梅,梁鑫
(成都中醫藥大學附屬生殖婦幼醫院,成都 610041)
高通量測序(next generation sequencing,NGS)是現代分子生物手段運用比較普遍的技術,其中高通量轉錄組技術(RNA sequencing,RNA-Seq)更是為臨床研究提供了便捷的手段。轉錄組(transcriptome)是組織或細胞在特定環境或生理狀態下轉錄表達的所有RNA的轉錄本,即包括編碼/非編碼蛋白的mRNA,以此來判斷這段特殊基因組區域的轉錄水平,可以從整體上反映出細胞中基因的表達情況及其調控規律。因此,RNA-Seq技術為研究基因表達及調控提供了重要的手段和方法,得到廣泛使用。
配子細胞及早期胚胎的RNA含量低,難以達到轉錄組測序建庫所需要的RNA最小起始量要求。早期構建的體外培養的人卵母細胞、4-細胞、8-細胞和32-細胞期的文庫[1],為今后的研究奠定了基礎。隨著NGS、RNA-Seq及Smart-seq2等微量測序技術的建立與發展,以及單細胞基因組測序技術的運用,使RNA-Seq技術的運用變得更加成熟,擺脫了轉錄組建庫RNA含量低的束縛。許多研究小組已經利用SAGE技術、生物芯片、原位雜交和基因敲除等方法對人類卵母細胞、植入前胚胎以及單個器官的發育進行了基因表達及轉錄本的研究。有研究者利用基因敲除等方法經過數年的研究,發現與男性不育癥密切相關的基因近200個[2],這些基因的突變、缺失或表達異常,可能是男性不育癥發生的重要原因。目前已成功利用RNA-Seq技術在人植入前胚胎發育[3]及其他物種[4]的早期胚胎發育調控機制方面開展過一些初步研究,而人類配子發生方面的轉錄組研究較少。高通量RNA-Seq技術具有顯著的優勢,可以在較短時間內大規模研究組織或細胞里多個基因的差異表達,篩選相關基因,也可以研究細胞通路和調控網絡,為解析不孕不育調控機制提供理論基礎。
1.卵母細胞研究:RNA-Seq技術已經運用在人類著床前胚胎發育過程中基因表達調控機理等方面的研究,但對卵母細胞的測序研究較少[5]。有學者對人類卵母細胞極體和原核進行單細胞全基因組測序分析,并確定了其卵母細胞的雜交圖譜,推斷出疾病相關等位基因中的非整倍體和單核苷酸多態性(SNP),獲得了減數分裂重組信息[6]。對比基因組測序,RNA-Seq技術具有明顯的優勢,可以比較正常和異常發育卵母細胞之間的分子水平差異:定量揭示基因調控以及表觀遺傳變異引起的基因表達缺陷,也可以分析SNP及調節通路,而這些基因調控超出了DNA測序的檢測范圍。有學者利用單細胞RNA-Seq技術對體外和體內成熟的人卵母細胞的轉錄組測序分析,發現調節人類卵母細胞成熟的關鍵基因與細胞通路,從RNA測序數據中篩選成熟相關的差異表達基因2 230個[7],如ACAT1、HADHA和ALDH2等基因;并發現81條細胞通路,其中,27%與代謝有關,19%與信號通路有關。
2.精子發生過程研究:精子發生障礙主要是由基因突變和染色體異常的遺傳缺陷引起的。近年來,基因組范圍的微陣列和RNA測序研究豐富的生精細胞群體或模型動物的睪丸樣本,為人類精子發生的分子控制提供了基礎。Montjean等[8]用基因表達探針法對比不育男性和正常男性的精液差異表達基因,發現大約15%的調控基因在精子發生中起作用。RNA-Seq技術可以篩選異常基因,為男性不育提供了新的線索。Djureinovic等[9]利用RNA-Seq技術對人睪丸組織進行了深入測序,并與其他器官組織進行了比較,根據表達模式將人類基因進行分類,結果表明睪丸是迄今為止組織特異性最強的基因。同樣,Zhu等[10]利用RNA-Seq技術對人類睪丸組織進行轉錄組測序,也發現睪丸組織的特異表達基因最多。
通過運用RNA-Seq技術與1 000多份高豐度精子轉錄本比對中,鑒定出900多份參與了精子發生、轉錄調控、精子運動和能力、受精和胚胎發生等生物學過程的基因,將這些基因用于比較受精卵和雄性精子的mRNA產物,發現特發性不孕癥患者生殖細胞轉錄譜與生育個體之間的不同[11]。另外,有研究通過對卡爾曼綜合征(KS)患者單個精子細胞測序與正常精子基因組序列比較,發現有數百個差異表達基因[12],這為KS患者臨床治療指明了方向。最近Chen等[13]應用精度高的單細胞RNA-Seq方法,建立小鼠精子發生過程的轉錄組圖譜,揭示了精子發生過程中基因表達調控的動態變化,這為人類精子轉錄組研究奠定了基礎。
RNA-Seq在篩選精子發生相關基因應用上有巨大潛能:通過一些生物技術手段鑒定了大量與精子發生相關的基因。與生精功能相關的基因有很多,如ODF1、ODF2和CLOCK等[14-16]。與生精相關的其他基因及與運動相關的基因也需要進一步的發掘研究。利用免疫組化等方法通過對PIWI蛋白相互作用RNA(PIWI/piRNA)通路的研究,發現該通路與人類無精子癥相關,即該通路可能在精子發育的過程中有著重要的保護作用[17]。另外,有研究人員利用單細胞高通量全基因組測序技術對單個精子細胞進行研究,鑒定出20多個在二倍體細胞基因組中并不存在的單核苷酸突變[18]
因此,RNA-Seq技術為我們提供了很好的篩選基因的工具,對篩選精子發生和卵母細胞成熟相關基因有巨大的潛能。采用高通量RNA-Seq技術能為我們發掘病理相關基因,更高效的研究細胞信號通路及表觀遺傳,為進一步研究打下基礎。
1.早期胚胎的轉錄組研究:RNA-Seq技術已經運用于人類著床前胚胎發育過程中基因表達調控機理等方面的研究。Dobson等[19]通過分析人類著床前胚胎的轉錄組,發現近2 000種mRNA在Day3的表達有明顯變化,而只有小部分基因在Day1~2上調或下調。Vassena等[20]通過RNA-seq分析人類單個胚胎,成功建立人類胚胎資源數據庫,為綜合分析胚胎發育過程調控提供了參考。Yan等[3]利用單細胞RNA-seq技術測定人類著床前胚胎和胚胎干細胞的基因表達,檢測到20 000多個表達的基因,包括8 000多個長非編碼RNA(long non-coding RNA,lncRNA),并成功繪制出完整的人類著床前單胚胎轉錄組精細圖譜,為今后胚胎發育的研究奠定了基礎。單細胞RNA-Seq技術將逐漸應用到臨床實踐中,方便對人類早期胚胎細胞基因程序化解析。
2.胚胎表觀遺傳研究:高通量RNA-Seq改進方法也得到了廣泛運用。Guo等[21]利用微量細胞DNA甲基化高通量測序技術,對人類早期胚胎發育過程中DNA甲基化重編程的系統深入解讀。另外,利用高精度的單細胞多組學測序技術,成功解析了人類著床前胚胎發育過程中DNA甲基化組和染色質狀態組的重編程過程,以及染色質狀態與DNA甲基化之間的相互關系等關鍵生物學特征[22]。隨后該研究團隊采用單細胞DNA甲基化高通量測序技術,繪制出人類著床前胚胎發育的DNA甲基化圖譜,進一步揭示了胚胎的去甲基化重編程以及父源/母源基因組差異甲基化等特征[23]。
Wu等[24]采用RNA-Seq技術,發現人類早期胚胎發育過程中基因組轉錄激活對于開放染色質區域重編程的關聯性,為深入理解人類胚胎早期發育表觀遺傳調控提供了理論基礎。同年,Li等[25]研究證明了人類和小鼠胚胎中父源/母源基因組的染色質開放程度差異:人類胚胎不同于小鼠胚胎的物種特異性的關鍵表觀遺傳學特征。這為研究非整倍體等發育異常的胚胎,以及反復流產等臨床醫學問題提供了新思路和新研究手段。
3.植入前胚胎檢測:自然流產和不孕不育比例逐年增加,利用NGS技術可精確排查染色體變異的原因,提高治療效率。體外受精患者的妊娠失敗絕大部分都是由于胚胎的非整倍性造成的,導致胚胎停止發育而發生流產的重要原因之一是胚胎的染色體異常,因染色體數目異常引發的自然流產率高達23%以上。Carvalho等[26]比對了全基因組拷貝數變異(copy number variants,CNVs)數據庫,發現其中與胚胎停育及早期流產相關的致病性CNVs約29個。另外,RNA-Seq可用于復發性流產絨毛組織的染色體拷貝數變異分析,檢測出亞顯微結構的染色體異常[27]。RNA-Seq方法檢測率高、分辨率高,對自然流產患者的遺傳咨詢及生育指導具有重要意義。
NGS技術在輔助生殖治療中最經典的應用是胚胎植入前遺傳學診斷(PGD)和植入前遺傳學篩查(PGS)。基于NGS技術的PGS/PGD將大大提高移植率、妊娠率,降低流產率。PGS/PGD結合RNA-Seq技術可在較短的時間內給予病因學診斷,彌補了傳統熒光原位雜交(FISH)技術、染色體核型分析和微陣列比較基因組雜交(CGH)等技術的不足。因此,RNA-Seq技術在胚胎植入前遺傳學診斷中有極大的優勢,其應用效果和價值較高,可以解決因囊胚形成率低而無可活檢的胚胎用于PGD的難題。
4.早期胚胎發育相關基因研究:早期胚胎發育過程中發現了大量相互調控的相關基因,RNA-Seq技術可以大規模篩選這些基因。早期胚胎發育是遺傳信息依據一定的時間、空間和次序表達的結果,伴有大量基因的激活,如胚胎細胞轉錄因子NANOG、OCT4和CLDN4等基因。NANOG能調控合子基因組的激活,缺乏NANOG的胚胎合子基因組激活率低、發育受阻,而CLDN4抑制因子也會導致胚胎不能形成正常的囊胚腔[28-29]。早期胚胎的發育屬母型調控,母源mRNA在胚胎發育早期起著重要生理作用[30]。隨著發育的進行,發育從母型調控向胚胎型調控過渡(maternalto-embryonic transition,MET),MET在不同的物種發生的時期并不相同,如小鼠MET發生在2-細胞期,人MET在4-到8-細胞期。早期胚胎發育遺傳程序中仍有大量基因的表達差異尚未發現,因此,RNA-Seq技術在篩選更多胚胎發育調控相關基因以及研究MET調控上有巨大潛力。
5.胚胎基因其他研究:SNP在生物體胚胎發育的不同階段中普遍存在。轉錄組測序可以分析SNP、微小RNA(microRNAs,miRNAs)及長片段非編碼RNA(lncRNAs)。miRNAs/lncRNAs表達及多態性與早期胚胎發育和著床的關系逐漸引起關注,但采用轉錄組技術對其研究較少。miRNAs在多種生物學過程中具有調控作用,包括細胞增殖、分化和凋亡以及胚胎發育和著床[31]。研究發現miRNAs編碼區SNP可能會干擾成熟miRNAs的表達,引起胚胎發育異常,增加復發性流產的風險[32]。另外,研究者利用RNA-Seq技術發現在早期胚胎發育的過程中lncRNAs發揮了重要的相關調控功能[33]。
RNA-Seq可以對胚胎發育細胞通路進行廣泛的研究。研究發現在早期胚胎發育過程中剪接體通路和內吞作用通路與胚胎母源RNA降解和基因組的啟動有關[34],細胞因子及其受體相互作用通路在早期胚胎的發育和植入過程中發揮重要作用。胚胎植入反復失敗的婦女子宮內膜中有許多mRNA表達異常,其中表達下調的多數mRNA都涉及細胞因子及其受體相互作用通路[35]。
隨著高通量測序技術快速的發展,更多的研究人員將其作為工具來挖掘人類不孕不育基因組資源,其高通量的優勢極大地促進人類不孕不育的研究。此外,與外顯子或基因組的高通量測序相比,轉錄組測序具有明顯的優勢,可以定量揭示基因調控以及表觀遺傳變異引起的基因表達缺陷,也可以分析SNP及調節通路,而這些基因調控超出了DNA測序的檢測范圍。轉錄組分析既可探究無精子癥患者差異表達基因,挖掘更多與精子成熟、運動和貯存密切相關的功能基因,也可以研究輔助生殖中卵母細胞成熟、受精卵發育和著床等相關的表達基因及其表觀遺傳。單細胞轉錄組測序技術的運用成熟更是為輔助生殖研究提供了便捷。
怎樣更好地將高通量轉錄組測序技術應用在人類不孕不育研究中?如何很好地發揮出轉錄組測序的優勢?如何發掘出特殊的基因并預測其功能?這一系列問題都將是在人類不孕不育轉錄組研究中所要重點考慮的。