趙敏蝶 吳 盡 趙宇卓 劉學東 鄭 冬 梁冬瑩
(東北林業大學,哈爾濱,150040)
細胞是生物體的基本結構和功能單位,在其生長發育過程中,因細胞類型、環境以及內部調節的不同,轉錄組信息的變化呈多樣性。轉錄組研究能夠從整體水平研究基因功能以及基因結構,揭示特定生物學過程以及疾病發生過程中的分子機理。傳統轉錄組的研究主要是在器官或者組織水平上測序,即轉錄組測序(RNA-seq),忽略了單個細胞在遺傳方面的特殊性。單細胞轉錄組測序(single cell RNA-seq,scRNA-seq)是在單個細胞水平對mRNA進行高通量測序的一項新技術,將分離的單個細胞的微量全轉錄組RNA擴增后進行高通量測序,從單細胞水平上獲得全轉錄組的表達譜[1-3]。scRNA-seq能夠以高通量和單分子分辨率研究單個細胞表達譜,揭示復雜細胞群體的異質性,避免單個細胞的基因表達信號被群體的平均值所掩蓋。scRNA-seq更加精準,最終得到的是每個細胞型的表達量,從而可以幫助理解組織異質性,鑒定罕見的細胞類型,檢測細胞組分的變化,在人類的癌癥異質性、胚胎發育、細胞對藥物的反應、神經細胞分型、差異表達通路等方面都發揮重要作用[4-7]。本文對scRNA-seq技術原理及其在動物研究中的應用與進展進行綜述。不僅可以了解動物不同發育時期組織細胞之間的特性,為動物研究提供科學參考,針對野生動物的研究也能提供一個新的方向。
1990年Brady等首次描述了一種基于聚合酶鏈式反應(PCR)的單細胞cDNA擴增方法[8]。幾乎同時,Eberwine等提出了另外一種基于體外轉錄的線性擴增方法[9]。隨著基因芯片技術的發展,2002年起多篇文章報道了單細胞轉錄組的基因芯片分析[10-13]。2009年,Tang等首次報道單細胞轉錄組的深度測序分析[3],并于2010年再次發表相關研究工作[14]。至今,scRNA-seq已成為生物學研究中應用熱門之一。
單細胞轉錄組研究能夠在單個細胞水平上揭示細胞內整體水平的基因表達狀態和基因結構信息,準確反映細胞間的異質性,深入理解其基因型和表型之間的相互關系[15]。scRNA-seq作為一種針對單細胞轉錄組進行測序的技術,隨著其發展,人們將會對細胞的認識更加全面豐富。在生物學研究中,scRNA-seq可以研究基因調控網絡,基因表達的異質性與隨機性,基因表達水平,監測新的基因(包括新的蛋白質編碼基因和非編碼RNA基因,尤其是低表達基因),定量研究基因的突變情況等。scRNA-seq技術主要用于大規模細胞圖譜構建[16-20]、細胞亞群細化和稀有細胞類型鑒定[19,21]、腫瘤方向研究[22]、干細胞發育及分化研究[23]、免疫方向研究[24-27]、神經科學研究[28]、發育生物學[3-4,16-19,29-38]等。這些研究為人類認識和了解生物機體和各種功能提供了重要的方法和途徑。同樣,scRNA-seq在動物的研究中也得到推廣和應用。
近年來,隨著單細胞轉錄組測序技術的發展,許多研究人員利用該技術對動物的某些單細胞的轉錄本進行研究,初步實現在單個細胞水平上對動物機體的了解,確定了scRNA-seq技術在動物研究中的適用性。具體的研究方法通常分為以下幾部分。
首先,研究者要對單個細胞進行分離以獲得單細胞樣品。分離單個細胞,常用技術:連續稀釋法、顯微操作法、微流控芯片(microfluidics)、熒光激活細胞流式分選(fluorescence-activated cell sorting,FACS)、磁性激活細胞分選(magnetic-activated cell sorting,MACS)、轉錄組體內分析法(transcriptome in vivo analysis,TIVA)以及激光捕獲顯微切割法(laser capture microdissection,LCM)等。研究人員根據實驗條件和目的對單細胞的分離采取不同的方法。例如汪俊幫等人在顯微鏡下分離出了小鼠(Musmusculus)胚胎二細胞期的細胞[39]。
scRNA-seq數據的獲得通常包括細胞裂解、mRNA逆轉錄成cDNA、cDNA擴增、文庫構建4個步驟。首先加入緩沖液使細胞降解,獲得mRNA,去除蛋白質和DNA等雜質,純化mRNA,然后進行逆轉錄,一般使用oligo-dT引物和SuperscriptⅡ或Ⅲ逆轉錄酶,將mRNA逆轉錄出cDNA第一鏈,并通過模板轉換,合成cDNA的第二條鏈。再對已逆轉錄生成的cDNA進行PCR或者IVT擴增,對擴增得到的產物進行純化測序。
單個哺乳動物細胞內的總RNA含量約為10 pg,其中mRNA約為0.1—0.5 pg,而目前高通量測序文庫需要至少數十納克DNA,因此單細胞RNA-seq的文庫構建過程需將起始核酸進行數十萬倍擴增[40]。根據合成第二條cDNA鏈時使用的酶,可將單細胞轉錄組測序的cDNA擴增方法分為PCR法、體外轉錄法和Phi29 聚合酶法。將擴增得到的產物進行純化后,一般采用高通量測序技術(high-throughput RNA sequencing)對轉錄組進行不同深度測序分析,得到大量原始的讀長(reads),初步得到單細胞轉錄組數據。
對scRNA-seq數據的處理首先要進行質量控制、表達量估計以及數據的標準化。獲得scRNA-seq原始reads后,需要對原始reads,對齊reads及不同批次細胞進行質量控制,以剔除低質量數據。質量評估后,采用不同的數據表達方式來代表表達水平。但這些方法不適用于直接比較細胞間的表達量差異,對于大多數下游分析,均需要先將不同細胞的數據進行標準化。scRNA-seq實驗中存在的各種噪聲,會對后續分析造成影響,所以,也需對數據進行評估和調整實驗誤差,來減少技術或生物來源造成的scRNA-seq實驗的噪聲。根據所調查的生物問題有許多分析方法,本文從細胞水平分析和基因水平分析兩個方面進行介紹。
2.3.1 細胞水平分析
細胞水平分析包括可視化、聚類分析、細胞發育階段推斷和排序等[18,31-33]。處理單細胞轉錄組數據這樣一個高維的數據時,一個常用的策略是將這些細胞投影到低維的空間上,達到可視化分析,也就是降維技術,通過僅考慮二維或三維空間,可視化提供了定性地探索數據的平均值。聚類分析用于識別細胞亞型(如細胞異質性、細胞分化周期的判定等),提供了通過相似性對細胞進行分組的機制。scRNA-seq能夠提供單個細胞全基因表達譜,利用scRNA-seq數據,結合計算機技術可將非同步細胞群中單個細胞的分化路徑排序。細胞發育階段推斷和排序分析是通過降維和基于圖論的原則,將處于不同分化階段的細胞進行排序。Monocle、PQ-trees等方法的使用使得scRNA-seq數據轉化成細胞所處的不同分化階段,可以確定基因表達的動態變化。
2.3.2 基因水平分析
基因水平分析包括高變異基因的鑒定、差異表達基因和標記基因的識別、基因調控網絡分析等。對于高變異基因的鑒定,Brennecke等首先利用插入分子估計了技術噪音,并建立了均值-方差關系模型來識別高度可變的基因[41];Kim等提出了一個基于生成模型的統計框架,將總方差分解為技術和生物方差,這將有助于識別可變基因[42];貝葉斯模型可聯合模擬尖峰和內源性基因,并提供生物變異程度的后驗分布[43]。在scRNA-seq研究中識別亞群的差異表達基因和標記基因是一個簡單但重要的分析。MAST、M3Drop等scRNA-seq實驗方法通過混合模型或簡單統計檢驗識別差異表達。標記基因的識別是通過差異分析來識別每個cluster下的標記基因,將該cluster下的細胞作為一組,其他cluster下的細胞作為另一組,然后進行差異分析。scRNA-seq研究的一個重要應用是識別基因的共調控模塊和利用基因與基因表達相關性構建的基因調控網絡。研究人員已經鑒定了許多共表達基因的功能模塊,可以描述小鼠的每個胚胎發育階段。scRNA-seq研究中推斷的網絡是無向的;也就是說,它們不能在基因之間提供直接的調節關系。為了揭示哪個基因位于調控級聯的上游/下游,通常需要進行擾動實驗(例如敲除目的基因)。
在胚胎發育的早期階段,受精卵會經歷廣泛的轉錄調節和表觀遺傳重編程過程。早期胚胎發育階段的細胞數量極為稀少,其轉錄組分析尤其需要scRNA-seq技術。2009年,Tang等首次應用scRNA-seq于單個小鼠卵裂球,檢測到比微陣列技術多75%的基因表達,并識別出1 753個以前未知的剪接連接;對于卵母細胞,與野生型對照相比,1 696和1 553個基因分別異常上調[3]。2013年,小鼠和人類著床前胚胎的高精度單細胞轉錄組圖譜陸續完成[16-17]。利用scRNA-seq篩選出影響盤羊(Ovisammon)卵母細胞成熟的關鍵基因,并結合實時定量PCR技術對基因進行定量驗證,即從分子水平研究卵母細胞成熟的調控機制,以此來提高羔羊卵母細胞發育后期胚胎的潛力[29]。蘭道亮等對野牦牛(Bosgrunniens)GV期和MⅡ期卵母細胞進行了轉錄組學測序和數據對比分析,篩選出了4 767個差異表達基因[30]。單細胞轉錄組測序的時間序列可以揭示細胞分化途徑的動態特征。研究人員用scRNA-seq技術分別在斑馬魚(Daniorerio)和非洲爪蟾(Xenopuslaevis)早期胚胎發育過程中建立了基因表達動態圖譜,將相關數據以幾分鐘到幾小時的時間間隔組合在一起,對細胞進行逐個描述,并觀察胚胎最終形成的過程,揭示了單個細胞構建整個生物體的完整過程[31-33]。這些研究為野生動物早期胚胎發育的研究提供了新的途徑。
組織器官發育是scRNA-seq技術應用的另一個重要領域。多種組織器官(包括肺[4]、腦[34]、心臟[35]、腎臟[36]、小腸[37]等)發育過程中的單細胞轉錄組分析已被報道。2018年,研究人員對來自小鼠20個器官和組織的約10萬個單細胞進行單細胞轉錄組分析,結果揭示了之前研究中從未完整展示的基因表達圖譜,并且能直接比較不同組織和細胞類型的基因表達,最終建立了一個名為Tabula Muris的儲存小鼠細胞信息的開源數據庫[39]。DeLaughter等從小鼠胚胎發育的7個不同階段提取心臟細胞樣本,利用scRNA-seq技術檢測了單個細胞基因活性隨時間的變化,提供了一個時間和空間的圖譜,描繪了心臟不同細胞群的發展[35]。scRNA-seq技術可以通過分析單個細胞轉錄組精細地識別出各種細胞類型,同時能夠發現新的細胞類型以及標記基因。Carter等研究得到了來自12個關鍵發育時間點的小鼠小腦單細胞圖譜,鑒定了主要的小腦細胞亞群,確定了有助于小腦發育的亞群[18]。Pandey等將單細胞轉錄組與腦解剖相結合,得到了約13 000個斑馬魚松果體韁細胞,確定了18種神經元類型和幾十種標記基因,創建了全面的斑馬魚松果體韁單細胞圖譜[19]。scRNA-seq技術鑒定細胞類型和識別標記基因的特點將有力推動發育生物學的研究。
免疫細胞對抗原物質的應答反應具有復雜和不均一性的異質性特點,單細胞轉錄組測序技術有望在此方面揭示豐富的未知信息。先天性淋巴細胞(ILCs)是動物免疫應答和體內平衡的重要介質。Hernández等利用scRNA-seq獲得了組織穩態期間和免疫攻擊后斑馬魚淋巴細胞的綜合圖譜,從野生型斑馬魚的腸道以及rag1突變(缺少T和B細胞)的斑馬魚中共收集14 080個單細胞,發現了ILC樣細胞[24]。應用scRNA-seq可以獲得斑馬魚特異性免疫細胞類型的第一個轉錄組并對其進行表征。差異表達分析揭示了新的免疫細胞特異性基因,為免疫系統的進化提供了更多的線索[25]。在其他研究中,scRNA-seq揭示了斑馬魚中存在Th2和調節T細胞(Tregs),進一步證實了哺乳動物和硬骨魚在免疫生物學上的相似性[26-27]。
scRNA-seq技術可作為一種新的腫瘤細胞鑒定技術,更加精準地判定腫瘤類型以及揭示相關基因調控網絡。Puram等采用scRNA-seq的方法分析了來自頭頸鱗狀細胞癌的細胞。他們通過分析構建出頭頸癌中存在的所有不同細胞的圖譜[22]。scRNA-seq還可用于大腦細胞圖譜繪制。Carter等研究得到了來自12個關鍵發育時間點的小鼠小腦單細胞圖譜,利用已知的譜系標記進行驗證,表明單細胞數據能準確概括小腦的發育。最后,創建了名為Cell Seek的數據集[18]。Davie等研究構建了全面的成年果蠅(Drosophilamelanogaster)大腦細胞圖譜;開發了SCENIC果蠅數據庫,能映射出果蠅大腦中神經元和神經膠質類細胞的基因調控網絡;繪制了大腦衰老過程中的細胞狀態變化,利用機器學習的方法,根據細胞的基因表達譜來準確預測細胞的年齡[20]。除此之外,Gerber等針對東方蠑螈(Cynopsorientalis)肢體再生的問題,聯合使用Cre-loxP報告基因譜系跟蹤和scRNA-seq,追蹤了CT細胞譜系的再分化軌跡及肢體再生過程中特殊譜系的分子重建步驟[44]。Feregrino等利用發育中的紅原雞(Gallusgallus)的足趾作為研究脊椎動物模式形成的范例,使用scRNA-seq,對來自雞自噬模式3個關鍵發育階段的17 628個細胞進行了測序[45]。結果顯示鑒定了23個具有不同轉錄譜的細胞群,檢測出稀有細胞類型,推斷出在發育過程中與不同組織類型相一致的基因共表達模塊。Foster等研究小海膽(Hakiacorbularis)胚胎時利用scRNA-seq分析揭示了胚胎發育過程中存在的細胞類型、抑制各種信號通路導致的基因調控網絡的變化,以及這些通路在影響發育軌跡方面的選擇性[46]。非洲爪蟾蝌蚪具有很高的再生潛力,為了描述這種再生反應,Aztekin等人在尾部截肢后進行了scRNA-seq[47]。轉錄譜分析顯示,再生組織細胞分泌與關鍵再生途徑相關的配體,向祖細胞發出信號,以重建丟失的組織。
隨著第三代測序技術的發展,scRNA-seq技術也逐漸得到重視。近年來,單細胞轉錄組測序技術已經取得了較為明顯的發展,被應用到諸多領域,隨著方法學的成熟,scRNA-seq技術在未來動物研究中將會得到更加廣泛地應用??赡馨▽Ω鞣N組織器官的發育過程進行單細胞轉錄組分析,發現新的細胞類型等;與基因組編輯技術結合,對轉錄調控網絡進行單細胞分辨率分析;與細胞成像技術結合,揭示基因表達網絡引起細胞差異以及進行動態調控的作用機制提供檢測方法等。目前,scRNA-seq在野生動物保護研究中的應用并不廣泛。野生動物保護研究主要集中在棲息地保護、環境資源保護、人為干擾等方面,對個體與基因層次的研究并不深入。scRNA-seq在小鼠、果蠅、雞等實驗模型動物或家畜以及蠑螈、非洲爪蟾、斑馬魚等的應用研究證明了該技術可應用于野生動物的個體和基因層次的保護研究中。未來,如果將scRNA-seq技術更多的應用到野生動物研究中,在單細胞水平上研究野生動物不同組織的基因表達情況,包括基因突變、基因調控網絡等,構建個體不同組織的細胞圖譜,研究個體干細胞發育及分化等內容,從早期胚胎發育到組織器官發育、免疫系統等多個領域,可以更加充分地從個體和基因方面了解野生動物的發育生長,對更好地保護和利用野生動物具有重要意義。