999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

植物單細胞轉錄組測序研究進展

2021-01-22 09:08:56李益孫超
生物技術通報 2021年1期
關鍵詞:植物分析研究

李益 孫超

(中國醫學科學院北京協和醫學院藥用植物研究所,北京 100193)

生物體由不同形態、具有特定功能的細胞構成,而不同細胞的基因表達模式也是不同的[1]。常規的植物轉錄組學研究通常是將植物整個器官或組織均質化后測序,忽略了細胞的異質性[2],雖然有助于在器官或組織水平上解決許多生物學問題,但無法了解稀有細胞類型或單個細胞的轉錄過程。細胞捕獲、測序技術和生物信息學的飛速發展使得單細胞轉錄組測序(Single-cell RNA-seq,scRNA-seq)成為可能,并不斷發展和完善,目前已廣泛應用于生物學和醫學領域,并在植物學研究中顯示出巨大的潛力。在植物中開展單細胞轉錄組研究有助于深入理解不同細胞類型在發育過程中的作用以及細胞間的調控網絡[3]。本文對植物單細胞轉錄組測序和數據分析以及單細胞轉錄組測序在植物研究中的應用進行了概述。

1 植物單細胞轉錄組測序技術

scRNA-seq技術發展迅猛,從最初只能檢測幾個細胞到單次實驗可以同時檢測數10萬個細胞,實驗效率得到了顯著提高[4]。同時,建庫及測序過程中不同環節的改進使得成本不斷降低、有效信息量不斷增加。目前已經開發出多種scRNA-seq技術,不同技術的適用范圍不同。多孔板法(PCR platebased)和液滴法(Droplet-based)是兩類成功應用于植物研究的scRNA-seq技術(表1)。兩類方法各有特點,可根據實驗目的和植物樣本性質選擇合適的技術方法[5]。

表1 單細胞轉錄分析技術

1.1 多孔板法

對于稀有類型細胞或者細胞量較少的樣本,可以考慮多孔板法。因此,基于多孔板法的scRNAseq技術適用于研究特定類型或稀有的細胞,如生殖細胞。通常結合毛細管口吸法、激光顯微切割或流式細胞熒光分選技術來分選單個細胞[6]。這種方法首先需要將少量的細胞分選到含有PCR引物的64/96孔板中,然后對單個細胞進行獨立構建測序文庫并測序[7]。基于多孔板的方法最大的優點是捕獲效率高,但由于其細胞通量較低,測序成本高,限制了其大規模應用。目前在植物中成功開展應用的有Smartseq2[8]和CEL-seq2[9]。Smart-seq2支 持 全長轉錄本測序,靈敏度高,是檢測低表達的轉錄本的最佳選擇[10]。CEL-seq2采用體外轉錄線性擴增(IVT)的建庫方法,主要優勢是減少了PCR指數擴增所造成的偏差,擴增后DNA的雙端深度測序能夠準確檢測兩條鏈的序列[11]。

1.2 液滴法

基于液滴法的scRNA-seq通過微流控芯片,利用液滴直接分選單個細胞,可以無差別獲得組織中上千個細胞,使得植物單細胞轉錄組研究實現了從少量細胞到高通量的飛躍[12-13]。2015年,哈佛大學的兩個團隊將微流控技術引入scRNA-seq中,分別開發出 Drop-seq[14]和inDro[15]兩種技術。隨后,10× Genomics 公司于2017 年推出一個基于液滴法的商業化單細胞分析系統Chromium,使得scRNAseq的應用得到了迅速發展。2019年,先后有多篇文章報道利用Chromium 平臺對擬南芥根開展了研究,證明了高通量單細胞轉錄組測序同樣可用于研究植物[16-20]。基于液滴法的scRNA-seq都運用了相似的技術原理,在微流控設備中,水流中包含懸浮狀態下的細胞,裂解緩沖液中包含了用條碼(Barcodes)標記的微珠,這兩股流體匯集在一起后穿過油體通道,最終形成一個個油滴包裹的凝膠珠。一旦液滴包裹成功,細胞立即被裂解,釋放出與微珠表面引物結合的 RNA,在微珠表面反轉錄成 cDNA,生成包含成千上萬個單細胞的 cDNA 文庫[21-22]。

2 植物單細胞轉錄組分析流程

相比于傳統轉錄組測序,scRNA-seq產生的數據量更為龐大復雜,分析和解釋數據也是scRNAseq分析中的重點[23]。scRNA-seq分析的具體步驟可能會由于生物學問題不同而有所不同,但大多數分析中使用的核心流程是一致的,包括數據預處理、數據的降維和聚類以及數據下游分析3部分[24-26](圖1)。

圖1 單細胞轉錄組數據分析流程

2.1 數據預處理

數據的預處理包括數據的質控、數據矯正和整合以及對數據的標準化處理3部分[27-30]。細胞異常破裂、死亡、捕獲細胞的位置沒有細胞或者含有多個細胞會導致產生低質量數據,因此在正式分析前需要對原始數據進行質量控制以剔除這部分數據[31]。數據整合可以消除實驗過程中的生物因素、技術因素以及不同批次引起的數據偏差,盡可能地展示單個細胞的真實表達情況[32-33]。通過多步過濾的數據即可用于構建高精度的基因-細胞表達矩陣,用于后續分析。

2.2 降維和聚類分析

scRNA-seq數據具有高維性,涉及數千個基因和大量細胞,當在一個高維基因表達空間中比較細胞時,細胞間的距離變得更加均勻,使得區分群體間或者群體內的差異非常困難。首先在數千個細胞的基因表達量數據中,選取其中高度可變的基因(Highly variable genes,HVGs),比使用所有的基因,選擇HVGs更為有效[26,34]。然后采取主成分分析(Principal component analysis,PCA)降低數據集的高緯度和復雜度,PCA可將數據投射到較少的獨立的線性維度中,從而捕捉到可能的最大方差。采用t分布隨機領域嵌入(t-Distributed stochastic neighbor embedding,tSNE)或均勻流形近似和投影(Uniform manifold approximation and projection,UMAP)對 細胞進行進一步降維,這兩種都是非線性降維方法,可以有效地將高維度數據轉換成二維圖像[35-36]。PCA降維后的數據傳遞到t-SNE與UMAP進行二維可視化展示,細胞之間的基因表達模式越相似,在t-SNE/UMAP圖中的距離也越接近。接下來可采用k-means算法或圖聚類算法(Graph-based)進行聚類分析,將表達相似的細胞聚在一起,形成不同的細胞亞群[24,37](Cell cluster)。Seurat是用于分析單細胞數據的常用軟件,它使用基于圖聚類的算法,通過計算細胞間的差異性,優化細胞間聚類關系距離的權重值(通過設定軟件中的閾值),實現對細胞的聚類。

2.3 數據下游分析

數據下游分析包含細胞水平和基因水平的分析[25]。細胞水平的分析又分為細胞類型鑒定和軌跡分析,其中也涉及到基因水平的分析。基因水平分析包括差異表達分析、基因集分析和基因調控網絡分析。目前,主要有兩種方法用于鑒定細胞類型,一種是人工鑒定方法,綜合利用樣本信息、組織類型、細胞狀態、表面marker和差異表達基因,并結合已知數據庫的信息,進行細胞類型注釋[38]。CellMarker[39]和panglaodb[40]是兩個常用數據庫,提供了人和小鼠細胞注釋集。對于其他物種,則需要根據報道的文獻來確定標記基因(marker基因)。另一種方法是利用自動化鑒定工具對細胞進行注釋,目前,已經開發出近30種自動化鑒定工具,包 括Scamp[41]、SingleR[42]、cellassign[43]等。自動化工具利用已知類型的細胞樣本的基因表達譜以及marker基因作為參考數據集,基于單細胞與參考數據集表達譜的相似性,對細胞類型進行自動化注釋。細胞聚類、注釋、重新聚類或子聚類以及重新注釋過程的反復迭代非常耗時,自動化鑒定方法提高了細胞注釋的效率,但也降低了其準確性。對于較小的數據集,可以優先考慮人工注釋的方法,隨著單細胞轉錄組測序樣本數和細胞數的增加,可以結合多種方法,如首先使用自動化工具進行粗略注釋,然后利用人工注釋對結果進行補充完善。在分選單細胞的過程中可以捕獲到處于中間狀態的細胞(從一種狀態到另一種狀態的細胞),scRNA-seq提供了一個很好的機會來組裝發育過程中的演化軌跡。在細胞的演化進程中,細胞的轉變可能表現出不同的速率,意味著不應隨著時間來評估基因表達的變化,而是應該依賴于發育過程中的進展。擬時(Pseudotime)分析,又稱細胞軌跡(Cell trajectory)分析,根據測序細胞之間表達模式的相似性對單細胞沿著軌跡進行排序,以此推斷出發育過程細胞的分化軌跡或細胞亞型的演化過程[44]。Saelens等[45]對45種軌跡推斷方法的準確性、可擴展性、穩定性和可用性4個方面進行了比較,評估結果發現當前軌跡推斷方法之間存在很大的互補性,不同的工具有不同的使用范圍。Monocle是一款常用的擬時分析軟件,其計算細胞的相關性得到最小生成樹,找到最小路徑,然后把其他的所有數據點投射到最小路徑,最終得到細胞分化軌跡圖的算法[46-47]。

基因水平上的分析主要是通過比較細胞亞型之間差異基因的表達和功能富集,從而進一步解釋細胞的異質性[48]。差異基因分析實際上是貫穿單細胞研究的重點分析內容,亞群特征基因分析、處理組之間的基因動態變化、分化路徑上的基因動態變化,本質上都是差異基因分析。目前的基因差異表達分析軟件有各自的優缺點,Wang等[49]對比了11種基因差異表達分析軟件發現,傳統的基因差異分析工具(DESeq2,edgeR)與單細胞差異分析工具性能表現相當,尤其在檢測靈敏度上表現良好,但此類軟件的運行時間較長,對于大數據量的單細胞轉錄組的基因差異分析來說,算法的運行時間通常是一種重要的考慮因素。在單細胞差異表達分析工具中,DEsingle[50]和SigEMD[51]可以同時保證檢測靈敏性和準確性,但是運行效率仍然比較低。另外,MAST(Model-based Analysis of Single-cell Transcriptomics)軟件利用hurdle模型消除dropout(基因在某些細胞完全沒有表達,同時在另外一些細胞有高表達的現象)的影響,在性能和效率上可以達到較好的平衡[25,52]。

3 單細胞轉錄組測序在植物研究中的應用

基于多孔板法的scRNA-seq可用于研究稀有細胞,Efroni等[8]和Nelms等[9]分別利用Smart-seq2和Cell-seq2捕捉到了愈傷組織和生殖細胞在進入分化階段前的瞬時變化。基于液滴法的scRNA-seq,尤其是Chromium平臺的高細胞通量為植物單細胞轉錄組研究帶來了新的突破口,使得研究樣本從少量細胞向組織器官轉變。總的來說,scRNA-seq可以通過捕獲單個細胞的基因的表達情況(表2),來揭示細胞的異質性,細胞的分化軌跡以及細胞對環境變化的響應機制。

表2 植物單細胞轉錄組研究概況

3.1 鑒定細胞類型

2019年2 月,首篇利用高通量單細胞測序的植物根尖單細胞圖譜文章發表在Plant Physiology上。Ryu等[16]選擇擬南芥幼苗根尖組織為樣本,利用Chromium平臺,共獲得了7552個細胞的轉錄組數據。通過Seurat對這些細胞進行降維聚類分析,得到9個主要的細胞亞群,隨后利用86個已知特異性表達的標記基因集對不同的細胞亞群進行注釋,同樣地,利用木質部和韌皮部標記基因集區分了中柱細胞內的不同細胞亞型,證實了高通量scRNA-seq在植物研究中的可行性和有效性。Denyer等[17]選用了相同的測序平臺對擬南芥根組織進行了測序,利用相似的有監督分類方法注釋細胞類型,并構建了含報告基因的轉基因擬南芥株系,結果顯示內皮層組織內的細胞確實有報告基因綠色熒光蛋白的表達。有監督分類方法僅適用于極少數有參考數據集的植物,作者還采用了無監督分類方法,通過定義聚簇中特異性的標記基因標準,在聚簇之間的差異基因集中進行篩選,獲取了數百個自定義的標記基因,并從中挑選了10個特異性高且此前未報導過與根發育相關的標記基因,通過報告基因株系進行驗證發現,有8個基因的表達模式與預測一致。有關擬南芥根組織的研究結果表明,利用scRNA-seq數據可以鑒別不同細胞類型,如中柱鞘細胞、韌皮部篩管和不同表皮細胞亞型,也能檢測到靜止中心(Quiescent centre,QC)這種數目稀少的細胞群。

3.2 揭示細胞分化軌跡

利用擬時序分析可以推導出具有分化/演化關系的細胞亞群間可能的分化路徑。Shulse等[54]通過Monocle推斷了內皮層細胞的發育過程,結果顯示發育早期的細胞亞群沿著兩支軌跡曲線分化。與內皮層發育相關的798個基因在擬時間序列上呈現早期、中期、晚期3種表達模式,且調節內皮細胞分化初始階段的相關基因在擬時間序列的早期階段表達,而晚期表達的基因主要與木質素代謝和細胞連接組分合成相關。對多項擬南芥單細胞的研究,同樣利用Monocle解析了根組織中的表皮[16]、內皮層[54]、根毛[56]、分生組織[17]、根冠[19]細胞分化軌跡和各類細胞分化過程中基因的動態變化。Nelms[9]收集了玉米的144個生殖細胞,通過單細胞分析重塑了玉米雄性細胞進入減數分裂的發育過程。在減數分裂前期,轉錄組圖譜發生了兩次急劇變化,通過比較轉錄組圖譜與染色體細胞形態學的關系發現,第一個轉錄水平轉變發生在第一次減數分裂前期的細線期,第二個轉變發生在偶線期,表明減數分裂期間轉錄表達的改變不僅與核事件相關,而且與細胞形態相關。通過擬時序分析還能找出驅動細胞亞群分化的關鍵基因。分生組織到根毛細胞的發育過程中的基因表達譜顯示,與根毛發育相關的細胞擴張和細胞重組的基因在擬時間序列的中期表達,以此推測這些基因可能是驅動根毛分化的特定基因。Turco等[55]研究木質部細胞分化到終端分化的分子機制,基于全根表達譜數據和單細胞數據,表明了VND7是啟動根細胞向木質部細胞急劇轉換的關鍵因子,確定了4個候選VND7下游靶基因。

3.3 分析細胞間調控網絡

高通量scRNA-seq技術的可提供單細胞分辨率的轉錄組信息,有助于發現新的發育調控因子。為了進一步研究在根毛細胞發育過程中基因的相互作用,Denyer等[17]調取了單細胞數據中239個轉錄因子的動態表達數據,構建了精細的基因調控網絡(Gene regulatory network,GRN),GRN分 析 結果顯示了參與根毛發育過程中的關鍵因子以及相互作用關系,進一步將GRN的轉錄因子過濾至25個核心組分,發現了一系列負反饋調控的轉錄因子。Liu等[20]采用scRNA-seq 技術解析了擬南芥氣孔譜系細胞發育進程中的轉錄組動態模式,對氣孔譜系細胞早期發育階段中轉錄因子進行了篩選,結果顯示調控植物幼苗生長、發育和應激響應的重要轉錄因子顯著高表達,轉錄因子的調控網絡顯示BPC、WRKY33作為核心轉錄因子不僅參與調控功能基因,還與其他轉錄因子相互作用。此外,Jean-Baptiste等[18]對幼苗進行熱脅迫處理,分析了單細胞水平熱激響應轉錄調控網絡發現,響應高溫的熱激基因在不同細胞類型中都有表達,但仍有一些基因在不同細胞類型中存在顯著的差異表達,植物對內外源信號的響應的細胞異質性應該廣泛存在。

4 挑戰與前景

植物單細胞轉錄組研究的最大技術挑戰是將細胞從適當的組織中分離出來,并獲得大量的細胞用于高通量分析。植物細胞有細胞壁的保護,必須先制備成原生質體才能制備單細胞懸液。目前尚未開發出可以適用于任何植物的通用的制備原生質體的方法,這也是植物單細胞研究樣本單一的原因。因此在制備植物單細胞懸液過程中,可根據植物組織的特性,優化酶解條件以分離原生質體。單細胞測序產生的背景噪聲數據和不同樣本間產生的批次效應是處理單細胞數據時的難點。為此,多種生物信息學工具已被開發并成功應用于scRNA-seq分析。多篇植物單細胞轉錄組測序文章證實了高通量scRNA-seq方法的在植物研究中的可行性和有效性,預示著植物研究進入了單細胞時代。未來植物單細胞技術發展的主要趨勢是提高植物單細胞分離效率,實現多樣本多組織研究。近期,有科學家提出了植物細胞圖譜計劃(Plant Cell Altas)[57],高通量scRNA-seq技術是其不可或缺的重要一環。可以預見單細胞ChIP-seq、單細胞ATAC-seq、單細胞Hi-C等單細胞測序技術也會加入植物單細胞研究的隊列,從而使高精度研究單細胞基因調控模型成為可能。

猜你喜歡
植物分析研究
FMS與YBT相關性的實證研究
遼代千人邑研究述論
隱蔽失效適航要求符合性驗證分析
視錯覺在平面設計中的應用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系統研究
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
哦,不怕,不怕
將植物穿身上
電力系統及其自動化發展趨勢分析
植物罷工啦?
主站蜘蛛池模板: 日本欧美一二三区色视频| 亚洲男人的天堂在线| www.国产福利| 天堂成人在线视频| 91视频99| 国产一二三区视频| 欧美日韩国产高清一区二区三区| 在线观看91香蕉国产免费| 成人毛片免费观看| 精品无码国产一区二区三区AV| 第一页亚洲| 亚洲av日韩av制服丝袜| 日韩免费成人| 亚洲av无码人妻| 91精品国产自产在线观看| 狠狠v日韩v欧美v| 国产在线拍偷自揄观看视频网站| 国产男人天堂| 欧日韩在线不卡视频| 久久国产精品夜色| 国产SUV精品一区二区| 亚洲AV无码不卡无码 | 伊人五月丁香综合AⅤ| 亚洲第一av网站| 2021精品国产自在现线看| 啪啪啪亚洲无码| 久久青草免费91观看| 国产内射一区亚洲| 亚洲成人在线网| 国产呦视频免费视频在线观看| 粉嫩国产白浆在线观看| 久久精品丝袜| 亚洲国产亚洲综合在线尤物| 在线综合亚洲欧美网站| 久久精品日日躁夜夜躁欧美| 亚洲精品不卡午夜精品| 99国产精品国产| 国产日韩欧美在线视频免费观看| 97亚洲色综久久精品| 国产精品亚洲片在线va| 国产H片无码不卡在线视频| 免费毛片在线| 伊人精品成人久久综合| 99久久精品免费视频| 欧美精品1区| 欧美人与动牲交a欧美精品| 国产激情影院| 日韩天堂在线观看| 亚洲精品免费网站| 无码中文字幕精品推荐| 天天躁日日躁狠狠躁中文字幕| 色综合网址| 国产日本视频91| 人人看人人鲁狠狠高清| 亚洲精品777| 亚瑟天堂久久一区二区影院| 欧美日韩国产在线播放| 精久久久久无码区中文字幕| 亚洲国产精品无码久久一线| 亚洲成A人V欧美综合| 99热这里只有精品免费| 国产熟女一级毛片| 国产亚洲日韩av在线| 亚洲男人天堂2018| 久久亚洲日本不卡一区二区| 日本不卡在线播放| 亚洲一区二区成人| 精品国产免费观看| 国产一区二区三区在线观看免费| 嫩草影院在线观看精品视频| 久久精品亚洲中文字幕乱码| 亚洲欧美不卡视频| 国产精品午夜电影| 亚洲综合色在线| 无码'专区第一页| 精品视频福利| 亚洲AⅤ无码日韩AV无码网站| 全部免费毛片免费播放 | 日韩最新中文字幕| 在线网站18禁| 日本日韩欧美| 欧美日韩久久综合|