宋金益,胡海洋
(中國藥科大學,江蘇 南京 211198)
自2009年第一個單細胞轉錄組測序(Single-cell RNA sequenc ing,sc RNA-seq)技術問世以來[1],對單個細胞的遺傳物質進行測序已日漸成為生物醫學研究的新范式。基于整個轉錄組的大量數據,scRNA-seq以極高的分辨率提供了有關基因表達及其調控的全面信息,從而能夠精準地描述細胞類型和狀態。近幾年,隨著單細胞轉錄組測序技術在靈敏度和精確性方面不斷被改良,不僅可以更高效、更低成本地提供全面的生物信息,同時也使更精確地解析單個細胞的增殖分化、衰老以及病變過程成為現實。單細胞組學技術的革新正在帶來一場細胞檢測、分類和鑒定的方法學革命,其應用范圍從早期胚胎發育擴大到組織器官發育、神經系統、免疫和腫瘤等多個重要領域。
單細胞轉錄組測序基本流程可以概括為單細胞捕獲、mRNA提取與逆轉錄、cDNA擴增、測序文庫構建、測序、數據分析等。目前,主流的單細胞測序平臺包括10X Genomics Chromium、Nadia(Dolomite Bio)、BD Rhapsody Single-Cell Analysis System、Illumina Bio-Rad、Fluidigm C1等。雖然scRNA-seq的新平臺仍在不斷涌現,但使用最廣泛的平臺仍然是基于Drop-seq測序技術的10X Genomics Chromium[2],其測序流程如圖1所示。具體如下:從組織中分離細胞,制備單細胞懸液;將每個細胞與具有明顯條形碼的微珠共同封裝在納升級液滴中;分離液滴,裂解細胞;微珠捕獲細胞的mRNA,形成STAMPs(Single-cell Transcriptomes Attached to Microparticles);在一個反應中逆轉錄、擴增和測序數千個STAMP;使用Barcode獲取每個轉錄本的細胞來源。

圖1 高通量單細胞轉錄組測序(Drop-seq)工作流程
吳昊等[3]開發的scNT-seq(single-cell metabolically labeled new RNA tagging sequencing)技術可以大規模并行分析來自同一細胞的已存在和新轉錄mRNA。CAO等[4]開發的sci-fate可以用于研究單細胞轉錄組的動態基因表達。MOUDGIL等[5]介紹了一種在不同細胞系以及小鼠體內可以同時捕捉基因表達和轉錄因子結合位點的單細胞測序方法scCC(single-cell calling cards)。
DUAN等[6]開發了基于人工智能度量學習的單細胞類型鑒定新方法scLearn。NITZAN等[7]首次利用生物學假設和數學優化模型,提出完全獨立于參考數據的單細胞空間位置從頭推斷策略。MA等[8]介紹了一種scRNA-seq差異表達基因和基因富集聯合分析的計算方法iDEA。LANGE等[9]建立了包括再生、重編程以及疾病發生過程等發展方向未知的單細胞命運映射工具CellRank。
在單細胞水平分析染色質可及性可以提供復雜組織內細胞類型組成和細胞間變異的關鍵信息。LI等[10]開發了基于流式分選并利用熒光標記轉座酶插入細胞染色質的測序方法 ftATAC-seq(fluorescent tagmentation-and FACS-sorting-based scATAC-seq)。陳曦等[11]詳細描述了一項基于流式細胞分選和384孔板的單細胞染色質可及性技術。
BODENMILLER等[12]使用大規模高維單細胞質譜成像分析技術,確定了腫瘤和基質單細胞的表型、組織和異質性,并能夠根據細胞組成和組織來表征乳腺癌組織的細胞結構。BAYRAKTAR團隊[13]開發的新工具Cell2location可對不同組織結構進行精細空間轉錄組分析。
除了探索單細胞的分子特征,采用單細胞測序技術還能通過譜系示蹤研究細胞的正常或疾病狀態[14-15]。PEI等[16]報告了人工DNA重組基因座,即Polylox條形碼,成功實現在高分辨率水平重建細胞發育軌跡以及在克隆水平揭示細胞發育命運。2020年,PEI等[17]在Polylox系統的基礎上,將DNA條形碼表達為RNA條形碼,實現了在單細胞水平整合細胞譜系信息與基因表達信息。
將RNA雜交、蛋白質免疫組織化學、原位測序、質譜等技術與單細胞空間轉錄組、蛋白組學等進一步整合,可以在時間和空間上實現對細胞狀態的檢測[18]。
任兵團隊[19]報道了利用Methyl-HiC技術可使DNA甲基化與染色質結構測定同步進行成為現實。MIMITOU等[20]開發了一種能夠同時檢測單細胞蛋白質水平和染色質可及性的方法PHAGE-ATAC。任兵團隊[21]開發了單細胞多組學技術Paired-Tag,利用該技術可在單個細胞中對組蛋白修飾和轉錄組進行聯合分析。YANAI等[22]將基于微陣列的空間轉錄組方法和單細胞轉錄組2種技術結合起來,并將多模式交叉分析應用于原發性胰腺腫瘤。
郭國驥等[23]利用簡單低成本的Microwell-seq高通量單細胞測序平臺,對來自小鼠的40萬個細胞進行了單細胞轉錄組分析,構建了首個哺乳動物細胞圖譜。這一單細胞組學領域里程碑式的研究成果,推動了單細胞測序在基礎科學領域的普及。2020年,郭國驥團隊[24]又對60種人體組織類型的樣本進行高通量單細胞測序分析,系統地繪制了包含8大系統的人類細胞圖譜,同時對人和小鼠的景觀進行了單細胞比較分析,確定了保守的遺傳網絡。
大腦皮層是高級認知的中樞,是人類進化過程中大腦中擴張和多樣化最多的區域。SESTAN等[25]通過跨物種單細胞數據整合分析、免疫染色分析以及重新分析已發表的數據,證明了成年人腦中神經元生成非常罕見甚至并不存在。KRIEGSTEIN團隊[26]利用單細胞測序,通過分析神經發生的高峰階段和早期膠質發生期間的10個主要大腦結構和6個新皮質區域,揭示了不同皮層區域不同細胞縱向發育的分子圖譜。現有的人類腦細胞圖譜還未涉及腦血管系統,而腦血管疾病是引發死亡和神經功能障礙的重要原因,NOWAKOWSKI團隊[27]通過分析約18萬個細胞的轉錄組,成功繪制了成人腦血管系統的細胞圖譜。
錢俊斌等[28]繪制了一份全面的COVID-19肺炎免疫圖譜,通過分析患有輕度或危重疾病的COVID-19患者的支氣管肺泡灌洗樣本以及非COVID-19肺炎患者樣本,為區分COVID-19特異性相關免疫變化的肺局部炎癥信號提供參考。CD8+T細胞是殺傷癌細胞的最主要細胞類群,但在腫瘤發生過程中,這些T細胞呈現功能失調狀態,即T細胞耗竭。張澤民團隊[29]對來自300多名患者的21種癌癥類型的T細胞進行測序,確定了不同T細胞類型轉錄物組成的差異。
在人類妊娠早期,子宮黏膜轉變為蛻膜,胎兒胎盤被植入其中,胎盤滋養層細胞與母體細胞混合并交流;滋養層-蛻膜相互作用異常是妊娠常見疾病的基礎,包括先兆子癇和死產。英國劍橋桑格研究所[30]通過單細胞測序分析了來自孕早期胎盤的約7萬個單細胞轉錄組與相匹配的母體血液和蛻膜細胞的轉錄組,構建了人類蛻膜-胎盤的詳細分子和細胞圖譜。LUNDEBERG等[31]以受孕后10周內的3個發育階段的人類心臟樣本為研究對象,綜合利用單細胞轉錄組測序、空間轉錄組測序和RNA原位雜交等實驗技術以及細胞空間概率分型的計算方法,首次從全器官尺度繪制了人類心臟發育的單細胞基因表達空間圖譜。CAMP團隊[32]成功繪制了呼吸道和胃腸道的多個發育中內胚層器官的單細胞轉錄組圖譜。ROY等[33]通過比較來自5個不同組織的57 489個造血干/祖細胞,跨越人類一生的4個發育階段,揭示了人類發育過程中肝臟和骨髓的造血干/祖細胞的高分辨率單細胞轉錄組圖譜。
湯富酬團隊[34]在人類胚胎和胎兒發育過程中對4個皮質葉和腦橋進行了單細胞轉錄組分析,系統鑒定了人類胚胎發育關鍵階段的8種主要細胞類型及其亞型。MICHAELA等[35]綜合利用scRNA-seq、空間轉錄組和原位測序技術,系統地描述了在妊娠前3個月3個發育階段的人類心臟的空間原型和細胞異質性。MEISTERMANN等[36]明確人類胚胎中譜系規范事件的精確時間以及相關的轉錄組學和細胞命運標志物。
單細胞測序技術已被廣泛應用于癌癥領域,揭示了腫瘤驅動基因突變、克隆進化、侵襲和轉移的潛在機制。LOCASALE課題組[37]首次通過單細胞測序數據解析了黑色素瘤和頭頸癌微環境中的代謝基因表達圖譜,并確定了不同免疫和基質細胞亞型的代謝特征。MAYNARD等[38]首次在單細胞轉錄組層面上對肺癌患者在治療之前和治療期間的腫瘤樣本進行了橫向及縱向對比,產生的癌癥和腫瘤微環境單細胞圖譜揭示了豐富而動態的腫瘤生態系統。ZHANG等[39]對結直腸癌患者的免疫和基質細胞進行了單細胞測序分析,同時對人和小鼠關鍵骨髓亞群進行綜合分析,確定了調節腫瘤免疫的關鍵細胞間的相互作用,并揭示了目前正在進行臨床試驗的骨髓靶向免疫療法的潛在機制。
張澤民團隊[40]對跨組織分布的腫瘤浸潤淋巴細胞的組成、譜系和功能狀態的鑒定,有助于進一步了解肺癌中T細胞的功能狀態和動力學。MERAD等[41]綜合利用scRNA-seq、CITE-seq和TCR-seq技術,對35個非小細胞肺癌病人的病灶腫瘤與非肺部組織進行分析,成功構建了早期肺癌免疫反應細胞圖譜。閻新龍團隊[42]明確了人類肝內膽管癌的腫瘤間異質性,強調肝內膽管癌細胞和血管癌相關成纖維細胞之間的細胞間通信的重要性,同時揭示了潛在的治療靶點。MILES等[43]對髓系惡性腫瘤患者樣本進行了單細胞突變分析,對髓系細胞的惡化機制以及克隆復雜性在疾病進程中的變化進行了闡述。
利用單細胞測序技術可準確度量單個細胞內生物信息,技術的不斷革新進一步推動了單細胞水平的生理過程和病理機制的解析與發現,從而為尋找新的診斷標志物或新的治療靶點提供重要基礎,也為提高疾病的診斷和治療水平提供潛在的實踐依據。
本綜述介紹了單細胞轉錄組測序技術的原理、測序技術的革新以及不斷涌現的單細胞測序新技術,如單細胞染色質可及性測序、空間轉錄組測序和單細胞譜系示蹤技術等;同時涵蓋了單細胞測序方法在神經系統、發育生物學、胚胎學、免疫學和腫瘤領域等方面的創新性應用,凸顯了單細胞測序技術在高度異質性單細胞研究中的巨大優勢。與此同時,單細胞測序技術仍存在操作煩瑣、檢測成本高等實際問題,限制了技術被更廣泛應用與推廣。此外,單細胞測序領域在從單細胞數據分析中獲取生物信息內容和質量等方面仍然有需要克服的技術和計算限制,同時單細胞多組學分析的應用仍處于早期階段,仍有許多方向有待探索,并且有相當多的發展機會。