魏 穎(綜述) 吾尼且木·吐拉克 滕方舟 湯蔚峰 董競成△(審校)
(1復旦大學附屬華山醫院中西醫結合科 上海 200040;2復旦大學中西醫結合研究院 上海 200040)
哮喘是一種異質性疾病,轉錄組測序常用來研究哮喘的發病機制及藥物干預哮喘的療效。由于哮喘的異質性,傳統基于血液或組織樣本的轉錄組測序方法獲得的是細胞群體的宏觀結果,呈現的是同一基因在所有細胞中的平均表達水平,不能呈現同一基因在單個細胞之間存在的差異以及其在疾病發病機制中的作用,因此不能完全揭示異質性哮喘的發病機制及藥物療效。單細胞轉錄組測序(single-cell RNA sequencing,scRNA-seq)是在單細胞水平對全轉錄組進行擴增與測序的一項新技術,能夠獲得每個細胞的mRNA表達信息,發現不同的細胞亞群以及相關信息,揭示細胞間基因表達的異質性并鑒定稀有細胞類型。scRNA-seq能夠繪制肺組織細胞圖譜,進行細胞譜系追蹤,多角度、多層次和直觀認識哮喘的發病機制,為深入研究和理解哮喘發病機制提供新的技術手段。本文對scRNA-seq技術在哮喘研究中的應用做一概述,以期為哮喘這一異質性疾病發病機制的深入研究提供思路。
哮喘概述哮喘影響各年齡段的健康,患病率逐年上升,尤其是兒童患病率。據WHO統計,目前全球約有3億人罹患哮喘,哮喘在不同國家的患病率為1%~18%,每年因哮喘死亡的人數高達25萬,對個人、家庭和社會造成沉重的負擔。全球哮喘防治創議(Global Initiative for Asthma,GINA)指出,哮喘是一種異質性疾病,以慢性氣道炎癥為主要特征[1]。哮喘的發病機制尚未完全明確,基因和環境的相互作用,參與哮喘發病的病理進展。哮喘的病理過程由多種細胞和細胞組分共同參與,包括肥大細胞、嗜酸性粒細胞(eosinophils,EOS)、T淋巴細胞、B淋巴細胞、巨噬細胞、中性粒細胞(neutrophils,NEU)、NK細胞和上皮細胞等,這些細胞與炎癥細胞和外部環境相互作用,導致患者出現慢性氣道炎癥、可逆性氣流受限、氣道高反應性和氣道重塑。
哮喘具有不同的疾病過程。可根據患者的病史、臨床表現、病理生理學特征、治療反饋以及預后差異分為不同的哮喘表型[2-3]。T淋巴細胞在哮喘慢性炎癥中具有重要作用,2型輔助性T細胞(type 2 helper T cells,Th2)免疫應答增強(2型免疫反應)被認為是一種重要的哮喘炎癥表型[4]。當初次接觸過敏原,上皮細胞監測到過敏原,釋放促炎因子,促進肺部樹突狀細胞的募集和活化,樹突狀細胞攝取過敏原,將過敏原轉運至回流淋巴結,誘導過敏原特異性Th2細胞活化。當再次接觸相同過敏原時,Th2效應細胞被刺激活化,分泌IL-4、IL-5和IL-13等2型炎癥因子,引起過敏性氣道炎癥、肺部EOS增多、杯狀細胞增生等炎癥變化。大量關于哮喘的發病機制以及藥效學研究均以Th2細胞作為關注的重點。NEU增多及Th17免疫應答增強也被認為是一種重要的哮喘炎癥表型,參與重癥哮喘的病理進展[5-10]。此外,臨床上根據誘導痰中炎癥細胞比例將哮喘分為EOS型、NEU型、混合粒細胞型和粒細胞缺乏型炎癥表型。近年來,一些新的T細胞亞型及其在哮喘中的作用逐漸被認識,包括調節性T細胞(regulatory T,Treg)、濾泡輔助T細胞(follicular T helper,Tfh)、Th3、Th17、Th22和Th9細胞等,由此可見哮喘表型的多樣性和發病機制的復雜性。
scRNA-seq概述scRNA-seq是以單個細胞為單位,通過將組織或體液樣本中的細胞群分離成單個細胞,進行全轉錄組擴增和高通量測序,獲得相應數據并進行信息分析的技術,也是目前應用最廣泛的單細胞測序方法。scRNA-seq能夠獲得每個細胞同一基因的轉錄組表達數據,準確呈現基因表達量在不同細胞間的差異,進而在單細胞水平重新認識各種組織器官及其在疾病發病機制中的作用,尤其對異質性疾病的研究具有不可替代的優勢。2009年,Tang等[11]首次將scRNA-seq用于小鼠胚葉細胞的研究,開創了第一個哺乳動物scRNA-seq方法。此后相繼出現改良和優化的scRNA-seq技術[12-17]。2017年,商業化的10×Genomics技術問世[18],此后相繼開發的Seq-Well技術[19]、Microwellseq測 序 平 臺[20]、SPLit-seq技 術[21]和Slide-Seq技術[22]使大規模單細胞測序相關研究得以開展。相較于傳統轉錄組測序技術,scRNA-seq能夠深入研究細胞類型、細胞功能、細胞亞群、細胞亞群的異質性和細胞譜系等[23],被廣泛應用于生命科學和醫學研究的多個領域。scRNA-seq的基本流程包括單細胞制備、單細胞文庫構建與測序和數據分析(圖1)。
單細胞制備 單細胞制備是scRNA-seq的第一步,直接影響后續的建庫、轉錄組測序和數據分析。常用的單細胞制備方法包括低通量單細胞制備方法(如有限稀釋法、顯微操作法、激光捕獲顯微切割分離法)和高通量單細胞分選方法(如流式細胞法和微流控技術)。有限稀釋法通過對細胞懸液進行梯度稀釋,至適宜濃度獲得單細胞懸液。顯微操作法需要將制備的單細胞懸液稀釋至適當濃度,在光學顯微鏡下挑選目的細胞,并利用口吸管將細胞吸出,獲得后續測序所需的單細胞。激光捕獲顯微切割分離法需要將組織樣本固定至熱塑膜涂片上,在倒置顯微鏡下使用高度聚焦的激光束切割待分選的目的細胞。流式細胞法分選目的細胞,首先對目的細胞進行熒光標記,利用流式細胞儀分選單個活細胞,該技術通量高、特異性強,是最常用的單細胞制備方法之一。微流控技術分選法利用含有與細胞大小一致的反應室的微流控芯片,進而獲得單個活細胞,除了具有分選活細胞的功能外,該技術還可以進行后續單細胞基因組或轉錄測序,具有高通量和高效率的雙重優勢。

圖1 單細胞轉錄組測序流程圖Fig 1 Flow chart of scRNA-seq
單細胞文庫構建與測序 獲得單細胞之后,需要對單個細胞進行轉錄組擴增,構建RNA文庫以滿足后續測序需求。全轉錄組擴增的方法主要有基于PCR的方法(多重擴增方法)和基于體外轉錄的全轉錄組方法(使用條形碼的多重線性擴增)。根據合成第2條cDNA鏈方法的不同,PCR擴增法分為末端加尾法、模板轉換法和隨機引物法。體外轉錄擴增法以線性擴增法代替PCR指數擴增,避免了PCR指數擴增帶來的實驗誤差。體外轉錄擴增法從單細胞逆轉錄反應開始,使用特殊的引物逆轉錄為cDNA,在T 7RNA聚合酶的作用下以上述cDNA為模板,轉錄得到RNA并建立RNA文庫[12]。
單細胞測序包括先擴增序列再測序的第二代高通量測序和直接測序的第三代高通量測序。第二代高通量測序具有測序成本較低和測序效率較高的特點,包括Illumina公司的Solexa聚合酶合成測序技術、ABI公司的寡聚物連接檢測測序和Roche公司的焦磷酸測序技術。第三代高通量測序基于單分子測序技術,不依賴PCR擴增技術,能夠避免PCR擴增產生的誤差。
數據分析 scRNA-seq數據分析包括一系列操作步驟,由于結果包含海量信息,首先需要對數據進行標準化處理。標準化的原始數據處理流程和數據處理包可從公開數據庫下載。在常規分析之前,需要移除干擾信息(如接頭序列、連接序列和標簽序列等),對剩余的序列信息進行分析。首先,通過基礎流程Cell Ranger將原始數據拆分成FASTQ文件[4,24],通過質控除去不符合要求的數據,再用標簽復讀、計算機對相應數據量化并生成基因表達矩陣。接著,利用Seurat軟件進行細胞聚類分析[25],先后通過主成分分析(principal component analysis,PCA)進行線性降維[26]和t-分布隨機鄰域嵌入(tdistributed stochastic neighbor embedding,t-SNE)算法進行非線性降維[27],呈現可視化結果。然后,利用monocle軟件進行偽時間分析。最后,尋找每個聚類中顯著表達的基因進行高度差異表達基因的鑒定。scRNA-seq數據分析主要是對測序樣本進行異質性分析,分析細胞內的基因變化、對細胞進行分群(通過已知的marker基因)、發現新的細胞類型以及分析不同細胞群體之間的相互作用。
scRNA-seq在哮喘研究中的應用scRNA-seq是近年來迅速發展的生命科學前沿技術,能夠在單細胞水平揭示細胞的基因表達狀態,反映細胞間的異質性,為研究異質性疾病提供了新的研究思路和技術手段。通過分離肺組織單細胞,進行轉錄組測序分析,有助于準確理解細胞分化、信號轉導等生物學過程及相關的基因調控網絡,深入闡明哮喘的發病機制。scRNA-seq已應用于哮喘的研究中,并取得一定進展。已發表的相關研究主要對肺組織、氣道、淋巴結細胞進行研究及分群,揭示不同細胞群體及群體之間的相互作用在哮喘發病中的作用。
肺部結構細胞和免疫細胞的相互作用對于維持肺穩態至關重要。Vieira Braga等[28]對正常人和哮喘患者肺組織的上氣道、下氣道和肺實質進行單細胞轉錄組學研究,選取通過鼻刷、支氣管活檢、肺切除和肺移植獲得的正常受試者和哮喘患者的樣本,對肺組織的結構細胞和定居在肺組織的炎癥細胞及其相互作用進行研究。針對上皮細胞譜系,在上氣道、下氣道和肺實質中發現了至少10種上皮細胞,包括基底細胞、club細胞、纖毛細胞、杯狀細胞Ⅰ型肺泡細胞、Ⅱ型肺泡細胞和ionocyte等;每種基底細胞、杯狀細胞和纖毛上皮細胞又可以細分為2種表達不同marker基因的細胞狀態。針對免疫細胞,在上氣道、下氣道和肺實質中發現了髓樣細胞,包括巨噬細胞、NEU、樹突狀細胞和肥大細胞;同時發現了淋巴樣細胞,包括T細胞、NK細胞和B細胞。針對基質細胞,在上氣道、下氣道和肺實質中發現了血管內皮細胞、成纖維細胞、肌成纖維細胞、平滑肌細胞和淋巴管內皮細胞。結構細胞和炎癥細胞的轉錄組學表型和細胞比例均存在差異;同時鑒定出一種新的定居在肺組織的CD4+T細胞亞群,該亞群同時具有循環記憶細胞和組織定居記憶細胞的特征,許多疾病相關基因具有高度細胞類型特異性表達模式。該研究在哮喘患者肺部發現了一種新的上皮細胞狀態——黏液纖毛細胞。這些黏液纖毛細胞代表了一種纖毛細胞的過渡狀態,其參與哮喘這類慢性病的黏液細胞增生。此外,還發現了其他哮喘相關的改變,包括杯狀細胞、上皮內肥大細胞、氣道壁病理性效應Th2細胞數量增加等。通過分析正常受試者和哮喘患者的細胞間通訊發現,伴隨與Th2細胞相互作用明顯增加,結構細胞通訊明顯減少,該研究對上皮細胞的變化產生了新的見解,發現免疫細胞和結構細胞之間的通訊模式改變是哮喘性氣道炎癥的發病基礎。
微生物低劑量暴露、呼吸道病毒感染及空氣污染物都是哮喘發病的危險因素,但是這些危險因素和宿主2型免疫紊亂易感性之間的發病機制仍不明確。Radermecker等[29]利用scRNA-seq技術對來自于載體對照、低劑量及高劑量LPS暴露合并HDM致敏和激發誘導的哮喘模型小鼠肺組織的NEU進行深入研究,結果顯示NEU共分為6群,其中載體對照的肺組織中,NEU主要為1個細胞群體(cluster 0);低劑量及高劑量LPS暴露合并HDM致敏和激發誘導的哮喘模型小鼠肺組織中,NEU分為5群(cluster 1~5)。cluster 1僅出現在低劑量LPS暴露合并HDM致敏和激發誘導的哮喘模型小鼠肺組織中;cluster 2/3/5出現在高劑量LPS暴露合并HDM致敏和激發誘導的哮喘模型小鼠肺組織中;cluster 4平均出現在低劑量及高劑量LPS暴露合并HDM致敏和激發誘導的哮喘模型小鼠肺組織中。分別對這6群NEU進行差異表達基因分析,明確了共同的、劑量非依賴的LPS誘導的基因表達特征,具體表現為:與NEU分群cluster 0相比,NEU分群cluster 1~5具有共同表達上調的轉錄本。對低劑量及高劑量LPS暴露誘導的肺組織特異性NEU分群(低劑量:cluster 1,高劑量:cluster 2/3/5)的基因表達特征進行鑒定,Cxcr4和Lamp-1轉錄本(其編碼的蛋白質可以通過流式細胞術檢測到)在低劑量LPS暴露特異性的NEU分群cluster 1中顯著上調。高劑量LPS暴露特異性的NEU分群cluster 2/3/5中包含25個轉錄本,基因本體論分析(gene ontology analysis)顯示這25個轉錄本富集在補體受體介導的信號通路及1型或2型干擾素反應等生物過程。低劑量LPS暴露特異性的NEU分群cluster 1中包含97個轉錄本,分別富集在內質網應激、活性氧合成、氧化應激和ERK 1/2信號級聯反應,這些通路均參與NET形成和分泌。通過scRNA-seq分析明確,在低劑量與高劑量LPS暴露誘導的炎癥環境中,肺部NEU存在明顯差異。
Th2細胞在哮喘發病中具有重要作用,但是對哮喘病理進展中Th2細胞的轉錄譜特征仍不清楚。Tibbitt等[30]對HDM誘導的哮喘模型中縱隔淋巴結、肺組織和氣道中Th細胞進行scRNA-seq研究。HDM誘導的小鼠哮喘模型中,CD4+T細胞擴增了120余倍。氣道中出現大量Foxp3+Treg、Th1、Th2和Th17細胞亞群,而肺組織和淋巴結中較少出現Th相關細胞亞群。該研究利用SMART-Seq2平臺對氣道中的CD3+CD4+CD44+Th細胞進行scRNA-seq,通過兩次獨立實驗,在每個細胞中檢測到2 000~2 500個基因表達,在所有細胞中共檢測到超過12 000個基因,其中1 971個基因明顯差異表達。進一步分析顯示,這些CD3+CD4+CD44+Th細胞共分為6個亞群,均表達Cd4、Cd3e、Cd3g、Cd3d和Cd44。Th細胞亞群cluster 1最像典型的Treg細 胞,表達Foxp3、Ctla4、Il10、Folr4、Il2ra和Klrg1 mRNA;Th細胞亞群cluster 4具有Th2細胞表 型 ,表 達Il1rl1(ST 2)、Gata3、Il13、Il5、Il17rb、Ltb4r1和Ccr8 mRNA。Pparg是Th2細胞介導免疫應答所必需的基因,在Th2細胞亞群中特異性表達。此外,在Th細胞亞群cluster 4中發現了一系列高 表達基 因(Igfbp7、Plac8、Gclc、Serpinb6a、Fgl2、Vdr、Hlf),此前并未報道這些基因與Th2免疫應答相關。Th細胞亞群cluster 5特征性表達Cxcr3、Ccl5和Ms4a4b mRNA,這群細胞同時富集Tbx21和Ifng mRNA,提示這群細胞具有Th1細胞特征。Th細胞亞群cluster 2高表達Tcf7、S1pr1、Tmem176 a和Tmem176b mRNA,具有活化和記憶表型。Th細胞亞群cluster 3缺少明確的差異表達基因,可能是細胞的混合表型。Th細胞亞群cluster 6顯著表達If it3、Isg15、Isg20、Mx1、Stat1和Stat2,說明這群細胞對Ⅰ型干擾素具有應答反應。但是Th細胞亞群cluster 6并未顯著表達Ⅰ型干擾素受體Ifnar1和Ifnar2,說明不具有對這類細胞因子作出反應的傾向性。研究人員提出假設,I型干擾素應答反應可能是由HDM提取物中的toll樣受體配體介導的。進一步通過野生型、Tlr4-/-和Myd88-/-小鼠開展相關研究,結果顯示,對Ⅰ型干擾素的應答反應并不局限于特定的Th細胞亞群,對Ⅰ型干擾素應答的幼稚CD4+T細胞、Th1、Th2、Treg細胞的轉錄譜特征。顯著富集到氣道的Th2細胞特征性基因包括Cd200r1、Il6、Plac8和Igfbp7;Th2細胞內差異表達的基因顯著富集到脂代謝相關通路,抑制關鍵通路明確了糖脂代謝通路在Th2細胞中的作用,進一步明確了細胞代謝對過敏性疾病中病理性Th2細胞分化的作用。
結語自2009年scRNA-seq技術問世以來,已廣泛用于各種疾病發病機制的研究,尤其是異質性疾病。目前基于scRNA-seq技術在哮喘方面的研究結果,揭示出肺組織不同的細胞群體及其相互作用在哮喘的發病機制中具有重要作用。目前針對肺組織的scRNA-seq還有待進一步提升。首先,肺組織單細胞懸液制備過程復雜,對肺組織樣本中某些細胞群體的分選提出了挑戰,部分細胞群體死亡率過高,造成數據失真或損失。構成肺組織的各類細胞對不同的消化酶的反應條件不同,為了盡可能獲得肺組織的全部細胞種類,需要對肺組織的酶消化方法進行實驗性探索。其次,現有scRNA-seq技術主要針對含有poly-A尾的mRNA,不能檢測在哮喘發病中具有重要作用但無poly-A尾的microRNA和lncRNA等,這也是scRNA-seq技術需要完善的重要方面。最新研究顯示,單細胞組學研究已由轉錄組學向多組學延伸,未來的單細胞多組學測序技術將更全面和準確揭示多種類型肺部細胞及其亞型在哮喘發病中的具體作用機制。
作者貢獻聲明魏穎 論文構思、撰寫和修改。吾尼且木·吐拉克,滕方舟 文獻整理。湯蔚峰 文獻整理,制圖。董競成 論文審定。
利益沖突聲明所有作者均聲明不存在利益沖突。