彭莉蓉,黎村艷,史楊
(1.湖南師范大學附屬第一醫院檢驗科,湖南 長沙 410005;2.人類干細胞國家工程研究中心,湖南 長沙 410000)
目前,免疫檢查點阻斷治療對多種類型腫瘤具有顯著的療效,但由于肝癌免疫微環境的復雜性以及耐受狀態導致肝細胞癌(hepatocellular carcinoma,HCC)患者的應答率要比其他腫瘤較低[1]。因此,深入地了解肝癌的免疫微環境和免疫調控關系有助于發掘新的治療靶點和提高臨床治療效果。隨著lncRNA研究的拓展,越來越多的報道開始闡述lncRNA 在肝癌免疫調控過程中的作用。如lncRNA Lnc-Tim3通過與Tim-3 結合并誘導Bat3 核轉位,從而加劇HCC 中CD8+T 細胞衰竭[2]。LncRNA FENDRR 可以通過海綿作用吸附miR-423-5p 上調GADD45B,從而抑制Treg 介導的肝癌免疫逃逸[3]。肝癌患者移植瘤模型發現lnc-EGFR 在Treg 細胞中上調,且與腫瘤大小、EGFR/Foxp3 表達成正比,機制上lnc-EGFR以EGFR 依賴的方式促進Treg 細胞分化、抑制CTL的活性從而促進肝癌生長[4]。以上研究都從不同程度上揭示了lncRNA 對肝癌免疫微環境的影響,但由于lncRNA 的表達具有明顯的組織和發育階段特異性,從單個細胞水平上系統分析lncRNA 的表達有助于在高度復雜的肝癌微環境中更詳細地了解這些lncRNA 分子在免疫細胞中的表達特性。為此,本研究聯合單細胞轉錄組測序數據和TCGA 數據描繪了肝癌免疫細胞中lncRNA 的分布情況,篩選重要的lncRNA 分子并建立預后模型,為臨床免疫治療提供更為充分的理論依據和更為精準的預后判斷指標。
1.1 單細胞數據分析 單細胞數據來源于GEO 數據庫中的GSE140228[5],從該數據中挑選有腫瘤及癌旁數據的3 個患者(DSM27、DSF22 和DSN09)的腫瘤及對應癌旁單個CD45+細胞數據進行分析。使用Seurat 包分析測序數據,篩選出檢測到超過50 個基因的細胞,聯合SingleR 包計算結果以及細胞注釋文件推斷細胞類型,基于PC 的鄰接距離進行TSNE聚類分析構建圖形。按照過濾條件cutoff 值設定為|logFC(fold-change)|>0.5,P<0.05 得到差異基因。利用網站HCC(http://cancer-pku.cn:3838/HCC/)分析6 位肝癌患者(DSF22、DSF27、DSM22、DSM27、DSA12 以及DSN09)中腫瘤和癌旁中免疫細胞的分布情況,并分析患者中lncRNA 在不同細胞類型中的豐度以及在不同組織類型中的分布。
1.2 TCGA 數據分析與統計 利用GEPIA2(http://gepia2.cancer-pku.cn/#index)數據庫[6]的生存分析模塊分析lncRNA 的表達水平和患者總生存期(overall survival,OS)、無病生存期(disease-free survival,DFS)的關系。從TCGA 數據庫下載HCC lncRNA 的表達譜數據以及臨床信息。采用單變量Cox 回歸分析的風險比(HR)確定保護性lncRNA 和風險性lncRNA。隨后,基于單個預后相關lncRNA 表達譜數據及其系數構建lncRNA 風險評分模型來預測預后價值。對lncRNA 進行系數加權,得到相應的多變量Cox 分析,AIC(akaike information criterion)作為最優模型選擇標準[7],由相應的多變量Cox 分析得出公式如下:

根據風險評分將患者相應地分為低、高風險組。Kaplan-Meier(K-M)生存曲線進行分析。采用該lncRNA 模型對單個臨床因素進行單變量和多變量Cox 比例風險回歸,計算HR 和95%置信區間(CI)。使用受試者工作特征曲線(receiver operating characteristic curve,ROC)檢測風險評分模型的預測能力[8]。
2.1 肝癌組織免疫細胞浸潤情況及lncRNA 的富集分析 通過分析GSE140228 數據中肝癌患者的腫瘤和癌旁組織免疫細胞浸潤狀態發現,與癌旁組織相比,腫瘤組織中C1QA+Mφ 細胞更為富集,而CD160+NK 細胞較為貧乏(圖1A、1B)。對lncRNA 表達的分析表明,腫瘤和癌旁免疫細胞中有51 個差異表達的lncRNA(P<0.05,|log2FC|≥2,圖1C)。

圖1 肝癌與癌旁免疫細胞及lncRNA 分布情況
2.2 lncRNA 在肝癌微環境免疫細胞中的差異分布單細胞測序數據分析結果顯示,共有42 個lncRNA在肝癌微環境的不同免疫細胞中的富集存在差異,其中大部分差異lncRNA 如C5orf58、LINC00963、ADAMTSL4-AS1、NEAT1、C5orf66、SLC8A1-AS1 等在單核細胞(0 簇)中富集程度高;LINC00998 在C1QA+Mφ 細胞(1 簇)中豐度高;APOA1-AS、DANCR、LINC01485、RUSC1 -AS1、IGFBP7 -AS1、ACTA2-AS1 在GPX3+Mφ 細胞(5 簇)中富集(圖2A、2B、2C);結合圖1 的結果,共有34 個lncRNA 既在肝癌微環境免疫細胞簇表達有差異,又在腫瘤和癌旁組織免疫細胞中差異表達(圖2D)。

圖2 腫瘤組織中lncRNA 在免疫細胞中的分布
2.3 關鍵lncRNA 篩選 利用GEPIA 網站分析存在差異表達及分布的34 個lncRNA 與肝癌患者預后的關系,發現LINC00861、LINC01278、THUMPD3-AS1、LINC01138 和DANCR 與HCC 的OS 有關(圖3A);分析這5 個lncRNA 在GSE140228 數據中免疫細胞中的表達豐度,發現LINC00861 主要富集在CD4、CD8 T 細胞以及NK 細胞中,LINC01278 主要富集在NK 細胞中,THUPPD3-AS1 多富集在DC、ILC、IL7R+Mast 和MKI67+NK 細胞中,LINC01138多富集在IL7R+CD8 T 細胞和NK 細胞,DANCR 在B-Plasma 和DC、ILC 和GPX3+Mφ 細胞中豐度較高(圖3B)。高表達LINC00861 患者具有較好的OS 和DFS;LINC01278 的高表達與較差的OS 有關,與DFS 無關;高表達THUMPD3-AS1、LINC01138 和DANCR 的HCC 患者具有較低的OS 和DFS(圖3C,3D)。結合TCGA 數據庫中肝癌患者的臨床特征,采用單變量Cox 回歸模型分析其與預后的關系,結果顯示LINC00861 高表達的患者風險較低(P<0.05,HR=0.843),而DANCR、THUMPD3-AS1 以及LINC01138 高表達患者的風險較高(P<0.05,HR>1),LINC01278 與預后無相關性(P=0.408),與生存分析結果一致(圖3E)。

圖3 關鍵lncRNA 篩選
2.4 構建預后模型 按照AIC 最優模型選擇標準,構建由多個lncRNA 組成的預后模型,其中LINC01278 在上述標準篩選過程中被淘汰,得到由4 個lncRNA(LINC00861、DANCR、THUMPD3-AS1以及LINC01138)組成的風險評分模型來預測預后價值,公式如下:

根據風險值中位值將肝癌患者分為高風險組(n=185)和低風險組(n=185)并繪制生存曲線,結果顯示,高風險組相較低風險組具有較低的生存率(P<0.05),其5 年生存率分別為0.350 和0.605(圖4A);利用ROC 曲線評估構建的模型作為預后指標的能力,與患者的T 分期和stage 分期相比,該模型能較好的判斷患者的預后(AUC=0.754)(圖4B)。風險評分和基因表達數據的分布顯示,肝癌患者LINC00861 表達水平降低,LINC01138、THUMPD3-AS1 和DANCR 表達水平升高、風險得分和死亡人數增加(圖4C)。單因素及多因素Cox 分析評估臨床性狀或預測模型風險值與生存預后的關系,結果表明在單因素和多因素Cox 分析中該模型的風險得分均有統計學意義(圖4D、4E),該模型可以作為獨立預后因子用于HCC 患者預后判斷。

圖4 lncRNA 預后模型建立與評估

圖4 lncRNA 預后模型建立與評估(續)
近年來,隨著測序技術的發展,尤其是單細胞轉錄組測序技術的開發,使得研究者能夠精細地對腫瘤組織的細胞類型進行分類以及測量單個細胞中基因表達水平,極大的推動了腫瘤免疫學發展[9]。目前,單細胞轉錄組測序技術已經應用到了肝癌免疫狀態的研究,并取得了一些重要成果。研究人員發現特定細胞亞群如耗竭性CD8T 細胞和Treg 細胞優先富集在HCC 中,其中在活化的CD8T 細胞和Treg 細胞中基因layilin 上調并且抑制CD8T 細胞的功能[10]。本研究分析了GSE140228 數據中腫瘤和癌旁組織免疫細胞的組成差異,發現C1QA+Mφ 細胞和Foxp3+CD4 T(對應Treg 細胞)主要富集在腫瘤組織,而CD160+NK 細胞在正常組織中的豐度高于腫瘤組織。已有研究表明[5,11],NK 細胞、巨噬細胞以及Treg 細胞均與肝癌患者預后有關,是否C1QA+Mφ細胞以及CD160+NK 細胞構成的改變也在肝癌發展中發揮重要作用值得進一步研究。
lncRNA 的表達具有明顯的時間和空間特異性,通過單細胞全轉錄組測序,研究人員揭示了lncRNA在體細胞重編輯過程中的重要作用以及lncRNA 表達水平與時間序列的相關性[12]。如有研究通過利用單細胞轉錄組測序技術研究了不同發育階段的腦皮層細胞,發現不同發育階段以及同一發育階段的不同細胞中lncRNA 的表達分布有所差異。進一步分析顯示,在由不同亞細胞群組成的組織中,相比mRNA,lncRNA 的表達水平更加離散分布[13],這提示在細胞水平研究lncRNA 是必要的。聯合單細胞測序分析和生物信息學功能分析,有研究構建了造血干細胞發展的lncRNA 表達圖譜,并發現H19 對胚胎造血干細胞的發育至關重要[14]。
本研究通過對單細胞測序數據分析發現,HCC患者腫瘤和癌旁免疫細胞的lncRNA 表達譜存在差異,其中單核細胞差異表達的lncRNA 較多,C1QA+Mφ 細胞和GPX3+Mφ 細胞差異表達的lncRNA 較少。一些lncRNA 被認為是預測HCC 患者預后的生物標志物,如LASP1-AS,NEAT1[15-17],然而它們在預測肝癌高復發風險患者和低復發風險患者方面仍然不夠敏感[18]。因此,目前仍需尋找高度敏感性和特異性的分子預后生物標志物[19]。本研究進一步聯合單細胞測序和轉錄組數據分析篩選出在腫瘤微環境免疫細胞中分布差異并與預后相關的lncRNA,共篩選出5 個與預后有關的lncRNA,其中4 個lncRNA 與HCC 患病風險有關。通過Cox 回歸分析和風險評分方法,建立了由4 個lncRNA 構成的預測模型。ROC 分析和Kaplan-Meier 分析提示該模型能夠較好對HCC 患者的生存狀態進行預測;用于構建模型的LINC00861[20]、DANCR[21]、LINC01138[22]和THUMPD3-AS1[23]均有報道稱發現其與HCC 預后有關,與本研究相一致。
本研究的局限性:本次分析的數據GEO 樣本量有限;本研究僅分析了腫瘤以及癌旁中lncRNA 在免疫細胞中的分布情況,而血液、淋巴結以及胸腹水與肝癌組織免疫細胞的關系也十分密切,了解這些組織中lncRNA 的分布也很有必要。
綜上所述,本研究篩選出在腫瘤組織微環境的特定免疫細胞中富集的lncRNA,并利用這些lncRNA 建立了由4 個lncRNA 組成的預測模型,可以有效預測HCC 患者的預后。