朱中山,楊洲,江承川,李小兵,任斗,黃橙,張維薇,李湘軍,趙順利
(湖南省第二人民醫院腫瘤科,湖南 長沙 410007)
非小細胞肺癌(non-small cell lung cancer,NSCLC)已連續多年位列全球癌癥致死率榜首[1-2],而其中的肺腺癌亞型(lungadenocarcinoma,LUAD)也是非小細胞肺癌中占比最多的一類[3]。近些年,隨著精準醫療的研究推進,尤其在肺腺癌領域鑒定出多個中國人群常見的驅動突變基因[4],其中以EGFR 以及ALK 為代表的驅動基因均已有相應的小分子抑制劑研發成功,并用于臨床延緩肺腺癌患者的復發以及死亡。但是整體的肺癌患者的5 a 生存率仍然較低,因此尋找更多的針對不同患者的精準治療的靶點仍然是一個非常迫切的臨床需求。
癌癥通常是由基因的突變或者功能異常而驅動的,尋找到不同患者的不同異常基因,降為后續的治療手段選擇提供非常有指導意義的參考。基于EGFR 驅動突變以及ALK 融合變異的靶向治療,以及通過檢測PDL1 表達[5-6]或者腫瘤突變負荷(Tumormutationburden)[7]而選擇使用免疫治療。這些精準診療精準用藥的手段在臨床上確實大大改善了患者的生存狀態和生存率。
PLA2G1B(Phospholipase A2 group 1B)基因可以編碼一種蛋白酶,其功能主要為調控細胞內的鈣離子結合以及A2 亞型的磷脂酶活性[8]。并且既往研究已發現肝癌中該基因會發生顯著的表達上調,并且該表達上調與肝癌患者的預后相關[9]。但是在肺癌中該基因的表達模式以及與患者的預后關系尚不清楚,本研究主要通過公共數據對PLA2G1B 基因全面的生物信息學分析,以解釋PLA2G1B 基因在肺腺癌中的表達特征、預后指導意義,并尋找潛在的治療靶點。
本研究納入TCGA 數據庫(數據下載自https://xena.ucsc.edu/)中共計490例肺腺癌原發灶的RNAseq 表達量數據,其中表達量信息包含測序得到的原始序列計數(Readscount)以及定量之后的TPM(Transcriptpermillion)信息。該490例患者均具有完整的預后OS 數據用于生存分析。并且納入來自GEO(Gene expression omnibus,https://www.ncbi.nlm.nih.gov/geo/)數據庫的GSE11969[10]以及GSE72094[11]兩個數據集,分別包含了90 以及398例肺腺癌患者的表達量數據以及臨床信息。選用的數據集中患者平均年齡均大于60 歲,且分期偏早期,性別分布相同,數據對比見表1、表2。

表1 GSE11969、TCGA 的年齡、分期、性別分布情況Tab.1 GSE11969、TCGA age,stage,gender distribution

表2 GSE72094、TCGA 的年齡、分期、性別分布情況Tab.2 GSE72094、TCGA age,stage,gender distribution overall
1.2.1 數據集定義其中來自TCGA 的490例肺腺癌數據用于本研究的訓練數據集(Trainingdataset),而GSE11969 以及GSE72094 兩個數據集作為本研究的2 個獨立驗證數據集(Independentvalidationcohort)。
1.2.2 基因表達量分析TCGA 中490例患者其中48例既有原發灶腫瘤樣本的表達量,同時檢測了癌旁正常肺組織的表達量信息。通過wilcoxontest 檢驗方法對比490例肺癌樣本與48例癌旁樣本之間的PLA2G1B 基因表達量。Pvalue 小于0.05 則定義為該基因在腫瘤以及癌種之間的表達量差異有統計學意義。
1.2.3 基因與患者的預后生存分析在訓練數據集以及驗證數據集中,分別按照PLA2G1B 基因的表達量排序,并取每個數據集中排名最低的四分之一樣本為低表達量組,其余為高表達量組。然后通過log-ranktest 檢驗分析高低表達兩組患者之間的預后總生存(overall survival,OS)差異。然后同時納入數據集中提供的患者年齡、性別、分期信息通過Coxregressiontest 檢驗進行多因素生存分析已確定PLA2G1B 的表達量高低為肺腺癌患者的獨立預后因素。
1.2.4 免疫浸潤分析通過CIBERSORT 算法[12]分析490例TCGA 中肺腺癌患者的共計20 個免疫細胞類型的浸潤程度,然后分別對比每一種免疫細胞在PLA2G1B 低表達和高表達兩組之間的顯著差異。
1.2.5 藥物敏感性分析根據PLA2G1B 表達量分成低表達和高表達2組之后,使用pRRophetic 算法[13]分析2組患者之間的化療藥物敏感性,該算法集合了來自CCLE 的不同細胞系經過不同藥物處理之后的IC50 信息。通過對比不同組別之間的IC50 信號差異,IC50 越低則說明該藥物對該類細胞的抑制作用越強。
通過對TCGA 中490例肺癌組織樣本以及48例癌旁組織樣本中的PLA2G1B 基因表達量進行對比分析發現,在肺腺癌樣本中該基因的表達量發生了顯著下調(P< 0.001),見圖1。

圖1 PLA2G1B 基因在肺腺癌組織以及癌旁組織中的表達量對比藍色為腫瘤組織,紅色為癌旁組織。Fig.1 Comparison of PLA2G1B gene expression between lung adenocarcinoma and paracancerous tissue
在TCGA 的490例訓練集數據中,PLA2G1B高表達組367例,低表達組123例;高表達組生存人數為247例低表達組生存人數為65例;中位生存期高表達組為1 632 d,低表達組1 115 d;中位隨訪期高表達組為670 d,低表達組為656 d。PLA2G1B 基因低表達的患者其整體生存率顯著低于高表達組的患者(P=0.002,HR=0.60,圖2A),在兩個獨立驗證數據集中同樣呈現出了低表達組預后差的一致結果。GSE72094 以及GSE11969 中的HR 分別為0.39 和0.51,P<0.05,差異有統計學意義,見圖2B,圖2C。

圖2 PLA2G1B 基因表達量與OS 關系Fig.2 The relationship between PLA2G1B gene expression and OS
在TCGA 以及來自GEO 的2 個獨立驗證數據集中均提供了患者年齡、性別、分期信息,將三個臨床潛在影響患者預后的因素以及PLA2G1B基因的表達量一起納入多因素預后分析模型中發現,經過多因素校正之后PLA2G1B 基因的表達量依然為顯著影響預后的因素。在訓練集以及兩個獨立驗證數據集中均達到了差異有統計學意義(P< 0.05),結果如圖3(A-TCGA 訓練集P=0.003,B-驗證集1GSE11969P=0.046,C-驗證集2GSE 72094P< 0.001)。

圖3 多因素校正生存分析Fig.3 Multivariate adjusted survival analysis
通過對CIBERSORT 得到的22 類免疫細胞浸潤程度對比分析發現,在PLA2G1B 基因高表達組的患者中相比低表達組的患者顯著富集Bcellmemory,Tcell CD4+memoryresting,Monocyte,Myeloiddendriticcell,Mastcellactivated。而在低表達組中則表現為Macrophage M0/M1,Mastcellresting更為富集。該結果說明在PLA2G1B 表達量不同的2組之間呈現了不同的免疫浸潤類型以及浸潤程度,見圖4。

圖4 CIBERSORT 算法分析免疫浸潤水平Fig.4 CIBERSORT algorithm analysis of immune infiltration level
為進一步研究PLA2G1B 表達量不同的兩組患者之間是否有藥物敏感性的不同,已探索后續針對預后顯著不同的這兩類人群采用不同的臨床治療方案。本研究通過pRRophetic 算法分析發現,在PLA2G1B 低表達(即患者預后表現更差的肺腺癌患者)的細胞系中,其對鉑類化合物(Cisplatin),見圖5A,多西他賽(Docetaxel),見圖5B,依托泊苷(Etoposide),見圖5C,吉西他濱(Gemcitabine),圖5D,紫杉醇(Paclitaxel),見圖5E,長春瑞濱(Vinorelbine),見圖5F 等常見化療藥物的敏感性均更好,表現為IC50 顯著更低(P< 0.05)。該結果也提示臨床上表現為PLA2G1B 基因低表達的肺腺癌患者相比高表達的患者,有更高的可能取得臨床獲益。

圖5 PLA2G1B 表達量不同分組之間化療藥物的敏感性分析Fig.5 Sensitivity analysis of chemotherapeutic drugs among different groups with PLA2G1B expression levels
本研究基于數據挖掘對肺腺癌中PLA2G1B基因的表達特征、預后特征、免疫特征以及藥物敏感性特征進行了全面分析。并發現在肺腺癌中患者的PLA2G1B 基因發生了顯著下調,該基因表達量的下調同時關聯了肺腺癌患者的整體更差的生存表現,提示該基因的表達量越低患者的腫瘤惡性程度也存在更高的可能性。該發現不僅了490例的TCGA 中大樣本發現,并且在兩個獨立的驗證數據集中進一步證實該結果的可靠性。當納入更多的潛在影響患者臨床預后表現的年齡、性別以及患者臨床分期之后,該基因的預后指導作用依然顯著,且同樣在多個獨立數據集中得到驗證,進一步證明該基因的獨立提示預后作用。
在既往研究中多次證明患者整體的預后表現與患者的免疫浸潤程度息息相關。殺傷性免疫細胞浸潤程度越高的患者其在整體的預后表現中則更好,這與免疫細胞的協助殺傷腫瘤功能相一致。而在本研究中為了解釋PLA2G1B 低表達的患者預后更差的潛在因素,同樣進行了免疫浸潤程度的分析。結果發現在低表達差預后的患者中僅有Macrophage M0/M1,Mastcellresting 細胞更為富集,而在高表達好預后的患者中顯著富集的免疫細胞較多,包括Bcellmemory,Tcell CD4+memoryresting,Monocyte,Myeloiddendriticcell,Mastcellactivated。其中尤其B 細胞以及CD4+T 細胞均已被多次證實[14],該細胞越多越容易激活免疫反應,并行使對腫瘤細胞的殺傷功能。該結果也為PLA2G1B低表達的患者表現出較差的預后提供了一種解釋,即為低表達的患者呈現較強的免疫排斥現象,有較少的免疫細胞浸潤,進而免疫殺傷功能不足,影響到患者的整體預后表現。
為了進一步協助臨床為低表達差預后的患者選擇更為有效的治療測序,本研究通過細胞系的藥物敏感性數據分析發現,在PLA2G1B 低表達的患者中其對化療藥物如鉑類化合物(Cisplatin),多西他賽(Docetaxel),依托泊苷(Etoposide),吉西他濱(Gemcitabine),紫杉醇(Paclitaxel),長春瑞濱(Vinorelbine)的敏感性更好,IC50 更低,該結果也為進一步的臨床治療選擇提供了一定的依據。但因缺少真實患者樣本的數據驗證,因此該結果具有一定的局限性。