葛 楠,高 飛,楊國旺
首都醫科大學附屬北京中醫醫院腫瘤科,北京 100010
直腸癌是由多因素參與形成的疾病。目前免疫檢查點抑制劑在多種實體腫瘤中顯示出良好的效果,但是對于微衛星穩定/無錯配修復缺陷的直腸癌患者,免疫療法獲益仍有限[1]。腫瘤微環境在直腸癌的發生、發展起重要作用,免疫細胞作為腫瘤微環境的重要組成部分,影響腫瘤的進展、預后及免疫藥物的治療效果。所以研究免疫微環境對于提高直腸癌患者的免疫治療效果具有重要意義。本研究從基因表達匯編數據庫(GEO)獲取203例直腸癌轉錄組測序數據,通過ESTIMATE算法(一種使用表達數據估計惡性腫瘤組織中的基質細胞和免疫細胞的方法)對數據集進行基質評分及免疫評分,分析評分結果與直腸癌臨床特征和預后的關聯,篩選出影響直腸癌預后的重要基因,為直腸癌免疫相關新靶點的研究提供參考。
1.1數據來源及處理 從GEO公共數據庫(https://www.ncbi.nlm.nih.gov/geo/)檢索人源直腸癌基因表達數據,下載數據集GSE87211,平臺信息:GPL13497?;蛐酒畔?Agilent-026652 Whole Human Genome Microarray 4×44K v2。該數據集包含腫瘤組織203例。對下載的基因芯片表達數據進行預處理,包括將基因對應多個探針取均值,探針名稱轉化為標準基因名稱,以及對基因芯片數據進行校正、標準化處理等。
1.2方法
1.2.1基質評分、免疫評分的計算及相關差異表達基因的篩選 利用ESTIMATE算法計算基質評分及免疫評分,以評分的中位數為界,將腫瘤組織分為高評分組及低評分組。以|log2FC|>0.5(FC表示差異倍數),校正后P值<0.05為差異表達基因的篩選條件,篩選差異表達基因并取交集。采用R軟件(版本:4.2.1)進行分析及熱圖繪制。使用VennDiagram程序包分別對基于免疫分數和基質分數得到的差異表達基因取交集,獲得共表達基因。
1.2.2基因功能分析 使用R軟件的clusterProfiler、enrichplot程序包對取交集獲得的差異表達基因進行基因本體論(GO)功能富集分析以及京都基因與基因組百科全書(KEGG)通路分析。GO分析主要用來揭示基因的生物學過程(BP)、細胞組分(CC)、分子功能(MF)。KEGG富集分析主要用來分析基因參與的信號通路。
1.2.3差異基因的預后分析 將差異基因與臨床數據進行整合,以差異表達基因的中位值為界,將直腸癌分為高表達組和低表達組,使用R軟件的survival程序包進行Kaplan-Meier生存分析,研究關鍵基因表達水平與直腸癌患者總生存期的相關性。
1.2.4關鍵基因的外部驗證 使用UALCAN在線網站(http://ualcan.path.uab.edu/)驗證篩選的關鍵基因與直腸癌生存的關系。
2.1直腸癌免疫和基質評分與預后、臨床特征關系 刪除了生存時間不詳的樣本,對剩余196例直腸癌腫瘤數據樣本進行免疫和基質評分與總生存期、臨床特征的關系分析。結果顯示,高免疫評分與低免疫評分患者,高基質評分與低基質評分患者生存預后比較,差異無統計學意義(P>0.05),見圖1。進一步將患者的臨床特征(年齡、是否有KRAS基因突變、T分期、是否有淋巴結轉移、是否存在遠處轉移)與免疫/基質評分進行聯合分析,結果顯示,KRAS基因突變型患者免疫評分低于野生型患者(P=0.033),KRAS基因狀態可能在一定程度上影響機體免疫細胞浸潤程度。存在遠處轉移患者基質評分高于無轉移患者(P=0.002),基質評分可能反映直腸癌惡性程度。免疫/基質評分與患者年齡、T分期、是否有淋巴結轉移無關(P>0.05)。見圖1。

注:A為免疫高評分組和低評分組患者生存曲線圖;B為基質高評分組和低評分組患者生存曲線圖;C為不同KRAS基因狀態患者的免疫評分;D為不同遠處轉移情況患者的基質評分。
2.2高、低免疫/基質評分組的差異表達基因篩選 高、低免疫評分組間共篩選得到1 632個差異基因,包括1 243個上調基因和389個下調基因。高、低基質評分組間共篩選得到2 446個差異基因,包括1 778個上調基因和668個下調基因。將兩者表達上調的基因數據集和兩者表達下調的基因數據集取交集繪制韋恩圖,得到799個上調基因和146個下調基因,共945個共表達基因。
2.3共表達基因GO分析和KEGG通路分析 945個共表達基因主要富集于免疫細胞遷移、趨化、黏附、增殖、活化與調節等BP,細胞膜、細胞外基質、組織相容性復合體(MHC)Ⅱ類蛋白復合物等CC,受體配體活性、趨化因子活性、細胞因子和受體活性等MF。KEGG通路分析表明,基因主要在細胞因子間相互作用、白細胞介素(IL)-17信號通路,細胞黏附分子等方面富集。見圖2。

注:A為前10位差異性較大的共表達基因GO富集分析氣泡圖;B為前10位差異性較大的共表達基因KEGG富集分析氣泡圖。
2.4預后基因篩選及驗證 為進一步篩選對直腸腺癌患者的預后具有影響的基因,對945個共表達基因和總體生存情況之間的關系進行了分析,結果顯示148個基因與總體生存相關(P<0.05),篩選出以下4個基因:ERM樣蛋白(ERMN)、受體活性修飾蛋白1(RAMP1)、鞘氨醇1磷酸酯受體3(S1PR3)、腫瘤壞死因子α誘導蛋白2(TNFAIP2)。直腸癌患者中,上述4個基因高表達組的總生存期顯著短于低表達組(P<0.05)。通過UALCAN在線網站驗證以上4個基因對直腸癌的預后影響,結果證實ERMN、RAMP1、S1PR3、TNFAIP2這4個基因低表達組有更多的生存獲益。見圖3。

注:A—D分別為ERMN、RAMP1、S1PR3、TNFAIP2高、低表達組的生存分析圖;E—H分別為UALCAN在線網站驗證ERMN、RAMP1、S1PR3、TNFAIP2 4個基因表達與生存的關系。
根據世界衛生組織國際癌癥研究機構發布的全球癌癥負擔數據顯示,結直腸癌已成為全球第三大常見癌癥和第二大癌癥死亡原因[2]。雖然根治性切除是治療結直腸癌的首選可靠方法,但仍有70%患者發生術后轉移[3]。20%~25%的患者在疾病初期即發現遠處轉移而喪失手術治療機會[4],其中直腸癌占這些病例的1/3。晚期直腸癌患者的預后仍然很差[5]。
直腸癌細胞與腫瘤微環境相互作用促進直腸癌的發生、發展。腫瘤微環境的主要成分包括血管細胞、間充質干細胞、免疫細胞、炎性細胞、細胞外基質等[6-8],參與腫瘤細胞增殖的免疫調節、化學療法耐藥性的產生和生物免疫耐受的誘導形成等。在腫瘤微環境中,免疫細胞和基質細胞是兩種主要的非腫瘤成分,并且對腫瘤的發生、發展和侵襲具有重要影響[9]。為了更好地研究腫瘤微環境,YOSHIHARA等[10]通過分析免疫和基質細胞的特定基因表達特征,創建了一種名為ESTIMATE的算法,此算法是一種基于表達數據估計腫瘤樣本的免疫細胞和基質細胞的方法,以計算免疫評分和基質評分預測非腫瘤細胞在惡性腫瘤組織的滲透程度。
本研究結果顯示免疫/基質評分的高低與直腸癌的生存預后之間無明顯的關聯,原因可能如下。一方面,影響直腸癌預后的因素不僅僅包含腫瘤微環境,也包括腫瘤分期、RAS基因情況、患者體能狀態、治療方式等,本課題組評估的是GSE87211數據集中所有直腸癌的患者,這些患者的臨床特征存在差別,所以腫瘤微環境對于生存的影響會受到其他條件的影響;另一方面,不同免疫細胞及基質細胞在腫瘤預后中發揮的作用也有不同,所以結果未顯示出免疫微環境評分與生存預后的關聯。由于腫瘤微環境會影響腫瘤的生長和發展,于是本課題組又分析了腫瘤患者臨床特征與腫瘤微環境的關系,結果顯示,KRAS基因突變型患者免疫評分低于野生型患者,存在遠處轉移患者基質評分高于無轉移患者,提示基質評分可能是反映直腸癌惡性程度的有用指標。在結直腸癌患者中,KRAS基因突變的發生率約為30%~50%,并與不良預后和轉移有關[11]。LIU等[12]研究證實與KRAS野生型結直腸癌患者相比,NF-κB和T細胞受體信號通路在KRAS突變的結直腸癌患者中受到顯著抑制,同時巨噬細胞M1和活化的CD4+記憶T細胞減少。提示KRAS基因突變會影響結直腸癌的免疫相關通路。
GO分析顯示差異共表達基因富集于免疫細胞遷移、趨化、黏附、細胞因子增殖、活化與調節等BP,細胞膜、細胞外基質、MHCⅡ類蛋白復合物等CC,受體配體活性、趨化因子活性、細胞因子和受體活性等MF。KEGG通路分析表明,基因主要在細胞因子間相互作用、IL-17信號通路,細胞黏附分子等方面富集。
GO分析和KEGG分析顯示,差異表達基因主要富集于免疫細胞及細胞因子的生物學功能,細胞膜、細胞外基質、MHCⅡ類蛋白復合物,以及IL-17信號通路等方面。細胞外基質作為細胞生存的內環境,其成分或結構變化都會影響腫瘤發生、發展[13]。細胞外基質可通過多種途徑對結直腸癌細胞增殖、侵襲、凋亡及不同的信號通路產生影響[14-16]。有研究報道,MHCⅡ通過與MHCⅠ互補的方式限制了腫瘤相關基因的突變[17],MHCⅡ在抗腫瘤反應中具有關鍵功能。IL-17與受體IL-17R組成的異二聚體發出信號,可激活NF-κB、MAPKs等下游通路,已被證實參與多種腫瘤的形成、生長和轉移。
ERMN是參與髓鞘形成過程的必需基因[18],是葉酸代謝紊亂的主要靶點[19],在神經系統疾病中表達失調[20],ERMN基因的表達改變與膠質瘤預后有關[21]。ERMN在前列腺癌的微環境中高度表達,并具有調節腫瘤免疫反應的潛力[22]。ERMN基因與Wnt途徑有關,可能是驅動肝母細胞瘤的候選基因[23]。關于ERMN基因在直腸癌報道中較少,本研究結果顯示,ERMN基因的高表達與直腸癌的不良預后有關,提示ERMN在直腸癌發展中起到促進作用。
RAMP1與G蛋白偶聯受體相互作用,調節血管活性腸肽受體、降鈣素受體等信號傳遞能力[24]。DALLMAYER等[25]發現,RAMP1的敲除降低了尤文肉瘤克隆形成,針對RAMP1受體的小分子抑制劑減少了尤文肉瘤的生長。LOGAN等[26]的研究顯示,RAMP1缺失會降低前列腺癌細胞的增殖和致瘤性。在直腸癌方面,研究顯示高表達的RAMP1預示著直腸癌患者更短的生存期,RAMP1可能是一個參與直腸癌發生的靶基因。
YAN等[27]對癌癥基因組圖譜(TCGA)數據庫的分析表明,S1PR3高表達的患者生存預后比低表達的患者更差,動物實驗結果也表明,S1PR3可促進腎細胞癌的發生和轉移。在乳腺癌的患者中S1PR3高表達,敲除乳腺癌腫瘤細胞中的S1PR3可有效延緩體內腫瘤生長和降低肺轉移概率[28]。張佳等[29]的研究顯示,S1PR3在急性T淋巴細胞性白血病(T-ALL)中發揮癌基因的作用,抑制S1PR3可抑制T-ALL異種移植小鼠模型疾病進展。本研究結果也顯示,在直腸癌中,S1PR3高表達的患者預后更差,提示S1PR3作為機體的癌基因在腫瘤發生、發展中起到促進作用,未來也許可以針對S1PR3基因靶點開發抗腫瘤藥物。
TNFAIP2基因通過調節腫瘤細胞活力和分化,參與腫瘤的發生和發展。有研究報道,TNFAIP2在腎癌組織中異常高表達,且TNFAIP2的高表達與腫瘤的分期、分級、淋巴結轉移、免疫細胞豐度密切相關,TNFAIP2高表達提示病情惡化及總生存期縮短[30]。TNFAIP2還參與幽門螺桿菌感染后胃癌發病過程,并且會促進腫瘤的侵襲和轉移[31]。此外,TNFAIP2在其他實體瘤如宮頸癌、肺癌、尿路上皮癌中也高表達[32-34]。本研究結果證實TNFAIP2基因可能是直腸癌患者的一個風險因素,高水平的TNFAIP2預示著更差的臨床結局及更短的生存期。
綜上所述,本研究通過生物信息學分析方法對GEO數據庫中的GSE87211數據集進行分析,發現在直腸癌患者中KRAS基因狀態及遠處轉移影響機體免疫微環境狀態。在免疫/基質評分高、低組間篩選出945個差異表達基因,其中148個基因與預后相關,通過外部數據庫驗證,確定ERMN、RAMP1、S1PR3、TNFAIP2這4個基因的高表達可能與直腸癌的不良預后有關,為直腸癌可能的藥物治療靶點研究提供了參考。然而,本研究篩選出的4個基因在直腸癌中的作用還需要進一步的實驗和臨床大樣本研究來驗證,其具體的作用機制還需要進行更深入的探討。