莊陽輝,康爭春,王海棠,陳貴珠,陳琪琛,蔡 慧
1.泉州市中醫院普通外科,泉州 362000 2.海軍軍醫大學附屬長海醫院普通外科,上海 200433
胃癌是我國乃至全球常見的消化道惡性腫瘤之一,嚴重威脅人類生命健康[1]。我國是世界上胃癌的高發地區之一,每年至少有50多萬人死于胃癌。因此,早期診斷、早期治療對于降低胃癌的病死率非常重要。隨著我國公共衛生事業的發展,早期胃癌發現率越來越高。早期胃癌是否伴有淋巴結轉移的治療方式、治療策略、預后均不同。對于早期胃癌淋巴結轉移相關分子的研究顯得十分重要[2]。本研究利用TCGA公共數據庫中的胃癌RNA-seq表達譜數據篩選了早期胃癌伴與不伴淋巴結轉移的差異表達基因,并分析了其與患者預后的關系,為胃癌的早期診治提供了新的靶點。
1.1 早期胃癌組織樣本RNA-seq數據的下載及預處理 首先,從癌癥基因組圖譜官方網站(TCGA[3],https://cancergenome.nih.gov/)下載胃腺癌RNA-seq數據,下載時間為2019年6月2日。利用Perl 5.26.2軟件,將原始數據轉化為gene id表達矩陣,并將Gene ID改寫成Gene Symbol,對表達譜信息進行編碼蛋白的mRNA抽提。然后下載TCGA數據庫胃腺癌患者的臨床生存及病理信息,獲取T1N0M0期和T1N1~3M0期胃癌患者的信息。
1.2 篩選T1N1~3M0期與T1N0M0期胃癌的差異表達基因 在R 3.5.3環境下,加載edgeR[4]包。以未發生淋巴結轉移的早期胃癌表達譜為對照組,以發生淋巴結轉移的早期胃癌表達譜為實驗組,篩選兩組的差異表達基因。以log2FoldChange(差異表達倍數取2的對數)絕對值大于1、假發現率(FDR)小于0.05為篩選條件,對差異表達基因聚類熱圖結果進行可視化分析。
1.3 差異表達基因的GO功能和KEGG通路富集分析 首先將Gene Symbol轉換成Gene ID,在R 3.5.3環境下,加載clusterProfiler包、org.Hs.eg.db包、enrichplot包、ggplot2包,對上調、下調差異表達基因分別進行GO功能和KEGG通路富集分析和可視化,檢驗水準(α)為0.05。
1.4 差異表達基因與胃癌患者預后的相關性分析 在Kaplan-Meier Plotter網站(http://kmplot.com/analysis/)對差異表達基因與胃癌患者的生存情況進行相關性分析,判斷差異表達基因是否影響患者預后(由于早期胃癌人群較少,故對全部分期胃癌患者進行生存分析,共371例)。分別對上調差異表達基因前10個和下調差異表達基因的前5個進行胃癌患者生存相關性分析。高風險和低風險的最佳截斷值由網站的智能化功能自動選擇。
2.1 早期胃癌組織樣本情況 腫瘤組織樣本共646例,其中T1N0M0期14例,T1N1~3M0期5例。檢測基因19 767個,為HTSeq-Counts數據。
2.2 T1N1~3M0期對比T1N0M0期胃癌相比的差異表達基因 共發現差異表達基因202個,其中上調197個、下調差異5個。聚類分析(圖1)顯示,T1N1~3M0期胃癌有獨特的上調基因表達譜。前10個上調差異表達基因的基本信息見表1,5個下調差異表達基因的基本信息見表2。

圖1 差異表達基因聚類熱圖
紅黑綠不同顏色及顏色深淺代表不同的mRNA表達量. 熱圖最上方的藍條代表T1N0M0期胃癌,紅條代表T1N1-3M0期胃癌

表1 T1N1-3M0期對比T1N0M0期胃癌的前10個上調差異表達基因情況
Log2FoldChange:差異表達倍數取2的對數;log2CPM:每百萬片段篩選獲得的該基因片段數取2的對數;FDR:假發現率

表2 T1N1-3M0期對比T1N0M0期胃癌下調的5個差異表達基因情況
Log2FoldChange:差異表達倍數取2的對數;log2CPM:每百萬片段篩選獲得的該基因片段數取2的對數;FDR:假發現率
2.3 差異表達基因顯著富集的GO功能和KEGG通路情況 由于下調差異表達基因數量僅5個,故不對其進行富集分析,僅對上調差異表達基因進行GO功能和KEGG通路富集分析。結果(圖2)顯示:上調差異表達基因與腫瘤對白細胞介素-6(IL-6)的反應、細胞對IL-6的反應、IL-1生成正向調節、IL-1β分泌、細胞對IL-1的反應、腫瘤對腫瘤壞死因子(TNF)的反應、骨形態發生蛋白(BMP)信號通路、DNA去甲基化等GO功能顯著相關;上調差異表達基因與Wnt信號通路、Ras信號通路、干細胞多能性的調節、細胞外基質(ECM)-受體相互作用、軸突指導、NF-κB信號通路、胃癌信號通路、鈣信號通路、腺苷酸激活蛋白激酶(AMPK)信號通路、磷脂酰肌醇3-激酶(PI3K-Akt)信號通路等信號通路顯著相關。

圖2 T1N1-3M0期胃癌較T1N0M0期胃癌顯著上調差異表達基因富集的GO功能(A)區域和KEGG通路(B)
2.4 差異表達基因與胃癌患者預后的相關性分析 在前10 個上調差異表達基因中,有6個與患者總生存期縮短相關,分別為DPEP3、THPO、HSPA6、SCGB3A2、CLDN6、CACNA1B(圖3),提示這6個基因可能與胃癌的惡性表型相關。5個下調差異表達基因中,有4個與患者總生存期縮短相關,分別為HDGFL1、CTRB1、CCL26、OLFM4(圖4)。

圖3 T1N1-3M0期胃癌較T1N0M0期胃癌上調差異表達基因與患者生存期的相關性分析
胃癌的發生、發展、轉歸中的分子調控機制和關鍵分子事件一直是我國腫瘤科研工作的重點。早期淋巴結轉移是胃癌早期侵襲的標志性事件之一,是否發生淋巴結轉移與早期胃癌的預后密切相關[5]。本研究以早期胃癌的淋巴結轉移狀態為切入點,利用TCGA公共數據庫表達譜數據,探索可能影響胃癌早期淋巴結轉移的差異表達基因及其富集的功能區域、信號通路,并探索其是否影響胃癌的惡性表型,進而影響胃癌預后。
目前,國內外關于早期胃癌淋巴結轉移相關因素的研究較多。閔叢叢等[6]發現,浸潤深度、分化程度、是否合并潰瘍是影響早期胃癌淋巴結轉移的關鍵病理因素;王力等[7]通過回顧性分析242例早期胃癌病例,證明腫瘤浸潤深度、脈管瘤栓是早期胃癌淋巴結轉移的顯著相關因素;周羽翙等[8]則通過回顧性分析更大樣本量(417例)早期胃癌患者的臨床資料發現,腫瘤大小、浸潤深度、組織學類型、性別4個因素獨立影響早期胃癌的淋巴結轉移。有學者[9]繪制了曲線下面積(AUC)達0.860的列線圖,用于評估各個臨床病理因素對早期胃癌淋巴結轉移的權重。然而,目前關于在基因表達層面評估早期胃癌淋巴結轉移影響因素的報道較少。

圖4 T1N1-3M0期胃癌較T1N0M0期胃癌下調差異表達基因與生存期的相關性分析
本研究通過生物信息學方法,篩選出早期胃癌淋巴結轉移組相對于早期胃癌淋巴結未轉移組顯著上調和下調的基因,首先發現顯著上調差異表達的基因占了差異表達基因的絕大部分,下調差異表達基因僅有5個。對兩類組織的差異表達基因進行聚類分析,發現其聚類明顯,早期胃癌具有獨特的表達譜特征。該現象說明發生早期淋巴結轉移的胃癌可能通過多個癌基因和癌癥相關信號通路的激活而促進早期侵襲事件的發生,而抑癌基因的失活對胃癌早期淋巴結轉移的促進作用并不明顯。上調差異表達的197的基因富集在以IL-1[10]、IL-6[11]、TNF[12]介導的促增殖相關GO功能區域,且干細胞多能性的調節、ECM-受體相互作用、軸突指導、NF-κB信號通路[13]及胃癌信號通路也多證實與癌癥密切相關,提示胃癌早期淋巴結轉移機制的研究可以從這些方面入手。
本研究還發現,早期淋巴結轉移胃癌差異表達基因多與胃癌預后相關,提示其可能影響胃癌的惡性表型。其中,上調差異表達顯著性前10的基因中,有6個高表達與早期胃癌不良預后相關;下調差異表達全部5個基因中,有4個低表達與早期胃癌不良預后顯著相關。該結論與GO功能和KEGG通路富集互相論證,為預后標志物及相關分子機制研究提供了參考。
早期淋巴結轉移胃癌中高表達前10個基因和低表達基因中,已有部分被報道。目前已發現MUC12[14]、CLDN6[15]在胃癌預后評估方面具有重要價值;Cui等[16]通過全基因組測序發現,MUC12在其研究的5組配對胃癌組織中最常見;Oh等[17]發現,miRNA-486通過靶向嗅素蛋白4(OLFM4)調控胃癌細胞的增殖活性; PIWIL2蛋白家族[18]則可以作為人類胃癌的預測標志物。部分基因雖未在胃癌中被報道,但在其他惡性腫瘤中被發現有重要的生物學意義,如:DPEP3高表達與三陰乳腺癌不良預后密切相關[19];THPO等5個基因表達譜模式在肺腺癌和肺鱗癌中存在顯著差異[20];CPA1的突變可增加胰腺癌的遺傳易感性,促進胰腺癌的發生、發展[21];HSPA6的表達上調與HBV相關的早期肝細胞肝癌不良預后相關[22]。這些基因給我們在胃癌的研究中提供了一個很好的思路和方向。也有腫瘤相關基因在惡性腫瘤中的研究缺乏,如TRIM43、HDGFL1、CTRB1等,均是潛在的重要研究對象。
綜上所述,本研究利用TCGA數據庫發掘早期胃癌淋巴結轉移相關的差異表達基因,并從GO功能、KEGG通路富集層面及其與預后相關性方面分析了差異表達基因的生物學意義,為更深入的胃癌調控機制研究提供了參考。這些差異表達基因并有可能作為胃癌的診治靶標應用于臨床實踐。