呂勝男, 彭新宇, 張 健, 劉 歡, 魏 鋒
吉林大學第一醫院普通外科中心肝膽胰腺外科, 長春 130021
胰腺癌是消化系統惡性程度最高的腫瘤之一,5年生存率不到9%,目前的治療手段對患者生存期的改善仍十分有限[1],大多數患者死于腫瘤復發或轉移,因此尋找新的標志物對于評價胰腺癌的預后具有重要的臨床意義。
內質網應激是細胞常見的一種適應性反應,當細胞受到內外不良環境的影響時,內質網應激被激活,通過激活未折疊蛋白質反應和回收錯誤折疊的蛋白質分子,使細胞恢復穩態,維持細胞存活,而當細胞穩態無法被恢復時,內質網應激也會誘導細胞凋亡。內質網應激在多種腫瘤中具有重要功能[2],其既可以調控腫瘤細胞本身的生存狀態,影響腫瘤細胞的信號通路改變及侵襲、遷移表型的變化,也可以調控腫瘤微環境內巨噬細胞[3]、自然殺傷細胞(NK 細胞)等免疫細胞的功能狀態[4],進一步影響腫瘤進展。內質網應激在胰腺癌的發生發展中具有重要的調控作用[5],但其與胰腺癌預后的關系尚未明確。
因此,本研究利用了生物信息學方法,分析內質網應激基因在胰腺癌組織和正常胰腺組織中的表達特征,并據此劃分預后不同的胰腺癌亞群,進一步篩選亞群間的差異表達基因作為預后標志分子,構建了胰腺癌的預后預測模型,最后通過生物學實驗驗證預后標志分子在胰腺癌組織內的表達情況。該研究證實了內質網應激基因影響胰腺癌預后,并篩選出最可能作為預后標志物和治療靶點的基因,為此后基于內質網應激的胰腺癌治療的相關研究提供了重要思路。
1.1 材料與試劑
1.1.1 組織樣本 利用生物信息學分析方法,對人類癌癥基因組圖譜(TCGA)及基因型-組織表達(GTEx)數據庫收錄的177 例胰腺癌樣本和170 例正常胰腺組織樣本的轉錄組數據中的260 個內質網應激基因的表達特征進行分析,并依據差異表達且影響預后的內質網應激基因劃分胰腺癌亞群。實驗所用的40 對胰腺癌組織和癌旁正常胰腺組織標本來源于吉林大學第一醫院普通外科中心肝膽胰外科,經術后病理確診為胰腺導管腺癌。
1.1.2 主要試劑和儀器 實時熒光定量PCR 儀購自美國Roche 公司;研究所用的RNA 采用總RNA 提取試劑盒(Invitrogen,美國)提取,利用PrimeScript RT reagent Kit (Takara)及通用引物對RNA 進行反轉錄,應用SYBR Primix Ex Taq 酶(Takara)進行實時熒光定量,引物序列在表1中列出。

表1 引物序列Table 1 Primer sequences
1.2 實驗方法
1.2.1 研究數據獲取及處理 通過基因組數據共享數據門戶(https://portal. gdc. cancer. gov/)平臺下載了TCGA和GTEx數據庫收錄的胰腺癌和正常胰腺組織樣本的轉錄組測序數據。利用R 分析軟件(R-4.2.1)的limma(3.52.4)包進行歸一化處理,應用Sva(3.46.0)包進行去批次效應。
1.2.2 內質網應激基因的獲取 通過MsigDB 網站(https://www. gsea-msigdb. org/gsea/msigdb)獲取到與內質網應激相關的260個基因。
1.2.3 差異表達分析 通過R 分析軟件DESeq2(1.36.0)包進行差異表達分析,并計算表達量倍數(fold change,FC),篩選條件為:|log2FC|≥1 且校正后的P值(Padj)<0.05。
1.2.4 共識聚類分析 利用R 分析軟件的ConsensusClusterPlus(1.60.0)包對TCGA 胰腺癌隊列的177例樣本進行共識聚類分析,迭代次數為50次。
A:如果這位老師扮演的角色就只是“管工”,那么,孩子即使很努力,也無法“用心學習”的。如果加上家長只會等著“收割”,那就是不斷制造壓力,讓孩子失去學習興趣。一年級的孩子需要半年的“磨合期”,對學校的制度、對老師的教學、對時間的管理,都需要重新適應,老師和家長的幫助必不可少。
1.2.5 總RNA 提取及反轉錄 按照Invitrogen 總RNA 提取試劑盒的說明書提取細胞總RNA 并測定RNA 濃度,按照逆轉錄試劑盒的操作步驟將RNA 反轉錄為cDNA。
1.2.6 實時熒光定量PCR 以反轉錄獲得的cDNA為模板進行實時熒光定量PCR,以GAPDH 作為內參基因,采用Folds=2-ΔΔCT公式計算實驗組與對照組的相對倍數關系。每個實驗重復3次,取平均值。
1.3 統計學方法 采用SPSS 20.0 統計軟件以及GraphPad Prism10進行數據分析。計量資料以±s表示,兩組間比較采用成組t檢驗。計數資料兩組間比較采用χ2檢驗。通過R 分析軟件的survival(3.5-0)包進行單因素Cox 回歸分析,判斷單個變量與患者預后的關系,對有統計學意義的變量應用R 軟件glmnet(4.1-6)包進行Lasso回歸分析篩選,以得到系數不為0的特征變量。基于R分析軟件的survival 和 surviminer包進行生存分析,并繪制Kaplan-Meier生存曲線,利用Log-rank 檢驗進行生存期的比較。應用R 軟件caret(6.0-93)包進行預測模型的建立,并利用ROCR(1.0-11)包繪制受試者工作特征(ROC)曲線,通過評估ROC曲線下的面積以評價模型的預測價值。P<0.05 為差異有統計學意義。
2.1 與胰腺癌預后相關的內質網應激基因 對在TCGA和GTEx隊列中胰腺癌腫瘤組(n=177)和正常組(n=170)之間差異表達的內質網應激基因進行單因素Cox回歸分析,結果顯示,MARCKS為胰腺癌預后的保護因素,而CEBPB、PMAIP1、UBXN10 是胰腺癌預后的獨立危險因素(圖1)。

圖1 胰腺癌預后相關內質網應激基因森林圖Figure 1 Forest map of ER stress genes associated with prognosis in pancreatic cancer
2.2 兩種預后不同的胰腺癌亞群 基于CEBPB、MARCKS、PMAIP1、UBXN10 的表達量對TCGA 胰腺癌隊列中177 個腫瘤樣本進行了共識聚類分析(圖2a),確定聚類變量K=2 為最佳分簇數并最終獲得兩個胰腺癌亞群:簇A(n=106)和簇B(n=71),簇B 患者的總體生存期要明顯長于簇A(χ2=12.232,P=0.01)(圖2b)。

圖2 依據胰腺癌內質網應激基因劃分的兩個亞群的聚類熱圖及生存曲線Figure 2 Cluster heat map and survival curve of two clusters of pancreatic cancer based on ER stress genes
2.3 胰腺癌亞群預后的獨立危險因素 分析了簇A和簇B 的基因差異表達情況,依據|log2
FC|≥1 且Padj<0.05的篩選條件共獲得了51個差異基因(附錄A),通過單因素Cox 回歸分析,鑒定出14個與總生存期相關的基因,且均為胰腺癌預后的危險因素(附錄A)。
2.4 成功構建胰腺癌預后預測模型
2.4.1 構建胰腺癌預后預測模型 對14 個預后相關的差異基因進行分析,應用Lasso 回歸分析方法,通過交叉驗證實驗得出log(λ)最小值為5(注:λ 表示懲罰系數)(圖3a),確定構建模型的5 個最佳基因并計算了回歸系數(圖3b),風險評分方程為:風險評分=0.156×CDA+0.135×AHNAK2+0.020×RHOV+0.095×LY6D+0.054×SPRR1B。將TCGA胰腺癌隊列的177個腫瘤患者根據中位風險值分為高風險或低風險,采用留出法進行訓練集和測試集的劃分,訓練集∶測試集=7∶3,通過隨機抽樣方法將177 個樣本劃分為訓練集(n=125)和測試集(n=52)以訓練并測試模型,結果顯示,該模型總體預測性能較好,預測患者1、3、5 年生存期的準確率分別為0.731、0.712、0.686(圖3c),且該模型所預測的高風險患者的總體生存期與低風險組相比明顯縮短(χ2=11.733,P=0.001)(圖3d)。

圖3 Lasso回歸結果及模型預測效果Figure 3 The results of Lasso regression and the effectiveness of this prediction model
采用χ2檢驗比較TCGA 胰腺癌隊列高低風險組之間的臨床特征(包括年齡、性別、腫瘤分期、T、N、M分期),結果顯示兩組之間的年齡、性別、腫瘤分期、T分期、N 分期均無顯著差異,而M 分期存在差異(χ2=8.730,P=0.007),但可能是大量樣本的遠處轉移情況無法評估導致的(附錄B)。
2.4.2 外部數據集驗證反映模型的預測效果良好驗證了該模型對來自GEO 數據庫的外部數據集GSE57495 的預測效果,結果顯示,該模型表現出了良好的預測性能,預測患者1、3、5 年生存期的準確率分別為0.674、0.680、0.608(圖4a),且該模型所預測的高風險患者的總體生存期與低風險組相比明顯縮短(χ2=5.303,P<0.05)(圖4b)。

圖4 模型對外部數據集生存期的預測結果Figure 4 Survival prediction of external datasets using this model
2.5 CDA、AHNAK2、RHOV、LY6D、SPRR1B 在胰腺癌組織中的表達情況 檢測了在40 對胰腺癌組織和癌旁正常組織中的基因表達量,結果顯示,與癌旁正常組織相比,CDA(t=2.529,P=0.013 4)、AHNAK2(t=2.458,P=0.016 2)、RHOV(t=3.314,P=0.001 4)、LY6D(t=3.583,P=0.000 6)、SPRR1B(t=5.082,P<0.000 1)在胰腺癌組織中顯著上調(圖5)。

圖5 CDA、AHNAK2、RHOV、LY6D、SPRR1B在腫瘤組織和正常組織的表達量Figure 5 The expression levels of CDA, AHNAK2,RHOV, LY6D, and SPRR1B in the tumor and normal tissues
胰腺癌是消化系統常見的惡性腫瘤,是全球所有癌癥中第二大致死性病因,目前胰腺癌的5 年生存率約為9%[6]。近幾年來胰腺癌的發病率仍呈逐年上升趨勢,但病死率并沒有因技術手段發展出現明顯改善,仍和發病率基本持平[7-8]。其根本原因在于胰腺癌的早期診斷困難,大部分患者起病隱匿,且臨床癥狀不典型,導致許多患者錯過了最佳的治療時機,且胰腺癌惡性程度高,容易發生神經、血管浸潤及轉移。目前針對胰腺癌患者的治療策略仍以手術治療為主[9],輔助吉西他濱等化療藥物治療,由奧沙利鉑、伊立替康、氟尿嘧啶、亞葉酸鈣組成的Forfirinox 聯合化療方案也取得了良好的效果[10]。但尚未研制出有效的分子靶向藥物,常規的免疫治療方法在胰腺癌中也已達到理想的療效[11]。如何找到有效的治療藥物,延長胰腺癌患者生存期,仍是醫學界亟待攻克的難關。
內質網應激在胰腺癌的發生發展中具有重要作用。內質網應激基因BZW1 能夠以PERK 通路依賴的形式促進胰腺癌細胞的Warburg效應進而促進動物模型體內的腫瘤生長[12],內質網氧化還原酶1 α在內質網應激條件下上調,并能夠促進胰腺癌細胞的增殖[13]。此外,有研究[14]表明內質網應激可能與胰腺癌的不良預后相關,葡萄糖調節蛋白78(glucose-regulated protein 78,GRP78)是一種重要的內質網伴侶蛋白,它被視為內質網應激的標志物,來自180 例胰腺癌患者的基于組織微陣列的腫瘤和正常組織的免疫組化顯示,與非腫瘤組織相比,癌細胞中的GRP78 表達顯著增加(P<0.05),GRP78 的高表達與更高的T 分期和較差的總生存期有關(P<0.05)[15]。多變量分析顯示,內質網跨膜蛋白ATF6α 高表達和磷酸化P38 低表達的組合與胰腺癌患者的不良結局(HR=2.705,P=0.023)以及腫瘤分級(HR=2.886,P=0.029)相關[16]。
但目前尚無研究闡述內質網應激基因能否作為胰腺癌的預后分子標志物,本研究適時地填補了這一領域的空白。筆者首次揭示了內質網應激基因作為胰腺癌預后的獨立相關因素的重要價值,并成功依據它們的表達特征實現了胰腺癌亞群的劃分。對兩個亞群間的基因表達特征的進一步探究發現了對胰腺癌預后有重要影響的14 個差異基因,并從中篩選出最重要的5 個基因:CDA、AHNAK2、RHOV、LY6D、SPRR1B,并且依據該組核心基因成功構建了胰腺癌的預后預測模型,而這一組基因在胰腺癌中的重要作用此前鮮有報道。有研究表明CDA編碼胞苷脫氨酶,在胰腺癌組織中高表達,能夠滅活吉西他濱,降低其對腫瘤細胞的毒性[17],高表達CDA的巨噬細胞也與胰腺癌的吉西他濱耐藥相關[18]。而AHNAK2 目前在胰腺癌中的研究較少,僅有一項薈萃分析[19]提示AHNAK2可以作為胰腺癌的診斷分子。既往有其他生物信息學分析提出LY6D與胰腺癌的不良預后相關[20]。僅有一項研究[21]表明SPRR1B是胰腺癌預后的危險因素。而RHOV在胰腺癌中的作用尚未被提及。
本研究的局限性在于,只能依據生物信息學分析推測變量與結局之間的相關性,并結合生物學背景進行一定的推測,但無法明確地闡明因果關系,這也是生物信息學的局限性所在。如需探究某變量變化與腫瘤發生發展的先后順序,揭示其內在作用機制,仍需要在體內和體外實驗中通過分子生物學實驗具體研究。此外,本研究只利用了TCGA 數據庫的胰腺癌隊列數據進行模型訓練,如果能納入多中心、多樣本數據,將有希望提升模型預測的準確性。
總之,本研究在構建胰腺癌內質網應激基因分型的基礎上,依據亞群間基因的表達差異篩選出5 個核心基因用以構建胰腺癌的預后預測模型,最終在40對胰腺癌組織中驗證了它們的高水平表達。本研究揭示了內質網應激在胰腺癌發生發展中的重要作用,為尋找胰腺癌治療靶點、預測胰腺癌患者預后提供了重要的參考價值。
倫理學聲明:本研究方案于2022年2月28日經由吉林大學第一醫院倫理委員會審批,批號:2022-017。
利益沖突聲明:本文不存在任何利益沖突。
作者貢獻聲明:呂勝男負責課題設計,數據收集與分析,實驗設計及操作,撰寫論文;彭新宇負責數據分析及撰寫代碼;張健負責修改文章;劉歡負責組織樣本收集及處理;魏鋒負責擬定研究思路,指導文章撰寫并最后定稿。