王雨娜,吳冬桂,趙 貝
(1.大理大學基礎醫學院,云南 大理 671000;2.珠海市人民醫院外科,廣東 珠海 519000)
胰腺癌(pancreatic adenocarcinoma,PAAD)[1]是全球癌癥死亡的主要原因,患者生存率不到7%。在歐美等發達國家,胰腺癌的發病率和死亡率最高。胰腺癌可能由遺傳性生殖系或癌癥相關基因的體細胞獲得性突變引起,突變也會導致癌癥進展和轉移,對基因腫瘤水平的研究分析尋找胰腺癌的潛在治療靶點為治療預防胰腺癌的發生發展提供了有力的發展方向。前梯度蛋白2(recombinant anterior gradient 2,AGR2)是一種原癌基因[2],最近的研究表明[3-5],AGR2 的高表達與各種人類癌細胞系的細胞增殖、轉移和耐藥性有關。此外,AGR2 的高表達也被證明是胰腺癌存活率低的預測因素。為此,本研究基于生物信息學分析,重點探究AGR2 與胰腺癌的密切關系,以期為未來的醫學發展提供指導方向。
1.1 利用GEO 數據庫挖掘AGR2 基因 GEO 是一個基因表達數據倉庫和在線資源,用于從任何物種或人造的來源檢索基因表達數據,本研究原始數據均從GEO 數據庫下載并通過R 3.2.2 集成。
1.2 利用Oncomine 數據庫分析AGR2 在胰腺癌與非瘤組織的相關性 在Oncomine 數據庫中設定篩選和挖掘數據的條件:①Gene:AGR2;②Analysis Type:Cancer vs.Normal;③Cancer Type:Pancreatic Carcinoma;④Data Type:mRNA;⑤Sample Type:Clinical Specimen;⑥臨界值設定條件(Pvalue<1E-4,fold change 2,gene rank=top 10%,data type=all)。
1.3 在GEPIA2 數據庫分析AGR2 基因在各腫瘤組織中的表達 GEPIA2(http://gepia2.cancer-pku.cn/)是一個常用的交互式網站,用于繪制給定基因的表達譜。GEPIA 包含來自TCGA 和GTEx 數據庫的9736 個腫瘤和8587 個正常組織,根據基因表達水平進行生存分析,本研究通過GEPIA2 獲取AGR2在各種腫瘤中的表達情況。
1.4 通過GEPIA2 分析胰腺癌中AGR2 與相似基因的相關度 據報道與胰腺癌相關的基因有S100P、C-K-RAS、CDC25B、HER,在數據庫GEPIA2 對這些基因與AGR2 基因的相關性進行統計學分析。
1.5 AGR2 在胰腺癌患者中的生存曲線 通過GEPIA2采用Kaplan-Meier 法構建AGR2 在胰腺癌中的生存曲線,探究AGR2 的mRNA 表達量與胰腺癌患者預后的關系。
1.6 AGR2 mRNA 表達水平與胰腺癌患者病理分期的關系 在GEPIA 數據庫(http://gepia.cancer-pku.cn/)中設定篩選和挖掘數據的條件為:①選擇Stage plot;②Gene:AGR2;③Cancer name:PAAD(pancreatic adenocarcinoma)。
1.7 通過The Human Protein Atlas 數據庫獲取AGR2在正常胰腺與胰腺癌的免疫組化 利用The Human Protein Atlas 數據庫獲得AGR2 基因在人正常胰腺組織的表達情況與在異常胰腺癌組織中的表達情況。
1.8 利用String 數據庫分析與AGR2 相互作用的蛋白網絡 通過String 數據庫獲取AGR2 的蛋白互作網絡,分析AGR2 與其他蛋白之間的關系;設定條件為:AGR2 選擇克隆號為No:HPA007912 的抗體對1 例正常胰腺組織和11 例胰腺癌組織的AGR2 蛋白表達程度進行分析。
1.9 GeneMANIA 分析AGR2 在胰腺癌的蛋白表達分析圖譜 執行GeneMANIA 以構建最重要的激酶靶標AGR2 的蛋白質-蛋白質相互作用(PPI)網絡。
1.10 UALCAN 分析 根據患者的腫瘤分期和淋巴結轉移狀態分析正常組織和癌組織中AGR2 的表達情況。
1.11 統計學分析 采用t檢驗分析正常組織與胰腺癌組織中的表達差異,采用Kaplan-Meier 模型和Logrank 法檢驗進行生存分析,采用Pearson 法進行基因表達的相關性分析。P<0.05 為差異有統計學意義,P<0.01 為統計學意義顯著。
2.1 AGR2 基因結構及數據集表達情況 GEO 數據庫是一個儲存芯片、二代測序以及其他高通量測序數據的數據庫,利用該數據庫,可知AGR2 位于7號染色體;HGNC 數據庫顯示,該基因編碼內質網(ER)蛋白的二硫鍵異構酶(PDI)家族成員,該蛋白催化蛋白質折疊和硫醇-二硫鍵交換反應。AGR2 編碼的蛋白質具有N 端ER 信號序列、催化活性硫氧還蛋白結構域和C 端ER 保留序列。這種蛋白質在細胞遷移、轉化和轉移中發揮作用,是一種p53 抑制劑。作為ER 定位的分子伴侶,它在富含半胱氨酸的跨膜受體和富含半胱氨酸的腸糖蛋白粘蛋白的折疊、運輸和組裝中發揮作用;該基因與炎癥性腸病和癌癥進展有關,見圖1。

圖1 AGR2 染色體定位及基因數據圖譜
2.2 AGR2 在胰腺癌中的表達情況 通過Oncomine數據庫分析可知,AGR2 基因在胰腺癌中呈現高表達狀態;AGR2 mRNA 在胰腺癌研究芯片中的表達情況顯示,AGR2 均在胰腺癌中現高表達狀態,差異有統計學意義(P<0.05),見圖2。

圖2 AGR2 mRNA 在胰腺癌中的表達情況
2.3 AGR2 在各種癌癥中的表達情況 通過GEPIA2數據庫分析AGR2 基因在各腫瘤組織中的表達如下:從高到低的表達情況依次為胃腺癌(STAD)、結腸癌(COAD)、直腸腺癌(READ)、胰腺癌(PAAD)、肺腺癌(LUAD)、乳腺癌(BRCA)、前列腺癌(PRAD)、食管癌(ESCA)等,見圖3。

圖3 AGR2 在各種癌癥中的表達情況
2.4 在胰腺癌中與AGR2 的相關基因分析 通過GEPIA2 分析報道過的相關基因,得出與AGR2 基因表達相關性最高的4 個基因,分別為S100P、CDC25B、C-K-Ras、HER3,以上4 個基因均與AGR2 基因的表達呈正相關,即AGR2 基因的表達量越高,相關基因的表達量也隨之升高,見圖4。

圖4 AGR2 mRNA 與其相關基因在胰腺癌組織中表達情況
2.5 AGR2 與胰腺癌患者預后的相關性 AGR2 mRNA的表達與胰腺癌患者的總生存率(overall survival,OS)和無病生存率(disease free survival,DFS)無相關性,見圖5。

圖5 AGR2 與胰腺癌患者預后的相關性
2.6 AGR2 在不同分期胰腺癌中的表達 GEPIA2 結果顯示,不同病理分期的胰腺癌AGR2 mRNA 表達水平比較,差異有統計學意義(P<0.05),見圖6。

圖6 AGR2 mRNA 在不同分期胰腺癌中表達情況
2.7 AGR2 在正常胰腺組織與胰腺癌組織的免疫組化 分析AGR2 蛋白在1 例正常胰腺組織和11 例典型胰腺癌組織中的表達情況,結果顯示6 例胰腺癌組織中AGR2 蛋白表達及抗體染色程度為“高度”水平;3 例為“中度”水平;2 例為“低度”水平,見圖7。

圖7 AGR2 在正常胰腺組織和胰腺癌組織中的免疫組化
2.8 與AGR2 相互作用的蛋白網絡 通過String 數據庫分析得到AGR2 基因相互作用的蛋白分別有TFF1、SPDEF、AGR3、TFF3、FOXA1、P4HB、RUB VBL、HSPA5、LYPD3、RUVBL2,節點數:11,邊數:25,平均節點度:4.55,局部聚類系數:0.752,預期邊緣數:11,PPI 富集P值:0.000 286,此網絡具有比預期更多的交互性,見圖8。

圖8 與AGR2 相互作用的蛋白網絡
2.9 基于GeneMANIA 構建AGR2 蛋白的PPI 網絡PPI 網絡和功能分析表明,AGE2 富集的基因組主要負責蛋白泛素化的正向調控、Wnt 通路的調控以及共表達蛋白組靶向,見圖9。

圖9 AGR2 蛋白的PPI 網絡
2.10 AGR2 甲基化分析 根據AGR2 在胰腺癌中不同樣本,胰腺癌的不同癌癥分期階段,患者種族差異、患者年齡、飲酒史以及淋巴結轉移情況綜合分析出以下數據,其中Beta(β)值表示從未甲基化(0)到完全甲基化(1)的DNA 甲基化水平,不同的β 值截止值已被認為表明高甲基化(β 值:0.5~0.7)或低甲基化(β值:0.25~0.3),見圖10。

圖10 AGR2 甲基化分析

圖10 AGR2 甲基化分析(續)
目前,胰腺癌是全球癌癥死亡的主要原因,其全球負擔在過去的25 年中增加了1 倍以上,盡管這一增長在很大程度上是由于全球人口老齡化引起的,但胰腺癌存在一些可改變的關鍵風險因素,例如吸煙、肥胖、糖尿病和酒精攝入[6-9]。這些風險因素的患病率在全球許多地區正在增加,因此也導致胰腺癌的發病率增加,但由于潛在患病率和預防策略的差異,這些風險因素的相對貢獻在全球范圍內有所不同。遺傳因素雖然不能直接改變,但卻是胰腺癌風險的重要組成部分,包括遺傳性癌癥基因的致病變異、與遺傳性胰腺炎相關的基因,以及在全基因組關聯研究中發現的常見變異。鑒定胰腺癌的遺傳變化不僅可以深入了解該病的病因,還可以為指導早期檢測提供參考[10-12]。因此,探究胰腺癌發生發展的分子機制并確定其早期診斷的分子標志物至關重要。
AGR 家族由3 個成員組成,即TXNDC12(AGR1)、AGR2 和AGR3。AGR2 蛋白是AGR 家族中研究最多的蛋白質。此外,AGR2 廣泛涉及人類疾病,特別是癌癥[13,14]。在人類癌癥模型中,AGR2 在多種癌癥類型中高度表達,其表達升高與癌細胞適應性增加有關[15,16]。如AGR2 過表達可促進癌細胞增殖和轉移以及促進細胞存活,在許多癌癥類型中ER 應激可導致AGR2 的表達增加。
Oncomine 是基于網絡的數據庫和數據挖掘平臺,是系統地管理、分析和提供所有公共癌癥微陣列數據的數據庫,其差異表達分析將大多數主要類型的癌癥與各自的正常組織以及各種癌癥亞型進行比較,基于臨床和病理學的分析可供探索選定基因或多個基因的查詢和數據可視化[17,18]。GEPIA2具有198 619 種isoforms(功能上相似的蛋白質,具有相似但不完全相同的氨基酸序列,由不同基因編碼,或由去除不同外顯子的相同基因的RNA 轉錄本編碼)和84 種癌癥亞型,可將基因表達量化從基因水平擴展到轉錄水平,并支持特定癌癥亞型的分析和亞型之間的比較[19]。此外,GEPIA2 還采用了受單細胞測序研究啟發的基因特征量化分析技術,并提供定制分析,用戶可以上傳自己的RNA-seq 數據并將其與TCGA 和GTEx 樣本進行比較[23]。人類蛋白質圖譜已對59 種組織中的超過15 313 種蛋白質進行了基于免疫組織化學的蛋白質組學可視化。在每個組織中,病理學家已經對許多不同細胞類型的染色模式進行了評分。因此,有大量的可視化蛋白質組學數據可用于將基因或蛋白質列表分類為特定的細胞類型。STRING 數據庫[20]是專用于全生物體蛋白質關聯網絡的幾個在線資源之一,STRING 數據庫旨在將重點放在覆蓋范圍(適用于數千個基因組測序生物)、證據來源的完整性(例如包括自動文本挖掘)和可用性功能(例如定制、富集檢測和程序訪問)[21]。本研究主要利用上述數據庫挖掘AGR2 在胰腺癌中的表達情況及其與患者預后的相關性。本研究結果顯示,AGR2 基因在胰腺癌癌組織中的表達水平高于正常組織(P<0.05),AGR2 基因高表達與患者的病理分期有關(P<0.05);AGR2 共表達基因分析顯示,S100P、CDC25B、C-KRAS、HER3 等基因與AGR2 基因表達呈正相關。這些均提示AGR2 基因在胰腺癌發生發展過程中可作為促癌因子發揮作用,同時亦可作為胰腺癌的預后指標。本研究還顯示,AGR2 基因主要負責蛋白質泛素化的正向調控、Wnt 通路的調控以及與共表達蛋白組靶向有關,推測AGR2 可能通過調控以上途徑來調節細胞周期,從而促進腫瘤細胞增殖。此外,本研究還發現與AGR2 正相關的共表達基因,這些基因可為后續研究提供參考。
綜上所述,AGR2 基因在胰腺癌中呈高表達,與胰腺癌的發生發展及預后存在一定關系,有望成為胰腺癌預后評估和治療的潛在靶點。