梅 雯,孫如麗,李 云,熊 偉,趙 一*
(1.大理大學第四附屬醫院,云南楚雄 675000;2.楚雄彝族自治州第二人民醫院,云南楚雄 675000;3.大理大學基礎醫學院,云南大理 671000)
胰腺癌(pancreatic adenocarcinoma,PAAD)是惡性程度較高的消化道腫瘤,5 年生存率不足8%〔1〕。臨床上90%以上的胰腺癌為胰腺導管腺癌(pancreatic ductal adenocarcinoma,PDAC),胰腺癌起病隱匿,多以黃疸或腹痛為首發癥狀,就診時超過80%的患者已進入中晚期,出現局部或遠處轉移,失去最佳手術時機,僅有少數可行根治性手術治療〔2〕。近年來胰腺癌相關診療方法取得了快速發展,對胰腺癌的治療采取外科手術、敏感的化療和放療聯合應用,但患者術后遠處轉移和局部復發仍然嚴重影響著患者生存率。隨著腫瘤個體化治療和靶向治療技術的發展,從分子水平研究胰腺癌發生、發展相關機制有利于發現新的分子靶點,提供新的治療手段和提高患者生存率,對臨床治療具有重要現實意義。
DNA 拓撲異構酶(topoisomerase,Topo)是一種存在于細胞核內,調節DNA 空間動態變化的核內蛋白質。DNA 拓撲異構酶通過結合并水解ATP,催化DNA 鏈的斷裂和結合,影響DNA 的拓撲結構〔3〕。拓撲異構酶具有兩種同工酶,拓撲異構酶Ⅰ(TopoⅠ)和拓撲異構酶Ⅱ(TopoⅡ),TopoⅡ型在哺乳動物細胞中的催化活性由兩種不同的同工酶介導,分別為TopoⅡα和TopoⅡβ,這兩種酶在結構和功能上是相似的,但在細胞周期的核定位和相對濃度上都不同,兩種酶編碼不同的基因產物,表達TopoⅡα 的基因是TOP2A(topoisomeraseⅡalpha)。TOP2A基因位于17q12-21染色體,在DNA 復制、重組、轉錄、染色體濃縮及染色單體分離等過程發揮重要作用〔4〕。TOP2A表達水平的高低和數量變化可導致細胞內物質和結構發生改變。TOP2A主要在增殖細胞中發揮重要作用,其表達水平與腫瘤細胞增殖與轉移密切相關。文獻報道,TOP2A是活躍增殖細胞的敏感特異標記物,TOP2A在腫瘤細胞增殖的不同時相其表達水平有所差異,在S期晚期和G2∕M 期表達增加,在有絲分裂后下降,且TOP2A以細胞周期依賴的方式磷酸化〔5〕。有研究發現,TOP2A在多種不同類型的腫瘤中均呈現高表達,如腸癌、食管癌、肝癌、胃癌等多種類型癌癥,且TOP2A表達水平與腫瘤細胞增殖水平呈正相關〔6-9〕。TOP2A的異常表達最常發生在乳腺癌中,被視為乳腺癌發展進程中的重要預后分子指標〔10〕。TOP2A在腫瘤的發生、發展中起著重要的調控作用,并與腫瘤的預后密切相關,但目前關于TOP2A與胰腺癌的相關研究鮮有報道。從分子水平深入研究胰腺癌發生、發展機制,尋找高靈敏度的分子標志物,對胰腺癌的早期篩查和臨床診斷具有重要意義。本研究旨在利用現有的各種腫瘤生物信息數據庫,通過數據挖掘分析TOP2A基因在胰腺癌中的表達及其預后意義,為TOP2A基因在胰腺癌發生、發展中的作用機制提供線索和思路。
1.1從ONCOMINE數據庫提取數據在ONCOMINE v4.5 數據庫中設定篩選和挖掘數據的條件為:①Gene:TOP2A;②Analysis Type:Cancervs.Normal Analysis;③Cancer Type:Pancreatic Cancer;④Data Type:mRNA;⑤Sample Type:Clinical Specimen;⑥臨界值設定條件(Pvalue<1E-4,fold change 2,gene rank=top 10%,data type=all)。
1.2從GEPIA數據庫提取數據在GEPIA 數據庫(http:∕∕gepia.cancer-pku.cn∕)中 設定 篩選 和 挖 掘數據的條件為:①Gene:TOP2A;②Cancer name:PAAD(pancreatic adenocarcinoma);③“Expression on Box Polts”框中設置條件|Log2FC |Cutoff:1,P-value Cutoff:0.01;④“Pathological Stage Plot”輸入TOP2A;⑤“Similar Genes Detection”選 擇PAAD Tumor 和PAAD Normal;然后輸入相應基因進行分析。
1.3 MethHC數據庫提取數據在MethHC 數據庫(http:∕∕methhc.Mbc.Nctu.Edu.tw)中設定篩選和挖掘數據的條件為:①Gene Reach:PAAD;②“Elect a gene region”中選擇Promoter;③List your interested genes:TOP2A。
1.4 String數據庫提取數據String數據庫(https:∕∕string-db.org ∕)中設定篩選和挖掘數據的條件為:①Protein name:TOP2A;②Organism:Homo sapiens;③Munber of nodes:11;④PPI enrichmentP-value:1.3E-10;⑤High confidence:0.700;⑥Max number of interactors to show:10。
1.5從Kmplot數據庫提取數據在Kmplot 數據庫(http:∕∕kmplot.com∕analysis∕)中設定篩選和挖掘數據的條件為:①RNA-seq;②Gene:TOP2A;③Cancer symbol:pancreatic ductal adenocarcinoma;④Survival:分別選擇總體生存率(overall survival,OS)和無復發生存期(relapse-free survival,RFS)。
1.6 The Human Protein Atlas數據庫提取數據The Human Protein Atlas 數據庫中設定篩選和挖掘數據的條件為:TOP2A。數據庫共有3 種TOP2A 免疫組化抗體(No:HPA006458,No:HPA026773,No:CAB002448),對正常胰腺組織和胰腺癌組織進行免疫組化實驗。選擇克隆號為No:HPA006458 的抗體對1 例正常胰腺組織和11 例胰腺癌組織的TOP2A蛋白表達程度進行分析。
1.7統計學分析正常組織與腫瘤組織之間TOP2A基因表達差異采用t檢驗。TOP2AmRNA 表達水平與胰腺癌患者病理分期的關系采用單因素方差分析(one-way ANOVA)。TOP2A基因表達量與患者預后的關系采用Kaplan-Meier 和Log-Rank檢驗。P<0.05為差異有統計學意義。
2.1TOP2A在部分腫瘤類型中的表達ONCOMINE數據庫共有462 項研究結果涉及TOP2A在腫瘤組織與對應非腫瘤組織中表達差異的比較。其中差異有統計學意義的有132 項,TOP2A高表達的研究有125 項,低表達的研究有7 項(P<0.05)。TOP2A在消化系統腫瘤的表達情況見表1。

表1 ONCOMINE數據庫中TOP2A表達有差異的消化系統腫瘤
2.2TOP2A在胰腺癌中的表達結果提取ONCOMINE v4.5 數據庫中的信息發現,從2003 年至2009年,共有10 個子數據集涉及TOP2A在胰腺癌組織和正常組織中的表達,共包括322 個樣本。文章分 別發表于Hepatogastroenterology〔11〕、Oncogene〔12〕、Neoplasia〔13〕、Cancer Sci〔14〕、Cancer Cell〔15〕、Clin Cancer Res〔16〕和Am J Pathol〔17〕。對10 個子數據集薈萃分析發現,與正常胰腺組織(對照組)相比,TOP2A在胰腺癌中呈現高表達,中位表達數值為1 169.0,P=0.008,差異有統計學意義。
2.3TOP2A在不同胰腺癌研究芯片的表達差異在ONCOMINE數據庫中,獲取TOP2AmRNA在胰腺癌研究芯片中的表達結果,對相關數據作箱圖比較分析,有7 項研究(Lacobuzio-Donahue Pancreas 2,Pei Pancreas, Grutzmann Pancreas, Logsdon Pancreas,Segara Pancreas, Buchholz Pancreas, Badea Pancreas)均顯示,相較于正常胰腺組織,TOP2AmRNA 在胰腺癌中呈現高表達,且差異具有統計學意義(P<0.05)。見圖1A~G。但其中1 項研究(Ishikawa Pancreas)中,TOP2AmRNA 在胰腺癌組織和正常胰腺組織中的表達量差異無統計學意義(P=0.109)。見圖1H。

圖1 ONCOMINE芯片數據庫TOP2A mRNA在正常胰腺組織和胰腺癌組織研究芯片中的表達差異
2.4TOP2A與多個基因的相關性分析基于GEPIA數據庫基因相關性分析結果顯示,胰腺癌組織TOP2A的mRNA表達水平與CDK1、HDAC1、NFE2L3、MTERF3、OLA1和RRM1基因mRNA 表達水平呈顯著正相關(P<0.05,R>0)。見圖2。

圖2 TOP2A mRNA表達水平在胰腺癌患者中與其他基因mRNA表達水平的相關性
2.5TOP2AmRNA表達水平與胰腺癌患者病理分期的關系從GEPIA 數據庫下載TOP2AmRNA 表達水平與胰腺癌患者病理分期的相關數據,結果顯示TOP2AmRNA 表達水平在胰腺癌患者不同病理分期中的表達差異無統計學意義(P>0.05),單因素方差分析得出F值為1.64,其對應P值為0.183。見圖3。

圖3 TOP2A mRNA表達水平與胰腺癌患者病理分期的關系
2.6TOP2AmRNA表達與胰腺癌患者預后的相關性為了進一步明確TOP2AmRNA 表達與胰腺癌患者預后之間的關系,在Kmplot 數據庫中對TOP2AmRNA 表達水平與胰腺癌患者預后相關的數據進行分析。結果表明,TOP2AmRNA 表達量與胰腺癌患者的OS和RFS均有顯著相關性,與TOP2AmRNA低表達組相比,TOP2AmRNA 高表達組胰腺癌患者總體生存時間和無復發生存時間顯著縮短(OS:LogrankP=4.9E-0.5;RFS:LogrankP=0.000 75)。見圖4。

圖4 胰腺癌患者的預后與TOP2A mRNA表達水平的關系
2.7TOP2A啟動子區DNA甲基化水平分析從Meth-HC數據庫下載相關數據,結果顯示TOP2A共有1個轉錄模板,編號為NM_001067,在胰腺導管腺癌中TOP2A啟動子區甲基化與正常胰腺組織甲基化水平差異無統計學意義(P>0.05)。見圖5。

圖5 正常胰腺組織和胰腺導管腺癌TOP2A啟動子區甲基化水平比較
2.8 TOP2A相互作用蛋白網絡在String 數據庫中按照篩選條件,篩選出相互作用強度排位靠前的10 個與TOP2A 有相互作用的蛋白質,分別是NCAPG、CDC20、UBE2C、PBK、TPX2、DLGAP5、CCNB2、TOP1、CDK1、BUB1。見圖6。這些蛋白相互作用,可能參與了胰腺癌細胞增殖、分化及細胞周期調節等功能,在胰腺癌發生、發展中發揮著重要的調節作用。

圖6 與TOP2A相互作用的蛋白網絡圖
2.9 TOP2A蛋白在胰腺癌中的表達情況在The Human Protein Atlas 數據庫中,選擇克隆號為No:HPA006458 的抗體,分析TOP2A 蛋白在1 例正常胰腺組織和11 例典型胰腺癌組織中的表達情況。其中有5 例胰腺癌組織蛋白表達及抗體染色程度為“高等”水平;6例為“中等”水平;0例為“低等”水平。TOP2A 蛋白在胰腺癌組織中較正常胰腺組織高表達(左側正常組患者id 2032,蛋白表達水平低;右側腫瘤組患者id 1320,蛋白表達水平高)。見圖7。

圖7 TOP2A蛋白在正常胰腺組織和胰腺癌中的表達(免疫組織化學染色)
ONCOMINE 數據庫是目前世界最大的腫瘤基因芯片數據庫,提供癌癥全面的基因表達數據及相關臨床信息,整合了TCGA、GEO 和已發表文獻來源的DNA 和RNA-seq 數據。GEPIA 是由北京大學開發的基因表達譜數據動態分析網站,其數據來自于TCGA 和GTEx 兩大數據庫。MethHC數據庫其數據來自于TCGA,用于分析18 種腫瘤和對應正常組織DNA 甲基 化和mRNA∕miRNA 相 關信 息。String 數據庫可用以提取蛋白質-蛋白質之間相互作用網絡,預測蛋白質-蛋白質之間的關系。The Human Protein Atlas 數據庫采用特制抗體檢測每種蛋白在人正常組織、腫瘤組織、細胞系和血液內的分布和表達情況,結果用免疫組織化學染色圖表示。為了更好地了解TOP2AmRNA 和蛋白在胰腺癌組織中的作用及其機制,通過數據挖掘,分析并探討其在胰腺癌組織中的表達水平及預后意義,為進一步研究TOP2A在胰腺癌發生、發展中的作用機制提供理論依據。
目前關于TOP2A與腫瘤進展的研究大多集中在其對DNA 結構的調控上。TOP2A通過調控DNA鏈的斷裂和重新連接,從而影響DNA 的拓撲狀態和復制。研究表明,腫瘤的增殖、轉移和化療藥物耐藥性等主要是通過調節DNA 拓撲狀態和DNA 復制來實現〔18〕。有研究表明,TOP2A通常在增殖活躍的細胞中過度表達,并且高表達可能與癌細胞侵襲性有關〔5〕。據報道,TOP2A過表達與脂肪肉瘤和肝細胞癌等癌癥的侵襲性密切相關〔19-20〕。另外有研究報道TOP2A在胰腺癌中呈現高表達,且高表達患者生存率較低,TOP2A可激活Wnt-β-catenin 通路,誘導上皮-間充質轉換,從而增加癌基因的轉錄,TOP2A的高表達可能與癌細胞生長速度、浸潤程度和遠處轉移能力等有關〔21〕。通過比較TOP2A在胰腺癌和正常胰腺組織中的表達,對ONCOMINE 數據庫和The Human Protein Atlas 數據庫中的TOP2A分析發現,mRNA 水平和蛋白水平在胰腺癌中均呈高表達(P<0.05)。此外,TOP2A在乳腺癌、前列腺癌、鼻咽癌等惡性腫瘤中的預后價值已得到證實〔22-24〕。然而,目前TOP2A在胰腺癌中的預后價值尚未得到證實。通過Kmplot 數據庫中下載TOP2AmRNA 表達水平與胰腺癌患者預后相關的數據,結果表明,TOP2AmRNA 與胰腺癌患者OS 和RFS 均有相關性,TOP2AmRNA 高表達者比低表達者預后差。因此,推測TOP2A可能成為胰腺癌預后的潛在生物標志物。另外通過基因相關性分析發現TOP2A與CDK1、HDAC1和NFE2L3等基因有顯著相關性,這些基因可能相互作用參與了胰腺癌的發生與發展過程。在String 數據庫中按照篩選條件,篩選出相互作用強度排位靠前的10 個與TOP2A 有相互作用的蛋白質,這些蛋白相互作用,導致TOP2A在調節DNA 結構方面的活性發生改變,可能參與了胰腺癌細胞增殖、分化及細胞周期調節等功能,在胰腺癌發生、發展中發揮著重要的調節作用,而具體機制需進一步實驗驗證加以闡明。值得注意的是,TOP2AmRNA 表達水平與胰腺癌臨床分期差異無統計學意義,分析可能原因:①上述研究結論僅僅是在轉錄水平上得出的,有一定局限性;②TOP2AmRNA 表達水平與胰腺癌臨床分期的關系受眾多因素共同參與調節,絕非某一個促癌因子能起到決定性作用,TOP2A的作用勢必被其他拮抗因子影響,而具體原因需進行后續研究加以驗證。
總之,通過腫瘤基因數據庫相關基因信息的深入挖掘發現,在mRNA 水平和蛋白水平上,TOP2A在胰腺癌組織中呈高表達,其表達水平與胰腺癌的預后有明顯關聯,通過對數據庫進行大量數據挖掘為發現胰腺癌新的分子靶點奠定理論基礎,也為今后胰腺癌的研究提供重要線索和數據支持。與此同時,數據庫高效能的分析能力和大量的樣本使分析結果具有極大的參考價值,避免了由于研究樣本量過小產生的誤差,合理利用已有信息資源,縮短科研周期,降低科研成本。