向曉輝 毛駿 李海
1天津市西青醫院消化內科,天津 300380;2武警后勤學院研究生隊,天津 300309;3天津市肝臟胰腺纖維化與分子診療重點實驗室,天津 300162
胰腺癌是一種惡性程度很高、診斷和治療都很困難的消化腺惡性腫瘤,起病隱匿,早期癥狀不典型,出現癥狀時大多已屬中晚期[4],預后差[1]。著絲粒蛋白(centromere protein,CENP)是一組形成、介導著絲粒功能的蛋白[6-7],最早被發現的是CENP-A,由CENP-A基因編碼。CENP-A是一種組蛋白H3變體,對于著絲粒的組裝形成、染色體的正確分離以及細胞分裂的正常進行起到了不可替代的作用[8-10]。CENP-A在正常細胞中的轉錄、翻譯水平受嚴格調控,對確保有絲分裂過程中基因組的穩定性發揮重要作用[7, 11]。研究發現CENP-A基因在多種惡性腫瘤中過表達,導致染色體非整倍體形成,而染色體非整倍體形成往往是腫瘤形成的重要原因之一[12]。本研究通過檢索高通量基因表達(Gene Expression Omnibus,GEO)數據庫和癌癥基因組圖集(The Cancer Genome Atlas,TCGA)數據庫,探討CENP-A在胰腺癌組織中的表達及其臨床意義。
自GEO數據庫(http:www.ncbi.nlm.nih.gov/geo)的1個微陣列數據集(GSE28735)下載45例具有完整臨床隨訪信息的胰腺癌患者癌組織和癌旁組織mRNA表達譜數據;自TCGA數據庫(https://cancergenome.nih.gov/)下載178例胰腺癌患者癌組織的mRNA Seq數據,其中177例患者具有匹配的mRNA表達譜、生存數據和完整的臨床病理數據。
下載edge R軟件包(http://www.bioconductor.org/packages/release/bioc/html/edgeR.html)對mRNA表達譜進行過濾、歸一化處理,并經log2轉換后用于后續分析[13-14]?;赥CGA數據庫中177例胰腺癌樣本CENP-A mRNA表達譜和隨訪數據,對樣本的表達量進行由高到低排序后,取中位數將其分為高表達、低表達2組。
使用基因集富集分析(gene set enrichment analysis,GSEA)軟件分析CENP-A mRNA表達水平與京都基因和基因組百科全書(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路基因集的相關性[15-17]。設置隨機組合次數為1 000次,計算標準化的富集系數(normallized enrichment score,NES),以標準化P值<0.01,且錯誤發現率(false discovery rates,FDR)<0.05為顯著性富集。
STRING(Search Tool for the Retrieval of Interacting genes/proteins)數據庫(https://string-db.org/cgi/input.pl)是一個研究分析蛋白之間相互作用的在線檢索生物數據庫,可用于尋找與CENP-A蛋白作用密切相關的多個蛋白,構建蛋白質-蛋白質相互作用(protein-protein interaction,PPI)網絡。將STRING數據庫分析結果中的蛋白和本研究中的GSEA富集通路結果結合,篩選出與CENP-A相關的蛋白,分析兩者表達的相關性。
癌組織與癌旁組織表達量比較采用配對樣本t檢驗,臨床病理指標參數采用獨立樣本t檢驗。生存分析采用Kaplan-Meier法及Log-rank檢驗。對CENP-A表達與相關蛋白表達進行Spearman相關性分析,并用GraphPad Prism 8.0軟件對數據進行可視化處理。P<0.05為差異有統計學意義。
GEO數據庫下載的45例胰腺癌組織和相匹配的癌旁組織中CENP-A mRNA表達量分別為4.492±0.361和3.431±0.405,胰腺癌組織CENP-A mRNA表達量顯著高于癌旁組織,差異有統計學意義(t=14.531,P=0.001,圖1)。

注:CENP-A為著絲粒蛋白A圖1 胰腺癌組織與匹配癌旁組織的CENP-A表達量
TCGA數據庫下載的177例胰腺癌組織CENP-A基因表達量與TNM分期、腫瘤分級密切相關,差異有統計學意義(P值分別為0.035、0.007),而與患者年齡、性別、飲酒史及腫瘤家族史均無明顯相關性(表1)。
CENP-A的表達水平與胰腺癌患者總體生存期顯著相關(P=0.001),高表達患者與低表達患者的生存率分別為36.4%和59.6%,中位生存期分別為511 d和913 d,高表達患者總體生存時間顯著短于低表達患者,提示CENP-A基因高表達是胰腺癌患者預后不良的因素(圖2)。
CENP-A高表達組織樣本富集到細胞周期(P<0.001,FDR=0.004)與DNA周期(P<0.001,FDR=0.043)兩個相關基因集,提示CENP-A可能通過上述兩條通路發揮促進腫瘤發生發展的作用(圖3)。


臨床指標例數CENP-A表達量t值P值年齡(歲)-0.9650.336 <65816.743±1.417 ≥65966.931±1.175性別0.4060.685 男976.888±1.202 女806.809±1.365腫瘤分級-2.7500.007 G1~G21256.663±1.349 G3~G4507.244±1.020 未知2TNM分期-2.2430.035 Ⅰ226.037±1.881 Ⅱ~Ⅳ1556.960±1.147飲酒史-0.6170.538 無706.771±1.019 有1076.893±1.443腫瘤家族史-0.6000.549 無896.787±1.444 有886.904±1.119
注:CENP-A為著絲粒蛋白A

注:CENP-A為著絲粒蛋白A圖2 CENP-A表達水平與胰腺癌患者生存時間的關系
使用STRING數據庫分析構建CENP-A蛋白的PPI網絡,發現周期蛋白依賴性激酶1(cyclin-dependent protein kinase, CDK1)、紡錘體檢測蛋白1(budding uninhibited by benzimidazoles 1, BUB1)、細胞周期調節激酶(aurora kinase A, AURKA)、AURKB等多個蛋白與CENP-A相互作用(圖4),結合GSEA富集的細胞周期與DNA復制相關通路結果篩選出CDK1和BUB1兩個關鍵蛋白。應用Spearman相關性分析顯示胰腺癌組織CENP-A與CDK1、BUB1呈顯著相關性(r值分別為0.861、0.825,P值均<0.001,圖5)。
著絲粒是真核生物細胞在進行有絲分裂和減數分裂時染色體分離的調控裝置,由DNA和蛋白質組成。CENP-A作為著絲點的標志性蛋白因子,在染色體精確分離過程中發揮著關鍵作用[18]。CENP-A功能失常將導致細胞分裂過程中發生染色體分離異常。在DNA復制過程中,染色質可通過回收修飾舊的組蛋白和沉積新的組蛋白而重新組裝[19-20]。Nye等[21]研究發現,在腫瘤細胞中CENP-A的異常定位可以募集著絲粒組件,并與G1期的有絲分裂缺陷和DNA損傷相關。Takada等[22]的研究結果揭示了通過CENP-A介導的著絲粒功能障礙,被激活的細胞周期蛋白E1/CDK2促進細胞染色體不穩定性和腫瘤的進展。

注:CENP-A為著絲粒蛋白A
圖3 CENP-A基因高表達相關基因集的富集 3A:富集細胞周期基因集;3B:富集DNA復制基因集

注:CENP-A為著絲粒蛋白A;CDK1為周期蛋白依賴性激酶1;BUB1為紡錘體檢測蛋白1
圖4 CENP-A的PPI網絡

注:CENP-A為著絲粒蛋白A;CDK1為周期蛋白依賴性激酶1;BUB1為紡錘體檢測蛋白1
圖5 CENP-A與CDK1(5A)及BUB1(5B)的相關性分析
近年來研究發現,CENP-A在多種惡性腫瘤中過表達,其過表達與腫瘤的發生、發展、侵襲、轉移及預后等密切相關[12]。最近一項基于生物信息學的研究顯示CENP-A在淋巴瘤、平滑肌肉瘤、膠質母細胞瘤、鱗狀上皮細胞肺癌、小細胞肺癌、髓樣乳腺癌、乳腺導管癌、胃腸型腺癌、食管鱗狀細胞癌、肝細胞癌、胰腺癌、口咽癌、結腸癌、直腸癌、宮頸癌、卵巢漿液性囊腺癌、前列腺癌等20種不同類型的實體癌中表達升高[9]。越來越多的研究表明,CENP-A具有作為腫瘤診斷標志物和預后指標的潛在應用價值[23]。CENP-A是雌激素受體陽性乳腺癌復發的預后標志物[24],CENP-A表達增加可能導致乳腺癌患者的無病生存期縮短[25]??谇击[狀細胞癌組織中CENP-A蛋白和mRNA的表達明顯高于正常組織,其表達水平與腫瘤大小、淋巴結轉移有關,可能成為口腔鱗狀細胞癌發生、發展的生物標志物[26]。CENP-A在11種主要的人原發性結直腸癌組織中均過表達。CENP-A mRNA表達也上調,表明CENP-A的過表達發生在轉錄水平,可能在結直腸癌的非整倍體形成中起重要作用[27]。
本研究借助GEO數據庫CENP-A基因表達譜證實胰腺癌組織CENP-A mRNA表達量較癌旁正常胰腺組織上調,表明CENP-A基因具備作為胰腺癌病理診斷標志物的潛在價值。本研究基于TCGA數據庫177例胰腺癌患者的CENP-A mRNA表達譜和臨床數據進一步分析CENP-A表達量與胰腺癌臨床病理指標及預后的相關性,發現CENP-A表達水平與腫瘤分期和分級密切相關,與患者生存時間呈負相關,提示CENP-A基因有望成為胰腺癌患者預后判斷的新型分子標志物,并將有助于胰腺癌患者術后復發監測策略的完善。借助基因集富集分析發現CENP-A高表達組顯著富集于細胞周期和DNA復制兩條KEGG通路,進一步結合與CENP-A相關蛋白的分析結果推測,CENP-A可能是通過與之相關的CDK1和BUB1協同在胰腺癌組織中發揮其生物學作用。
雖然本研究為深入探討CENP-A在胰腺癌中的作用提供了線索和依據,但尚未明確CENP-A參與胰腺癌發生發展的具體作用機制和途徑,由于腫瘤的發生發展過程中存在多基因協同的復雜調控作用,因此其在胰腺癌形成過程中發揮的功能還有待后續實驗予以進一步闡明及豐富。
利益沖突所有作者均聲明不存在利益沖突