呂珊妹 徐文杰 王藝臻 董學君
乳腺癌是全球女性癌癥死亡的主要原因[1, 2]。盡管手術結合放化療的診療手段取得了一定的提高,但其預后不良的情況并未改善[3,4]。因此,從分子水平深入研究乳腺癌潛在的發生、發展機制,對延長乳腺癌患者的生存時間具有重要意義。細胞有絲分裂相關基因ASPM (abnormal spindle microtubule assembly)位于1號染色體,編碼3477個氨基酸殘基組成的蛋白質,在正常細胞有絲分裂過程中發揮紡錘體功能是必不可少的[5, 6]。近年來研究發現,ASPM在多種癌癥中異常表達,且與肝癌、卵巢癌、胰腺癌和前列腺癌等多種腫瘤的不良預后顯著相關[6~9]。然而,ASPM參與癌癥進展的機制尚不明確,并且其在乳腺癌中的表達和作用機制的研究較少。為深入研究ASPM與乳腺癌的相關性,本研究使用Oncomine在線數據庫分析ASPM在乳腺癌中的表達水平,并利用GEO (gene expression omnibus)和TCGA (the cancer genome atlas)公共數據庫中的乳腺癌基因芯片數據,探討ASPM與乳腺癌患者臨床病理指標的相關性及其對預后的影響。通過基因富集分析 (gene sets enrichment analysis, GSEA)、String以及TIMER數據庫進一步預測ASPM在乳腺癌發生、發展中可能參與的信號通路及作用機制。同時RT-qPCR驗證ASPM在乳腺癌臨床組織樣本中的表達情況。
1.ASPM表達量分析:利用Oncomine數據庫 (https://www.oncomine.org/resource/login.html) 分析ASPM在乳腺癌組織中的表達情況。以正常組織為對照,選擇差異表達倍數大于2倍、基因排位于前10%且P=0.000的結果,選擇箱式圖展現結果。本研究設置的篩選條件:①Gene:ASPM;②Analysis Type:cancer vs normal analysis;③Cancer Type:breast cancer;④Data Type:mRNA;⑤Sample Type:Clinical Specimen。
2.ASPM與乳腺癌患者臨床資料相關性分析:在美國國立生物技術信息中心 (National Center for Biotechnology Information, NCBI)上的GEO公共數據庫 (https://www.ncbi.nlm.nih.gov/geo/)中下載乳腺癌基因表達譜數據集GSE3494的系列矩陣數據文件,以獲得表達原始數據和臨床資料。GSE3494采用的平臺是Affymetrix公司的GPL96基因表達芯片 (Affymetrix Human Genome U133A Array),包含251例乳腺癌樣本及對應的臨床信息。從TCGA公共數據庫 (https://cancergenome.nih.gov/)中共下載1090例乳腺癌組織樣本,排除目的基因表達值和臨床信息缺失的病例。根據ASPM表達值的中位數分為高表達組和低表達組,χ2檢驗分析ASPM表達與臨床病理指標的相關性。GSE3494數據庫中采用Kaplan-Meier法分析ASPM表達與乳腺癌患者預后的關系。采用Kaplan-MeierPlotter在線數據庫選取乳腺癌頁面,分析ASPM表達與乳腺癌患者總生存期的關系。
3.基因富集分析:官方網站(http://software.broadinstitute.org/gsea/index.jsp) 下載GSEA 2.2.4版本并按照其運行說明進行GSEA分析。將GSE3494數據集中的乳腺癌樣本根據ASPM (219918_s_at)表達值的中位數分為ASPM高表達組和ASPM低表達組。選擇MsigDB數據庫的KEGG基因集 (c2.cp.kegg.v6.0.symbols.gmt)作為參照基因集,按缺省加權富集統計的方法,設置隨機組合次數為1000次,錯誤發現率 (FDR)<0.25以及P<0.05,預測高表達ASPM富集的基因集,探究ASPM可能參與的信號通路機制研究。
4.蛋白質相互作用網絡分析:STRING數據庫 (https://string-db.org/)是一個包含2031種物種和960萬種蛋白質的在線數據庫,利用該數據庫可分析蛋白質之間的相互作用,結合基因富集分析結果,進一步分析乳腺癌中ASPM相關蛋白的相互作用。
5.TIMER數據庫分析:利用TIMER數據庫(https://cistrome.shinyapps.io/timer/),對ASPM在乳腺癌組織中的表達與BUB1、CCNA2、CDC20C、CDK1、DLGAP5C、KIF11C、KIF23、NCAPG、TTK的表達進行Spearman相關性分析。本研究設置的篩選條件:①Cancer Type:breast invasive carcinoma,共1093例;②gene symbols (Y-axis):ASPM;③gene symbols (X-axis):BUB1、CCNA2、CDC20C、CDK1、DLGAP5C、KIF11C、KIF23、NCAPG、TTK;④correlation adjusted by:tumor purity。
6.RT-qPCR:采用Trizol 法提取乳腺癌組織樣本總RNA,使用TaKaRa One Step SYBR PrimeScriptTMRT-PCR Kit Ⅱ進行PCR擴增,反應條件為: 42℃ 5min, 95℃ 10s (反轉錄);95℃ 5s,60℃ 20s,40個循環(PCR反應);95℃ 0s,65℃ 15s,95℃ 0s (溶解曲線分析)。以β-actin為內參,用2-△△Cq法計算ASPM mRNA的相對表達量。PCR引物序列如下:ASPM上游引物:5′-TCCGAAGTTGTAATCGCAGT-3′,下游引物: 5′-GTTGCAGGGGATTTGTGATT-3′; β-actin上游引物:5′-CATGTACGTTGCTATCCAGGC-3′,下游引物:5′-CTCCTTAATGTCACGCAC-GAT-3′。

1.乳腺癌組織中ASPM的表達情況:Oncomine數據庫顯示,與正常乳腺組織比較,ASPM基因在乳腺癌組織中高表達,共有9個數據庫,2880個樣本。在TCGA Breast芯片包含的6個子數據庫中,ASPM在乳腺癌組織中的表達分別是正常乳腺組織的9.248、7.378、9.379、8.673、6.466、7.590倍 (P<0.01,圖1)。

圖1 Oncomine子數據庫中ASPM mRNA在正常乳腺組織和乳腺癌組織中的表達
2.乳腺癌組織中ASPM表達與臨床病理指標的相關性:本研究利用TCGA數據庫中1090例乳腺癌患者 (表1)和GSE3494數據集中251例乳腺癌患者 (表2)的ASPM mRNA相對表達量及臨床隨訪資料,研究ASPM表達與乳腺癌臨床病理指標的相關性。在兩個數據庫中,ASPM表達均與ER、PR水平 (P=0.000)顯著相關,在TCGA數據庫中ASPM表達還跟年齡 (P=0.002)以及TNM分期中的T分期 (P=0.000)和N分期 (P=0.030)顯著相關。GSE3494數據集分析結果顯示,ASPM還與腫瘤直徑(P=0.000)和淋巴結浸潤 (P=0.012)顯著相關。
3.ASPM表達與乳腺癌患者預后的關系:本研究利用GSE3494數據集 (251例乳腺癌患者)和Kaplan-MeierPlotter在線數據庫分析乳腺癌組織ASPM表達與預后的關系。GSE3494數據集生存分析結果為Log-Rank=9.821,P=0.002 (圖2A);Kaplan-MeierPlotter在線數據庫結果為HR=1.71, 95%CI: 1.38~2.13,P=0.000(圖2B),ASPM高表達乳腺癌患者總體生存率短于低表達患者,差異有統計學意義。

表1 ASPM與乳腺癌患者 (GSE3494)的臨床病理指標的相關性

表2 ASPM與乳腺癌患者 (TCGA)的臨床病理指標的相關性
4.ASPM高表達的基因集富集分析:本研究在明確ASPM基因與乳腺癌多個臨床病理指標及預后的相關性后,進一步分析ASPM基因促進乳腺癌發生、發展的作用機制。將GSE3494數據集中的251個乳腺癌樣本按照ASPM (219918_s_at)表達值的中位數分為ASPM高表達組 (n=126)和ASPM低表達組 (n=125),選用 MsigDB 數據庫中的KEGG基因集作為參照基因集進行GSEA分析。ASPM高表達組乳腺癌樣本主要富集在細胞周期 (圖3A)、氧化磷酸化 (圖3B)、DNA修復 (圖3C)、錯配修復 (圖3D)、剪接體 (圖3E)和蛋白酶體 (圖3F)基因集。
5.與ASPM相關蛋白的分析:本研究通過STRING在線數據庫分析ASPM蛋白的相互作用,發現多個蛋白與ASPM相互作用,其中包括BUB1、CENPE、KIF23、KIF11、DLGAP5、CCNA2、NCAPG、TTK、CDC20、CDK1 (圖4)。結合GSEA分析結果,在細胞周期中, BUB1、CCNA2、TTK、CDC20、CDK1這些相關蛋白與ASPM表達上調有關。同時,在TIMER數據庫中相關性分析顯示,乳腺癌組織中ASPM與BUB1 (r=0.878,P=4.62e-320,圖5A)、CCNA2 (r=0.848,P=3.11e-275,圖5B)、TTK (r=0.851,P=3.08e-279,圖5C) 都具有強相關性,與CDC20 (r=0.683,P=1.62e-137,圖5D)和CDK1 (r=0.774,P=2.27e-199,圖5E)也有一定的相關性。

圖2 Kaplan-Meier法分析ASPM表達水平與乳腺癌預后的相關性A.GSE3494數據集;B.Kaplan-Meier Plotter在線數據庫

圖3 GSEA分析ASPM高表達的乳腺癌樣本富集基因集A.細胞周期 (P=0.000;FDR=0.003;ES=0.68);B.氧化磷酸化 (P=0.002;FDR=0.004; ES=0.60);C.DNA修復 (P=0.000;FDR=0.003;ES=0.77);D.錯配修復 (P=0.000;FDR=0.008;ES=0.71);E.剪接體 (P=0.010;FDR=0.008;ES=0.51);F.蛋白酶體 (P=0.000;FDR=0.007;ES=0.73)

圖4 String數據庫中與ASPM相互作用的蛋白質
6.RT-qPCR驗證ASPM mRNA在乳腺癌組織中的表達:本研究通過RT-qPCR檢測了13對乳腺癌及癌旁組織中ASPM的mRNA表達情況,結果顯示乳腺癌病灶組織中ASPM的表達水平顯著高于其配對的癌旁組織,差異有統計學意義 (P<0.01, 圖6),與Oncomine數據庫的分析結果一致。
ASPM位于人類染色體1q31,編碼由3477個氨基酸殘基組成的蛋白質,在維持有絲分裂紡錘體功能的過程中發揮重要作用,與腫瘤的發生、發展密切相關[5]。ASPM基因可能參與了DNA損傷修復的相關過程,該基因的缺失會影響細胞有絲分裂、分裂方向和分化方式,造成DNA損傷增加和細胞凋亡[10]。最新的研究表明,ASPM在膠質母細胞瘤和惡性膠質瘤中過表達,干擾ASPM表達可以減少腫瘤細胞和神經干細胞的增殖[11~13]。ASPM與肝細胞癌、卵巢癌、胰腺癌和前列腺癌的預后不良顯著相關[14]。上述研究均提示,ASPM異常表達與癌癥進展密切相關,然而ASPM表達與乳腺癌臨床指標的相關性及預后的研究仍較為缺乏。

圖5 TIMER數據庫進行Spearman相關性分析A.ASPM與BUB1的相關性 (r=0.878,P=4.62e-320);B.ASPM與CCNA2的相關性 (r=0.848,P=3.11e-275);C.ASPM與TTK的相關性 (r=0.851,P=3.08e-279);D.ASPM與 CDC20的相關性 (r=0.683,P=1.62e-137);E.ASPM與CDK1的相關性 (r=0.774, P=2.27e-199)

圖6 RT-qPCR驗證ASPM在13對乳腺癌配對組織中mRNA的表達
本研究首先利用Oncomine數據庫分析發現,與正常的乳腺組織比較,ASPM在乳腺癌組織中的表達異常升高。進一步對收集的乳腺癌配對組織進行RT-qPCR檢測,發現與配對的癌旁組織比較,ASPM的mRNA水平在乳腺癌組織中顯著上調。通過GSE3494數據集和TCGA數據庫中臨床資料完整的乳腺癌樣本,回顧性分析發現,ASPM與多項臨床指標顯著相關。在兩個數據庫中均發現ASPM與ER水平、PR水平顯著相關 (P=0.000)。ASPM與年齡僅在TCGA數據庫中顯著相關 (P=0.002),可能是TCGA數據庫包含有1090例乳腺癌患者,而GSE3494只含有251例,樣本量不夠大。此外,在GSE3494數據集中,ASPM與腫瘤直徑、淋巴結浸潤顯著相關 (P=0.000);在TCGA數據庫中,ASPM與TNM分期中的T分期 (P=0.000)、N分期 (P=0.03)顯著相關,與M分期 (P=0.724)無相關性,提示ASPM在乳腺癌的發生、發展中可能發揮癌基因的作用。通過GSE3494數據集中的乳腺癌患者的臨床隨訪數據資料,發現ASPM高表達的乳腺癌患者預后較差。Kaplan-MeierPlotter在線數據庫也證實了ASPM高表達患者的總體生存率顯著低于ASPM低表達患者。這些結果提示ASPM表達水平升高與預后不佳有關,可作為乳腺癌預后評估的臨床指標。
本研究進一步利用GSE3494數據集的251例乳腺癌樣本進行基因富集分析,發現ASPM高表達與細胞周期、氧化磷酸化、DNA修復、錯配修復、剪接體和蛋白酶體等基因集關系密切。多數腫瘤細胞常表現出染色體的改變,包括缺失、易位和多倍體等[15]。細胞周期是細胞增殖過程中的主要步驟,腫瘤的發生都有一個共同特征即細胞周期調控機制紊亂。而ASPM與細胞周期過程中的紡錘體功能密切相關,影響著細胞周期的進展,從而影響細胞的增殖[16]。ASPM還能與Cdk2/Cyclin E復合物相互作用,通過調節其泛素化、磷酸化和在細胞核內的定位來調節細胞周期蛋白的活性[17]。胃癌的起源細胞,缺乏特定的生物學標志物,唯一表達的轉錄因子E2F1,可以參與干細胞的自我更新和胃癌發展,其與ASPM密切相關,共同參與了關鍵細胞的調控機制,故ASPM可作為胃癌干細胞生物學標志物[18]。ASPM可以通過增強Wnt-β-catenin信號通路維持前列腺癌細胞的干性特征[19]。這些結果提示ASPM可能通過調節乳腺癌細胞的細胞周期及癌細胞的干性,影響乳腺癌的增殖能力,從而促進乳腺癌細胞的發生、發展。
綜上所述,通過GSE3494數據庫和TCGA數據庫的分析,發現ASPM與乳腺癌多個病理指標有關,可以通過多種途徑來促進腫瘤的進展,從而影響患者的臨床預后水平,其有望成為預警乳腺癌不良預后的生物學標志物。然而,其促進腫瘤發生、發展的具體機制仍需要開展進一步研究。