饒玉梅,張微微,張 穎,趙 倩,李留霞,郭瑞霞
鄭州大學第一附屬醫院婦科 鄭州 450052
卵巢癌病死率位居女性生殖系統惡性腫瘤之首[1]。 卵巢癌確診時往往期別較晚,預后差,5 a生存率約為47%[2]。因此,研究卵巢癌的發病機制,能為該疾病的診治提供理論和實踐依據,具有重要意義。本研究從GEO數據庫中,獲取漿液性卵巢癌與正常卵巢組織基因芯片數據,經過分析獲得二者間差異表達基因(differentially expressed gene,DEG),通過對DEG進一步分析,得到與卵巢癌患者生存期相關的關鍵基因,有助于我們更好地探索卵巢癌發病機制。
1.1 數據提取從GEO數據庫(http://www.ncbi.nlm.nih.gov/geo)中篩選下載數據集GSE54388、GSE105437,數據集分析平臺均為GPL(gene platform)570。GSE54388包含16例漿液性卵巢癌和6例正常卵巢組織,GSE105437包含10例高級別漿液性卵巢癌和 5例正常卵巢組織。
1.2 DEG篩選利用GEO分析工具GEO2R(http://www.ncbi.nlm.nih.gov/geo/geo2r)分別篩選出兩個數據集中兩組之間的DEG。篩選標準為校正后P<0.05,|lgFC|>1。下載所得原始DEG數據,去除沒有對應基因符號的探針組或同一基因對應多個探針等情況。然后應用Venn軟件(http://bioinformatics.psb.ugent.be/webtools/Venn/)分析并作圖,得出交集。
1.3 GO和KEGG富集分析用DAVID 6.8數據庫(http://david.ncifcrf.gov/)對篩選出的DEG進行功能富集,主要包括GO和KEGG富集分析。設P<0.05為富集差異有統計學意義。
1.4 蛋白質-蛋白質相互作用(protein-protein interaction,PPI)網絡及模塊分析用String 11.0數據庫(http://string-db.org)構建DEG的PPI網絡。利用String檢索DEG中的交互基因。然后用Cytoscape 3.7.1軟件中的MCODE 1.5.1對篩選基因進行重塑,構建調控網絡模塊[3]。
1.5 關鍵基因篩選分析應用Kaplan Meier plotter(http://kmplot.com/analysis)網站分析關鍵基因,進一步篩選出在卵巢癌組織中表達與總生存率有關的關鍵基因(P<0.05)。再利用GEPIA 數據庫(http://gepia.cancer-pku.cn)分析所獲得的關鍵基因,再一次篩選出表達異常的基因(P<0.05)。
2.1 DEG的篩選從GSE105437、GSE54388兩個數據集分別得到1 959個(上調1 399個、下調560個)、3 147個(上調1 881個、下調1 266個)DEG。Venn軟件對二者取交集獲得322個DEG,包括174個上調和 148個下調基因(圖1)。

左:上調基因;右:下調基因
2.2 GO和KEGG富集分析結果對322個DEG進行GO和KEGG富集分析。GO分析結果見表1,表內基因數為對應GO的DEG數目,結果分為生物學過程、細胞組分和分子功能3個方面。DEG的生物學過程:上調基因主要集中在染色體分離、血管平滑肌發育、上皮細胞分化等方面(僅列出前3位);下調基因主要集中在平滑肌細胞增殖負調節、蛋白分泌正調節、RNA聚合酶Ⅱ啟動子轉錄負調控等方面。細胞組分:上調基因主要集中在染色體、膜結合細胞器、膜封閉管腔等部位;下調基因主要集中在Z盤、膜的外部成分、高爾基管腔等部位。分子功能:上調基因涉及蛋白質結合;下調基因涉及氧化還原酶活性、核酸結合、肌動蛋白絲結合等方面。KEGG富集分析結果見表2:上調基因富集于細胞周期、癌癥通路、ECM作用受體3條信號通路;下調基因富集于干細胞多能性的信號通路調節、酪氨酸代謝、癌癥蛋白多糖等信號通路。

表1 卵巢癌DEG的GO分析結果

表2 卵巢癌DEG的KEGG富集分析結果
2.3 PPI網絡構建及關鍵基因選擇的結果對322個DEG分析后制作的PPI網絡圖見圖2。對篩選的關鍵基因進行網絡模塊構建,得到MCM10、 MCM4、GINS2、BRCA1、FANCD2、TOP2A、KIF4A、MKI67、ESPL1、CDCA3、NEK2、KPNA2、ASF1B、ESCO2 14個關鍵基因,均為上調基因(圖3)。

紅色:上調基因;綠色:下調基因

圖3 關鍵基因的模塊圖
2.4 關鍵基因分析結果用Kaplan Meier plotter網站分析14個關鍵基因表達與卵巢癌患者總生存率之間關系,其中MCM10、FANCD2、TOP2A、ESPL1、CDCA3、NEK2、ESCO2等7個基因高表達及BRCA1低表達與患者總生存率不良有關(圖4)。用GEPIA數據庫分析這8個關鍵基因在卵巢癌和正常卵巢組織中表達情況,結果顯示卵巢癌組織中MCM10、TOP2A、ESPL1、CDCA3、NEK2、ESCO2等6個基因的表達水平高于正常卵巢組織中的表達水平(圖5)。

圖4 卵巢癌組織中8個關鍵基因表達水平與患者總生存曲線關系

圖5 6個關鍵基因在卵巢癌與正常卵巢組織中的表達情況
我國每年死于卵巢癌的女性約為2.5萬,而且呈上升趨勢[4]。漿液性卵巢癌早期診斷困難,患者就診時往往已發生盆腹腔廣泛轉移[5]。因此,尋找能早期診斷、預后預測、靶向治療的分子靶標,成為目前分子腫瘤學研究重點之一。為此,本研究提取GSE105437、GSE54388兩個數據集中卵巢癌和正常卵巢組織資料,運用生物信息學分析方法,最終獲取了MCM10、TOP2A、ESPL1、CDCA3、NEK2、ESCO2等6個關鍵基因。
MCM10高表達與前列腺癌[6]、乳腺癌[7]等腫瘤預后不良或惡性行為有關。MCM10在染色體復制的S期使DNA松解,其核心序列含有進化保守的結構域,由寡核苷酸-糖和相鄰的鋅指結構組成。其異常表達致腫瘤患者預后不良機制未明。ESCO2對細胞染色體凝聚及基因組穩定性有重要作用,其在腎細胞癌[8]、乳腺癌[9]組織或細胞中高表達。ESCO2表達失調能夠抑制基質金屬蛋白酶2表達,從而影響結腸癌的轉移[10]。在胃癌細胞中抑制ESCO2的表達,能通過影響AMPK信號通路而抑制腫瘤細胞的增殖并誘導腫瘤細胞凋亡[11]。而CDCA3高表達與結腸癌預后不良有關,在結腸癌細胞SW480中降低CDCA3表達,能影響P21通路使腫瘤細胞阻滯在G1/S期,導致細胞增殖受抑[12]。同樣在胃癌組織中CDCA3高表達也促進腫瘤惡性行為[13]。ESPL1編碼一種分離酶,在細胞有絲分裂過程中切割染色體,其高表達不僅使乳腺癌細胞容易受到因染色體錯聚,而致染色體非整倍體出現,而且還使細胞容易受到其他不穩定性遺傳因素的影響,包括DNA損傷和關鍵抑癌基因位點的丟失。這些變化疊加起來,能導致腫瘤發生發展[14]。MCM10、ESPL1、CDCA3、ESCO2在多種惡性腫瘤發生發展中有重要作用,但其在卵巢癌中的研究鮮有報道。我們的研究顯示這4種基因在卵巢癌組織中都是高表達,且高表達的患者生存期縮短。
有研究顯示:NEK2在卵巢癌組織中高表達[15],且與卵巢癌的紫杉醇耐藥有關[16]。抑制卵巢癌細胞中NEK2表達,能抑制腫瘤細胞的侵襲和增殖[17]。TOP2A在細胞有絲分裂中集聚于染色質,作用于著絲點,在DNA穩定性中發揮作用。它也是化療藥蒽環類和依托泊苷類藥物的作用靶點之一[18]。研究[19]發現TOP2A在漿液性卵巢癌組織中表達上調,并通過TGF-β/Smad途徑加速卵巢癌進展。復發性上皮性卵巢癌組織中TOP2A表達升高,患者對脂質體阿霉素的敏感性更高[20]。表明TOP2A在預測卵巢癌患者對脂質體阿霉素敏感性方面有良好的價值。
總之,雖然本研究發現了一些有意義的結果,但也有一些局限性。比如缺乏實驗驗證,以及這6個基因如何影響卵巢癌的發生發展,尚需進一步研究。