999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用生物信息學分析篩選乳腺癌不良預后的關鍵基因

2020-08-14 07:57:42曹林韓麗楊明韓彬劉福
中國醫藥生物技術 2020年4期
關鍵詞:關鍵乳腺癌數據庫

曹林,韓麗,楊明,韓彬,劉福

·論著·

利用生物信息學分析篩選乳腺癌不良預后的關鍵基因

曹林,韓麗,楊明,韓彬,劉福

637000 南充,川北醫學院附屬醫院藥劑科

利用生物信息學方法,通過分析基因表達數據庫(GEO)基因芯片數據篩選與乳腺癌不良預后相關的核心基因,為乳腺癌的治療提供新的候選靶點。

從 GEO 數據庫下載微陣列數據集 GSE15852,采用 GEO 在線工具 GEO2R 篩選差異表達基因(DEGs);DAVID 數據庫對篩選出的差異表達基因,進行基因本體論分析(GO)和京都基因與基因組百科全書(KEGG)通路富集分析;基于 STRING 數據庫和 Cytoscape 軟件構建蛋白質-蛋白質相互作用關系(PPI),并用Cytoscape 軟件 MCODE 插件進行模塊分析,獲取關鍵基因;用在線工具 Kaplan-Meier Plotter 對這些關鍵基因進行生存分析,獲取與乳腺癌預后不良的相關核心基因;采用基因表達譜交互分析(GEPIA)進一步驗證。

篩選出 57 個差異表達基因,其中上調基因 17 個,下調基因 40 個。上調基因主要富集在雌激素反應、對細胞運動的負調控反應、心臟右心室形態發生、交感神經系統發育、細胞-細胞黏附及輸尿管的萌芽發育等生物過程;聚焦于造血細胞系信號通路。下調基因顯著富集在脂質代謝、分解、存儲過程,膽固醇的儲存、運輸,甘油三酯的合成分解代謝,血管生成等生物過程;聚焦于 PPAR 信號通路、對脂肪細胞脂肪分解的調節作用、脂肪細胞因子信號通路等途徑。PPI 網絡及 MCODE 模塊分析鑒定出 7 個核心基因,關鍵基因的生存分析及 GEPIA 分析發現24 和基因的高表達患者生存率低于低表達患者。

該方法為尋找乳腺癌不良預后的關鍵基因、探索乳腺癌治療新靶點提供一定依據。

乳腺癌; 生物信息學; GEO 數據庫; 差異表達基因; 關鍵基因

乳腺癌是女性發病率最高的惡性腫瘤之一,是全球女性癌癥死亡的主要原因。在全球范圍內,2018 年有大約 210 萬新診斷的女性乳腺癌病例,占女性癌癥病例的近四分之一[1]。隨著篩查方法及治療手段的發展,乳腺癌患者的生存率有所提高。但有研究報道,I 期確診的乳腺癌患者 5 年相對生存率接近 100%,而對于那些被診斷為 IV 期乳腺癌的患者 5 年相對生存率下降到 26%,揭示乳腺癌的晚期患者生存率較低[2]。手術、化療和放療等傳統治療方法對晚期乳腺癌患者來說并不能提供理想的治療結果[3]。此外,乳腺癌腫瘤的異質性,使乳腺癌的治療結果個體差異大。乳腺癌發病機制復雜,目前對其潛在的分子機制尚不完全清楚。因此,迫切需要探索更特異、更經濟的生物標志物來預測乳腺癌的預后,開發更好的治療策略和更好地了解其潛在機制的靶點。

近年來,基于高通量平臺的微陣列已成為篩選癌癥發生過程中重要的遺傳或表觀遺傳學改變及尋找癌癥診斷和預后的有前途的生物標志物的有效工具[4]。生物信息學分析基于基因芯片,通過數據篩選、統計分析、可視化手段、分子互作網絡和通路分析等方法整合海量、復雜的生物學信息,挖掘潛在的生物標記物,為疾病的治療提供新的策略。

鑒于乳腺癌在女性的高發病率和死亡率,不少學者進行乳腺癌研究。早期診斷和分子靶向治療迫切需要確定決定乳腺癌進展、轉移和不良預后的關鍵基因。Li 等[5]研究表明,LAPTM4B、VEGF 和核 survivin 的表達與乳腺癌患者的各種臨床病理特征和預后顯著相關,可以被視為乳腺癌的治療靶點。文獻研究報道一些與乳腺癌不良預后分子生物標記物,如 KPNA2 有助于關鍵蛋白的異常定位和乳腺癌的預后不良[6],RASSF1A 甲基化對女性乳腺癌預后不良的預測作用[7]等。本研究通過分析基因表達數據庫(gene expression omnibus,GEO)中基因芯片,旨在探討乳腺癌不良預后的關鍵差異基因,希望能獲得更多與乳腺癌預后相關的分子機制的生物學信息,為治療乳腺癌提供新的靶點。

1 資料與方法

1.1 微陣列數據集下載

美國國立生物技術中心(NCBI)的 GEO 數據庫是一個免費的基因表達公共數據庫(https:// www.ncbi.nlm.nih.gov/geoprofiles/),從 GEO 下載乳腺癌的微陣列數據集 GSE15852。芯片信息:[HG-U133A] Affymetrix Human Genome U133A Array,ID:20097481,平臺:GPL96。該數據集包含 43 例乳腺癌組織和 43 例正常乳腺組織基因表達數據。

1.2 方法

1.2.1 差異表達基因分析 用GEO2R在線工具篩選乳腺癌標本與正常乳腺標本之間的差異表達基因(differentially expressed genes,DEGs),篩選條件|logFC| > 2(FC 為差異倍數),矯正后值 < 0.01。logFC < 0 的 DEGs 為下調基因,log FC > 0 的 DEGs 為上調基因。

1.2.2 基因本體論和京都基因與基因組百科全書通路富集分析 DAVID 是一個在線生物信息學工具,用于基因/蛋白質功能注釋和功能基因集富集。將篩選的 DEGs 輸入 DAVID6.8(https://david. ncifcrf.gov)進行基因本體論(gene ontology analysis,GO)功能注釋,包括生物過程(biological processes,BP)、分子功能(molecular function,MF)、細胞成分(cell component,CC);京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析,尋找差異表達基因富集的關鍵信號通路。以< 0.05 認為差異具有統計學意義。

1.2.3 蛋白質-蛋白質相互作用關系網絡和模塊分析 采用 STRING11.0 數據庫(https://string-db. org/cgi/input.pl),設置置信度為 0.04,構建乳腺癌差異表達基因蛋白質-蛋白質相互作用關系網絡(protein-protein interaction networks,PPI),用Cytoscape 3.7.2 軟件進行對 PPI 網絡可視化,并用 Cytoscape 軟件的 MCODE 插件進行模塊分析,篩選關鍵基因。

1.2.4 生存分析 通過在線數據庫 Kaplan-Meier Plotter(https://kmplot.com/analysis/)中乳腺癌樣本的生存率,對“1.2.3”中 MCODE 篩選出的關鍵基因進行總生存(overall survival,OS)分析。logrank< 0.05 被認為具有統計學意義。篩選出乳腺癌患者生存率較差的基因,采用基因表達譜交互分析(gene expression profiling interactive analysis,GEPIA)進一步驗證,獲取與乳腺癌不良預后的關鍵基因。

2 結果

2.1 差異基因表達

GEO 在線工具GEO2R 基因芯片 GSE15852 進行分析,以 |logFC| > 2 和矯正后< 0.01 為標準,篩選出 57 個差異表達基因,其中上調基因17 個,下調基因 40 個(表 1)。

2.2 GO 功能富集分析和 KEGG 通路富集分析

通過 DAVID 網站對 57 個差異表達基因進行 GO 功能富集分析和 KEGG 通路富集分析,GO 分析包括生物過程(BP)、細胞成分(CC)和分子功能(MF)。結果表明,上調基因顯著富集在雌激素反應、對細胞運動的負調控反應、心臟右心室形態發生、交感神經系統發育、細胞-細胞黏附及輸尿管的萌芽發育等生物過程;主要聚焦于造血細胞系信號通路。而下調基因顯著富集在脂質代謝、分解、存儲過程,膽固醇的儲存、轉運,甘油三酯的合成分解代謝,血管生成等生物過程;聚焦于 PPAR 信號通路、對脂肪細胞脂肪分解的調節作用、脂肪細胞因子信號通路等途徑(圖 1 和表 2)。

表 1 差異表達基因(17 個上調基因和40 個下調基因)(P < 0.01)

Figure 1 Genes ontology enrichment analysis of differentially expressed genes (A: Up-regulated genes; B: Down-regulated genes;< 0.05)

表 2 差異表達基因 KEGG 通路富集分析(P < 0.05)

圖 2 差異表達基因的PPI 網絡和模塊分析(A:差異表達基因的PPI 網絡可視化結果;B:關鍵模塊;紅色為上調基因,藍色為下調基因,連接線表示差異表達基因之間的相互作用)

Figure 2 DEGs PPI network complex and the module analysis (A:Differentially expressed gene protein interaction network visualization results; B: Key module; Up-regulated genes were marked in red, down-regulated genes were marked in blue, and the lines show the interaction between the DEGs)

2.3 PPI 網絡和模塊分析

STRING11.0 在線數據庫構建 PPI 網絡。57 個差異表達基因中共有 37 個差異表達基因(14 個上調基因和 23 個下調基因)被過濾到 PPI 網絡復合體中,該復合體包括 37 個節點和 86 條邊,而 57 個 DEG 中有 20 個沒有過濾到 PPI 網絡復合體中(圖 2A)。然后,通過 Cytotype MCODE 插件識別關鍵模塊。以 Node Score Cutoff = 0.2,K-Core = 2,Max. Depth = 100 為標準,在 37 個節點中共鑒定出 7 個中心節點,均為上調基因(圖 2B)。

2.4 生存分析

7 個核心候選基因的預后信息可在免費的在線 Kaplan-Meier 繪圖儀數據庫中獲得。結果發現,3 個基因的總體存活率明顯較差,而 4 個基因的總體存活率無顯著性差異(< 0.05,表 3 和圖 3)。隨后,利用 GEPIA 網站進一步驗證了總體存活率有顯著差異的 3 個基因在癌癥患者和正常人之間的表達狀況。結果表明,2 個基因(24 和)在乳腺癌()組織中的表達高于正常乳腺組織(< 0.01,圖 4)。高表達患者的生存率比低表達患者的更差。

表 3 7 個核心基因的預后信息

圖 3 核心基因的Kaplan-Meier 預后價值(Logrank P < 0.05 認為有統計學意義)

Figure 3 Prognostic values of the key genes by Kaplan-Meier Plotter (Logrank< 0.05 was considered statistically significant)

圖 4 基因表達譜交互分析進一步驗證核心基因CD24(A)和EPCAM(B)在BRCA 標本中的表達水平,并與正常標本進行對照(紅框表示癌組織組,灰色表示正常組織組,*P < 0.01;點表示每個樣本的表達)

Figure 4 Gene expression profiling interactive analysis was performed to further demonstrate the genes' expression level of core genes24 (A) and(B) in BRCA samples contrasted to normal samples (Red box means the cancer tissue group, gray means the normal tissue group,*< 0.01. The dots represented expression in each sample)

3 討論

乳腺癌是一種異質性疾病,根據雌激素受體(ER)、孕激素受體(PR)、人表皮生長因子受體2(HEGFR 2)和增殖標志物 Ki67(MKI67)[8-10]的表達可分為四大分子亞型。目前,乳腺癌患者的預后預測主要基于這一分類和常規的臨床病理特征,如組織學分級、組織學類型和 TNM 分期。然而,在臨床實踐中,腫瘤的異質性給治療效果和預后的預測帶來了極大的困難。近年來,乳腺癌生物學過程中涉及的分子機制研究取得了很大進展。隨著新批準的基因治療策略的出現[11],增加的癌基因正在被測試為癌癥的治療靶點。基因的變化已經被確認在乳腺癌的發生和發展中起著關鍵作用[12-15]。因此,需要進一步探索更有效的分子生物標記物用于乳腺癌的預防、診斷和治療。

本研究利用 GEO 數據庫的基因芯片 GSE15852 進行生物信息學分析乳腺癌組織與正常乳腺組織的差異基因,鑒定出 57 個差異表達基因,其中上調基因 17 個,下調基因 40 個。通過 GO 分析和 KEGG 通路分析,發現主要富集在細胞運動和脂質代謝等通路。文獻報道脂質對癌癥的影響已被廣泛研究,對不同的癌癥有不同的影響[16]。通過 PPI 網絡及 MCODE 挖掘出 7 個核心基因,進一步進行生存分析和 GEPIA 分析,發現 CD24 和 EPCAM 基因在癌癥中的表達高于正常組織,患者的生存率更低。CD24 是糖基-磷脂酰-肌醇連接的糖蛋白,在包括癌細胞在內的多種細胞類型中表達。文獻表明,CD24 在多種腫瘤發生和發展中起作用,包括肺癌、前列腺癌、卵巢癌等[17]。已經有報道表明24 的過表達對癌細胞中突變的 p53 蛋白的失活至關重要[18]。本研究們結果表明,24 是乳腺癌治療的關鍵基因,可以作為一種很有前途的治療靶點和預后標志物,與文獻[19-20]報道一致。我們試圖確定細胞內24 的位置,并確定位置是否影響腫瘤表型和患者預后,以便最終允許開發最優的24 定向治療。EPCAM 是一種跨膜糖蛋白,其過度表達被認為與不同腫瘤的增殖增強和惡性程度有關[21]。Baccelli 等[22]和Sadeghi 等[23]報道,的過表達提高了乳腺癌患者的轉移率,提示EPCAM 可能是一個潛在的惡性腫瘤的生物標志物,與本文結果一致。是乳腺癌中重要的過表達基因,可作為預后因素進行評估。

綜上所述,本研究利用 GEO 數據集結合生物信息學的綜合分析,發現 2 個核心基因與 BRCA 的進展和預后相關,可能會為 BRCA 潛在的生物標志物和生物學機制提供一些有用的信息和方向,為制定有效的診斷和治療策略提供參考。

[1] Bray F, Ferlay J, Soerjomataram I, et al. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries. A Cancer J Clin, 2018, 68(6):394-424.

[2] Miller KD, Nogueira L, Mariotto AB, et al. Cancer treatment and survivorship statistics, 2019. A Cancer J Clin, 2019, 69(5):363-385.

[3] Zheng S, Li M, Miao K, et al. SNHG1 contributes to proliferation and invasion by regulating miR-382 in breast cancer. Cancer Manag Res, 2019, 11:5589-5598.

[4] Song E, Song W, Ren M, et al. Identification of potential crucial genes associated with carcinogenesis of clear cell renal cell carcinoma.J Cell Biochem, 2018, 119(7):5163-5174.

[5] Li S, Wang L, Meng Y, et al. Increased levels of LAPTM4B, VEGF and survivin are correlated with tumor progression and poor prognosis in breast cancer patients. Oncotarget, 2017, 8(25):41282-41293.

[6] Alshareeda AT, Negm OH, Green AR, et al. KPNA2 is a nuclear export protein that contributes to aberrant localisation of key proteins and poor prognosis of breast cancer. Br J Cancer, 2015, 112(12):1929- 1937.

[7] Buhmeida A, Merdad A, Al-Maghrabi J, et al. RASSF1A methylation is predictive of poor prognosis in female breast cancer in a background of overall low methylation frequency. Anticancer Res, 2011, 31(9):2975-2981.

[8] Sorlie T, Tibshirani R, Parker J, et al. Repeated observation of breast tumor subtypes in independent gene expression data sets. Proc Natl Acad Sci U S A, 2003, 100(14):8418-8423.

[9] S?rlie T, Wang Y, Xiao C, et al. Distinct molecular mechanisms underlying clinically relevant subtypes of breast cancer: gene expression analyses across three different platforms. BMC Genomics, 2006, 7:127.

[10] Goldhirsch A, Wood WC, Coates AS, et al. Strategies for subtypes-dealing with the diversity of breast cancer: highlights of the St. Gallen International Expert Consensus on the Primary Therapy of Early Breast Cancer 2011. Ann Oncol, 2011, 22(8):1736-1747.

[11] Stein CA, Castanotto D. FDA-approved oligonucleotide therapies in 2017. Mol Ther, 2017, 25(5):1069-1075.

[12] Buys SS, Sandbach JF, Gammon A, et al. A study of over 35,000 women with breast cancer tested with a 25-gene panel of hereditary cancer genes. Cancer, 2017, 123(10):1721-1730.

[13] Li G, Guo X, Tang L, et al. Analysis of BRCA1/2 mutation spectrum and prevalence in unselected Chinese breast cancer patients by next-generation sequencing. J Cancer Res Clin Oncol, 2017, 143(10): 2011-2024.

[14] Cybulski C, Carrot-Zhang J, Klu?niak W, et al. Germline RECQL mutations are associated with breast cancer susceptibility. Nat Genet, 2015, 47(6):643-646.

[15] Dan X, Pu C, Mengjiao H, et al. An integrated bioinformatical analysis to evaluate the role of KIF4A as a prognostic biomarker for breast cancer. Onco Targets Ther, 2018, 11:4755-4768.

[16] Zhang J, Zhou YJ, Yu ZH, et al. Identification of core genes and clinical roles in pregnancy-associated breast cancer based on integrated analysis of different microarray profile datasets. Biosci Rep, 2019, 39(6):BSR20190019.

[17] Lee JH, Kim SH, Lee ES, et al. CD24 overexpression in cancer development and progression: a meta-analysis. Oncol Rep, 2009, 22(5):1149-1156.

[18] Wang L, Liu R, Ye P, et al. Intracellular CD24 disrupts the ARF–NPM interaction and enables mutational and viral oncogene-mediated p53 inactivation. Nat Commun, 2015, 6:5909-5919.

[19] Suyama K, Onishi H, Imaizumi A, et al. CD24 suppresses malignant phenotype by downregulation of SHH transcription through STAT1 inhibition in breast cancer cells. Cancer Lett, 2016, 374(1):44-53.

[20] Zhang P, Zheng P, Liu Y. Amplification of the CD24 gene is an independent predictor for poor prognosis of breast cancer.Front Genet, 2019, 10:560.

[21] van der Gun BT, Melchers LJ, Ruiters MHJ, et al. EpCAM in carcinogenesis: the good, the bad or the ugly. Carcinogenesis, 2010, 31(11):1913-1921.

[22] Baccelli I, Schneeweiss A, Riethdorf S, et al. Identification of a population of blood circulating tumor cells from breast cancer patients that initiates metastasis in a xenograft assay. Nat Biotechnol, 2013, 31(6):539-544.

[23] Sadeghi S, Hojati Z, Tabatabaeian H. Cooverexpression of EpCAM and c-myc genes in malignant breast tumours. J Genet, 2017, 96(1): 109-118.

Identification of key genes with poor prognosis in breast cancer by bioinformatical analysis

CAO Lin, HAN Li, YANG Ming, HAN Bin, LIU Fu

Department of Pharmacy, Affiliated Hospital of North Sichuan Medical College, Nanchong 637000, China

Bioinformatic method was used to analyze the gene expression database (GEO) gene chip data to screen core genes related to poor prognosis of breast cancer and to provide a new candidate target for the treatment of breast cancer.

Microarray dataset from GEO database GSE15852 was downloaded and differentially expressed genes (DEGs) were screened using GEO online tool GEO2R. Next, Gene Ontology and Kyoto Encyclopedia of Gene and Genome pathway enrichment analyses were performed using the online databases DAVID for selected DEGs. Protein-protein interaction relationship (PPI) was constructed based on STRING database and Cytoscape software, and the key genes were obtained by module analysis with MCODE plug-in of Cytoscape software. Then, overall survival analysis was performed using the Kaplan–Meier curve to screen core genes related to the prognosis of breast cancer, and the genes were further validated in gene expression profiling interactive analysis (GEPIA).

57 DEGs were identified in BRCA in the dataset, including 17 up-regulated genes largely enriched in the response to estrogen, negative regulation of cell motility, cardiac right ventricle morphogenesis, sympathetic nervous system development, cell-cell adhesion, viral process, ureteric bud development biological processes and hematopoietic cell lineage signaling pathway, and 40 down-regulated genes specifically enriched in lipid metabolic process, lipid transport, lipid storage, positive regulation of cholesterol storage, cholesterol transport, triglyceride catabolic process, angiogenesis biological processes, PPAR signaling pathway, regulation of lipolysis in adipocytes, and adipocytokine signaling pathway. By extracting key modules from the PPI network by Cytotype MCODE plugin, all 7 up-regulated genes were selected. In addition, survival analysis and gene expression profiling interactive analysis of key genes showed that the survival rate of patients with high expression of24 andgenes was lower than that of patients with low expression.

This study provides a basis for finding the key genes with poor prognosis of breast cancer and exploring new targets for the treatment of breast cancer.

Breast cancer; Bioinformatics; GEO database; Differentially expressed genes; Key genes

LIU Fu, Email: nclf91@163.com

四川省教育廳項目(18ZB0219)

劉福,Email:nclf91@163.com

10.3969/j.issn.1673-713X.2020.04.012

2020-02-26

猜你喜歡
關鍵乳腺癌數據庫
絕經了,是否就離乳腺癌越來越遠呢?
中老年保健(2022年6期)2022-08-19 01:41:48
高考考好是關鍵
乳腺癌是吃出來的嗎
胸大更容易得乳腺癌嗎
別逗了,乳腺癌可不分男女老少!
祝您健康(2018年5期)2018-05-16 17:10:16
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
獲勝關鍵
NBA特刊(2014年7期)2014-04-29 00:44:03
主站蜘蛛池模板: 日本AⅤ精品一区二区三区日| 国产精品久久自在自线观看| 亚洲一区二区三区国产精华液| 欧类av怡春院| 麻豆精品在线| 91精品国产丝袜| 无码一区18禁| 亚洲天堂网在线播放| 伊人婷婷色香五月综合缴缴情| 国产精品毛片一区| 亚洲三级视频在线观看| 真实国产精品vr专区| 99精品视频九九精品| 四虎国产永久在线观看| 鲁鲁鲁爽爽爽在线视频观看| 在线观看国产精美视频| 免费在线色| 丰满人妻被猛烈进入无码| 午夜福利视频一区| 曰韩人妻一区二区三区| 成人av手机在线观看| 国产在线日本| 91亚洲视频下载| 欧美日本在线一区二区三区| 97av视频在线观看| h视频在线播放| 色哟哟色院91精品网站| 国产日本欧美在线观看| 亚洲天堂.com| 日韩成人午夜| 国产精选自拍| 天堂网国产| 国产丰满成熟女性性满足视频| v天堂中文在线| 亚亚洲乱码一二三四区| 久久久久久高潮白浆| 国产无码高清视频不卡| 久久国产精品77777| a天堂视频在线| 99久久精品国产自免费| 亚洲国产精品无码AV| 国产亚洲视频播放9000| 91精品情国产情侣高潮对白蜜| 亚洲国产成人超福利久久精品| 欧美不卡视频在线| 国产9191精品免费观看| 青青草国产免费国产| 久久超级碰| 72种姿势欧美久久久大黄蕉| 婷婷午夜天| 在线看国产精品| 国产无吗一区二区三区在线欢| 国产精品乱偷免费视频| 99无码中文字幕视频| 亚洲日韩AV无码精品| 欧美啪啪网| 美女被狂躁www在线观看| 欧美日韩专区| 久久久久亚洲AV成人人电影软件| 亚洲综合欧美在线一区在线播放| 在线观看视频一区二区| 精品视频一区二区观看| 亚洲中文字幕国产av| 国产精品短篇二区| 国产女人18毛片水真多1| 人妻少妇乱子伦精品无码专区毛片| 欧美综合成人| 91视频免费观看网站| 亚洲区视频在线观看| 日韩av高清无码一区二区三区| 免费a级毛片18以上观看精品| 大学生久久香蕉国产线观看| 欧美日韩资源| 99视频在线精品免费观看6| 国产熟睡乱子伦视频网站| 99热亚洲精品6码| 亚洲AV无码一二区三区在线播放| 成年人国产视频| 狠狠v日韩v欧美v| 18禁影院亚洲专区| 久操中文在线| 免费又爽又刺激高潮网址|