999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

生物信息學分析食管癌關鍵基因的表達及其臨床意義

2023-10-20 05:55:54趙立然
癌變·畸變·突變 2023年5期
關鍵詞:標準化數據庫差異

趙立然,卜 梁*

(1.廈門大學附屬翔安醫院胸外科,福建 廈門 361100;2.廈門大學醫學院,福建廈門 361100)

食管癌是世界上常見的癌癥之一[1],是世界上第8常見的癌癥,也是導致癌癥死亡的第6 大原因。因其具有較強的侵襲、遷移能力和較差的預后,5 年生存率僅為15%~25%[2]。食管癌的危險因素包含環境、遺傳和表觀遺傳因素,如吸煙和飲酒,以及改變細胞生長的表觀遺傳和遺傳調節的變化[3]。食管癌早期通常無癥狀,但單獨吞咽困難或伴有體質量意外減輕是最常見的癥狀。由于早期診斷的篩查方法不夠有效,大多數人在確診時失去了根治性切除的機會[4]。此外,長期服用抗癌藥物(包括順鉑)的患者通常會出現耐藥性,也會導致癌癥復發。化療、放療和手術治療后仍有許多患者出現疾病進展和復發[5]。新的治療方法和腫瘤分子標志物的發現對確定治療靶點和改善患者預后具有重要意義。因此,研究食管癌的病理機制,尋找早期檢測標志物,提高患者的生存時間和預后迫在眉睫。

1 材料與方法

1.1 數據來源

選取GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/)中食管癌的基因表達譜芯片GSE38129[6]和GSE20347[7]。GSE38129 包含30 例食管癌組織樣本,30 例癌旁正常組織樣本。GSE20347 包含17 例食管癌組織樣本,17例癌旁正常組織樣本。

1.2 數據處理

使用GEOquery 包在基因表達綜合數據庫(Gene Expression Omnibus,GEO)中下載兩個食管癌芯片數據集GSE38129,GSE20347。首先對兩個芯片數據集進行整合,再用R 語言中的sva 包去除批次效應,然后對標準化數據集進行主成分分析(principal component analysis,PCA)。進一步,對標準化后的基因芯片數據集進行差異分析,使用Limma 包,設置差異表達基因(differently expressed genes,DEGs)閾值為|log2(FC)|>1.5 且P<0.01 進行篩選,以降低假陽性結果的產生,FC指基因表達的差異倍數(fold change)。

1.3 DEGs的富集分析

利用clusterProfiler包對上調和下調DEGs分別進行基因本體(gene ontology,GO)功能和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析,以P<0.05作為納入標準。

1.4 蛋白互作網絡分析

將篩選出的DEGs導入STRING(https://cn.string-db.org/)網站,進行權重算法分析并構建蛋白互作網絡(protein-protein interaction,PPI),選取combined score≥0.9(highest confidence)作為納入標準,將結果導入Cytoscape 軟件,應用MCODE 及CytoHubba 插件提取核心模塊及Hub gene。

1.5 關鍵基因在UALCAN 數據庫里的信息檢索與表達差異分析

分析DEGs 在多種腫瘤中的表達情況,及其在食管癌和正常組織中的表達水平以及與分期、性別、年齡、TP53 突變的關系,并探索DGEs 表達與自身啟動子甲基化水平的關系。篩選步驟為:①UALCAN 網站輸入關鍵基因名稱;②探索泛癌視圖,查看食管癌和其他癌癥中關鍵基因的表達情況;③探索關鍵基因在該數據庫納入的食管癌患者與正常人群中的表達,選擇分期、性別、年齡、啟動子甲基化水平、TP53突變選項分析。

1.6 關鍵基因表達與疾病預后相關性

使用GEPIA(http://gepia.cancer-pku.cn/)數據庫對經UALCAN 數據庫篩選出的相關基因在食管癌患者和正常人群中的表達再次驗證,繪制Kaplan-Meier 生存曲線,探究關鍵基因表達是否影響食管癌患者的預后。

2 結果

2.1 評價批次效應去除結果、評估標準化數據集合理性與DEGs篩選結果

A:部分數據集單個樣本表達量;B:部分標準化數據集單個樣本表達量.

R語言中的sva包對數據集去除批次效應后得到標準化數據集,使用箱線圖來評估批次效應去除效果,標準化數據集樣本表達量分布情況比原始數據集更加集中,部分標準化數據集與數據集中單個樣本表達量的數據如圖1 所示。對標準化數據集進行主成分分析(PCA),如圖2顯示該數據集中食管癌組與正常對照組組間差異大,絕大部分組內差異較小在正常誤差范圍內,從而可進一步分析。在標準化數據集GSE38129_GSE20347 中,設置篩選標準為|log2(FC)|>1.5且P<0.01,共篩選出390個顯著差異表達基因,其中上調基因166 個,下調基因224 個。根據篩選出的390 個顯著差異基因,利用Volcano Plot 包繪制火山圖,對這些基因進行可視化展示如圖3 所示。在上調和下調基因中挑選log2(FC)降序排名前10 基因,繪制差異基因聚類熱圖進行可視化展示如圖4。

圖2 標準化數據集的主成分分析

圖3 390個顯著差異基因火山圖

圖4 差異基因聚類熱圖

2.2 DEGs的GO和KEGG富集分析

對上調和下調基因進行GO 和KEGG 富集分析,GO 分析表明上調基因參與的生物進程有:有絲分裂細胞周期相變、細胞外基質組織、細胞外結構組織生成等,下調基因與表皮發育、角質細胞分化、皮膚發展等功能密切相關(均為P<0.05),部分上、下調基因分別GO富集結果的信息見表1,部分DEGs的GO富集結果如分子功能(molecular function,MF)、生物過程(biological process,BP)和細胞組成(cellular component,CC)可視化見圖5。

圖5 部分差異基因的GO分析結果

KEGG 通路富集分析結果顯示,上調基因主要涉及細胞周期、細胞外基質受體相互作用、阿米巴病等信號通路(均為P<0.05),部分上調基因的KEGG 富集信號通路可視化如圖6 所示。下調基因主要與視黃醇代謝、不飽和脂肪酸的生物合成、5-羥色胺能神經突觸等信號通路密切相關(均為P<0.05),部分下調基因的KEGG 富集信號通路可視化如圖7 所示。部分上、下調基因分別KEGG富集結果的信息見表2。

表2 食管癌組織差異基因KEGG富集分析結果

圖6 上調差異基因KEGG分析結果

圖7 下調差異基因KEGG分析結果

2.3 DEGs的PPI、中心模塊及核心基因篩選

將DEGs 導入STRING 網站構建PPI,得到的結果導入Cytoscape 軟件,使用MCODE 插件,對所得網絡進行提取分析,得到了4 個中心模塊,選最主要的模塊分析,使用CytoHubba 中的MCC 算法,篩選出評分最高的前20 個核心基因(CDK1、ASPM、TOP2A、AURKA、CCNB2、CDC20、AURKB、NUSAP1、KIF20A、BUB1、DLGAP5、TPX2、BUB1B、KIF2C、NDC80、PBK、TTK、NEK2、PRC1、KIF4A),它們之間的關系如圖8 所示,基因間聯系密切,可能在食管癌的發生、發展中起著協同作用。

圖8 20個關鍵基因蛋白互作網絡

2.4 CDK1、TOP2A、AURKA在GEPIA與UALCAN數據庫里的表達差異分析

在UALCAN數據庫中對這20個關鍵基因進行泛癌驗證,篩選出CDK1、TOP2A、AURKA在食管癌中的表達顯著高于正常組織(均為P<0.05,見圖9A、10A、11A)。在GEPIA數據庫中,CDK1、TOP2A、AURKA在食管癌中的表達也顯著升高(均為P<0.05,見圖9B、10B、11B)。在UALCAN 數據庫中,CDK1、TOP2A、AURKA與正常組織比較,在I~IV期表達均升高,且各期與正常組織表達水平間差異均有統計學意義(P<0.05,見圖12A~C)。表達在性別、年齡、TP53 突變狀態方面與正常組織比較,差異均有統計學意義(P<0.05,性別分類見圖12D~F,年齡分類見圖12G~I,TP53突變狀態分類見圖12J~L),甲基化分析結果顯示,食管癌組織中CDK1、TOP2A、AURKA啟動子甲基化表達水平升高,差異具有統計學意義(P<0.05,見圖13A~C)。以上指標均證明CDK1、TOP2A、AURKA與食管癌的發展有關。

圖9 CDK1在食管癌腫瘤組織和正常組織的表達差異

圖10 TOP2A在食管癌腫瘤組織和正常組織的表達差異

圖12 CDK1、TOP2A、AURKA表達水平與臨床資料相關性

圖13 CDK1、TOP2A、AURKA在腫瘤組織和正常組織中的啟動子甲基化水平

2.5 生存分析

把UALCAN 得到的相關基因輸入GPEPIA 數據庫進行驗證,結果顯示CDK1、AURKA與食管癌預后密切相關,CDK1高表達組總生存期(overall survival,OS)顯著低于低表達組(HR=1.8,P=0.036,見圖14A),AURKA高表達組OS 亦顯著低于低表達組(HR=2,P=0.033,見圖14A),利用芯片數據集GSE70409 對3 個基因進行再次驗證,CDK1、TOP2A、AURKA在食管腫瘤組織中表達顯著上調,與標準化數據集趨勢表現一致(見表3)。

表3 食管癌中CDK1、TOP2A及AURKA在3個數據集的差異表達

圖14 CDK1、TOP2A、AURKA表達水平與食管癌預后的生存曲線

3 討論

本研究通過生物信息學方法,對食管癌基因芯片GSE38129、GSE20347 進行整合并標準化處理,共得到390個DEGs,其中166個上調,224個下調。GO和KEGG 富集分析結果顯示上調基因涉及有絲分裂細胞周期相變、細胞外基質組織構成等功能以及細胞周期、細胞外基質受體相互作用等信號通路。下調基因與表皮發育、角質細胞分化等功能和5-羥色胺能神經突觸等信號通路密切相關。通過PPI和cytohubba 插件選出20 個關鍵基因,在UALCAN 和GEPIA 數據庫中進行表達差異分析及生存分析驗證,顯示基因CDK1、TOP2A及AURKA可能與食管癌的發生、發展密切相關。

細胞周期蛋白依賴性激酶(CDK)屬于蛋白激酶家族成員一種;其中,CDK1通過G2/M期轉變和激活同源重組(HR)DNA修復途徑在細胞周期進程中發揮關鍵作用。癌細胞以永久性增殖、分裂,不受控制為特點,因此CDK1 在其生存中充當著不可替代的角色。細胞周期中有序的G2/M 轉換由CDK1/CCNB 復合物控制。CDK1 參與多種癌癥的發展,例如乳腺癌、膠質瘤、肝癌等。Zou 等[8]研究表明CDK1 中mRNA 表達在包括HCC 在內的多種腫瘤組織中上調。CDK1 的高表達與HCC 患者的較差預后相關,CDK1 較低的啟動子甲基化可能導致HCC腫瘤組織中較高的表達水平。目前,已經開發了多種用于癌癥治療的CDK1 抑制劑,這些抑制劑可誘導延長的G2 停滯和/或使細胞對腫瘤細胞中的DNA 損傷劑敏感,從而導致細胞死亡[9]。CDK1 藥物抑制劑包括:Rigosertib(III 期)、BEY-1107(II 期)等,藥物臨床適應癥主要集中在胰腺癌和膠質瘤[10]。文獻顯示,食管癌中的CDK1明顯上調,BIRC5可能通過影響細胞周期通路在ESCC 中發揮重要作用,而CDK1 可能是該通路的樞紐基因[11]。而本研究也發現CDK1 在食管癌中的表達明顯上調,與上述文獻結果一致,但有關CDK1 在食管癌中的實驗及藥物研究并未見報道,需要開展進一步研究予以驗證。

DNA拓撲異構酶II Alpha(TOP2A)是一種蛋白質編碼基因,是復制過程的核心,已發現在包括乳腺癌在內的多種惡性腫瘤中失調。TOP2A是染色質拓撲結構的保守調節劑,可催化可逆的DNA 雙鏈斷裂(DSB),對于在轉錄、復制和細胞分裂等多種動態過程中維持基因組完整性至關重要。有研究表明TOP2A在乳腺癌組織中高度過表達,TOP2A的過表達與較差的總生存期和無復發生存期相關[12]。此外,TOP2A 顯示與腫瘤間質高度相關,尤其是與骨髓來源的抑制細胞。Liu等[13]研究發現MDM4 和TOP2A 相互結合并在翻譯后表達水平上調,導致TOP2A 蛋白穩定、p53 抑制和腫瘤細胞增殖增加,揭示了MDM4和TOP2A的新功能以及它們在腫瘤發生中的相互作用,表明抑制MDM4-TOP2A相互作用可能代表了一種新的策略,可以特異性并同時靶向TOP2A 和MDM4 進行癌癥治療。Hailati 等[14]通過生物信息學分析得出TOP2A 可能為食管癌患者診斷和預后判斷的標志物。

細胞周期調節激酶(aurora kinase A,AURKA)屬于絲氨酸/蘇氨酸激酶家族,其激活對于通過調節有絲分裂的細胞分裂過程是必需的。Aurora 激酶家族由三種絲氨酸/蘇氨酸激酶Aurora-A/B/C 組成。其中,Aurora-A和Aurora-B在有絲分裂中發揮核心作用,而Aurora-C 在減數分裂中發揮獨特作用。激酶的過度表達或基因擴增已在廣泛的人類惡性腫瘤中得到報道,如AURKA 的異常擴增表達與人類結直腸癌、肺癌和白血病的化療耐藥密切相關[15],表明它們在腫瘤發生中作為有效致癌基因的作用。目前已經產生了許多激酶抑制劑(AKI);其中一些正在接受臨床評估。AURKA 的過表達已被證明會導致染色體畸變和基因組不穩定[16]。細胞實驗證實,USP3和AURKA在ESCC細胞中的高表達促進了腫瘤細胞的增殖和侵襲[17]。有研究報道了AURKA在人ESCC組織和細胞系中的表達上調,這種上調導致預后不良[18]。Aurora-A 可能在多西他賽化療敏感性中發揮重要作用,抑制其表達可能是ESCC的潛在治療靶點[19]。

差異基因的GO 功能和KEGG 富集分析顯示、有絲分裂細胞周期相變、表皮發育、細胞外基質組織、細胞周期、阿米巴病等信號通路與食管癌的發生、發展機制有著密切的聯系。本文局限之處在于,未對這些基因對于食管癌的具體臨床意義進行深究和驗證,但本研究為食管癌發病機制的研究提供了新的思路,后續將開展進一步的實驗驗證。

猜你喜歡
標準化數據庫差異
相似與差異
音樂探索(2022年2期)2022-05-30 21:01:37
標準化簡述
找句子差異
生物為什么會有差異?
標準化是綜合交通運輸的保障——解讀《交通運輸標準化體系》
中國公路(2017年9期)2017-07-25 13:26:38
數據庫
財經(2017年2期)2017-03-10 14:35:35
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
論汽車維修診斷標準化(上)
主站蜘蛛池模板: 国产在线麻豆波多野结衣| 久久综合结合久久狠狠狠97色| 国内精品九九久久久精品 | 手机永久AV在线播放| 国产一级裸网站| 国产成人高精品免费视频| 尤物视频一区| 日韩A∨精品日韩精品无码| 欧美成人a∨视频免费观看| 91精品国产91久无码网站| 亚洲一级无毛片无码在线免费视频| 国产一级毛片在线| 色天天综合| 国产精品尹人在线观看| 国产亚洲高清在线精品99| 久久人人妻人人爽人人卡片av| 黄色在线不卡| 亚洲成A人V欧美综合天堂| 日韩av无码精品专区| 亚洲国产系列| 日韩毛片免费| 制服丝袜一区二区三区在线| 伊人AV天堂| 99资源在线| 一级成人a毛片免费播放| 91视频精品| 国产无码精品在线| 久久国产高清视频| 亚洲天堂.com| 亚洲一区二区在线无码 | 四虎影视国产精品| 91午夜福利在线观看精品| 一本大道无码高清| 免费一级大毛片a一观看不卡| 亚洲欧洲一区二区三区| 人人91人人澡人人妻人人爽| 黄网站欧美内射| 毛片在线看网站| 国产精品女在线观看| 日韩高清成人| 色综合天天综合中文网| 久久婷婷五月综合色一区二区| 免费无遮挡AV| 国产xxxxx免费视频| 亚洲欧洲日韩国产综合在线二区| 99中文字幕亚洲一区二区| 国产视频自拍一区| 亚洲妓女综合网995久久 | 亚洲成a∧人片在线观看无码| 国产精品亚洲一区二区三区z| 国产91熟女高潮一区二区| 久草视频一区| 日韩美毛片| 人人91人人澡人人妻人人爽| 欧美亚洲欧美区| 日韩国产黄色网站| 国产精品女主播| 青青热久免费精品视频6| 亚洲一区网站| 亚洲精品麻豆| 国产av一码二码三码无码| 91精品国产自产在线观看| 欧美日韩免费观看| 国产无码网站在线观看| 久久性妇女精品免费| 五月天婷婷网亚洲综合在线| 女人18毛片一级毛片在线 | 麻豆精品在线播放| 中文无码精品a∨在线观看| 亚洲欧美另类日本| 国产97视频在线观看| a毛片在线播放| 韩国v欧美v亚洲v日本v| 99精品热视频这里只有精品7| 亚洲天堂视频网| 中文字幕 91| 日韩成人在线一区二区| 亚洲一级毛片免费观看| 久久精品视频亚洲| 亚洲成人在线免费观看| 朝桐光一区二区| 国内熟女少妇一线天|