999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TCGA 和GEO 數據庫構建結腸癌預后模型

2022-01-11 01:10:12操利超盧曉萍張核子
醫學信息 2021年24期
關鍵詞:結腸癌模型

操利超,巴 穎,盧曉萍,張核子

(深圳市核子基因科技有限公司,廣東 深圳 518071)

結腸癌(colorectal cancer,CRC)是一種常見的惡性腫瘤,是世界上第二大致死原因[1]。盡管結腸癌的診斷和治療已經取得了很大的進展,但結腸癌患者通常會出現復發和轉移,導致5 年生存率顯著下降[2]。因此,迫切需要改善結腸癌患者的診斷、治療和預后。近些年來,分子診斷技術已廣泛應用于腫瘤的治療、預后領域[3-5]。生物信息學和機器學習技術已廣泛應用于腫瘤診斷或預后分子標志物的識別,這種分子標志物類型多種多樣,如microRNAs[6]、長鏈非編碼RNA[7]、差異表達基因[8]、DNA 甲基化[9]等。其中,差異表達基因作為潛在的腫瘤診斷或預后標志物應用最為廣泛。為得到廣泛驗證的結腸癌相關的差異表達基因,本文利用生物信息學方法,從多個數據集、不同的數據庫中尋找共同的結腸癌相關的差異表達基因,并進一步利用機器學習的方法,從這些差異基因中挑選出結腸癌預后相關的預測因子,并建立預后風險評估模型。

1 材料與方法

1.1 數據下載和獲取 通過GEO 數據庫(https://www.ncbi.nlm.nih.gov/geo/)下載基因芯片表達數據集GSE44076、GSE28000 和GSE39582,每個參考數據集的正常和腫瘤樣本情況見表1。TCGA 中mRNA表達數據集和對應的臨床信息從UCSC Xena 平臺(https://xenabrowser.net/datapages/)下載,選擇隊列為GDC TCGA Colon Cancer(COAD),樣本信息見表2。

表1 3 個GEO 數據集的樣本量情況

表2 TCGA 數據集的樣本信息[n(%)]

1.2 差異基因分析和統計分析 利用R 包分別對3個GEO 數據集和TCGA 數據集進行差異基因分析,過濾標準為adjustedP-value<0.05 和差異倍數1.5倍(|log2FC|>0.585),然后取交集,得到共同的上調差異基因和下調差異基因。

1.3 構建和評估預后風險評分模型 為了確定與生存相關的差異表達基因,使用R 包Survival 進行單變量Cox 比例風險回歸模型(P<0.05)。接著,使用LASSO 回歸分析進一步縮減預后因子數量,通過多因子回歸分析確定每個預后因子的回歸系數,建立預后風險評估模型,預測患者生存率。公式為:

1.4 繪制生存曲線和ROC 曲線 根據風險評分預后模型,計算每個腫瘤樣本的預后因子風險評分。利用R 包survivalROC 繪制ROC 曲線,用以展示構建的風險評估模型的敏感性和特異性。在ROC 曲線的轉折點選擇最佳風險評分臨界值,轉折點處真陽性和假陽性之間的差異最大。高于臨界值的患者屬于高危組,低于臨界值的患者屬于低危組。使用未配對t檢驗估計兩組正態分布變量的統計顯著性,并使用R 包Survminer 繪制兩組的生存曲線。

1.5 構建和驗證列線圖 為了提高預后模型的性能,通過整合風險評分模型和臨床信息,包括年齡、性別和腫瘤分期,可視化不同患者特征的預后價值,構建列線圖。該分析使用R 軟件包rms 繪制校準曲線,以評估預測概率,并與理想預測線進行比較。此外,基于單因子回歸分析的森林圖說明了臨床信息與OS 之間的關系。其中,一致性指數(C-index)表明了列線圖的預測準確性。

2 結果

2.1 差異基因分析 通過比較測試腫瘤樣本組和正常樣本組,TCGA 數據集和三個GEO 數據集的差異基因數量分布見表3 和圖1,可以看到共同的上調差異基因為48 個,共同的下調差異基因數為77 個。

表3 差異表達基因的統計信息

圖1 三個GEO 數據集和TCGA 數據集的差異基因數量情況

2.2 結腸癌預后模型的建立 通過單因子回歸分析表明,有14 個DEGs 與總生存期(OS)有關(P<0.05),見表4。進一步LASSO 回歸將基因數量縮減為10 個,見圖2。根據逐步回歸模型,Akaike 信息標準(AIC)為995.94,C 指數為0.63。

圖2 LASSO 回歸分析結果

表4 與結腸癌預后相關的基因信息

2.3 結腸癌預后模型的性能評估 使用預后模型公式計算每個結腸癌患者的風險評分,然后根據R軟件包survminer 中預后因子相關風險評分的最佳臨界值(cut-off 為0.16),將結腸癌患者分為高評分組和低評分組。結果顯示,隨著風險得分的增加,生存時間呈現縮短的趨勢,并且高危組的死亡比例比低危組高,高風險評分患者的OS 比低評分患者預后更差,其中基因CILP 和C7 在低風險組表達量低,在高風險組表達量低,而其余8 個基因趨勢相反,見圖3。

圖3 預后風險評分分組和評估

2.4 預后模型的統計分析 為了進一步評估預后風險評分模型的性能,繪制ROC 曲線和腫瘤分層分析。通過將風險評分的預后準確性作為一個連續變量進行研究,OS 預后模型的ROC 曲線下面積(AUC)在3 年時為0.628,4 年時為0.678,5 年時為0.730,見圖4。Wilcoxon 檢驗表明,較高的風險評分與較高的病理分期(P=0.0019)、T 分期(P=0.049)、M分期(P=0.003)、N 分期(P=0.0015)相關。

圖4 預后風險評估模型性能評價

2.5 列線圖模型的構建與驗證 在列線圖中,每個變量的得分可以在分數表上找到,然后通過計算總分來估計3 年、4 年和5 年的生存概率,見圖5A。森林圖顯示患者特征,包括年齡(>60)、腫瘤分期(Ⅲ和Ⅳ)和風險評分與OS 相關(P<0.05),見圖5B。為了驗證列線圖的性能,繪制校準曲線,可觀察到預測曲線接近理想曲線,性能良好,見圖5C~圖5E。此外,該列線圖(C-index:0.74)的預測準確性高于風險評分模型(C-index:0.63)。

圖5 列線圖模型的構建與驗證

3 討論

本研究中利用3 個GEO 數據集和TCGA 數據集來挖掘共同的差異表達基因。其中,GEO 數據集是基于基因芯片平臺,TCGA 數據集是基于二代測序平臺,不同數據集交叉驗證,使得得到的差異表達基因具有相對廣泛適用性。回歸分析研究表明,有10 個差異表達基因與結腸癌預后顯著相關。其中,SLC4A4 全稱Solute Carrier Family 4 Member 4,已有研究報道該基因在結腸癌患者中低表達,與結腸癌癌較差的預后相關,也與淋巴結浸潤和遠處轉移有關[10,11]。CD177 被認為是一種干細胞因子受體,有實驗證明CD177 可作為結直腸癌患者對含貝伐單抗的抗癌治療反應的潛在預測生物標記物[12]。另有研究[13]提出CD177 調節胃癌中的腫瘤細胞粘附和遷移,是生存預后的因素。有報道表明[14],CD177 的異常表達與結腸癌的發生發展相關。C7 作為一種潛在的腫瘤抑制因子,被報道與前列腺癌的免疫相關預后生物標志物[15]。此外,細胞膜上表達的C7 是過度促炎反應的調節因子[16],而非小細胞肺癌(NSCLC)中C7 的低表達可能是腫瘤抑制劑,與腫瘤進展和預后相關[16]。UGT2A3 是葡萄糖醛酸轉移酶(UGT)家族成員之一,UDP-葡萄糖醛酸轉移酶負責外源和內源性化合物的葡萄糖醛酸化,包括藥物、環境麻醉劑、類固醇、神經遞質、膽汁酸和其他激素。據報道,UGT2A3 主要在與藥物清除有關的組織中表達水平最高,其中肝臟是表達最多的器官,其次是胃腸道和腎臟。研究表明[17],原發性結腸癌肝轉移患者的UGT2A3 水平明顯高于無肝轉移患者。DNASE1L3 與自身免疫性疾病相關,它可以消化凋亡細胞釋放的微粒中的染色質,這是一種潛在的自身抗原,它的過度積累將導致身體產生自身免疫反應[18,19]。有研究表明,DNASE1L3 可能是結腸癌免疫浸潤的重要生物標志物,并將為結腸癌免疫治療靶點的選擇提供理論依據[20]。HEPACAM2 是粘附基因免疫球蛋白家族的成員,已有研究表明該基因與結腸癌的發生發展有關[21]。ITLN1 可作為多種癌癥的腫瘤抑制因子,如胃癌[22]、卵巢癌[23]、神經母細胞瘤[24]和結腸癌[25]。有研究通過免疫組織化學發現[25],148例大腸癌中87 例(59%)ITLN1 蛋白低表達,ITLN1表達低的結腸癌患者的M 分級高于ITLN1 表達高的結腸癌患者(P=0.0017),且ITLN1 表達高的患者比ITLN1 表達低的患者預后更為良好。MMP3 和MMP10 均屬于基質金屬蛋白酶(matrix metalloproteinase,MMP)家族,該家族成員參與正常生理過程中細胞外基質的分解,如胚胎發育、生殖和組織重構,以及疾病的發生發展。研究表明[26,27],MMP3 和MMP10 均可作為結腸癌的預后相關。CILP 基因編碼軟骨中間層蛋白,在早期骨關節病軟骨中增加,目前還未見該基因與腫瘤的相關性報道。

綜上所述,本研究基于以上10 個預后相關的基因,構建了結腸癌風險評分模型和列線圖模型,結果表明,構建的模型在結腸癌預后和腫瘤分層中表現良好,具有一定的應用價值。

猜你喜歡
結腸癌模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
MicroRNA-381的表達下降促進結腸癌的增殖與侵襲
3D打印中的模型分割與打包
結腸癌切除術術后護理
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
中西醫結合治療晚期結腸癌78例臨床觀察
結腸癌合并腸梗阻41例外科治療分析
帕瑞昔布鈉用于結腸癌術后鎮痛的療效觀察
主站蜘蛛池模板: 成人一区专区在线观看| 国产H片无码不卡在线视频| 国产精品午夜电影| 午夜福利在线观看成人| 久久免费视频6| a色毛片免费视频| 99ri国产在线| 国产午夜精品鲁丝片| 免费高清a毛片| 久久国产成人精品国产成人亚洲| 夜夜操国产| 色男人的天堂久久综合| 99热这里只有精品2| 亚洲首页国产精品丝袜| 99久久国产自偷自偷免费一区| 亚洲天堂视频网站| 成人福利在线看| 婷婷亚洲综合五月天在线| 久久综合伊人 六十路| 国产视频一二三区| 国产主播福利在线观看| 久久精品嫩草研究院| 2021国产精品自拍| 欧洲日本亚洲中文字幕| 国产新AV天堂| 在线不卡免费视频| 激情国产精品一区| 视频二区亚洲精品| 666精品国产精品亚洲| 高潮毛片无遮挡高清视频播放| 91免费精品国偷自产在线在线| 日本黄色a视频| 无码一区中文字幕| 高清无码一本到东京热| 日韩123欧美字幕| 亚洲妓女综合网995久久| 国产成人精品午夜视频'| 亚洲激情区| 干中文字幕| 日韩国产另类| 国产精品精品视频| 一级毛片在线播放| 国产69囗曝护士吞精在线视频| 91在线免费公开视频| 99在线国产| 日本不卡在线视频| 极品国产在线| 91人人妻人人做人人爽男同 | 永久成人无码激情视频免费| 国产精品人成在线播放| 91福利在线观看视频| 国产欧美专区在线观看| 日韩123欧美字幕| 日韩精品久久无码中文字幕色欲| 亚洲精品无码AⅤ片青青在线观看| 日韩成人在线网站| 欧美精品伊人久久| 日韩成人在线网站| 国产国语一级毛片在线视频| 丁香综合在线| 国产成人高清在线精品| 国产欧美在线观看精品一区污| 丰满的少妇人妻无码区| 欧美亚洲国产精品第一页| 欧美精品综合视频一区二区| 青青青伊人色综合久久| 欧美日韩国产在线观看一区二区三区 | 亚洲AⅤ综合在线欧美一区| 成人自拍视频在线观看| 久久无码高潮喷水| 国产成人高清精品免费软件| 国产成人久久777777| 国产真实二区一区在线亚洲| 试看120秒男女啪啪免费| 久久中文电影| 99久久人妻精品免费二区| 香蕉色综合| 精品人妻无码区在线视频| 国产无码在线调教| a级毛片网| 91在线精品免费免费播放| 国产男女XX00免费观看|