999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TCGA 數(shù)據(jù)庫確定宮頸癌預(yù)后免疫相關(guān)性長鏈非編碼RNA 并構(gòu)建預(yù)后模型

2020-12-10 04:47:22底斐瑤王一鶴底澤亞袁瑞通訊作者
關(guān)鍵詞:數(shù)據(jù)庫分析模型

底斐瑤,王一鶴,底澤亞,袁瑞(通訊作者)

(1.重慶醫(yī)科大學(xué)附屬第一醫(yī)院婦產(chǎn)科,重慶;2.鄭州大學(xué)第一附屬醫(yī)院泌尿外科,河南 鄭州;3.北京大學(xué)信息科學(xué)技術(shù)學(xué)院,北京)

0 引言

宮頸癌是女性最常見的惡性腫瘤之一,發(fā)病率和死亡率均居女性常見惡性腫瘤的第四位;在世界范圍內(nèi),據(jù)統(tǒng)計(jì),每年大約有53 萬新發(fā)病例,27 萬死亡病例[1-3]。其病理類型最常見的是鱗狀細(xì)胞癌(squamous cell carcinoma,SCC),約占所有宮頸癌的70%[3,4],其他類型的宮頸癌相對(duì)少見。早期宮頸癌的標(biāo)準(zhǔn)治療方法為手術(shù)治療,晚期宮頸癌主要是放射治療和化學(xué)治療,由于耐藥性和復(fù)發(fā)性,治療效果有限[5,6],有文獻(xiàn)報(bào)道晚期宮頸癌五年生存率僅為16.8%[7],嚴(yán)重危害婦女身心健康。

近幾年,免疫治療逐漸興起。癌癥免疫治療是通過增強(qiáng)或觸發(fā)患者的免疫系統(tǒng)誘發(fā)機(jī)體抗腫瘤的治療總稱[8]。越來越多的研究表明免疫療法在癌癥治療中的可行性[9-11],這種治療方法為癌癥患者帶來了希望。特別是程序性死亡-1(PD-1)/(PD-L1)抑制劑在包括宮頸癌在內(nèi)的多種實(shí)體腫瘤中取得了療效,已獲得美國食品和藥物管理局(FDA)的批準(zhǔn)[8]。

長鏈非編碼RNA(long non-conding RNA,LncRNA)是轉(zhuǎn)錄長度大于200 個(gè)核苷酸的非編碼RNA,不具備編碼蛋白的能力[6],但是LncRNA 的過表達(dá)、缺失或者突變等對(duì)腫瘤的惡性生物學(xué)行為有驅(qū)動(dòng)作用[12,13]。例如,LncRNA-H19、LncRNAXIST、LncRNA-HOTAIR、LncRNA-NCK1-AS1、LncRNA-IGF2等的異常表達(dá)已被證明與宮頸癌的發(fā)生、發(fā)展及預(yù)后相關(guān)[14-21]。癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫是美國國家癌癥研究所和美國國家人類基因組研究組于2006共同發(fā)起建立的癌癥數(shù)據(jù)庫,該數(shù)據(jù)庫收集了常見腫瘤的臨床數(shù)據(jù)、長鏈非編碼RNA、差異表達(dá)基因、拷貝數(shù)變異、甲基化等,是重要的權(quán)威癌癥數(shù)據(jù)庫之一[22]。TCGA 數(shù)據(jù)病理診斷明確、來源可靠、免費(fèi)、公開,目前已被癌癥研究者廣泛使用。本研究基于TCGA 數(shù)據(jù)庫尋找與宮頸癌預(yù)后相關(guān)的免疫相關(guān)性LncRNA,并將確定的免疫相關(guān)性LncRNA 構(gòu)建宮頸癌預(yù)后模型,為宮頸癌的預(yù)后提供新的研究思路。

1 資料與方法

1.1 研究方法

從TCGA 數(shù)據(jù)庫中下載宮頸癌轉(zhuǎn)錄數(shù)據(jù)及臨床數(shù)據(jù),從Molecular Signatures Database 下載免疫相關(guān)基因,利用Strawberry Perl 軟件(版本 5.30.1,64-bit)對(duì)數(shù)據(jù)進(jìn)行分析與合并,通過R 軟件對(duì)數(shù)據(jù)進(jìn)行處理和分析。首先通過構(gòu)建免疫基因-LncRNA 共表達(dá)網(wǎng)絡(luò),篩選出免疫相關(guān)性LncRNA。通過單因素COX 回歸篩選具有預(yù)后價(jià)值的LncRNA。通過多因素COX 回歸分析構(gòu)建預(yù)后模型,根據(jù)赤池信息量準(zhǔn)則(Akaike information criterion,AIC)值確定最佳模型。根據(jù)風(fēng)險(xiǎn)評(píng)分的中位數(shù)將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,運(yùn)用R 軟件對(duì)兩組患者進(jìn)行生存分析。我們使用受試者接受特征(receiver operating characteristic,ROC)曲線對(duì)模型進(jìn)行評(píng)價(jià),并與T 等級(jí)、N 等級(jí)、Grade 等級(jí)、年齡等臨床特征進(jìn)行比較。最后將得到的關(guān)鍵LncRNA 與宮頸癌臨床特征進(jìn)行相關(guān)性分析。

1.2 數(shù)據(jù)收集及處理

2020年5 月,從癌癥基因組圖譜(TCGA)數(shù)據(jù)庫(https://tcga-data.nci.nih.gov/tcga/)CSCC 項(xiàng)目下載宮頸癌患者的轉(zhuǎn)錄表達(dá)數(shù)據(jù)及臨床資料。利用strawberry perl(版本 5.30.1,64-bit)腳本語言軟件用于獲取整合轉(zhuǎn)錄組LncRNA 表達(dá)數(shù)據(jù)和相應(yīng)的臨床資料;其中基因表達(dá)數(shù)據(jù)提取包括基因名稱、樣本編號(hào)、和表達(dá)值。

患者納入標(biāo)準(zhǔn):1)腫瘤原發(fā)于宮頸;2)病理證實(shí)為鱗狀細(xì)胞癌;3)數(shù)據(jù)類型為轉(zhuǎn)錄組;4)數(shù)據(jù)類型:基因表達(dá)量;5)可獲得患者的總體生存時(shí)間;

由于本研究制定的模型與預(yù)后相關(guān),因此排除標(biāo)準(zhǔn)如下:

1)排除生存時(shí)間≤30 天的患者;2)總體生存時(shí)間未知或者生存狀態(tài)未知的患者。

從Molecular Signatures Database 獲取免疫相關(guān)基因即Immune System process 基 因 集,編 號(hào):M13664, Immune Response 基因集,編號(hào):M19817。

1.3 確定顯著差異的免疫相關(guān)性LncRNA

獲得表達(dá)數(shù)據(jù)后,在R 軟件中(版本 3.6.2),使用“l(fā)imma package” 和 “cor.test” 函數(shù)進(jìn)行共表達(dá)分析,其中“cor.test”函數(shù)可得到LncRNA 與免疫基因的相關(guān)系數(shù),從而確定有顯著差異的免疫相關(guān)性LncRNA(設(shè)置標(biāo)準(zhǔn):P<0.001,相關(guān)系數(shù)COR 絕對(duì)值大于0.4)。

1.4 確定與預(yù)后相關(guān)的LncRNA 并建立風(fēng)險(xiǎn)評(píng)估模型

為篩選與宮頸癌預(yù)后相關(guān)的免疫相關(guān)性LncRNA,我們?cè)赗 軟件中使用“Survival package”進(jìn)行單因素Cox 回歸分析(P<0.01 認(rèn)為有統(tǒng)計(jì)學(xué)差異)篩選出影響宮頸癌預(yù)后的免疫相關(guān)性LncRNA。我們根據(jù)上一步篩選出的LncRNA 在每位患者中的表達(dá)量,通過Cox 回歸分析獲得每個(gè)LncRNA 的風(fēng)險(xiǎn)系數(shù),計(jì)算模型AIC 值并對(duì)其進(jìn)行調(diào)整,AIC 值最高者即為最優(yōu)模型,計(jì)算得到患者的風(fēng)險(xiǎn)評(píng)分Risk,計(jì)算公式如下;其中exp 代表LncRNA 的表達(dá)量。

根據(jù)風(fēng)險(xiǎn)評(píng)分的中位值,Risk ≥中位值的患者為高風(fēng)險(xiǎn)組,Risk<中位值低風(fēng)險(xiǎn)組,利用R 包“Survival package”進(jìn)行生存分析(P<0.05 認(rèn)為有統(tǒng)計(jì)學(xué)差異)。根據(jù)每位患者的風(fēng)險(xiǎn)值利用R 軟件繪制風(fēng)險(xiǎn)狀態(tài)圖,風(fēng)險(xiǎn)熱圖。風(fēng)險(xiǎn)熱圖使用的R 包“Pheatmap”。為了驗(yàn)證模型,我們?cè)赗 軟件中使用ROC 工作曲線評(píng)估每個(gè)危險(xiǎn)因素的價(jià)值。

1.5 LncRNA 與臨床的關(guān)系

為了確定LncRNA 與臨床之間的關(guān)系,我們將從TCGA中下載的臨床數(shù)據(jù)進(jìn)行篩選,剔除臨床情況未知的患者。在R 軟件中,使用“ggpubr package”評(píng)估LncRNA 表達(dá)量與T分期,M 分期,N 分期和Grade 分級(jí)的相關(guān)性,并將其可視化(P<0.05 認(rèn)為有統(tǒng)計(jì)學(xué)差異)。

2 結(jié)果

2.1 創(chuàng)建免疫基因-LncRNA 共表達(dá)網(wǎng)絡(luò),篩選免疫相關(guān)性LncRNA

首先我們從TCGA 數(shù)據(jù)庫中獲取255 例宮頸癌樣本,通過構(gòu)建免疫-LncRNA 共表達(dá)網(wǎng)絡(luò)來篩選有顯著差異的免疫相關(guān)性LncRNA,最終篩選出637 個(gè)LncRNA。

2.2 確定與宮頸癌預(yù)后相關(guān)的免疫相關(guān)性LncRNA

我們利用R 包 “Survival Package”將上一步鑒定的LncRNA 與TCGA 數(shù)據(jù)庫中下載的255 例宮頸癌患者的生存時(shí)間及生存狀態(tài)進(jìn)行單因素COX 回歸分析(P<0.01 認(rèn)為有統(tǒng)計(jì)學(xué)差異)篩選出34 個(gè)LncRNA(圖1)。

圖1 單因素COX 回歸篩選出和宮頸癌預(yù)后相關(guān)的LncRNA

2.3 構(gòu)建宮頸癌預(yù)后有關(guān)的模型并進(jìn)行生存分析和繪制風(fēng)險(xiǎn)曲線圖

基于多因素COX 回歸和AIC 值篩選出構(gòu)成最優(yōu)模型的8 個(gè)關(guān)鍵的免疫相關(guān)性LncRNA(表1),根據(jù)風(fēng)險(xiǎn)評(píng)分模型,計(jì)算每個(gè)患者的預(yù)后風(fēng)險(xiǎn)評(píng)分Risk,并根據(jù)中位數(shù)將患者分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組以構(gòu)建預(yù)后模型。為了進(jìn)一步驗(yàn)證模型的預(yù)測(cè)能力,將高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組進(jìn)行生存分析顯示,高風(fēng)險(xiǎn)組較低風(fēng)險(xiǎn)組生存率有差異(P<0.05 認(rèn)為有統(tǒng)計(jì)學(xué)意義)(圖2)。根據(jù)每位患者的風(fēng)險(xiǎn)值利用R 軟件繪制風(fēng)險(xiǎn)狀態(tài)圖顯示:隨著風(fēng)險(xiǎn)值增加,死亡人數(shù)逐漸增加(圖3A);風(fēng)險(xiǎn)熱圖顯示:AC004540.2、AL365203.2 表達(dá)量隨著風(fēng)險(xiǎn)值增加逐漸增加;相反ATP2A1-AS1、AC096992.2、AC004847.1、AC097468.3、AC099568.2 表達(dá)量隨著風(fēng)險(xiǎn)值增加逐漸降低。LncRNA;AC105277.1 表達(dá)量隨著風(fēng)險(xiǎn)值增高變化不明顯(圖3B)。

表1 多因素COX 回歸篩選出用于構(gòu)建模型的免疫相關(guān)性lncRNA

圖2 將高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組進(jìn)行K-M 生存分析

圖3 A:風(fēng)險(xiǎn)狀態(tài)圖

圖3 B:風(fēng)險(xiǎn)熱圖

2.4 利用ROC 曲線評(píng)價(jià)模型

為了進(jìn)一步評(píng)估模型的準(zhǔn)確性,將風(fēng)險(xiǎn)值及臨床性狀共同繪制ROC 曲線(圖4)顯示:風(fēng)險(xiǎn)評(píng)分模型AUC 值(ROC曲線下面積)為0.758,較其他臨床特征作為預(yù)后因素準(zhǔn)確性高。

圖4 ROC 曲線評(píng)價(jià)宮頸癌預(yù)后模型

2.5 確定LncRNA 與臨床的關(guān)系

我們將從TCGA 中下載的臨床數(shù)據(jù)進(jìn)行篩選,剔除臨床情況未知的患者。在R 軟件中,評(píng)估LncRNA 表達(dá)量與T 分期的相關(guān)性,并將其可視化。結(jié)果顯示AC099568.2、AC105277.1 與T 分期具有相關(guān)性(P<0.05 認(rèn)為有統(tǒng)計(jì)學(xué)差異),其表達(dá)量隨著T 分期增加逐漸降低(圖5)。

圖5 將8 個(gè)LncRNA 與宮頸癌臨床T 分期進(jìn)行臨床相關(guān)性分析,*代表P<0.05,ns 代表P>0.05

3 討論

晚期宮頸癌患者一般采取傳統(tǒng)的放射治療和化學(xué)治療,由于耐藥性和易復(fù)發(fā)性,治療效果欠佳[23,24],文獻(xiàn)報(bào)道宮頸癌患者的五年生存率仍低[7,23],這個(gè)問題亟需解決。隨著免疫治療在多種實(shí)體腫瘤的興起,宮頸癌的免疫治療也成為當(dāng)前研究熱點(diǎn)。越來越多的研究顯示LncRNA 的異常如突變、缺失或過表達(dá)等對(duì)腫瘤的發(fā)生、發(fā)展、轉(zhuǎn)移、復(fù)發(fā)等有驅(qū)動(dòng)作用[12,25-28],這為宮頸癌的研究提供了新的思路。夏艷[29]等研究顯示LncRNA TUG1 高表達(dá)與宮頸癌預(yù)后不良密切相關(guān)。Huang[30]等發(fā)現(xiàn)LncRNA PANDAR 在宮頸癌組織和細(xì)胞中的表達(dá)水平上調(diào),能促進(jìn)腫瘤的生長,與宮頸癌的不良預(yù)后相關(guān),提出PANDAR 可能是宮頸癌早期診斷的生物標(biāo)志物,并且是逆轉(zhuǎn)腫瘤惡性表型的潛在治療靶標(biāo)。HaoBo[31]等發(fā)現(xiàn),AFAP1-AS1 在宮頸癌中表達(dá)升高且甲基化不足,并且與宮頸癌患者預(yù)后不良相關(guān)。因此,本文利用生物信息學(xué)方法從TCGA 數(shù)據(jù)庫中提取宮頸癌相關(guān)信息,尋找與宮頸癌預(yù)后相關(guān)的免疫相關(guān)性LncRNA,構(gòu)建預(yù)后模型,為宮頸癌治療提供新的靶點(diǎn)。

我們從TCGA 數(shù)據(jù)庫下載宮頸癌轉(zhuǎn)錄組及臨床數(shù)據(jù),從Molecular Signatures Database 下載免疫相關(guān)基因,通過免疫基因-LncRNA 共表達(dá)篩選出637 個(gè)顯著差異的免疫相關(guān)性LncRNA。我們將這些LncRNA 與TCGA 數(shù)據(jù)庫中下載的宮頸癌患者的生存時(shí)間及生存狀態(tài)行單因素COX 回歸分析初步篩選出34 個(gè)與宮頸癌預(yù)后相關(guān)的LncRNA,基于多因素COX 回歸和AIC 值篩選出構(gòu)成最優(yōu)模型的8 個(gè)關(guān)鍵的LncRNA,分別為AC004540.2、AL365203.2、ATP2A1-AS1、AC096992.2、AC004847.1、AC097468.3、AC099568.2、AC105277.1。我們根據(jù)每個(gè)病人的LncRNA 表達(dá)量構(gòu)建預(yù)后風(fēng)險(xiǎn)模型,根據(jù)風(fēng)險(xiǎn)中位值將病人分為高風(fēng)險(xiǎn)組及低風(fēng)險(xiǎn)組。通過繪制風(fēng)險(xiǎn)熱圖可見AC004540.2、AL365203.2 表達(dá)量隨著風(fēng)險(xiǎn)值增加逐漸增加,考慮為危險(xiǎn)性LncRNA;相反ATP2A1-AS1、AC096992.2、AC004847.1、AC097468.3、AC099568.2 表達(dá)量隨著風(fēng)險(xiǎn)值增加逐漸降低,考慮為保護(hù)性LncRNA;AC105277.1 表達(dá)量隨著風(fēng)險(xiǎn)值增高變化不明顯,待臨床相關(guān)性實(shí)驗(yàn)進(jìn)一步驗(yàn)證。將高、低風(fēng)險(xiǎn)組進(jìn)行K-M 生存分析、繪制ROC 曲線評(píng)估模型的準(zhǔn)確性及預(yù)測(cè)能力。在K-M生存分析中,高風(fēng)險(xiǎn)組患者生存率顯著低于低風(fēng)險(xiǎn)組;ROC 曲線下面積為0.758,兩者結(jié)果一致,驗(yàn)證了預(yù)后模型的準(zhǔn)確性,聯(lián)合檢測(cè)這八個(gè)LncRNA 所創(chuàng)建的模型能較準(zhǔn)確地預(yù)測(cè)宮頸癌患者的三年和五年生存率,而且其有可能成為宮頸癌治療的潛在靶點(diǎn)。將確定的LncRNA 與患者臨床特征(T、N、M)進(jìn)行相關(guān)性分析,結(jié)果顯示AC099568.2、AC105277.1 與T 分期具有相關(guān)性(P<0.05 認(rèn)為有統(tǒng)計(jì)學(xué)差異),且其表達(dá)量隨著T 分期增加逐漸降低,提示其可能為宮頸癌預(yù)后的保護(hù)因素。

ZHOU[32]等人建立了舌鱗狀細(xì)胞癌(SCCT)患者的生存風(fēng)險(xiǎn)評(píng)估模型,通過生存分析顯示,AC105277.1 與SCCT患者整體生存率顯著相關(guān),認(rèn)為該LncRNA 有可能是預(yù)測(cè)SCCT 預(yù)后的生物標(biāo)志物之一。同樣地,在我們的研究中也發(fā)現(xiàn)AC105277.1 與宮頸癌的預(yù)后顯著相關(guān),因此,我們推測(cè)其可能成為宮頸癌的潛在治療靶點(diǎn)。我們的研究結(jié)果表明,AC004540.2、AL365203.2、ATP2A1-AS1、AC096992.2、AC004847.1、AC097468.3、AC099568.2 均與宮頸癌的預(yù)后密切相關(guān),但目前尚未發(fā)現(xiàn)關(guān)于它們的研究。在未來的研究中,這些LncRNA 在臨床上的價(jià)值仍然需要探索,我們認(rèn)為它們可能作為宮頸癌預(yù)后標(biāo)志物。我們計(jì)劃收集自己的臨床數(shù)據(jù)對(duì)本研究結(jié)果進(jìn)一步驗(yàn)證,并從分子生物學(xué)角度對(duì)其發(fā)生機(jī)制進(jìn)行研究探討。

綜上所述,我們通過TCGA 數(shù)據(jù)庫挖掘相關(guān)宮頸癌相關(guān)的生物學(xué)信息,創(chuàng)建免疫基因-LncRNA 共表達(dá)網(wǎng)絡(luò),確定了8 個(gè)與宮頸癌預(yù)后相關(guān)的免疫相關(guān)性LncRNA,為宮頸癌患者提供可能的免疫治療靶點(diǎn)。并基于此8 個(gè)LncRNA 構(gòu)建了宮頸癌預(yù)后模型,預(yù)測(cè)準(zhǔn)確性中等。將8 個(gè)LncRNA 與宮頸癌患者臨床特征進(jìn)行相關(guān)性分析,其中AC099568.2、AC105277.1 表達(dá)量隨著T 分期增加逐漸降低,提示其可能為宮頸癌預(yù)后的保護(hù)因素。但它們?cè)趯m頸癌中的作用機(jī)制有待進(jìn)一步研究和驗(yàn)證。

猜你喜歡
數(shù)據(jù)庫分析模型
一半模型
隱蔽失效適航要求符合性驗(yàn)證分析
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
電力系統(tǒng)不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
數(shù)據(jù)庫
電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
3D打印中的模型分割與打包
數(shù)據(jù)庫
數(shù)據(jù)庫
主站蜘蛛池模板: 欧美综合在线观看| 大陆精大陆国产国语精品1024| 日韩欧美网址| 亚洲中文久久精品无玛| 亚洲欧美在线综合一区二区三区| 亚洲—日韩aV在线| 亚洲精品在线影院| 4虎影视国产在线观看精品| 国产一线在线| 亚洲人成网址| 一区二区理伦视频| 亚洲AV无码一区二区三区牲色| 亚洲二区视频| 日本精品影院| 四虎亚洲精品| 亚洲成人在线网| 黄色网页在线观看| 狼友av永久网站免费观看| 97精品伊人久久大香线蕉| 精品视频一区二区观看| 免费看av在线网站网址| 日韩欧美一区在线观看| 老司机aⅴ在线精品导航| 中文字幕中文字字幕码一二区| 在线不卡免费视频| 99视频在线精品免费观看6| 久久婷婷六月| 无码AV日韩一二三区| 欧美无遮挡国产欧美另类| av大片在线无码免费| 国产呦精品一区二区三区网站| 国产鲁鲁视频在线观看| 99视频国产精品| 韩日无码在线不卡| 制服丝袜一区二区三区在线| 香蕉久人久人青草青草| 亚洲国产精品日韩专区AV| 欧美成人看片一区二区三区 | 日韩东京热无码人妻| 色成人亚洲| 亚洲精品老司机| 扒开粉嫩的小缝隙喷白浆视频| 另类欧美日韩| a级毛片在线免费| 国产一区二区网站| 国产精品香蕉| 欧美不卡在线视频| 成年人福利视频| 亚洲av日韩av制服丝袜| 国产精品永久在线| 97国产精品视频自在拍| 老司机午夜精品网站在线观看| a国产精品| 日韩在线中文| 国产91精品久久| 免费人成在线观看成人片| 青青草国产免费国产| 久久semm亚洲国产| 国产精品lululu在线观看| 亚洲—日韩aV在线| 亚洲国产天堂久久综合| 国产自产视频一区二区三区| 丁香婷婷在线视频| 日韩第一页在线| 中国精品久久| 亚洲人成影院午夜网站| 成人综合网址| 亚洲美女一区| 国产午夜无码专区喷水| 久热中文字幕在线| 免费精品一区二区h| 欧美日韩动态图| 免费a级毛片视频| 亚洲av片在线免费观看| 中文字幕调教一区二区视频| 亚洲一区色| 亚洲精品综合一二三区在线| 欧美成人精品在线| 依依成人精品无v国产| 亚洲精品在线观看91| 香蕉视频国产精品人| 亚洲区欧美区|