賈二娜,郭 博,周長玉*
(吉林大學中日聯誼醫院 1.消化內科;2.胸外科,吉林 長春130033)
結腸癌是世界范圍內發病率位居第三的惡性腫瘤,年發病率高達1400萬人,死亡率高達69.4萬人[1]。在我國,結腸癌是癌癥相關死亡疾病的第5大原因。約有75%的結腸癌診斷時已發展至臨床晚期,5年生存率僅有14%;而早期診斷可顯著降低死亡率,5年生存率可達到90%[2]。目前,對于結腸癌高風險人群推薦的篩查方法主要有結腸鏡和糞便潛血實驗[3]。糞便潛血實驗對早期診斷和高危人群篩查的敏感性有限[4]。結腸鏡雖然具有較好的敏感性及特異性,但是具有有創性、費用昂貴,耗時且耐受性差[5]。血清CEA不僅敏感性低,且特異性差,多種良性疾病均可出現CEA增高[6]。外泌體是指來源于各種細胞分泌的直徑在40-100 nm之間的小囊泡,可作為載體,運載RNA(如miRNA)、蛋白質、脂質及代謝產物,在細胞間及細胞與組織間進行信息傳遞,在腫瘤的發生發展中起著尤為重要的作用[7]。多項研究報道,miR-23a在結腸癌組織及細胞中顯著高表達,促進結腸癌細胞轉移和增殖[8]。本研究基于GEO及TCGA數據庫篩查及驗證miR-23a在結腸癌患者血清外泌體中是否異常表達,是否有希望成為新型無創性的早期診斷及預后標志物。
進入NCBI-GEO數據庫(https://www.ncbi.nlm.nih.gov/geo/),用關鍵詞查詢和選擇結腸癌血清外泌體相關的miRNAs表達數據集,從中獲得GSE39833數據集,該數據集是基于GPL14767平臺,包含了結腸癌患者及健康對照者血清學外泌體miRNAs的表達水平及部分臨床資料(年齡,性別及病理學分期)。應用R(4.1.0版本)軟件在線下載TCGA數據庫(https://portal.gdc.cancer.gov/)中結腸癌miRNAs的表達數據集及結腸癌患者的臨床資料(年齡、性別、TNM分期等)。
選擇GSE39833數據集中Ⅰ-Ⅱ期結腸癌患者40例和健康對照11例,應用在線工具GEO2R分析兩組之間血清外泌體差異表達的miRNAs,并作火山圖。GEO2R是GEO自帶的在線工具,用于篩選GEO系列中的兩個或更多樣本組間的差異基因,默認應用Benjamini-Hochberg方法測定錯誤發現率。
應用TCGAbiolinks包下載TCGA數據庫中結腸癌組織的miRNAs表達數據集,包括444例結腸癌組織和8例鄰近的正常組織。應用DEseq2包分析兩組之間差異表達的miRNAs,篩選出驗證的目標miRNA。以目標miRNA的中位值為分界線,將結腸癌患者分為高表達組和低表達組,剔除生存期小于30天的患者,然后采用Log-rank方法進行Kaplan-Meier生存分析并繪制生存曲線。最后,通過逐步Cox回歸分析確定目標miRNA是結腸癌預后的獨立危險因素。
所有統計學計算均采用R軟件(4.1.0版本)。|log2FC|>1,P<0.05和調整后的P<0.05作為識別差異表達miRNAs的閾值。P<0.05表示差異有統計學意義。
GSE39833和TCGA數據集中結腸癌患者的一般資料詳見表1。在GSE39833數據集中,經在線GEO2R工具共鑒定到163個差異表達的miRNAs,12個miRNAs表達下調,151個miRNAs表達上調 (見圖1)。與健康對照組比較,miR-23a顯著高表達于結腸癌患者血清外泌體中(log2FC=2.384,P<0.05和adj.P<0.05);在TCGA數據庫下載的結腸癌數據集中,共鑒定出368差異表達的miRNAs,158個miRNAs表達下調,210個miRNAs表達上調。結果驗證miR-23a顯著高表達于結腸癌組織中,log2FC=2.5949,P<0.05和adj.P<0.05。

表1 GSE39833和TCGA數據集結腸癌患者的一般資料

圖1 GSE39833數據集中差異表達miRNAs篩選火山圖
剔除TCGA數據集中生存時間小于30天的結腸癌患者,最終納入299例患者。根據miR-23a表達的中位值將上述299例結腸癌患者分為高表達組和低表達組,進行log-rank生存分析。結果顯示,miR-23a高表達組患者總生存時間顯著短于低表達組(P=0.035,見圖2)。

圖2 TCGA數據集中結腸癌患者Kaplan-Meirer生存曲線
將TCGA數據集中結腸癌患者的臨床特征包括年齡、性別、TNM分析以及miR-23a表達情況進行逐步Cox回歸分析,探索結腸癌預后的獨立危險因素。單因素Cox回歸分析結果表明年齡(HR=1.90,P=0.0388)、M分期(HR=0.49,P=0.0082)以及miR-23a(HR=2.05,P=0.0145)與結腸癌的預后相關;進一步將年齡、M分期及miR-23a進行多因素Cox回歸分析,結果顯示M分期(HR=0.53,P=0.0305)和miR-23a(HR=2.22,P=0.0481)與結腸癌患者預后顯著相關,miR-23a是結腸癌預后重要的獨立危險因素(見表2)。

表2 Cox回歸分析TCGA數據集中結腸癌的獨立危險因素
外泌體是細胞外囊泡的一種,普遍存在于各種體液中,如血液、唾液、尿液、乳汁等。外泌體來源于細胞膜內陷內吞,可攜帶核酸、蛋白質、脂質及代謝物被釋放到細胞外[9]。當外泌體在細胞外循環時,這些外泌體可被臨近或遠處的細胞吸收,在細胞間傳遞信息或者調節細胞功能[9-10]。大量研究已經證實外泌體具有來源組織或細胞的特性,在生理及病理過程中發揮著舉足輕重的作用。尤其來源于特定免疫細胞的外泌體,如樹突狀細胞和B細胞,可介導對病原體和腫瘤的免疫調節[11-12]。腫瘤細胞來源的外泌體,通過腫瘤基因和腫瘤相關miRNA在腫瘤細胞之間以及腫瘤細胞和腫瘤基質之間的轉移,在腫瘤的發生、轉移以及治療應答中發揮著重要的作用[13-14]。基于外泌體的上述特征,外泌體可作為有潛力的診斷標志物用于腫瘤的診斷和預后評估。
外泌體核酸包括mRNA,miRNA,lcnRNA等多種核酸分子。MiRNA是小分子非編碼RNA,通過與靶mRNA的3’非編碼區或開放閱讀框結合,介導轉錄后基因沉默,在各種生理及病理過程中被廣泛研究。外泌體miRNA具有負調控作用,通過調節靶基因表達水平影響腫瘤的發生和發展。例如,來自乳腺癌細胞的外泌體miR-105降低內皮細胞ZO-1基因表達,促進乳腺癌肺轉移和腦轉移[15]。Goldie等人曾報道,在各種小RNA分子中,miRNA在外泌體中含量最高。正如一些研究所述,miRNA不是隨機進入外泌體中的。在不同的病理狀態下,外泌體中miRNA種類及表達水平存在一定的差異。膠質瘤患者外泌體中miR-21的表達水平顯著低于健康對照組。與健康對照組比較,非小細胞肺癌患者血漿外泌體中Let-7f和miR-20b表達水平明顯較低。外泌體miRNA已經頻繁作為腫瘤診斷的標志物被報道。外泌體miR-27a和miR-130a可作為結腸癌診斷和預后的標志物,在獨立驗證試驗中,miR27a的診斷AUC值為0.82,miR-130a的AUC值為0.79[16]。
miR-23a的編碼基因位于19號染色體的p13.13位,通過抑制抑癌基因的表達從而促進癌細胞增殖、轉移和浸潤。多項研究顯示,在結腸癌細胞及組織中,miR-23a表達水平均顯著升高[8,17-18]。過度表達的miR-23a與晚期結腸癌以及結腸癌淋巴轉移浸潤相關。MiR-23a可綁定在PDK4 mRNA的3’非編碼區,抑制mRNA和 PDK4蛋白的表達,進而抑制PDH基因活性影響結腸癌細胞的增殖[19]。另有研究顯示miR-23a通過調節 MARK1基因的表達促進結腸癌細胞增殖和轉移[8]。因此,miR-23a可作為有希望的結腸癌診斷和預后標志物指導臨床。
本研究通過分析GSE39833數據集表明,與健康對照組比較,結腸癌患者血清外泌體中miR-23a顯著高表達,并通過TCGA數據集驗證,得到相同的結果。進一步應用生存分析和逐步Cox回歸分析,證實miR-23a與結腸癌患者預后顯著相關,是結腸癌預后的獨立危險因素。然而,本研究結果均基于在線數據庫分析所得,結果與既往研究結果一致,具有一定的指導作用,但結論尚需要大樣本前瞻性臨床研究進一步證實。