李玖明,崔凱颯,王 雪,黃朝暉
結腸癌作為臨床常見的一種惡性腫瘤,近年來發病率和死亡率均呈現逐年升高的趨勢[1]。結腸癌的發病機制復雜,涉及遺傳學、表觀遺傳學以及腫瘤微環境等多個因素的調控。在生物體中,通??筛鶕涫欠窬邆涞鞍拙幋a功能將RNA分為編碼RNA及非編碼RNA。近年研究已證實,非編碼RNA并非是基因轉錄的“噪音”,而是具有重要的生物學功能[2]。其中長度>200 bp的長鏈非編碼RNA(long noncoding RNA,lncRNA)廣泛存在于細胞核和細胞質中。LncRNA可通過多種機制調控生理、病理過程,不僅影響細胞生長、分化、遷移和凋亡等功能,還在疾病的診斷和治療中具有重要的應用價值。
有研究發現,Linc00355在胃癌中表達上調,并通過調節Wnt/β-連環蛋白(β-catenin)通路促進細胞增殖[3]。在頭頸部鱗狀細胞癌中高表達的Linc00355可通過調控微RNA(microRNA,miR)-195/HOXA10信號軸促進細胞遷移、侵襲及上皮-間質轉化[4]。但Linc00355在結腸癌中的功能和機制目前尚不清楚。
本研究基于腫瘤基因組圖譜(The Cancer Genome Atlas,TCGA)等數據庫結腸癌轉錄組數據,發現Linc00355在腫瘤中表達顯著上調,并可能是一個結腸癌潛在的新預后指標。通過生物信息學方法預測與Linc00355相關的靶基因,進行基因本體(Gene Ontology,GO)功能富集分析,預測Linc00355在結腸癌中的功能以及分子調控機制,并通過細胞實驗初步探討Linc00355對結腸癌細胞生物學功能的影響,以期為結腸癌的診斷和治療提供新的靶點。
結腸癌細胞株HCT116購自美國菌種保藏中心。DMEM購自美國HyClone公司,胰蛋白酶、青霉素/鏈霉素購自中國碧云天生物技術公司,胎牛血清(fetal bovine serum,FBS)購自美國Gibco公司,LipofectAMINE 2000購自美國Invitrogen公司。CCK-8購自日本Dojindo公司,RNAiso和PrimeScript反轉錄試劑盒、SYBR PCR Master Mix購自南京諾唯贊生物科技公司,Transwell小室購自美國Corning公司。Linc00355小干擾及陰性對照購自中國吉瑪基因公司。
實時熒光定量PCR儀器(型號:SLAN-96P)為上海宏石醫療科技有限公司產品,光學顯微鏡(型號:EVOS M7000)為美國賽默飛公司產品,全自動酶標儀(型號:Bio-Tek ELX800)為美國寶特公司產品。
首先從TCGA數據庫中下載473例結腸癌患者(包括473例癌組織及41例配對的癌旁正常組織)測序數據及患者臨床資料。首先將下載的數據整理成基因表達矩陣文件,利用R語言EdgeR包對樣本分別進行LncRNA在腫瘤中的差異分析,選取差異表達P<0.05且|Log2Fold Change,Log2FC|>2的基因作為差異表達LncRNA用于后續分析。利用基因表達綜合(Gene Expression Omnibus,GEO)芯片數據庫(GSE23878、GSE41328和GSE39582)中Linc00355的表達數據繪制差異表達圖,并根據臨床信息進行Kaplan-Meier生存分析并繪制生存曲線。進一步采用共表達方法預測Linc00355的靶基因。利用R語言Limma包對表達矩陣分析,篩選與Linc00355表達具有相關性的mRNA(P<0.05,相關系數R>0.3)。利用GEO芯片數據庫(GSE38832)中Linc00355、黑色素瘤抗原A3(melanoma antigen-A3,MAGE-A3)和周期蛋白依賴性激酶抑制因子CDKN1A的表達數據繪制相關性散點圖(P<0.05,相關系數R>0.3)。最后使用DAVID數據庫,對54個與Linc00355相關的mRNA進行GO功能富集分析。使用R語言Ggplot2包進行可視化作圖。
HCT116細胞使用含10% FBS、100 mg/L青霉素/鏈霉素的DMEM培養液,置于37 ℃、CO2體積分數為5%的細胞培養箱中進行培養。待細胞貼壁且占滿培養皿底面積的80%~90%時傳代。HCT116細胞用胰蛋白酶消化傳代后,按3×105個/孔的密度接種于6孔板中。根據LipofectAMINE 2000轉染試劑說明書分別將陰性對照siRNA(siNC)和2條針對Linc00355的siRNA(siLinc00355-1和siLinc00355-2)轉入HCT116細胞中。siNC正義鏈序列為5’-UUCUUCGAAGGUGUCACGUTT-3’,反義鏈序列為5’-ACGUGACACGUUCGGAGAATT-3’;siLinc00355-1正義鏈序列為5’-CCACUGACAGCAGAGUCUUTT-3’,反義鏈序列為5’-AAGACUGCUGUCAGUGGTT-3’;siLinc00355-2正義鏈序列為5’-GGGAAACUCUCUACGCUAUTT-3’,反義鏈序列為5’-AUAGCGUAGAGAGUUUCCCTT-3’。
收集HCT116細胞(5×106個),用PBS清洗3遍,采用RNAiso試劑盒提取細胞總RNA,反轉錄合成cDNA后,進行實時熒光定量PCR檢測,以β-actin基因作為內參照;PCR擴增反應條件為95 ℃預變性5 min,95 ℃ 30 s、95 ℃5 s、60 ℃ 30 s,共40個循環。以2-ΔΔCt值表述目的基因的相對表達水平。β-actin基因上游引物序列為5’-AGTGTGACGTGGACATCCGCAAAG-3’,下游引物序列為5’-ATCCACATCTGCTGGAAGGTGGAC-3’,Linc00355上游引物序列為5’-GCAGACAGTTGTATCACGCC-3’,下游引物序列為5’-TCCGGAAGGTTGAGTGGTTG-3’;MAGE-A3基因上游引物序列為5’-GGCAGGCCTCCTGATAATCG-3’,下游引物序列為5’-GGTGAGCAGCTTCTTGGGAT-3’;CDKN1A(p21)基因上游引物序列為5’-TCTAGGAGGGAGACACTGGC-3’,下游引物序列為5’-TGTCTGACTCCTTGTTCCGC-3’。
HCT116細胞分別轉染siNC、siLinc00355-1和siLinc00355-2 24 h后收集3組細胞,以2×103個/孔的密度接種于96孔板中,分別于1、2、3、4和5 d時加入CCK-8試劑,在酶聯免疫檢測儀波長450 nm處檢測各孔細胞的D值,并繪制細胞增殖曲線,具體檢測流程參閱試劑盒操作說明。
收集上述轉染24 h后對照組和實驗組細胞,以1×103個/孔的密度接種于6孔板中,靜置培養7~14 d。用10%甲醛溶液固定細胞30 min后,加入1%的結晶紫染色20 min,計數每個孔內的克隆數并拍照記錄(每個克隆含有50以上的細胞,直徑為0.3~1.0 mm)。
收集上述轉染24 h后的3組細胞,用無血清DMEM培養液制成細胞懸液,以1×105個/室的密度接種于Transwell小室的上室中,并在Transwell下室中加1 mL完全培養液。培養24 h后除去培養液,用10%甲醛溶液固定細胞20 min,加入0.1%結晶紫染色20 min。清水沖洗去除染色液,用棉簽擦去未穿過小室膜的細胞。在倒置光學顯微鏡下(放大倍數為100倍)計數穿過小室膜的細胞數,分析細胞的遷移能力。
Transwell小室侵襲實驗,在Transwell小室的上室中預先鋪設Matrigel,其余檢測流程同Transwell小室遷移實驗,Transwell小室的上室中接種3組細胞48 h后,在倒置光學顯微鏡下(放大倍數為100倍)計數穿過小室膜的細胞數,分析細胞的侵襲能力。
采用GraphPad Prism 7.0統計學軟件處理研究數據,計量資料以表示,各實驗均獨立重復3次。采用Kaplan-Meier法繪制生存曲線,多組間均數比較采用非參數檢驗(Kruskal-Wallis秩和檢驗)。組內兩兩比較采用Mann-WhitneyU檢驗,相關性分析采用Pearson線性相關分析;采用COX多因素回歸分析結腸癌患者死亡的影響因素。以P<0.05為差異有統計學意義。
在TCGA數據庫中下載基因表達矩陣文件并提取結腸癌患者的臨床信息;lncRNA的數據(包括473例癌組織及41例配對癌旁正常組織),利用R語言edgeR包,根據差異倍數|Log2FC|>2和校正P<0.05篩選出差異表達的lncRNA。熱圖(圖1A)和火山圖(圖1B)分析結果顯示,與癌旁正常組織相比,在結腸癌中有871個lncRNA表達上調(圖中紅色標注)和259個lncRNA表達下調(圖中綠色標注)。
在這些差異表達的lncRNA中,根據生存分析篩選后發現,Linc00355表達與結腸癌患者不良預后相關,且在結腸癌中的功能未知,故選擇Linc00355進行后續研究。
利用TCGA數據庫和GEO數據庫中的3組芯片(GSE23878、GSE41328和GSE39582)數據分析Linc00355在結腸癌中的表達和預后情況。結果(圖2A、圖2B和圖2C)顯示,Linc00355在結腸癌組織中高表達(P<0.01,P<0.01和P<0.05)。
對TCGA數據庫檢索獲得的447例結腸癌(剔除26例信息不全數據)分析結果顯示,Linc00355表達水平與患者的TNM分期成正相關(P<0.0001)(圖2D),且Linc00355高表達患者的總生存期(overall survival,OS)(圖2E)和疾病特異性生存期(disease-specific survival,DSS)(圖2F)均明顯縮短(P值均<0.05),GSE39583數據庫來源的患者同樣顯示(圖2F),Linc00355高表達者的OS明顯縮短(P<0.05)。
采用Mann-WhitneyU檢驗分析TCGA數據庫中Linc00355表達水平與臨床病理特征之間的關系。結果(表1)顯示,結直腸癌組織中Linc00355表達與患者性別、年齡、T分期均無顯著相關性(P值均>0.05),但與患者的臨床N、M分期及病理TNM分期有顯明顯的相關性(P<0.01)。
COX多因素風險回歸模型分析結果(表2)顯示,Linc00355是結腸癌患者生存期的獨立預測因子,其表達水平越高,患者的OS期越短[風險比(hazard ratio,HR)=1.601,95%可信區間(confidence interval,CI)為1.008~2.542,P=0.046]。此外,年齡和T分期也是結腸癌患者OS期的影響因素。
為了探究Linc00355影響患者預后的原因,通過共表達分析預測與Linc00355相關的mRNA,共發現54個mRNA與Linc00355表達有相關性(圖3A),相關系數見表3。對這些基因進行功能富集分析,發現這些基因富集于如p53的信號轉導、細胞蛋白分解代謝過程,泛素蛋白轉移酶活性、蛋白質乙?;?、蛋白質小泛素相關修飾物(small ubiquitin-related modifier,SUMO)化和細胞衰老等信號通路(圖3B)。這一結果提示,Linc00355在結腸癌細胞的增殖、遷移及侵襲等過程中可能發揮重要調控作用。

Fig.1 Differentially expressed long non-coding RNA (lncRNA) in colon cancer based on The Cancer Genome Atlas (TCGA) dataset.A:Heat map of differentially expressed lncRNAs in colon cancer of TCGA database;B:Volcano map of differential lncRNA in colon cancer (red indicates up-regulation,green indicates down-regulation).logFC:Log2Fold change;FDR:False discover rate.圖1 基于TCGA數據庫獲得結腸癌中差異表達的lncRNA(A為熱圖;B為火山圖;紅色代表在癌組織中表達上調,綠色代表在癌組織中表達下調)

Fig.2 The correlation between Linc00355 expression and the prognosis of colon cancer patients.A-C:Linc00355 was up-regulated in tumor tissues compared with normal tissues in colon cancer cohorts of The Cancer Genome Atlas (TCGA) database (A) and Gene Expression Omnibus (GEO) database [GSE23878 (B)and GSE41328 (C)];D:Linc00355 expression was related to TNM stage;E-G:Survival analyses based on the expression of Linc00355 in the colon cancer cohorts of TCGA [overall survival (OS) (E) and disease-specific survival (DSS) (F)]and GSE39582 [OS (G)].圖2 采用TCGA及GEO數據庫分析Linc00355表達與結腸癌患者預后的相關性
實時熒光定量PCR檢測結果(圖4A)顯示,與對照組比較,siLinc00355-1和siLinc00355-2組HCT116細胞中Linc00355的表達水平均明顯下調(P值均<0.001),提示2條siRNA均可有效沉默Linc00355的表達。
CCK-8法(圖4B)和克隆形成實驗(圖4C)檢測結果顯示,敲低Linc00355表達后,siLinc00355-1和siLinc00355-2組HCT116細胞的增殖能力和克隆形成能力均明顯降低,差異有統計學意義(P值均<0.001)。
Transwell小室法檢測結果(圖4D)顯示,敲低Linc00355表達后,HCT116細胞的遷移和侵襲能力均明顯降低(P值均<0.001)。
上述結果提示Linc00355可促進結腸癌細胞增殖、遷移和侵襲能力。

表1 Linc00355表達水平與結直腸癌患者臨床病理特征的相關性Table 1 Correlation between Linc00355 expression and the clinicopathological characteristics of patients with colon cancer Total=447,n

表2 多因素COX風險模型分析Linc00355表達與結腸癌患者OS期的關系Table 2 Multivariate COX risk model analysis of the relationship between the expression of Linc00355 and the overall survival (OS) of patients with colon cancer

Fig.3 Analysis of mRNA co-expressed network of Linc00355 and Gene Ontology (GO) function enrichment analysis.A:Co-expression network of Linc00355;B:GO enrichment analysis of Linc00355 coexpressed genes.圖3 Linc00355共表達mRNA網絡(A)與GO功能富集分析結果圖(B)

表3 前20條Linc00355相關的共表達mRNATable 3 Linc00355 co-expression related mRNAs (TOP20)

Fig.4 Silencing Linc00355 expression inhibits the proliferation,migration and invasion of colon cancer HCT116 cells.A:The expression level of Linc00355 in HCT116 cells transfected with siRNA targeting Linc00355 (siLinc00355-1 and siLinc00355-2) was detected by real-time fluorescent quantitative PCR,the expression level of Linc00355 was significantly reduced;B-C:The cell proliferation was detected by CCK-8 (B) and clone formation method (C),the cell proliferation ability was significantly reduced in Linc00355 knockdown HCT116 cells;D:The cells migration and invasion abilities were detected by Transwell method,the cells migration and invasion abilities were inhibited in Linc00355 knockdown HCT116 cells.HCT116 cells were transfected with negative control (NC)-siRNA (siNC) as the control.***P<0.001 (n=3).圖4 沉默Linc00355表達抑制結腸癌HCT116細胞的增殖、遷移和侵襲能力
為了驗證上述共表達分析結果,選擇評分最高的MAGE-A3及其下游靶基因CDKN1A(p53通路關鍵信號分子)進行了驗證。基于GSE38832數據集分析發現,Linc00355與MAGE-A3的表達存在顯著正相關(R=0.552 3,P<0.000 1)(圖5A),而與CDKN1A的表達水平則呈顯著負相關(R=-0.406 8,P<0.001)(圖5B)。

Fig.5 The relationship between Linc00355,melanoma antigen (MAGE)-A3 and CDKN1A.A:Linc00355 was positively correlated with the expression of MAGE-A3 in colon cancer (R=0.552 3,P<0.000 1);B:Linc00355 was negatively correlated with the expression of CDKN1A (R=-0.406 8,P<0.001);C.Silencing Linc00355 expression could inhibit the expression of MAGE-A3 and promote the expression of CDKN1A.***P<0.001 (n=3).圖5 Linc00355與MAGE-A3和CDKN1A mRNA表達的相關性
實時熒光定量PCR檢測結果(圖5C)顯示,與對照組比較,2個敲低Linc00355表達組HCT116細胞中MAGE-A3 mRNA的表達水平均明顯下調(P值均<0.001),而CDKN1A mRNA的表達水平均明顯上調(P值均<0.001)。
上述結果提示,Linc00355可能通過影響MAGE-A3基因的表達,進而調控抑癌因子p21的表達,從而促進結腸癌的發生和發展。
結腸癌是全球第3大常見的惡性腫瘤,居腫瘤相關死因第2位。據2020年統計結果顯示,將有超過190萬例新增結直腸癌病例和935 000例死亡病例,約占癌癥新發和死亡病例的10%[5]。研究表明。LncRNA的失調可能與腫瘤的發生、發展、轉移、耐藥及多種生物學表型相關[6]。呂夢佳等[7]發現,在非小細胞肺癌患者血漿中lncRNA MALAT1的表達水平明顯下調,lncRNA-ATB的表達明顯上調,血漿MALAT1及ATB可作為非小細胞肺癌的診斷指標。曾明曦等[8]發現,胃癌組織中lncRNA RP11-513G11.1的表達水平顯著高于癌旁組織及正常胃組織,與胃癌患者的TNM分期、淋巴結轉移、遠處轉移、腫瘤分化及生存狀態顯著相關。
LncRNA作為結腸癌生物標志物和治療靶點的潛能同樣不容忽視。SVOBODA等[9]發現,結腸癌患者血液中的lncRNA HOTAIR的表達水平顯著高于健康對照,且血液中HOTAIR的表達水平與患者的TNM分期、組織學分級以及OS期均有相關性。本課題組前期發現,在結直腸癌中高表達的lncRNA FEZF1-AS1通過結合并促進丙酮酸激酶2蛋白的穩定性,從而調控糖酵解和信號轉導及轉錄激活因子3(signal transducer and activator of transcription 3,STAT3)信號通路,進而促進腫瘤的發生和發展[10]。并發現lncRNA UCA1和Linc00152分別通過調控miR-204-5p和miR-139-5p的表達促進結直腸癌的增殖和化療耐藥[11]。此外,還發現lncRNA SNHG6在結直腸癌中發揮促癌作用,且SNHG6的表達可作為一個新的不良預后指標[12]。
本研究首次發現,Linc00355可能是與結腸癌預后相關的新生物標志物。Linc00355在結腸癌組織呈現高表達,并與患者的不良預后相關;沉默Linc00355的表達水平體外可抑制結腸癌細胞增殖、遷移及侵襲能力,提示Linc00355在結腸癌中發揮癌基因功能。隨后,基因共表達網絡及信號通路富集提示,Linc00355可能與細胞蛋白分解代謝、蛋白質泛素化、乙酰化、蘇木化,p53信號轉導及細胞衰老等多個生物學過程相關。而蛋白質修飾、p53信號轉導及細胞衰老與腫瘤的發生和發展密切相關。本研究中進一步驗證發現,沉默Linc00355表達可上調MAGE-A3 mRNA的表達水平。有研究表明,MAGE-A3可通過調控p53抑癌因子,影響p21、細胞周期蛋白D1(cyclin D1)及Bax的表達并調控與細胞增殖、凋亡相關的信號通路[13]。上述結果提示,Linc00355可能通過MAGE-A3基因影響p53信號通路進而影響結腸癌細胞的增殖。關于Linc00355調控結腸癌發生和發展的具體功能及機制的深入尚需進一步研究。
綜上所述,本文結果提示Linc00355有望成為一種新的結腸癌患者的預后標志物和治療靶點。