陸凌翔, 蔣民軍, 陳建春, 陸季成
(江蘇省蘇州市第九人民醫(yī)院, 1.泌尿外科, 2.腫瘤科, 江蘇 蘇州, 215000)
全世界每年有超過40萬人罹患腎細胞癌(RCC), 發(fā)病年齡大多為60歲左右,其中2/3患者為男性[1]。RCC包括多種亞型,約70%為腎透明細胞癌(ccRCC)[2]。早期確診并盡早治療可以提高ccRCC的治愈率,但多達1/3的ccRCC患者確診時已出現(xiàn)轉(zhuǎn)移[3]。轉(zhuǎn)移性ccRCC惡性程度高,嚴重威脅患者的生命健康[4],因此尋找其診斷和治療靶點尤為重要。微小RNA(miRNA)是一類長度為19~23 nt的內(nèi)源性小型非編碼類RNA,由DNA轉(zhuǎn)錄而來[5]。miRNA可通過直接與靶向信使RNA(mRNA)上的堿基進行配對,引導RNA誘導沉默復合體(RISC)間接降解所編碼的蛋白質(zhì),或通過直接抑制mRNA蛋白的翻譯而在轉(zhuǎn)錄后水平或亞轉(zhuǎn)錄階段終止后水平間接調(diào)節(jié)靶蛋白質(zhì)的表達[6]。許多特殊的miRNA在ccRCC組織和正常腎組織中存在差異表達,如微小RNA-206(miR-206)、微小RNA-141-3p(miR-141-3p)、微小RNA-30a(miR-30a)和微小RNA-194-5p(miR-194-5p)[7-10]。研究[11]發(fā)現(xiàn),微小RNA-182-5p(miR-182-5p)通過靶向泛素結(jié)合酶E2T mRNA抑制泛素結(jié)合酶E2T蛋白表達,進而抑制ccRCC細胞的增殖、遷移和侵襲。另有研究[12]發(fā)現(xiàn),近80%的與ccRCC轉(zhuǎn)移相關(guān)的miRNA與ccRCC患者的復發(fā)率和生存率有關(guān)。RNA干擾可有效控制基因的表達,在腫瘤治療中起著廣泛作用[13], 而miRNA與ccRCC的發(fā)生及發(fā)展密切相關(guān),故調(diào)控相關(guān)miRNA的表達有望成為治療ccRCC的新方法。本研究對數(shù)據(jù)庫樣本進行挖掘和分析,篩選ccRCC組織的差異表達基因(DEGs), 旨在尋找ccRCC治療的潛在生物學靶點,現(xiàn)報告如下。
從基因表達綜合(GEO)數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)的數(shù)據(jù)集中下載ccRCC樣本和正常腎組織樣本的表達譜數(shù)據(jù)。① GSE116251數(shù)據(jù)集中,從18名ccRCC患者(9名疾病復發(fā)和9名未復發(fā)患者)的配對腫瘤組織和鄰近正常組織中分離總RNA,然后進行NanoString miRNA分析。NanoString是一種高通量的RNA表達檢測方法,其優(yōu)點是適用于嚴重降解的RNA樣本如福爾馬林固定石蠟包埋(FFPE)樣本,且操作簡單、數(shù)據(jù)準確、重現(xiàn)性好。應(yīng)用實時定量聚合酶鏈反應(yīng)(PCR)方法對腫瘤中失調(diào)的miRNA 進行進一步驗證。② GSE168845數(shù)據(jù)集中,分析4個ccRCC組織和配對癌旁組織樣本(作為對照)的基因表達譜。
從GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)的GSE116251、GSE168845數(shù)據(jù)集中下載ccRCC樣本和正常腎組織樣本表達譜數(shù)據(jù),利用R軟件的Limma包篩選出差異表達的miRNA和基因,設(shè)置|log2FC|≥2和錯誤發(fā)現(xiàn)率(FDR)<0.05為篩選標準。FunRich(http://www.funrich.org/)是一個主要用于基因和蛋白質(zhì)的功能富集和相互作用網(wǎng)絡(luò)分析的獨立軟件工具,還可用于靶基因預測。本研究利用FunRich網(wǎng)站對差異表達miRNA(DEmiRNAs)進行潛在轉(zhuǎn)錄因子及靶基因預測,并進行生物學過程(BP)、細胞成分特征(CC)和分子功能(MF)富集分析。利用R軟件的ClusterProfiler包和Cytoscape軟件對靶基因的信號通路進行富集分析。將預測到的靶基因與DEGs取交集,獲得差異表達的靶基因,通過Cytoscape軟件繪制miRNA-mRNA調(diào)控網(wǎng)絡(luò)。以DEmiRNAs及其靶基因的中位表達值為分界,將患者分為高表達組和低表達組,通過Kaplan-Meier plotter網(wǎng)站(https://kmplot.com)判斷DEmiRNAs及其靶基因的表達水平與患者總生存期的關(guān)聯(lián),選擇P值最小的靶基因及其相互作用的miRNA與腫瘤基因組圖譜(TCGA)中616例ccRCC患者的臨床特征(年齡、性別、TNM分期和初始治療結(jié)局)進一步分析。通過人類蛋白質(zhì)圖譜(HPA)數(shù)據(jù)庫驗證所選基因在ccRCC組織及正常組織中的蛋白表達。
使用Wilcoxon檢驗篩選腫瘤組織與癌旁組織的DEmiRNAs、DEGs, 采用BH法對P值進行矯正,設(shè)置|log2FC|>2和FDR<0.05為篩選標準。采用卡方檢驗評估各指標在高表達組、低表達組中的分布差異。采用Kaplan-Meier分析和Log-rank檢驗評估高風險組、低風險組患者的生存差異。應(yīng)用R軟件(版本4.0.2)對數(shù)據(jù)進行統(tǒng)計學分析,P<0.05為差異有統(tǒng)計學意義。
應(yīng)用R軟件篩選GSE116251數(shù)據(jù)集中的DEmiRNAs和GSE168845數(shù)據(jù)集中的DEGs,分別篩選出3種DEmiRNAs(miR-142-3p、miR-200c-3p、miR-141-3p)和1 610種DEGs, 見圖1。

A: GSE116251中DEmiRNAs的熱圖; B: GSE116251中DEmiRNAs的火山圖; C: GSE168845中DEGs的熱圖;D: GSE168845中DEGs的火山圖。紅色代表上調(diào),藍色或綠色代表下調(diào)。
GO和KEGG富集分析結(jié)果顯示, DEmiRNAs在細胞環(huán)腺苷酸(cAMP)受體介導的信號傳導、翻譯的調(diào)節(jié)、發(fā)展、溶酶體、高爾基體、細胞表面、受體信號蛋白和絲氨酸酶/蘇氨酸肌激酶活性、磷酸二酯水解酶活性和細胞骨架蛋白等方面具有獨特的功能,見圖2; DEmiRNAs主要富集于6種途徑,即破骨細胞分化、金黃色葡萄球菌感染、細胞黏附分子、補體和凝血級聯(lián)、吞噬體和原發(fā)性免疫缺陷,見圖3。

A: FunRich軟件識別的DEmiRNAs的潛在轉(zhuǎn)錄因子; B、C、D: miRNA靶基因表達的前10種生物學過程、細胞成分特征和分子功能富集分析。

Osteoclast differentiation: 破骨細胞分化; Phagosome: 吞噬體;Primary immunodeficiency: 原發(fā)性免疫缺陷;Staphylococcus aureus infection: 金黃色葡萄球菌感染;complement and coagulation cascades: 補體和凝血級聯(lián);Cell adhesion molecules(CAMs): 細胞黏附分子。
使用預測軟件對3個DEmiRNAs的靶基因進行預測,共獲得846個靶基因,將其與GSE168845數(shù)據(jù)集的DEGs取交集,共得到49個交集靶基因,見圖4A。根據(jù)相互作用關(guān)系,篩選出miRNA-mRNA調(diào)控網(wǎng)絡(luò), miRNA包括hsa-miR-142-3p(上調(diào))、hsa-miR-200c-3p(下調(diào))和hsa-miR-141-3p(下調(diào)),其關(guān)聯(lián)的30個靶基因中包括11個下調(diào)基因和19個上調(diào)基因,見圖4B。

A: 預測的靶基因與GSE168845數(shù)據(jù)集DEGs交集的韋恩圖; B: miRNA-mRNA調(diào)控網(wǎng)絡(luò)(綠色表示下調(diào),粉色表示上調(diào))。
通過Kaplan-Meier plotter網(wǎng)站分析ccRCC患者的總生存期,結(jié)果顯示, miR-142-3p、miR-200c-3p、miR-141-3p和TNFAIP3、STAT4、P2RY1、CORO1C、MYBL1、CCNE2、BHLHE41、ANLN、BASP1均與ccRCC患者總生存期相關(guān)(P<0.05), 見圖5、圖6。各種基因中,ANLN基因的P值最小即差異最顯著,故本研究選擇ANLN基因及其相互作用的miR-200c-3p進行后續(xù)研究。

A: hsa-miR-141-3p與總生存期的關(guān)系; B: hsa-miR-142-3p與總生存期的關(guān)系; C: hsa-miR-200c-3p與總生存期的關(guān)系。

圖6 不同基因表達水平與ccRCC患者總生存期的關(guān)系
從TCGA數(shù)據(jù)庫中下載ccRCC患者臨床診斷指標和相關(guān)基因片段的克隆表達研究數(shù)據(jù)(例如患者的年齡、性別、TNM分期和初始治療結(jié)局數(shù)據(jù)),結(jié)果顯示,不同TNM分期患者的ANLN、miR-200c-3p表達水平比較,差異有統(tǒng)計學意義(P<0.05), 見表1、表2。進一步分析ccRCC患者臨床特征與預后的關(guān)系后發(fā)現(xiàn), TNM分期、初始治療結(jié)局均與ccRCC患者預后相關(guān)(P<0.05), 見表3、表4。

表1 ANLN表達水平與ccRCC患者臨床特征的關(guān)系

表2 miR-200c-3p表達水平與ccRCC患者臨床特征的關(guān)系

表3 ccRCC患者臨床特征、ANLN表達與預后關(guān)系的單因素分析和多因素分析

表4 ccRCC患者臨床特征、miR-200c-3p與預后關(guān)系的單因素分析和多因素分析
基于HPA數(shù)據(jù)庫,本研究發(fā)現(xiàn),與正常腎臟組織相比, ccRCC組織中的ANLN表達顯著上調(diào),見圖7。

圖7 ANLN蛋白在正常腎臟組織(n=3)和ccRCC組織(n=3)中的表達(HE染色,放大100倍)
本研究從GEO數(shù)據(jù)庫下載GSE116251、GSE168845數(shù)據(jù)集進行分析, KEGG分析結(jié)果顯示, DEmiRNAs主要富集于破骨細胞分化、金黃色葡萄球菌感染、細胞黏附分子、補體和促凝血因子級聯(lián)反應(yīng)、吞噬體和原發(fā)性免疫缺陷這6個途徑中,而這些途徑與癌癥的發(fā)生和轉(zhuǎn)移密切相關(guān)[14-16]。已有研究[17]表明,細胞黏附分子配體唾液酸Lewis(a/x)抗原可通過與E-選擇素受體結(jié)合而參與內(nèi)皮細胞壁的黏附,這一生化過程由炎癥細胞和腫瘤細胞共同參與,可以部分解釋炎癥與腫瘤發(fā)生之間的關(guān)系,進一步闡明抗炎藥在腫瘤治療中的功效。轉(zhuǎn)錄調(diào)節(jié)因子是一種能夠以特定序列結(jié)合DNA分子并參與調(diào)節(jié)基因轉(zhuǎn)錄活動的蛋白質(zhì)[18]。轉(zhuǎn)錄抑制因子可通過選擇性識別一些特定類型的DNA序列信息來同時調(diào)控染色質(zhì)形成和轉(zhuǎn)錄,從而形成一個可調(diào)控整個基因組信息表達活動的復雜系統(tǒng)。此外,轉(zhuǎn)錄因子可以結(jié)合特定序列促進或抑制下游基因,對腫瘤發(fā)生、遷移和侵襲等生物學過程產(chǎn)生重要影響[19]。
本研究使用Cytoscape軟件進行miRNA-mRNA調(diào)控網(wǎng)絡(luò)構(gòu)建,確定了3個miRNA(miR-142-3p、miR-200c-3p和miR-141-3p), 并獲得了846個潛在靶基因,其中僅49個在GSE168845數(shù)據(jù)集中差異表達,進一步根據(jù)相互作用關(guān)系篩選miRNA-mRNA調(diào)控網(wǎng)絡(luò), 3個miRNA關(guān)聯(lián)的30個靶基因中包括11個下調(diào)基因和19個上調(diào)基因。miR-142-3p是雜合性丟失、易位和擴增的首選位點,可參與人體內(nèi)多種特定生物類型細胞上的某些原發(fā)細胞腫瘤分子中過氧化酶的表達,包括原發(fā)性肝細胞癌、卵巢癌和胰腺癌等[20-23]。此外, miR-142-3p的過表達可以抑制血清剝奪誘導的細胞凋亡,當miR-142-3p抑制劑降低miR-142-3p表達時,可以逆轉(zhuǎn)對細胞凋亡的抑制,且miR-142-3p可在G1/S期加速細胞分化并促進細胞增殖[24]。包含miR-200a、miR-200b、miR-200c、miR-141和miR-429的miR-200家族已被證明在上皮間質(zhì)轉(zhuǎn)化中發(fā)揮作用[25]。另外,越來越多的研究[26-27]表明miR-200家族成員在多種惡性腫瘤組織中下調(diào),包括RCC。因此, miR-200c是一種潛在的生物標志物,或可為RCC替代治療方案的制訂提供參考依據(jù)。
ANLN基因編碼蛋白中含有的Anillin蛋白,是體內(nèi)一種有著高度保守性表達的肌動蛋白結(jié)合蛋白,在胞質(zhì)的分裂及其復制形成過程中發(fā)揮著關(guān)鍵作用[28]。研究[29-31]發(fā)現(xiàn), ANLN在許多原發(fā)腫瘤組織中均有表達,特別是晚期胰腺癌、乳腺癌和中晚期肺癌組織。流行病學研究[32-33]發(fā)現(xiàn),ANLN還具有一系列生物功能,包括參與調(diào)節(jié)人類腫瘤干細胞的生長、增殖、轉(zhuǎn)化和腫瘤遷移,影響多種惡性腫瘤組織的發(fā)生與發(fā)展,因此其通常被認為是對某些腫瘤患者預后具有重要意義的幾個主要特征基因之一。高ANLN表達水平的原發(fā)性乳腺癌患者預后可能較差,而ANLN水平敲低可能導致乳腺癌組織衰老的細胞增加、多核形態(tài)和G2/M期停滯[34]。另一項人類非小細胞肺癌細胞凋亡實驗[35]發(fā)現(xiàn),敲除ANLN會顯著抑制腫瘤細胞分裂增殖速度和增加多形核細胞凋亡數(shù)量。
近年來, miRNA及其靶基因在腫瘤發(fā)生發(fā)展中的作用已被廣泛研究,基因表達調(diào)控可能成為腫瘤治療的新選擇。本研究發(fā)現(xiàn), miR-200c-3p及其靶基因ANLN參與了ccRCC的發(fā)展,并可能成為ccRCC的潛在生物標志物。ANLN可能對ccRCC患者的預后判斷具有重要價值,并可為其治療策略提供新的選擇。