王寧,劉昌偉,褚校涵,王曉甫,趙興華,郝斌,許長寶
(鄭州大學第二附屬醫院 泌尿外科,河南 鄭州 453000)
腎細胞癌是泌尿系統致死率最高的惡性腫瘤,且發病率持續升高。乳頭狀腎細胞癌(papillary renal cell carcinoma,PRCC)是第二常見的腎細胞癌,占15%~20%[1]。根據病理學特征,PRCC可分為Ⅰ型和Ⅱ型。Ⅰ型PRCC的瘤體由管狀及小核仁的乳頭狀嗜堿性細胞組成;Ⅱ型PRCC的瘤體則由大核仁的嗜酸性細胞組成。Ⅱ型PRCC細胞生物惡性度相對較高,常對應高T分期和差的核分級,易出現血管浸潤或遠處遷移,預后更差[2]。目前早期PRCC患者的首選治療方式是手術治療,晚期患者缺乏有效的治療方法[3]。早發現、早治療PRCC十分重要。本研究基于生物信息學挖掘PRCC生物標志物有助于診斷和預后評估,可為臨床治療提供新思路。
miRNA是一類內源性、非編碼、單鏈小RNA,通過調控靶基因轉錄后表達參與一系列生物過程[4-5]。miRNA可通過正向或負向調控靶基因,發揮促癌或抑癌作用[6],也可參與腫瘤免疫識別以及免疫逃逸,引起免疫系統紊亂,進而影響癌癥進展[7]。基于miRNA在癌癥發生發展中的作用,miRNA作為癌癥生物學標志物被廣泛用于早期診斷及預后評估[8-9]。本研究通過生物信息學方法分析TCGA數據庫中PRCC臨床信息及miRNAs表達,旨在挖掘PRCC診斷和預后相關的miRNA生物標志物。
從TCGA(https://portal.gdc.cancer.gov/)數據庫下載326例樣本miRNA表達數據(292例PRCC樣本,34例正常樣本)及匹配的臨床數據(291例PRCC樣本,34例正常樣本),如年齡、性別、腫瘤分期、生存狀態等(項目ID為TCGA-KIRP)。
利用R軟件“edgeR”包篩選出差異表達miRNAs(|log2FC|>1,P<0.05),并繪制熱圖和火山圖。
利用單因素Cox回歸、LASSO及多因素Cox回歸分析篩選與生存相關的miRNAs(P<0.05)。借助R軟件“Survival”包繪制生存曲線。并借助受試者工作特征(receiver operating characteristic,ROC)曲線評價其診斷PRCC的準確度。
借助GeneCards(https://www.genecards.org)和TransmiR (https://www.cuilab.cn/transmir)數據庫預測篩選差異表達miRNAs的轉錄因子(transcription factor,TF),并對預測結果取交集。運用Cytoscape軟件將miRNAs及其TFs進行可視化。
借助miRDB(http://www.mirdb.org)、TargetScan(https://www.targetscan.org/vert_80/)、miRTarBase(https://mirtarbase.cuhk.edu.cn/~miRTarBase/miRTarBase_2022/php/index.php)數據庫進行差異表達miRNAs的靶基因預測,其中miRDB數據庫中選取靶基因預測得分>80。取3個數據庫預測結果的交集,并運用Cytoscape軟件將miRNAs及其靶基因進行可視化。
借助DAVID數據庫(https://david.ncifcrf.gov/)將篩選的差異表達miRNAs靶基因進行GO以及KEGG富集分析,探索靶基因涉及的生物學過程(biological process,BP)、細胞組分(cellular component,CC)、分子功能(melecular function,MF)以及參與的信號通路。
借助TIMER 2.0免疫浸潤數據庫(http://cistrome.dfci.harvard.edu/TIMER/)分析miRNA靶基因與多種免疫細胞浸潤水平的相關性。
應用R軟件進行差異表達miRNA篩選、單因素Cox、LASSO及多因素Cox回歸分析及ROC曲線繪制和生存分析。借助GraphPad Prism9軟件進行不同腫瘤Stage、TMN分期的miRNA表達量統計分析,采用單因素ANOVA分析及Bonferroni法校正。P<0.05為差異有統計學意義。
TCGA數據庫中292例PRCC樣本和34例正常樣本共篩選出163個差異表達miRNAs(|log2FC|>1,P<0.05),其中82個miRNAs上調,81個miRNAs下調。顯著上調的5個miRNAs分別為hsa-miR-21、hsa-miR-106b、hsa-miR-589、hsa-miR-671和hsa-miR-93;顯著下調的5個miRNAs分別為hsa-miR-184、hsa-miR-33a、hsa-miR-129-2、hsa-miR-129-1、hsa-miR-126(圖1)。

圖1 差異表達的miRNA
為分析差異表達miRNAs對PRCC的預后影響及其診斷意義,選取TCGA數據庫共291例PRCC樣本的生存時間信息進行處理。單因素Cox回歸初篩出14個差異表達miRNAs與患者的總體生存率相關(P<0.05,HR>1),分別為hsa-miR-589、hsa-miR-219a-1、hsa-miR-34a、hsa-miR-3170、hsa-miR-875、hsa-miR-599、hsa-miR-4636、hsa-miR-211、hsa-miR-551b、hsa-miR-1258、hsa-miR-4423、hsa-miR-486-2、hsa-miR-486-1、hsa-miR-4732。采用LASSO回歸進一步篩選出6個與預后相關的差異表達miRNAs,分別為:hsa-miR-219a-1、hsa-miR-34a、hsa-miR-3170、hsa-miR-551b、hsa-miR-1258、hsa-miR-4423。采用多因素Cox回歸分析進一步篩選,結果顯示hsa-miR-34a和hsa-miR-551b與PRCC預后相關(P<0.05,圖2A)。以miRNA的中位表達量將PRCC樣本分為高表達組和低表達組,并繪制生存曲線。生存分析顯示, hsa-miR-34a及 hsa-miR-551b高表達組的生存期明顯長于低表達組(P<0.001,圖2B)。

A為多因素Cox回歸分析結果;B為hsa-miR-34a及hsa-miR-551b的生存曲線圖,以其在PRCC樣本表達量的中位數為基準劃分高表達和低表達;C為hsa-miR-34a及hsa-miR-551b在不同分期的表達量(**P<0.01,***P<0.001)。
為進一步探索hsa-miR-34a及hsa-miR-551b表達量與PRCC臨床分期的關系,本文分析hsa-miR-34a及hsa-miR-551b在PRCC不同腫瘤Stage、TMN分期中的表達量。結果顯示,hsa-miR-34a在PRCC Stage Ⅲ、Ⅳ期、M1期、N2期、T3期的表達量下調(P<0.01,圖2C),提示hsa-miR-34a表達水平與臨床分期相關,對PRCC發展可能存在一定的抑制作用。對比hsa-miR-551b在PRCC不同腫瘤Stage、TMN分期中的表達量,圖2C顯示隨著腫瘤進展,hsa-miR-551b表達水平出現不同程度的下調。
繪制hsa-miR-34a及hsa-miR-551b的ROC,結果顯示hsa-miR-34a的曲線下面積(area under curve,AUC)>0.7,診斷PRCC的準確度和敏感度更高(圖3)。

圖3 hsa-miR-34a及hsa-miR-551b的ROC曲線
轉錄因子可激活或抑制miRNA,介導miRNA成熟。圖4顯示,hsa-miR-34a的上游轉錄因子包含經典的TP53、STAT1、STAT3及FOS等共26個。

圖4 hsa-miR-34a的轉錄因子預測
TargetScan、miRDB(靶基因預測得分>80)及miRTarBase數據庫預測結果取交集顯示hsa-miR-34a的靶基因共28個(圖5A)。GO富集分析顯示,hsa-miR-34a靶基因主要參與以DNA為模板的轉錄負調控、RNA聚合酶Ⅱ啟動子的轉錄負調控及細胞因子生成負調控等生物學過程(圖5B)。其中靶基因PPP1R11及LGR4參與細胞因子生成負調控。細胞定位分析顯示靶基因主要位于細胞核(圖5C)。KEGG分析顯示靶基因主要富集在癌癥中的miRNAs通路和甲狀腺激素通路(圖5D)。

A為hsa-miR-34a的預測靶基因;B為靶基因的GO-生物過程分析;C為靶基因的亞細胞定位;D為靶基因的KEGG通路分析。
T細胞、B細胞可誘導炎癥因子的產生,進一步加劇炎癥反應。GO-BP分析顯示hsa-miR-34a的靶基因PPP1R11及LGR4參與細胞因子生成的負調控。借助TIMER2.0分析PPP1R11及LGR4表達與多種免疫細胞(B細胞、CD4+T細胞、CD8+T細胞、中性粒細胞、巨噬細胞及樹突狀細胞)浸潤水平的相關性。結果顯示,PRCC患者PPP1R11表達與B細胞、CD8+T細胞、中性粒細胞和樹突狀細胞的浸潤水平呈正相關(圖6A);LGR4表達與樹突狀細胞的浸潤水平呈正相關(圖6B)。

圖6 PPP1R11及LGR4表達與免疫細胞浸潤水平的關系
miRNA表達穩定、特異性強且檢測靈敏度高,因此被廣泛用于疾病及癌癥的早期檢測、療效預測、實時并發癥監測及預后判斷[10-12]。近年來,研究發現miRNA在RCC腫瘤組織鑒別、組織學分型及預后判斷方面發揮作用[13-14]。Faragalla 等[15]發現透明細胞腎細胞癌及PRCC患者hsa-miR-21表達升高,且其表達量與癌癥Stage分期呈正相關,與生存周期呈負相關,可用于鑒別診斷透明細胞腎細胞癌、PRCC與嫌色腎細胞癌、嗜酸細胞瘤。上述研究提示miRNA在PRCC早期診斷、分期鑒定及預后評估中的潛在作用。
本研究對TCGA數據庫共292例PRCC樣本及34例正常樣本的miRNA進行差異分析,篩選出163個差異表達miRNAs,其中82個上調,81個下調。進一步利用單因素Cox、LASSO及多因素Cox回歸篩選出2個與PRCC預后相關的miRNAs:hsa-miR-34a和hsa-miR-551b,其中hsa-miR-34a的診斷準確度和敏感度更高。隨著腫瘤瘤體增大,浸潤程度增加,遠處轉移和淋巴結遷移,患者預后不良且hsa-miR-34a表達降低,而hsa-miR-34a高表達的PRCC患者預后良好,提示hsa-miR-34a可能抑制PRCC發生發展。有研究發現hsa-miR-34a抑制癌細胞增殖與浸潤,抑制腎細胞癌發生發展[16-18],且對乳腺癌、結腸癌等多種實體瘤均存在抑制作用[19-21]。因此,hsa-miR-34a有望成為PRCC新的診斷及預后評估標志物和潛在治療靶點。
轉錄因子通過結合miRNA的特定序列,調控miRNA表達。本文借助GeneCards及TransmiR數據庫預測hsa-miR-34的上游轉錄因子,其中TP53、STAT3等參與癌細胞浸潤與轉移,影響癌癥發生發展,與相關研究結果[22-23]一致。抑癌因子p53可占據hsa-miR-34a轉錄起始位置附近的高度保守結合位點,激活hsa-miR-34a轉錄,抑制上皮細胞間充質細胞轉化(epithelial-to-mesenchymal transition,EMT),抑制癌細胞浸潤與轉移[22]。STAT3磷酸化則抑制hsa-miR-34a表達,促進EMT、腫瘤細胞浸潤與轉移[22-23]。
為探索hsa-miR-34a參與抑制PRCC的潛在機制,本文借助多個數據庫預測其靶基因并進行通路富集和功能分析。其中,hsa-miR-34a可引起PPP1R11表達下調,進而抑制結直腸癌細胞EMT與浸潤[24]。SHCBP1在多種癌癥中過表達,抑制SHCBP1表達可誘導多種癌細胞凋亡、抑制遷移與浸潤[25-27]。研究發現乳腺癌組織中DCAF7表達上調[28]。采用DAVID數據庫進行靶基因功能富集分析。KEGG分析顯示,hsa-miR-34a的靶基因不僅參與miRNAs與癌癥通路,也通過甲狀腺激素通路介導PRCC的發生發展。研究表明miRNAs與癌癥通路也參與肺腺癌預后相關miRNA靶基因調控通路[29]。甲狀腺激素T3和T4借助轉運蛋白進入胞內,隨后T4轉化為T3,T3轉移入核,與配體結合位點結合,招募聚合酶Ⅲ,進而激活下游基因表達[30]。甲狀腺激素紊亂可增加患多種癌癥的風險,研究表明甲亢患者患甲狀腺癌、乳腺癌、前列腺癌及肝細胞癌的風險增加[31-32]。且甲亢病史10 a甚至更長的患者,尤其是女性患者,患肝細胞癌的風險更高[33]。GO富集結果顯示,hsa-miR-34a的靶基因參與RNA聚合酶Ⅱ啟動子的轉錄調節、炎癥因子生成負調控等生物學過程,且上述生物學過程均與癌癥的產生及發生發展相關[34-35]。研究表明炎癥與癌癥關系密切,炎癥過程中產生的細胞因子等炎癥介質誘發癌癥[36]。炎癥因子生成減少,炎癥反應減輕,癌癥發生率降低。本研究結果顯示靶基因PPP1R11、LGR4與細胞因子生成負調控緊密相關。PPP1R11可抑制炎癥因子分泌,減輕炎癥反應[37]。而LGR4可激活NF-κB信號通路,誘導炎癥因子等產生,引起炎癥反應[38]。
T細胞、B細胞、中性粒細胞、巨噬細胞等免疫細胞介導的炎癥調控可影響癌癥免疫豁免、免疫監測,參與癌癥的發生發展[39-41]。本文發現參與細胞因子生成負性調控的靶基因表達與免疫細胞浸潤水平關系緊密。PPP1R11表達與PRCC中B細胞、CD8+T細胞、中性粒細胞和樹突狀細胞的浸潤水平呈正相關。Joshi等[37]也發現PPP1R11可調節T細胞對調節性T細胞介導抑制作用的敏感度。LGR4表達與PRCC中樹突狀細胞的浸潤水平呈正相關。LGR4表達變化引起免疫平衡改變,CD4+T、CD16+NK細胞、調節性T細胞、CD20+B細胞等免疫細胞數量發生不同改變[42]。Tan等[43]發現LGR4通過介導LGR4/ERK/STAT3通路促進巨噬細胞M2極化,誘導癌細胞增殖及浸潤。由此推測hsa-miR-34a的靶基因PPP1R11及LGR4參與細胞因子生成負性調節,且可通過影響PRCC多種免疫細胞浸潤,影響患者預后。
本研究采用生物信息學方法篩選出hsa-miR-34a與PRCC診斷及預后相關。hsa-miR-34a對多種癌癥均有一定的抑制作用,但影響PRCC預后的研究鮮有報道,有望成為新的PRCC早期篩查及預后判斷標志物。