鐘 科,唐富豪,潘 鑫,張征宇
腎細胞癌(renal cell carcinoma,RCC)是最常見的腎癌,2017年在美國確診近63 990例,其中死亡人數高達14 400[1]。腎細胞癌70%以上為腎透明細胞癌(clear cell RCC,ccRCC),大部分病例為散發性[2]。雖然大多數局限性腎癌患者腫瘤生長緩慢,呈非致死性,但是大約四分之一的患者在部分或根治性腎切除術后發生了疾病進展和轉移[3-4]。為了區分惰性腫瘤和侵襲性腫瘤,目前臨床指南主要以腫瘤的大小、分期和分級作為依據,這些都不包含任何分子生物標記物[5-6]。然而,即使是根據這些臨床指南所定義的低風險的患者也可能會發生疾病進展和腫瘤復發[7]。一些研究報告了某些特定分子有助于ccRCC的風險分層,如ClearCode34和復發評分[8-9],但其臨床應用可能太昂貴和復雜。因此,有必要尋找一種可以準確有效地對ccRCC患者預后進行分層的新的預后生物標記物。
長鏈非編碼RNA(long noncoding RNAs,lncRNAs)已被證實在腫瘤發展中具有重要作用[10-12]。我們以前對lncRNAs的功能進行了廣泛的研究,特別是在ccRCC進展和靶向治療抵抗方面[13-15]。近年來,隨著RNA測序的進展,已經發現了大量lncRNAs可以作為一類新的預后生物標記物[16-17]。基于ccRCC的這些臨床需要和lncRNAs作為腫瘤生物標記物的潛在優勢[18],本研究對來自3個獨立ccRCC隊列的轉錄組數據進行分析,以確定與患者預后相關的lncRNAs,隨后在多個獨立的ccRCC隊列中進行驗證。
1.1 研究設計本研究遵循腫瘤標志物預后研究(REMARK)標準[19]的報告建議,并得到了所有機構審查委員會的批準。腫瘤樣本和臨床數據是在長海醫院、長征醫院、東部戰區總醫院倫理委員會批準和患者知情同意下獲得[13-15,20-22]。本研究在3個有可用RNA測序數據和臨床注釋的ccRCC患者隊列中進行:①來自TCGA(癌癥基因組圖譜)數據庫(美國隊列)的530個原發腫瘤和72個匹配的相鄰正常組織[22],②來自EGA(歐洲基因組表型檔案)數據庫(日本隊列)的100個原發腫瘤[21],③來自ICGC(國際癌癥基因組聯盟)數據庫(歐洲隊列)的91個原發腫瘤和45個匹配的鄰近正常組織[20],具體流程見圖1。驗證研究在多中心隊列中進行,包括來自長海醫院的1326例ccRCC患者、來自長征醫院的353例ccRCC患者和來自東部戰區總醫院的229例ccRCC患者。在驗證隊列中連續采集了從2004年到2012年的組織樣本。這些隊列包括有臨床病理特征和隨訪資料的患者,中位隨訪時間為96個月。

圖1 腎透明細胞癌患者隊列的研究流程圖
1.2 方法開發一種綜合數據挖掘策略來識別3個篩選隊列中的預測候選lncRNA:為了確定ccRCC中高度可靠的預后lncRNA,對3個研究隊列[①來自TCGA數據庫(美國隊列,中位隨訪40個月),②來自EGA數據庫(EGAS0001000509,日本隊列,中位隨訪50.5個月),③來自ICGC數據庫(歐洲隊列,中位隨訪58.9個月)] 進行研究,獲得準確的lncRNA注釋集,篩選出基因組定位中與蛋白質編碼基因重疊的lncRNAs(GENCODE版本19注釋),并對7070個lncRNAs進行分析。然后,考慮在每個隊列中至少80%的樣本中表達值大于零的lncRNAs用于下游分析。對所選lncRNA的預后價值進行驗證:為了驗證ReCAL評估患者預后的能力,使用RNA原位雜交技術(RNA scope)檢測長海隊列(n=1326)、長征隊列(n=353)和東總隊列(n=229)三家獨立醫院1908例ccRCC患者ReCAL的表達。進一步評估在用Mayo Clinic SSIGN評分分層的患者中ReCAL的評估預后能力。對98例接受舒尼替尼或索拉非尼治療的患者進行lncRNA表達與臨床預后的關系分析。主要臨床終點是總生存期(overall survival,OS)。采用單變量和多變量Cox回歸、Kaplan-Meier曲線評估lncRNA表達與臨床終點的相關性。
1.3 統計學分析采用SPSS 16.0軟件(SPSS Inc., USA)進行統計分析。以頻率和百分比描述患者的臨床病理特征。用χ2檢驗或Fisher精確檢驗估計ReCAL表達水平與臨床變量的相關性。t檢驗用于檢驗兩組間的ReCAL表達差異。用Kaplan-Meier方法估計事件發生的時間,用log-rank檢驗評估患者特征之間的比較。應用多變量Cox比例風險模型來評估有意義和無意義的預測協變量對總生存期(overall survival,OS)的影響,并在Cox模型中報告風險比(hazard ratios,HR)[23-26]。使用Kaplan-Meier生存曲線來評估Cox回歸模型中風險的占比。所有統計檢驗均為雙側,以P≤0.05為差異有統計學意義。
2.1 多數據集分析證實長鏈非編碼RNA ReCAL是ccRCC的預后生物標志物每個數據集中得到大約1695個lncRNAs。在研究隊列中,單變量Cox回歸分析顯示,29個lncRNA的表達與3個隊列的生存率顯著相關(P<0.05)。接下來,分別以29個lncRNA的表達中值作為界值將患者分為高表達組和低表達組,并評估2組總體生存期差異。確定了一個獨特的lncRNA,該基因在RefSeq參考序列數據庫中被注釋為LINC01410(集成基因注釋ENSG0000238113),它顯示了3個隊列和集合隊列中高表達組和低表達組之間最顯著的差異生存率,見圖2a-2d。根據其與ccRCC預后的關系,將該基因命名為“與腎癌相關的LincRNA”(renal cancer associated LincRNA,ReCAL)。多變量Cox回歸分析表明,高表達ReCAL是ccRCC患者預后不良的獨立預測因素(美國隊列:HR:1.420,95%CI:1.040~1.939,P=0.027;日本隊列:HR:3.658,95%CI:1.457~9.181;P=0.006;歐洲隊列:HR:1.630,95%CI:0.732~3.630;P=0.232),見表1。此外,探討連續的ReCAL表達與OS的關系發現,在所有3個隊列中,隨著ReCAL表達的增加,低OS的風險呈線性增長(美國隊列:HR:1.736;95%CI:1.416~2.129;P=1.141E-7;日本隊列:HR:1.711;95%CI:1.161~2.522;P=0.007;歐洲隊列:HR:2.257;95%CI:1.105~4.609;P=0.025),見表1。
2.2 通過多隊列研究驗證了ReCAL評估患者預后的能力ccRCC腫瘤中ReCAL的代表性染色見圖3a,通過RNA scope和實時熒光定量PCR(qRT-PCR)結果的比較,證實了ReCAL探針的特異性,見圖3b。以中位數為界將ReCAL的表達分為高表達組和低表達組。在所有3個驗證隊列和集合隊列中,與低表達組的患者相比,ReCAL高表達組的患者預后較差,見圖2e-2h。多變量Cox回歸分析顯示,在這些隊列中高ReCAL表達與較短OS獨立相關(長海隊列:HR:2.180,95%CI:1.775~2.678,P=1.111E-13;長征隊列:HR:2.735,95%CI:1.747~4.280,P=1.076E-5;東總隊列:HR:2.113,95%CI:1.270~3.514,P=0.004),見表1。此外,當建模為連續變量時,發現隨著ReCAL表達增加,低OS風險呈線性增長(長海隊列:HR:3.391,95%CI:2.741~4.386,P=1.344E-14;長征隊列:HR:2.473,95%CI:1.062~3.251,P=0.044;東總隊列:HR:2.409,95%CI:1.097~3.210,P=0.037),見表1。
2.3 ReCAL在低危Mayo Clinic SSIGN評分腎透明細胞癌患者中尤其具有預后價值ReCAL評估預后的能力在低風險患者(SSIGN評分0~3)中最為明顯,在中等風險患者(SSIGN評分4~7)中則較小,而在高風險患者(SSIGN評分>8)中最小,見圖4。長海、長征和東總隊列中高ReCAL表達的低風險患者發生ccRCC特異性死亡的可能性分別為低ReCAL表達組的5.854倍、8.15倍和3.091倍(95%CI:3.799~9.020,P=1.142E-15;95%CI:2.420~27.450,P=0.001;95%CI:1.458~6.555,P=0.003),見表2。中等風險患者中,長海隊列ReCAL高表達的患者發生ccRCC特異性死亡的可能性是低ReCAL表達組的1.408倍(95%CI:1.055~1.879,P=0.02),而在其他兩個隊列中無顯著相關性。在高風險患者中ReCAL的表達與ccRCC特異性死亡無顯著相關性。

表1 研究隊列和驗證隊列中腎透明細胞癌患者總體生存率相關因素的單變量和多變量分析

a:美國隊列;b:日本隊列;c:歐洲隊列;d:聯合研究隊列;e:長海隊列;f:長征隊列;g:東總隊列;h:聯合驗證隊列圖2 長鏈非編碼RNAReCAL在腎透明細胞癌中的表達對3個研究隊列和3個驗證隊列總生存率的生存曲線

a:長鏈非編碼RNA ReCAL的代表性染色;b:RNA scope和qRT-PCR結果圖3 腎透明細胞癌患者腫瘤中長鏈非編碼RNA ReCAL的表達
2.4 長鏈非編碼RNA ReCAL表達與靶向治療反應呈負相關與匹配的鄰近正常組織相比,ReCAL在腫瘤中的表達顯著上調,見圖5。此外,與原發腫瘤相比,ReCAL在復發轉移腫瘤中的表達較高(P=0.048),見圖6a。探討ReCAL是否可以作為評估靶向治療反應的生物標記物時發現,與對新輔助舒尼替尼治療有良好反應的患者相比,ReCAL在舒尼替尼治療后復發的腎癌組織中富集(P=0.034),見圖6b。為了確定接受靶向治療的ccRCC患者的ReCAL表達與患者預后的關系,對先前報道的兩組患者[13-15]進行評估發現,舒尼替尼或索拉非尼治療對所有ccRCC患者無進展生存期的改善能力有限,而與對照組相比,低ReCAL表達的患者在接受靶向治療后預后較好,高ReCAL表達的患者對靶向治療反應不佳,見圖7。這些結果提示ReCAL可以作為ccRCC患者評估靶向治療反應的生物標志物。

表2 不同Mayo Clinic SSIGN 評分患者的ReCAL表達對總生存期(OS)和無進展生存期(PFS)的分析

a、b、c:長海隊列;d、e、f:長征隊列;g、h、i:東總隊列圖4 3個驗證隊列不同Mayo Clinic SSIGN(分期、大小、分級和壞死)評分患者的ReCAL表達對總體生存率的生存曲線

a: 美國隊列;b:歐洲隊列;c:長海隊列圖5 ReCAL表達在腫瘤中與匹配的鄰近正常組織比較

a:復發轉移腫瘤中與原發腫瘤比較;b:舒尼替尼治療后復發的患者腎癌組織中與對新輔助舒尼替尼治療有良好反應的患者腎癌組織比較圖6 在不同分組的組織中長鏈非編碼RNA ReCAL的表達

a、b、c:有或無舒尼替尼治療的ccRCC患者無進展生存期的生存曲線;d、e、f:有或無索拉非尼治療的ccRCC患者無進展生存期的生存曲線圖7 腎透明細胞癌患者中長鏈非編碼RNA ReCAL表達與靶向治療反應的關系
本研究證實了一種之前未報道的lncRNA,命名為ReCAL,其高表達與ccRCC患者的不良預后相關。值得注意的是,ReCAL評估預后的能力在低風險患者(SSIGN評分0~3)中最為明顯。此外,本研究還發現ReCAL可以作為靶向治療反應的獨立預測因子。雖然以往的研究已經推薦了幾種用于ccRCC風險分層的分子生物標記物,以及傳統的臨床病理參數,但是這些作為檢測預后的可靠生物標記物的能力不足,并且這些研究大多集中于晚期ccRCC[27]。本研究確定并驗證了lncRNAReCAL,它在6個獨立的ccRCC患者隊列中顯示出顯著的預后價值,表明了ReCAL在臨床應用中的重要作用。
對于ccRCC患者的分層,ReCAL比經典的腫瘤分期和分級指標更能反映ccRCC復發風險。患者常常對術后可能發生轉移性疾病感到不安,即使術后發生轉移的風險很低。然而,大多數患者由于缺乏任何可以有效降低復發風險并最終保持健康的指導方針而惡化,例如早期發現復發性疾病的生物標志物和有效的治療方案。在本研究分層分析中,ReCAL主要在根據標準臨床病理指標SSIGN評分被歸類為低風險的患者中表現出對評估預后的高效率。
三分之一被診斷為區域性或遠處轉移的ccRCC患者需要強化治療,如靶向治療[28]。血管內皮生長因子(VEGF)抑制劑或雷帕霉素靶蛋白(mTOR)信號通路是晚期ccRCC患者的標準治療方案[29]。然而,10%~20%的晚期ccRCC患者天生對靶向治療不敏感,其余大多數患者在治療6~15個月后出現耐藥性和腫瘤進展,導致靶向治療未能有效延長ccRCC患者的生存期[30-31]。由于在選擇治療反應性患者時缺乏生物標記物,靶向治療可能對一部分ccRCC患者有未實現的臨床益處[32]。本研究發現,治療前ccRCC腫瘤中ReCAL的高表達與舒尼替尼和索拉非尼治療反應不良顯著相關,而治療后ReCAL低表達的患者預后顯著改善。因此,在決定一個療程之前,最好評估ccRCC腫瘤中ReCAL的表達,以確定可能受益于靶向治療的患者類型。
總的來說,本研究提供了可靠的證據,證明ccRCC組織中ReCAL高表達與惡化臨床結局的風險增加相關,并且獨立于多個獨立隊列中其他已知的病理預測因子。此外,這種聯系在低風險ccRCC患者中更為明顯。本研究的發現揭示了ReCAL可以作為ccRCC評估預后的生物標記物,可能有助于個體化治療方案的有效制訂,改善患者的治療和預后。