葛品序 羅晨銘 張中祺 袁騰飛 侯宇川 (吉林大學第一醫院,吉林 長春 130021)
全球每年確診約有43萬新發腎癌病例,死亡18萬例〔1〕。腎癌起病隱匿,早期常無明顯癥狀或體征,進展時期可能有腰痛和血尿的表現〔2〕。腎透明細胞癌(ccRCC)是最常見的腎癌類型,占所有病例的60%和轉移性病例的75%~80%〔3〕。多種因素共同導致ccRCC患者的預后存在顯著差異,包括臨床分期、組織病理學和基因突變層面上的差異等等〔4〕。傳統的腫瘤淋巴結轉移(TNM)分期系統和患者的臨床病理特征預測風險分層與預后實際上并不令人滿意。因此,需要開發新的預后模型用于更加準確的預測患者預后狀態。
雙硫死亡是一種不同于鐵死亡〔5〕、銅死亡〔6〕及凋亡〔7〕等的新型死亡方式。其致使細胞內過量胱氨酸積累導致的二硫化物應激引起的快速死亡形式誘導腫瘤細胞雙硫死亡,可以抑制腫瘤細胞的生長和疾病進展〔8〕。LncRNA是長度大于200個核苷酸的非編碼RNA,在腫瘤的發生和轉移中起著重要作用〔9〕。目前,雙硫死亡相關lncRNA(DR-lncRNA)對ccRCC患者預后影響尚未清楚。本研究全面分析了DR-lncRNA在ccRCC的預后和免疫景觀中的作用,并進行了風險模型的構建,該模型具有比傳統臨床變量更高的預測準確性,并為促進對ccRCC生物學的理解和開發新興治療方法提供了觀點。
1.1數據下載與整理 從癌癥基因組圖譜(TCGA,https://portal.gdc.cancer.gov/)下載ccRCC患者542份腫瘤組織和72份正常組織腎臟樣本的轉錄本數據和臨床信息數據〔10〕,納入標準為患者均有完整的臨床信息(TNM分級、分期、性別、年齡和生存數據)排除生存時間<30 d和臨床信息不全的樣本,最終得到506份腫瘤組織和72份正常組織的腎臟樣本。有研究〔11〕證明了15個雙硫死亡相關基因(DRGs),包括:FLNA、FLNB、MYH9、TLN1、ACTB、MYL6、MYH10、CAPZB、DSTN、IQGAP1、ACTN4、PDLIM1、CD2AP、INF2、SLC7A11。通過Perl軟件,本文對轉錄組數據進行整理,得到了轉錄組的lncRNAs和蛋白編碼mRNA,繼而從mRNA中提取DRGs。篩選與ccRCC顯著相關的lncRNA,采用R語言中“limma”包行Pearson相關性分析,篩選標準為Pearson相關系數(PCC)>0.4且P<0.001,分析ccRCC患者腫瘤樣本中lncRNA和DRGs表達之間的相關性,篩選出與DRGs相關的lncRNA。
1.2DR-lncRNA預后模型的構建 使用“caret”包將數據集按照1∶1隨機分為訓練集和驗證集。使用R語言中“survival”包,行單因素Cox回歸分析,挑選與總體生存率差異顯著的DR-lncRNA(P<0.05)。隨后采用“glmnet”包行LASSO回歸,在懲罰系數λ最小時,選擇最合適的lncRNAs構建預后模型。將LASSO回歸篩選出的lncRNAs行多因素Cox回歸,根據赤池信息量準則(AIC),挑選AIC極小值當作ccRCC患者最佳預后模型。根據公式計算,風險評分:(risk score)=Σcoef基因i×基因i表達量,通過加權lncRNA回歸系數(coef)和表達水平得到風險值,依照風險評分的中位值,將ccRCC患者分為高風險組和低風險組。
1.3預后模型的驗證 采用R“survival”包繪制K-M生存曲線,比較高、低危組的總生存期(OS)和無進展生存期(PFS),評估風險模型預測ccRCC生存率的準確性,估計高風險組和低風險組間生存差異。對年齡、性別、分期(Stage)、分級(Grade)、風險評分進行單因素和多因素Cox回歸分析,評估風險評分是否可做為ccRCC的獨立預后因素。利用受試者工作特征(ROC)曲線和C指數方法比較風險評分和不同臨床病理特征的預測能力。采用C指數方法對本研究構建的預后模型進行預測效能評估,獲得一致性指數(C指數),C指數取值范圍為0.5~1.0,越趨近于1證明模型預測準確性越高。
1.4列線圖和校準曲線 列線圖是建立在多因素Cox回歸分析的基礎上,采用多個臨床指標來評估患者生存預后的常用工具。使用多因素Cox回歸中差異有統計學意義的因素來繪制列線圖,分析ccRCC患者1、3和5年的生存期。使用校準曲線評估預測的生存率是否與實際生存情況一致,C指數來評估列線圖的識別和預測能力的可靠性。
1.5富集分析和免疫相關性分析使用 為探究風險評分與生物學過程的關系,使用R“limma”包識別高危與低危組間差異基因,篩選條件為|log2 (fold change)|>1和FDR<0.05。使用京都基因與基因組百科全書(KEGG)來評估與差異表達基因(DEGs)相關的生物通路。基于基因本體論(GO)對DEGs調控的功能進行分析。
1.6高、低風險組免疫微環境的差異 基于22種腫瘤富集的免疫細胞在每個基因的情況得出每個樣本的免疫細胞分布,根據高、低風險患者的分組,利用單樣本基因集富集分析(ssGSEA)得分計算所有樣品中的高、低風險組間免疫相關功能和細胞的富集水平差異。
1.7高、低風險組免疫治療敏感性差異預測 利用在線數據庫腫瘤免疫功能障礙和排斥(TIDE,http://tide.dfci.harvard.edu/)對所有樣品進行打分,然后對高、低風險組間TIDE得分進行差異分析。
1.8模型中DR-lncRNAs正常與腫瘤樣本的差異 分析構建模型中lncRNAs的表達量與正常組織的差異,在72例正常樣本與505例腫瘤樣本數據中提取模型中lncRNAs的表達量,使用“pheatmap”包構建表達熱圖。
1.9RNA提取及實時熒光定量聚合酶鏈反應(RT-qPCR)檢測ccRCC組織和癌旁組織 本項目經過吉林大學第一醫院醫學倫理委員會同意并實施,倫理審查號為2023-545。以下實驗均嚴格按照說明書進行。使用Trizol法從10個ccRCC標本和癌旁組織中提取總RNA。用超微量紫外分光光度計(Nanodrop 2000)檢查總RNA濃度和純度。然后,使用SweScript All-in-One RT SuperMix for qPCR (One-Step gDNA Remover)試劑將標本逆轉錄成cDNA,在熒光PCR儀器上使用Universal Blue SYBR Green qPCR Master Mix對模型的7個基因進行qPCR分析。使用2-ΔΔCt方法進行數據分析,以磷酸甘油醛脫氫酶(GAPDH)為內參,將基因表達量歸一化處理。引物均從武漢塞維爾有限公司處設計并購買,引物序列(5′→3′):AC106786.1上游引物:GTTTTGACTGGCGTCGTTATGA,下游:CGATGGAGTTGCTGGAGGTC;AC108673.3上游引物:AACTGCACCTGCTAAATCCCTT,下游:AGTGCCTCAAATGTTGTCCTCC;AL355835.1上游引物:AGATTTCTGCTGG-AGGATGGG,下游:TCTTACACGAGGGATCAGGC-AC;SPINT1-AS1上游引物:AGAAGCTGGTGCCCTTGGTG,下游:TCAAGGTTCAAGAGCAGGAGG;AL12-1944.1上游引物:GAAGCTGGTTCTACCTTTCTCCG,下游:CCTCCAAACATCCAGTCCCTC;AL590822.3上游引物:TAAAATGTCCCCGACCATCCTC,下游:GACGGGCTCCCATGACAAGA;AC008555.1上游引物:CAATTCTCCTGCCTCAGCCT,下游:CGAGGAG-GGTGGATCAACTG。
1.10統計學分析 使用Perl數據語言(http://www.perl.org/)、R軟件(版本4.2.3,https://www.r-project.org/)進行數據統計。連續資料采用Wilcoxon檢驗或獨立t檢驗,分類資料采用χ2檢驗或Fisher精確檢驗。Cox比例風險回歸模型用于計算單因素和多因素分析的風險比。不同組整體生存時間的比較使用Kaplan-Meier生存分析。
2.1構建DR-lncRNA并構建預后模型 15個DRGs來自之前的文獻,經過共表達分析后獲得397個DR-lncRNA。通過單因素Cox回歸分析進一步篩選出161個具有預后作用的lncRNA,再將上述lncRNA進行lasso回歸和多因素Cox回歸分析,最終確定7個關鍵預后相關的lncRNA納入構建預后模型,風險模型評分=(0.442 6×AL590822.3表達量)+(-0.734 5×AL355835.1表達量)+(-0.354 5×AC008555.1表達量)+(-0.415 8×SPINT1-AS1表達量)+(0.690 5×AC106786.1表達量)+(0.387 6×AC108673.3表達量)+(-1.106 9×AL121944.1表達量)。
2.2構建模型效能的驗證 將505例患者隨機分為訓練組252例和驗證組253例,訓練組與驗證組臨床資料比較差異無統計學意義(P>0.05)。根據風險評分中位數分為高風險組、低風險組。生存分析結果表明,在訓練組、驗證組和整體組中,高風險組OS均短于低風險組,在整個數據集中高風險組PFS也顯著短于低風險組(P均<0.05);該風險模型預測1、3、5年生存率的曲線下面積(AUC)分別為0.729、0.750、0.772。DR-lncRNA在整體組的表達熱圖,可以看出AL355835.1、AC008555.1、SPINT1-AS1、AL121944.1在低風險患者中高表達,AL590822.3、AC106786.1、AC108673.3在高風險風險的患者中高表達。見圖1。

圖1 驗證DR-lncRNA預后特征
2.3列線圖構建 繪制列線圖,C指數為0.792(95%CI:0.760~0.823),結合校準曲線,表明預測與實際觀測的生存率基本一致。見圖2。

圖2 構建和評估模型的預測能力
2.4富集分析 為了探究高風險組和低風險組ccRCC患者之間功能差異,使用高低風險組的差異基因進行了GO和KEGG富集分析。GO富集分析顯示,在分子生物學過程(BP)、類別中,基因主要富集在對細菌的防御反射、體液免疫反應。在細胞成分(CC)類別中,主要富集于質膜外側和含膠原蛋白的細胞外基質。在分子功能(MF)類別中,富集于信號受體激活劑活性和受體配體活性(圖3)。KEGG富集分析中,其富集于細胞因子和細胞因子受體相互作用(圖4)。GSEA分析顯示,在高危組富集的途徑與原始免疫缺陷與亞油酸代謝等有關,而在低危組中與一些代謝途徑相關,如纈氨酸和異亮氨酸降解及過氧化物酶體(圖5)。

圖3 差異基因的GO富集分析

圖4 KEGG分析

圖5 GSEA分析
2.5高、低風險組中免疫治療效果 通過TIDE評分來判斷高、低風險組樣本對免疫治療的有效性。如圖6所示,高風險組樣品較低風險組樣品具有較高的TIDE評分,提示高風險組樣品在免疫治療中的效果較低風險組差。

圖6 腫瘤免疫功能障礙和排斥反應(TIDE)
2.6高、低風險組中免疫細胞浸潤分析和免疫功能的差異分析 使用CIBERSORT分析計算了患者的免疫細胞浸潤分數,結果顯示,高風險組中CD8+T細胞、輔助性T細胞、調節T細胞、M0巨噬細胞浸潤更高。低風險組中靜止的CD4+記憶T細胞、單核細胞、M1巨噬細胞、M2巨噬細胞及靜止的肥大細胞浸潤更高。免疫發生和反應過程中高低風險有差異的免疫功能為CD8+T細胞、未成熟的樹突細胞(IDCs) 、肥大細胞、中性粒細胞、T細胞共刺激、2型干擾素反應。見圖7。

A.基于ssGSEA評分,16種免疫細胞在不同風險組中的比較;B.13種免疫相關功能的差異比較圖7 風險模型與腫瘤免疫微環境的關系
2.7模型中DR-lncRNAs正常與腫瘤樣本的差異表達 在505例ccRCC和72例正常組織中,構建模型中lncRNAs的表達量與正常組織的差異顯著(表1)。為了驗證模型的可靠性,在10例ccRCC標本和癌旁中進行qRT-PCR測定以驗證7種DR-lncRNA的表達水平。結果顯示,與癌旁組織相比,AL355835.1、AC008555.1、SPINT1-AS1、AL1219-44.1表達水平在ccRCC細胞系中下調,而AL590822.3、AC106786.1、AC108673.3在ccRCC中上調(表2)。這些結果證明了從DR-lncRNA構建風險模型的可靠性。

表1 風險模型lncRNA在TCGA的正常組織與ccRCC組織中表達比較

表2 RT-qPCR驗證雙硫死亡相關預后lncRNA在ccRCC與癌旁表達水平(n=10)
雙硫死亡〔11〕是一種新的細胞死亡方式,其機制可能被用于治療癌癥。硫是一種機體不可缺少的微量元素。細胞質內二硫鍵的積累可破壞細胞氧化還原狀態的平衡,進而誘導雙硫應激和細胞毒性〔12〕。
然而DR-lncRNA在ccRCC患者中的價值仍然未知。本研究建立了基于7個DR-lncRNA的模型,其中AL590822.3、AC106786.1及AC108673.3為風險基因,而AL355835.1、AC008555.1、SPINT1-AS1及AL121944.1為保護基因。在本文模型的7個DR-lncRNA中, SPINT1-AS1也稱為HGF激活劑(HGFA)抑制劑1型(HAI-1),是一種Kunitz型絲氨酸蛋白酶抑制劑,在大多數上皮細胞表面表達。在乳腺癌中SPINT1-AS1有促進乳腺癌細胞增殖和遷移的作用,其在乳腺癌患者和乳腺癌細胞系的血清中上調,當基因敲低后乳腺癌細胞的增殖和遷移能力明顯下降〔13〕。與乳腺癌類似,其在前列腺癌〔14〕、胰腺導管腺癌〔15〕、結直腸癌〔16〕和甲狀腺癌〔17〕中高表達,但是在食管鱗癌〔18〕、胃癌〔19〕和子宮內膜癌〔20〕中低表達。因此,其結果說明 SPINT1作用可能是器官特異性的。AC008555.1,AC106786.1,AC108673.3分別在 甲狀腺癌〔21〕、肺鱗狀細胞癌〔22〕與卵巢癌〔23〕的預測模型中作為關鍵基因。
本文GO結果表明,高低風險組中DR-lncRNA差異基因的MF主要富集于信號受體激活劑活性和受體配體活性。信號受體激活劑和受體配體的異常活化或表達可能會導致癌癥。受體酪氨酸激酶 (RTKs) 是一類細胞表面受體,對于細胞增殖、生存和遷移起到關鍵作用。多種RTKs,如血管內皮生長因子受體(VEGFR)、血小板衍生生長因子受體(PDGFR)和肝細胞生長因子受體(c-Met),在腎癌中的異常激活與疾病的進展和預后有關〔24〕。本文KEGG結果表示,差異基因富集通路在細胞因子和細胞因子受體相互作用中。細胞通過分泌細胞因子和化學因子來相互通訊,從而影響腫瘤的生長、侵襲和轉移。本文多種免疫和代謝途徑的GSEA預測顯示,DR-lncRNA可能在高危組中影響ccRCC中的原始免疫缺陷和亞油酸代謝。因此,干預這些代謝途徑可能有助于未來ccRCC治療。腎癌與腫瘤免疫微環境的關系是一個復雜且不斷發展的研究領域。
綜上,基于7個DR-lncRNA的預測模型展現了較高的精確度,本文模型揭示了高風險和低風險患者的免疫微環境并預測了患者的免疫治療狀態。然而本文的研究也存在局限性,該模型需要在更大的人群隊列中進行驗證。